Sobre a Openflow - Snowflake Deployments¶
A Openflow - Snowflake Deployment é executada em Snowpark Container Services (SPCS) e fornece uma solução simplificada e integrada para integração de dados e conectividade em armazenamento interoperável, como Iceberg e armazenamento nativo do Snowflake. Como um serviço totalmente independente no Snowflake, é fácil de implantar e gerenciar, oferecendo um ambiente conveniente e econômico para executar seus fluxos de dados. Uma das principais vantagens é sua integração nativo com o modelo de segurança do Snowflake, que permite autenticação, autorização e segurança de rede perfeitas, além de operações simplificadas.
Embora os clientes possam ter tanto o BYOC quanto implantações do Snowflake, a lista a seguir casos de uso que são adequados para implantações do Snowflake:
Incorporação de dados de personalização total na camada Bronze: descarregamento de dados brutos de várias fontes diretamente no Snowflake e uso das implantações do Openflow Snowflake para extrair e carregar.
Enriquecimento de dados: execução de pipelines para enriquecer tabelas que já existem dentro do Snowflake.
Da ingestão ao insight em um só lugar: criação de aplicativos onde todo o ciclo de vida dos dados (ingestão, processamento e fornecimento) acontece dentro do ecossistema Snowflake.
Transformação de dados brutos em insights com AI: ingerir dados não estruturados e, por exemplo, usar o Snowflake Intelligence para pesquisar e entendê-los melhor, tudo em conjunto com os outros dados estruturados dos usuários.
Emprego de ETL reverso: fecha o loop na geração de insights compartilhando com sistemas operacionais externos via APIs, infraestrutura de mensagens e muito mais.
Compreensão das funções de tempo de execução e integrações de acesso externo¶
Openflow - Snowflake Deployments devem ser capazes de interagir com fontes e destinos de dados que normalmente estão fora do Snowflake. Além disso, essas implantações também devem ser capazes de se comunicar e acessar o próprio Snowflake. Funções de tempo de execução e integrações de acesso externo fornecem esse suporte.
O que é uma função de tempo de execução?¶
Uma função de tempo de execução é uma função tradicional do Snowflake, associada a um tempo de execução do Openflow específico e usada para as seguintes tarefas:
Conceder acesso a integrações de acesso externo (EAIs). Essas EAIs especificam regras que permitem que o tempo de execução acesse as fontes e destinos de dados de dentro do próprio Snowflake.
Conceder acesso aos recursos do Snowflake.
Conceder acesso a recursos específicos do conector
As funções de tempo de execução estão vinculadas aos tokens de sessão do Openflow, evitando a necessidade de os clientes criarem usuários de serviços separados e pares de chaves para autenticação no Snowflake.
O que é uma integração de acesso externo (EAI) no Openflow?¶
Uma integração de acesso externo (EAI) é um objeto Snowflake projetado para fornecer acesso seguro a recursos externos, como sistemas de origem dos quais os conectores Openflow extraem dados externos. As implantações Openflow Snowflake usam EAIs e regras de rede juntas para definir os pontos de extremidade que um conector Openflow pode ler ou gravar.
Os engenheiros de dados definem e configuram EAIs e funções de tempo de execução específicas para um determinado conector e seu tempo de execução subjacente.
Fluxo de trabalho típico do Openflow - Snowflake Deployment¶
As seções a seguir descrevem os conceitos e os fluxos de trabalho da Openflow - Snowflake Deployment.
Persona do usuário |
Tarefa |
|---|---|
Administrador do Snowflake |
|
Engenheiro de dados (autor do pipeline, responsável pela ingestão de dados) |
Os conectores são uma maneira simples de resolver para um caso de uso de integração específico, e usuários menos técnicos podem implantá-los sem assistência de um engenheiro de dados. |
Engenheiro de dados (operador de pipeline) |
Configura parâmetros de fluxo e executa o fluxo. |
Engenheiro de dados (responsável pela transformação para as camadas Silver e Gold) |
Responsável pela transformação de dados da camada Bronze que foi preenchida pelo pipeline para as camadas prata e ouro para análise. |
Usuário corporativo |
Utiliza objetos da camada Gold para análise. |
Limitações¶
A Openflow - Snowflake Deployment não é compatível com as contas de avaliação.
Apenas uma única Openflow - Snowflake Deployment é aceita por conta. Entretanto, uma conta pode ter muitos tempos de execução da Openflow - Snowflake Deployment, cada um com uma função e acesso à rede separados, o que permite aos usuários separar a carga de trabalho.
Os clientes que exigem conectividade privada precisarão configurar um PrivateLink de saída. O PrivateLink está disponível somente para a Business Critical Edition.
Próximos passos¶
Configuração do Openflow - Implantação do Snowflake - Visão geral da tarefa