Snowflake Data Clean Room: dados externos do Google Cloud Platform¶
Os dados analisados em uma Snowflake Data Clean Room podem ser nativos do Snowflake, residir externamente no armazenamento do provedor de nuvem ou ambos. Um conector permite que os colaboradores acessem dados externos de um provedor de nuvem de dentro da sala limpa.
O conector de dados externo usa tabelas externas do Snowflake para disponibilizar dados. Esteja ciente de que há um risco maior de segurança associado à vinculação de tabelas externas em uma sala limpa. Como resultado, o provedor deve permitir explicitamente o uso de tabelas externas na sala limpa antes que os consumidores possam usar um conector para incluir dados externos. Se o provedor usar o conector de dados externo, o consumidor será avisado de que tabelas externas estão sendo usadas para que ele possa decidir se deseja instalar a sala limpa.
Este tópico descreve como usar um conector para que analistas de salas limpas possam acessar dados externos de um bucket do Google Cloud Platform.
Importante
Conectores de terceiros não são oferecidos pela Snowflake e podem estar sujeitos a termos adicionais. Essas integrações são disponibilizadas para sua conveniência, mas você é responsável por qualquer conteúdo enviado ou recebido das integrações.
Os clientes são responsáveis por obter todos os consentimentos necessários em conexão com o uso das Snowflake Data Clean Rooms. Certifique-se de estar em conformidade com as leis e regulamentações aplicáveis ao usar os Snowflake Data Clean Rooms, inclusive em conexão com conectores de terceiro para fins de ativação.
Pré-requisitos¶
Para usar o conector para dados externos:
O provedor deve permitir explicitamente o uso de tabelas externas na sala limpa.
Os arquivos devem estar no formato parquet.
Conexão a um bucket do Google Cloud Platform¶
Permitir que colaboradores de salas limpas acessem dados do armazenamento do Google Cloud Platform (GCP) envolve as seguintes etapas:
No GCP, obtenha o URL do bucket GCP.
No ambiente de sala limpa, crie o conector.
No GCP, conceda permissões ao conector.
No ambiente de sala limpa, autentique o conector com o GCP.
As seções a seguir discutem essas etapas com mais detalhes.
Como obter o URL do bucket do GCP¶
O conector de sala limpa precisa do URL do bucket de armazenamento do GCP para acessar os dados. Antes de criar o conector, você deve:
Entre no console do Google Cloud Platform como editor de projeto.
No painel do console, selecione Cloud Storage » Browser.
Selecione o bucket com os dados que deseja acessar da sala limpa e navegue até o local desses dados. O bucket não pode estar vazio.
Selecione o ícone de cópia para copiar o URL do bucket de armazenamento e guarde-o para a próxima tarefa.
Criação do conector e cópia do identificador de conta de serviço¶
Agora você está pronto para criar o conector no ambiente de sala limpa. Após criar o conector, você precisa copiar os detalhes sobre sua conta de serviço para que ele possa ser associado ao bucket no GCP. Para criar o conector em seu ambiente de sala limpa:
Navegue até a página de login do Snowflake Data Clean Rooms.
Digite seu endereço de e-mail e selecione Continue.
Insira sua senha.
Se você estiver associado a vários ambientes de sala limpa, selecione a conta Snowflake que deseja usar.
No painel de navegação à esquerda, selecione Connectors e expanda a seção Google Cloud.
No campo Storage bucket URL, insira o URL que você copiou do GCP e substitua
https://
porgcs://
no URL.Selecione Create. A sala limpa gera uma conta de serviço que ela usa para acessar o GCP.
Use o ícone de cópia para copiar o identificador da conta de serviço e salvá-lo para a próxima tarefa.
Concessão de permissões ao conector¶
As salas limpas precisam de permissão para acessar dados externos no bucket do GCP. A concessão dessas permissões consiste em criar uma função GCP para a conta de serviço do conector e adicionar a conta de serviço como uma entidade do bucket GCP.
Para criar o a função GCP dedicada para a conta de serviço do conector:
Entre no console do Google Cloud Platform como editor de projeto.
No painel do console, selecione IAM & admin » Roles.
Selecione Create Role.
Insira um nome e uma descrição para a função.
Selecione Add Permissions e adicione as seguintes permissões:
storage.buckets.get
storage.objects.list
storage.objects.get
Agora que você criou uma função dedicada, está pronto para associar a conta de serviço do conector como uma entidade do bucket GCP. Para associar a conta de serviço:
Entre no console do Google Cloud Platform como editor de projeto.
No painel do console, selecione Cloud Storage » Browser.
Selecione o bucket com os dados externos.
Selecione Show Info Panel. O painel de informações desliza para abrir.
Selecione Add Principals.
Na caixa de texto New Principals, cole o identificador da conta de serviço copiado da sala limpa.
Na lista suspensa Select a role, selecione a função dedicada criada para a conta de serviço.
Autenticação do conector¶
Agora você está pronto para autenticar o conector e garantir que ele possa acessar o bucket GCP. Para autenticar o conector:
No painel de navegação à esquerda da sala limpa, selecione Connectors e expanda a seção Google Cloud. Se estiver desconectado da sala limpa, consulte Faça login no aplicativo da Web..
Selecione o bucket GCP ao qual está se conectando e escolha Authenticate.
Remoção do acesso a dados externos no GCP¶
Para remover o acesso a um bucket GCP de um ambiente de sala limpa:
Navegue até a página de login do Snowflake Data Clean Rooms.
Digite seu endereço de e-mail e selecione Continue.
Insira sua senha.
Se você estiver associado a vários ambientes de sala limpa, selecione a conta Snowflake que deseja usar.
No painel de navegação à esquerda, selecione Connectors e expanda a seção Google Cloud.
Encontre o bucket GCP que está conectado no momento e selecione o ícone de lixeira.