Snowflake Data Clean Room : données externes provenant de Google Cloud Platform

Les données analysées dans une Snowflake Data Clean Room peuvent être natives à Snowflake, résider en externe dans le stockage d’un fournisseur de cloud ou les deux. Un connecteur permet aux collaborateurs d’accéder aux données externes d’un fournisseur de cloud depuis la salle blanche.

Le connecteur de données externe utilise des tables externes Snowflake pour rendre les données disponibles. Soyez conscient qu’il existe un risque de sécurité accru associé à la liaison de tables externes dans une salle blanche. Par conséquent, le fournisseur doit autoriser explicitement l’utilisation de tables externes dans la salle blanche avant que les consommateurs puissent utiliser un connecteur pour inclure des données externes. Si le fournisseur utilise le connecteur de données externe, le consommateur est averti que des tables externes sont utilisées afin qu’il puisse décider d’installer ou non la salle blanche.

Cette rubrique décrit comment utiliser un connecteur pour que les analystes de salles blanches puissent accéder à des données externes à partir d’un compartiment de Google Cloud Platform.

Important

Les connecteurs tiers ne sont pas proposés par Snowflake et peuvent être soumis à des arguments supplémentaires. Ces intégrations sont mises à votre disposition pour votre commodité, mais vous êtes responsable de tout contenu envoyé ou reçu à partir des intégrations.

Les clients sont responsables de l’obtention de toutes les autorisations nécessaires à l’utilisation de Snowflake Data Clean Rooms. Veuillez vous assurer que vous respectez les lois et réglementations en vigueur lorsque vous utilisez Snowflake Data Clean Rooms, y compris en relation avec des connecteurs tiers à des fins d’activation.

Conditions préalables

Pour utiliser le connecteur pour les données externes :

Se connecter à un compartiment de Google Cloud Platform

Permettre aux collaborateurs de la salle blanche d’accéder aux données du stockage de Google Cloud Platform (GCP) consiste à suivre les étapes suivantes :

  1. Dans GCP, obtenez l’URL du compartiment GCP.

  2. Dans l’environnement de la salle blanche, créez le connecteur.

  3. Dans GCP, accordez des autorisations au connecteur.

  4. Dans l’environnement de la salle blanche, authentifiez le connecteur avec GCP.

Les sections suivantes décrivent ces étapes de manière plus détaillée.

Obtenir l’URL du compartiment GCP

Le connecteur de salle blanche a besoin de l’URL du compartiment de stockage GCP pour accéder aux données. Avant de créer le connecteur, vous devez :

  1. Vous connecter à la console Google Cloud Platform en tant qu’éditeur de projet.

  2. Dans le tableau de bord de la console, sélectionnez Cloud Storage » Browser.

  3. Sélectionnez le compartiment qui contient les données auxquelles vous souhaitez accéder depuis la salle blanche, et naviguez jusqu’à l’emplacement de ces données. Le compartiment ne peut pas être vide.

  4. Sélectionnez l’icône de copie pour copier l’URL du compartiment de stockage et l’enregistrer pour la tâche suivante.

Créer le connecteur et copier l’identificateur du compte de service

Vous êtes maintenant prêt à créer le connecteur dans l’environnement de la salle blanche. Une fois le connecteur créé, vous devez copier les détails de son compte de service afin de l’associer au compartiment dans GCP. Pour créer le connecteur dans votre environnement de salle blanche :

  1. Accédez à la page de connexion Snowflake Data Clean Rooms.

  2. Saisissez votre adresse e-mail et sélectionnez Continue.

  3. Entrez votre mot de passe.

  4. Si vous êtes associé à plusieurs environnements de salles blanches, sélectionnez le compte Snowflake que vous souhaitez utiliser.

  5. Dans la navigation de gauche, sélectionnez Connectors, puis développez la section Google Cloud.

  6. Dans le champ Storage bucket URL, entrez l’URL que vous avez copié à partir de GCP, puis remplacez https:// par gcs:// dans l’URL.

  7. Sélectionnez Create. La salle blanche génère un compte de service qu’elle utilise pour accéder à GCP.

  8. Utilisez l’icône Copier pour copier l’identificateur du compte de service et l’enregistrer pour la tâche suivante.

Accorder des autorisations au connecteur

Les salles blanches ont besoin d’une autorisation d’accès aux données externes dans le compartiment GCP. L’attribution de ces autorisations consiste à créer un rôle GCP dédié pour le compte de service du connecteur, puis à ajouter le compte de service en tant que principal du compartiment GCP.

Pour créer le rôle GCP dédié au compte de service du connecteur :

  1. Connectez-vous à la console Google Cloud Platform en tant qu’éditeur de projet.

  2. Dans le tableau de bord de la console, sélectionnez IAM & admin » Roles.

  3. Sélectionnez Create Role.

  4. Entrez un nom et une description pour le rôle.

  5. Sélectionnez Add Permissions, puis ajoutez les autorisations suivantes :

  • storage.buckets.get

  • storage.objects.list

  • storage.objects.get

Maintenant que vous avez créé un rôle dédié, vous êtes prêt à associer le compte de service du connecteur en tant que principal du compartiment GCP. Pour associer le compte de service :

  1. Vous connecter à la console Google Cloud Platform en tant qu’éditeur de projet.

  2. Dans le tableau de bord de la console, sélectionnez Cloud Storage » Browser.

  3. Sélectionnez le compartiment qui contient les données externes.

  4. Sélectionnez Show Info Panel. Le panneau d’informations s’ouvre.

    Afficher le panneau d'informations d'un compartiment Google Cloud Platform
  5. Sélectionnez Add Principals.

  6. Dans la zone de texte New Principals, collez l’identificateur de compte de service que vous avez copié depuis la salle blanche.

  7. Dans la liste déroulante Select a role , sélectionnez le rôle dédié que vous avez créé pour le compte de service.

Authentifier le connecteur

Vous êtes maintenant prêt à authentifier le connecteur pour vous assurer qu’il peut accéder au compartiment GCP. Pour authentifier le connecteur :

  1. Dans la navigation gauche de la salle blanche, sélectionnez Connectors et développez la section Google Cloud. Si vous êtes déconnecté de la salle blanche, consultez Connectez-vous à l’application Web..

  2. Sélectionnez le compartiment GCP auquel vous vous connectez, puis sélectionnez Authenticate.

Supprimer l’accès aux données externes sur GCP

Supprimer l’accès à un compartiment GCP d’une salle blanche :

  1. Accédez à la page de connexion Snowflake Data Clean Rooms.

  2. Saisissez votre adresse e-mail et sélectionnez Continue.

  3. Entrez votre mot de passe.

  4. Si vous êtes associé à plusieurs environnements de salles blanches, sélectionnez le compte Snowflake que vous souhaitez utiliser.

  5. Dans la navigation de gauche, sélectionnez Connectors, puis développez la section Google Cloud.

  6. Trouvez le compartiment GCP qui est actuellement connecté et sélectionnez l’icône de la corbeille.