Cas d’utilisation : chevauchement et segmentation¶
Snowflake fournit un modèle de chevauchement et de segmentation pour déterminer quelles entités existent dans les données pour tous les collaborateurs, et afficher des informations agrégées sur ces entités.
En utilisant ce modèle, deux parties ajoutent chacune une ou plusieurs tables à une clean room. Les entités de ces tables sont jointes ou identifiées par les colonnes de jointure que vous spécifiez. En outre, le nombre de chevauchements peut être ventilé et filtré en fonction d’attributs de segmentation particuliers. Cela permet aux parties d’avoir un aperçu du chevauchement entre leurs ensembles de données, ce qui peut aider à déterminer la valeur de la collaboration et faciliter d’autres cas d’utilisation en aval dans la clean room. Le consommateur spécifie les colonnes à joindre et les colonnes à afficher. Toutes les colonnes projetées doivent être soit regroupées, soit agrégées à l’aide d’une fonction d’agrégation. Les colonnes identificatrices d’entités sont bloquées dans les résultats de la requête et la clean room applique le principe de confidentialité différentielle pour mieux protéger les informations relatives à des entités spécifiques. Si le créateur de la clean room l’autorise, les résultats peuvent être activés auprès d’un tiers (application web uniquement).
Par exemple, un annonceur peut effectuer une analyse de chevauchement sur l’inventaire d’un éditeur afin d’éclairer la valeur de l’achat de médias sur cet éditeur. L’annonceur active ensuite les IDs l’audience souhaitée et le renvoie à l’éditeur à des fins de ciblage.
Le modèle de chevauchement et de segmentation est disponible à la fois dans l’application web et dans le code. L’application web facilite l’utilisation des fournisseurs d’identité et l’activation auprès de partenaires tiers, tandis que l’utilisation du code permet de créer plusieurs tables à la fois pour le fournisseur et le consommateur.
Utilisation des applications web¶
Dans l’application web, ce casse-tête est pris en charge par un modèle prêt à l’emploi appelé Audience Overlap & Segmentation. Bien que ce modèle soit ciblé pour les cas d’utilisation en marketing et en publicité, il peut être utilisé pour tout cas d’utilisation de chevauchement et de segmentation dans tous les secteurs d’activité. Suivez les étapes ci-dessous pour apprendre à créer et à utiliser ce modèle.
Fonctions du modèle Web :
Activation en un clic, si elle est configurée par votre administrateur de clean room.
Utilisation en un clic des fournisseurs d’identité, s’ils ont été configurés par votre administrateur de clean room.
Soutien aux analyses gérées par les fournisseurs.
Les deux parties peuvent importer des données et spécifier des colonnes jointes (non visualisables), projetées (visualisables) et activables (qui peuvent être exportées vers un tiers désigné, si l’activation est activée).
Requête de chevauchement sur une table de consommateurs et une table de fournisseurs parmi les tables disponibles.
Confidentialité différentielle configurable.
Note
Essayez le tutoriel de l’interface Web pour voir une démonstration complète de l’utilisation des clean rooms dans l’application Web. Ce modèle est également abordé dans ce tutoriel.
Étape 1 : Le fournisseur crée la clean room¶
Voici comment un fournisseur crée et configure une clean room avec le modèle Audience Overlap & Segmentation :
Connectez-vous à l’application Web et créez une nouvelle clean room.
Sous Add Data, procédez comme suit :
Choisissez les tables à lier (importer) dans la clean room. Si les tables dont vous avez besoin ne sont pas annoncées, adressez-vous à un administrateur des clean rooms.
Sous Specify Join Policies, procédez comme suit :
Choisissez les colonnes qu’un collaborateur peut joindre à partir de vos tables. N’oubliez pas que les colonnes joignables ne peuvent pas non plus être affichées ou utilisées dans l’analyse à des fins de segmentation, de filtre ou de groupe.
Si vous souhaitez utiliser un fournisseur d’identité pour résoudre des entités qui peuvent avoir plusieurs identificateurs, par exemple une personne qui possède plusieurs comptes de courrier électronique dans différentes bases de données, choisissez un fournisseur d’identité à l’adresse Identity Hub.
Sous Configure Analysis & Query, procédez comme suit :
Sélectionnez Audience Overlap & Segmentation comme type d’analyse. (Vous pouvez sélectionner plusieurs modèles pour une clean room) Les options de configuration pour chaque modèle seront affichées sur la page.
Pour Tables, choisissez les tables que vous avez liées précédemment et qui devraient être disponibles pour les consommateurs dans cette clean room à l’aide de ce modèle.
Utilisez Segmentation & Attribute Columns pour choisir les colonnes à afficher dans les résultats de la requête. Le collaborateur peut afficher, filtrer et grouper les colonnes sélectionnées. Les collaborateurs peuvent activer ces valeurs d’attribut lorsque l’activation Snowflake est activée dans la clean room. Si une colonne ne figure pas dans cette liste, c’est probablement parce que vous l’avez marquée comme joignable. Or, une colonne ne peut pas être à la fois joignable et visible dans les résultats de la requête.
Allow categorical value previews during filtering spécifie si les aperçus affichent les valeurs réelles. Elle est activée par défaut s’il y a moins de 20 valeurs distinctes dans la colonne, mais désactivée par défaut s’il y a plus de 20 valeurs distinctes, afin de protéger PII.
Consultez la section Activation Settings pour activer, configurer ou désactiver l’activation des données de résultats :
Sélectionnez ID Columns qui devrait être disponible lors des cas d’utilisation de l’activation. Par défaut, les colonnes de la politique de jonction sont sélectionnées automatiquement.
Activez Allow non-overlap activation pour activer les IDs à partir de votre ensemble de données sans qu’il y ait de correspondance avec les IDs dans l’ensemble de données de votre collaborateur. Par exemple, si vous avez apporté 100 IDs et que vous avez effectué une analyse de chevauchement avec votre collaborateur et que seuls 25 IDs se chevauchent, l’activation sans chevauchement activera les 75 IDs non appariés de votre ensemble de données.
Consultez le site Enabled Partners pour vous assurer que seules vos destinations d’activation préférées sont activées dans votre clean room. Si vous avez besoin de modifier les destinations autorisées, adressez-vous à un administrateur des clean rooms.
Mettez à jour Privacy Settings par défaut si nécessaire :
Threshold Value est activée par défaut et réglée sur 5. Cela empêche l’affichage des résultats pour tout groupe dont le nombre de distinctions d’une colonne de politique de jointure est inférieur à ce seuil.
Differential Privacy est désactivé par défaut. Lorsqu’elle est activée, cette option fournit une protection contre les attaques potentielles par différenciation en ajoutant du bruit aux résultats et en limitant le nombre de requêtes quotidiennes. Apprenez-en plus sur Confidentialité différentielle dans Snowflake Data Clean Rooms et comprenez les coûts liés à l’activation de cette fonction.
Sous Share clean rooms, procédez comme suit :
Développez le menu Select collaborator pour ajouter des collaborateurs à la clean room. Les collaborateurs recevront un e-mail les invitant à se joindre à votre clean room et à l’utiliser, comme décrit ci-dessous. La liste des collaborateurs de la page affiche tous les comptes, y compris le vôtre, qui peuvent accéder à cette clean room.
Sélectionnez Enable run analysis and query à côté d’un collaborateur pour contrôler si ce compte peut exécuter un modèle dans la clean room. Par défaut, votre propre compte ne peut pas exécuter une analyse dans la clean room (c’est-à-dire que la fonction analyses exécutées par le fournisseur est désactivé par défaut). Par défaut, les consommateurs peuvent exécuter n’importe quel modèle dans la clean room.
Étape 2 : Le consommateur rejoint la clean room¶
Voici comment un consommateur rejoint et configure une clean room qui inclut le modèle d’analyse Audience Overlap & Segmentation :
Connectez-vous à l’application web et rejoignez la clean room.
Sous Add Data, procédez comme suit :
Choisissez les tables à lier (importer) dans la clean room. Si les tables dont vous avez besoin ne sont pas annoncées, adressez-vous à un administrateur des clean rooms.
Sous Specify Join Policies, procédez comme suit :
Déterminez quelles colonnes joignables de vos données mappent les colonnes joignables des données du fournisseur. Vous indiquerez laquelle de ces colonnes doit être jointe lors de chaque exécution.
Si vous souhaitez utiliser un fournisseur d’identité pour aider à résoudre des entités qui peuvent avoir plusieurs identificateurs - par exemple une personne qui a plusieurs comptes de messagerie dans différentes bases de données - choisissez un fournisseur d’identité dans le site Identity Hub.
Dans l’étape Configure Analysis & Query, procédez comme suit :
Sélectionnez l’analyse Audience Overlap & Segmentation pour afficher les options de configuration de ce modèle.
Choisissez dans le menu déroulant Tables la table à utiliser pour cette analyse.
Utilisez Segmentation & Attribute Columns pour choisir les colonnes à afficher dans les résultats de la requête. Ces colonnes peuvent également être activées lorsque l’activation Snowflake est activée dans la clean room. Si une colonne ne figure pas dans cette liste, c’est probablement parce que vous l’avez marquée comme joignable. Or, une colonne ne peut pas être à la fois joignable et visible dans les résultats de la requête.
Sélectionnez ID Columns qui devrait être disponible lors des cas d’utilisation de l’activation. Par défaut, les colonnes de la politique de jonction sont sélectionnées automatiquement.
Activez éventuellement Allow activation for clean room provider pour permettre au fournisseur de clean room d’activer les destinations d’activation prises en charge. Cette option n’est affichée que lorsque le fonctionnement par fournisseur est activé dans la clean room. Notez que l’activation de cette option permet aux données au niveau des lignes d’être réactivées sur le compte du fournisseur. Notez que le consommateur est facturé pour les coûts de calcul lors de l’exécution des requêtes et de l’activation du fournisseur, bien que le consommateur doive donner son accord pour autoriser l’action du fournisseur.
Examinez le site Enabled Partners pour vous assurer que les destinations d’activation préférées sont activées dans la clean room. Si vous avez l’exigence de modifier les destinations autorisées, contactez le fournisseur de la clean room.
Cliquez sur Finish pour enregistrer vos résultats. Pour exécuter l’analyse, reportez-vous à la section suivante.
Étape 3 : Le consommateur effectue l’analyse¶
Note
La configuration par défaut permet uniquement au consommateur d’exécuter une analyse à l’aide de ce modèle. Pour activer l’analyse effectuée par le fournisseur avec ce modèle, le fournisseur doit ouvrir l’onglet Share clean rooms dans la configuration de la clean room et sélectionner Enable run analysis and query à côté de son nom de compte.
Une fois que le fournisseur et le consommateur ont configuré la clean room pour le chevauchement et la segmentation de l’audience, l’une ou l’autre des parties disposant des autorisations nécessaires pour exécuter une analyse peut procéder de la manière suivante :
Dans l’application web, naviguez jusqu’à Clean rooms.
Sélectionnez Run pour la clean room où vous avez configuré le chevauchement des audiences, puis choisissez Audience Overlap & Segmentation > Proceed. (Vous pouvez également consulter la page Analyses & Queries, sélectionner + New Analysis & Query, choisir le type Audience Overlap & Segmentation, puis choisir la clean room pour laquelle ce type d’analyse a été configuré)
Paramétrez les détails de la course dans le site Query Configurations section:
My tables - Choisissez parmi vos tables celles qui seront jointes aux tables de votre collaborateur.
Collaborator table - Choisissez une table de collaborateurs à joindre à votre table.
My join columns - Sélectionnez toutes les colonnes à joindre entre les tables.
User segmentation - Sélectionnez éventuellement des colonnes de regroupement.
Filters - Il est possible de fournir un ou plusieurs filtres sur les colonnes spécifiées comme colonnes de segmentation et d’attributs lors de la configuration.
Privacy settings - Cette requête met en œuvre la confidentialité différentielle et un nombre minimum de lignes par groupe. Vous pouvez voir votre utilisation et la confidentialité différentielle restante et la taille minimale du groupe ici.
Si vous effectuez l’analyse en tant que consommateur, vous pouvez modifier la taille de l’entrepôt afin d’améliorer les temps de requête en sélectionnant un entrepôt plus grand ou de réduire les coûts en sélectionnant un entrepôt plus petit. Lorsque vous effectuez une analyse en tant que fournisseur, la sélection de l’entrepôt n’est pas disponible, mais la mise à l’échelle automatique tentera d’optimiser les temps de requête.
Sélectionnez Run. S’il s’agit d’une nouvelle requête, procédez comme suit :
Indiquez un nom pour votre analyse et votre requête.
En option, planifie une analyse répétitive.
Sélectionnez Save pour lancer ou planifier l’exécution. L’exécution de chaque cycle peut prendre un certain temps. Vous pouvez vérifier le statut ou les résultats de l’analyse sur la page Analysis & Queries de l’application web.
Utilisation du code¶
Vous pouvez télécharger et exécuter un échantillon de notebook montrant comment utiliser l’exemple de chevauchement et de segmentation dans le code SQL. Cet exemple peut être téléchargé et exécuté sur Snowsight.
Le notebook ne montre pas comment utiliser les fournisseurs d’identité, l’activation vers des fournisseurs tiers, ou les analyses gérées par les fournisseurs. Les liens ci-dessous montrent comment réaliser ces actions dans le code.
Conditions préalables
Vous devez avoir deux comptes dans la même organisation avec le programme Snowflake Data Clean Rooms installé. Utilisez un compte pour le fournisseur, l’autre pour le consommateur.
Installez et exécutez l’exemple de code
:download :
Téléchargez le notebook d'exemples </samples/clean-rooms/overlap-segmentation.ipynb>
.Installez le Notebooks dans vos comptes fournisseur et consommateur. Pour télécharger un notebook, procédez comme suit :
Naviguez jusqu’à Projects » Notebooks dans Snowsight.
Sélectionnez + Notebook » Import .ipynb file.
Sélectionnez le fichier .ipynb que vous avez téléchargé.
Nommez le fichier comme vous le souhaitez et choisissez une base de données et un schéma.
Conservez l’entrepôt par défaut
APP_WH
.Sélectionnez Create.
Ouvrez le carnet dans le compte fournisseur et complétez la partie fournisseur pour créer la clean room.
Ouvrez le Notebooks dans le compte du consommateur et complétez la partie consommateur pour installer et configurer la clean room et exécuter le modèle.