Collaboration de modélisation des audiences similaires¶

À propos du modèle¶

Le modèle de modélisation des audiences similaires vous permet de découvrir et de cibler de nouveaux clients à forte valeur ajoutée, qui reflètent vos clients existants les plus rentables. En entraînant un modèle de machine learning XGBoost personnalisé dans une salle blanche de données de collaboration Snowflake, vous pouvez améliorer considérablement vos efforts marketing sans jamais exposer ou partager des données brutes entre les parties.

Cet exemple utilise un pipeline en trois étapes basé sur des tables internes pour les workflows en plusieurs étapes. Chaque étape enregistre ses résultats dans une table interne dans la salle blanche, et l’étape suivante lit les données à partir de cette table. Cela offre à l’annonceur un point de décision après chaque étape :

Entraînement : créez un modèle XGBoost sur l’audience de départ. Examinez la qualité du modèle (AUC, taux d’erreur) avant de poursuivre.
Évaluation : évaluez la population complète de l’éditeur en utilisant le modèle entraîné. Examinez la taille de l’audience avant l’activation.
Activation : envoyez l’audience similaire évaluée au compte de l’éditeur.

Cet exemple illustre une collaboration à deux parties où l’éditeur est le propriétaire de la collaboration et fournit une offre de données, un bundle de code contenant deux UDFs Python (une pour l’entraînement, une pour l’évaluation) et trois modèles (entraînement, évaluation, activation). L’annonceur rejoint la collaboration, lie ses données d’audience de départ et exécute les trois modèles en séquence.

Rôles de collaboration¶


Collaborateur	Rôles	Actions
Éditeur	Propriétaire, fournisseur de données	Enregistre une offre de données (fonctionnalités utilisateur, y compris l’état de l’adhésion, la tranche d’âge, la région et le niveau d’activité), un bundle de code avec des UDFs Python pour l’entraînement et la notation de modèles, ainsi que trois modèles (entraînement, évaluation, activation), puis crée la collaboration. Une fois que l’annonceur a activé les résultats, l’éditeur affiche et traite les données d’audience similaire.
Annonceur	Exécutant d’analyses, fournisseur de données (à lui-même)	Enregistre une offre de données (audience de départ avec des montants d’achat et des segments). Joint la collaboration, lie les données et exécute le pipeline en trois étapes : forme le modèle, évalue la population et active l’audience évaluée auprès de l’éditeur.

Cas d’utilisation clés¶

Acquisition de clients : recherchez de nouveaux clients qui sont similaires à vos clients existants les plus importants en créant un modèle prédictif basé sur des fonctionnalités partagées.
**Augmentation du ROI : ** améliorez le retour sur investissement de vos campagnes marketing en ciblant les utilisateurs qui sont statistiquement plus susceptibles d’acheter.
Développement de la portée du marché : découvrez de nouveaux segments de marché que vous n’avez peut-être pas pris en compte auparavant, en fonction des modèles de fonctionnalités de votre audience de départ.
Publicité personnalisée : proposez des expériences publicitaires plus pertinentes et personnalisées en ciblant une audience similaire basée sur les données plutôt que sur des données démographiques étendues.

Obtenir les feuilles de calcul et le modèle¶

Téléchargez les feuilles de calcul et installez-les dans deux comptes Snowflake distincts de la même organisation et du même environnement d’hébergement Cloud. Ces feuilles de calcul montrent comment créer et gérer une collaboration avec un modèle de modélisation d’audience similaire que vous pouvez utiliser et modifier.

Étape 1 : Générer des données d’échantillon¶

Générez des exemples de données dans vos comptes d’éditeur et d’annonceur en exécutant le générateur d’échantillons de données Python.

Téléchargez le générateur de tables de données d’échantillon Python.

Astuce

Pour exécuter le générateur de données d’échantillon :

Dans Snowsight, allez dans Projets> Feuilles de calcul > + > Feuille de calcul Python.
Collez le contenu du fichier téléchargé dans la feuille de calcul.
Définissez Gestionnaire ** sur ``main`` et **Type de retour sur String.
Mettez à jour les variables DATABASE_NAME et``SCHEMA_NAME`` avec vos valeurs.
Sélectionner l”exécution

Étape 2 : Exécuter les feuilles de calcul de l’éditeur et de l’annonceur¶

Après avoir généré des échantillons de données, téléchargez et exécutez les feuilles de calcul de l’éditeur et de l’annonceur. Exécutez ces feuilles de calcul en utilisant le même rôle que celui que vous avez utilisé pour générer les données d’échantillon. Consultez les instructions pour charger une feuille de calcul SQL dans votre compte Snowflake.