Utiliser le profilage des données pour comprendre vos données¶
Le profilage des données vous aide à comprendre la structure, le contenu et la qualité de vos ensembles de données en rassemblant automatiquement des statistiques telles que les types de données, les distributions de valeurs, le nombre de valeurs NULL et l’unicité. Le profil des données révèle des modèles, des anomalies et des problèmes de qualité potentiels, ce qui vous permet d’évaluer la fiabilité de vos données et de prendre des décisions éclairées sur la manière de nettoyer, de transformer ou d’utiliser efficacement vos données. Le profilage des données simplifie le processus de surveillance continue de la qualité des données en fournissant des informations sans configuration manuelle.
Le profil des données comprend les statistiques suivantes :
Nombre de lignes de la table.
Dernière mise à jour de la table.
Nombre de valeurs NULL dans une colonne.
Valeurs minimale et maximale dans une colonne.
Valeurs les plus courantes dans une colonne.
Prise en main¶
Pour afficher le profil des données d’une table ou d’une vue, procédez comme suit :
Connectez-vous à Snowsight.
Dans le menu de navigation, sélectionnez Catalog » Database Explorer, puis sélectionnez la table ou la vue.
Sélectionnez l’onglet Data Quality.
Sélectionnez Data Profile.
Considérations relatives aux entrepôts¶
Le profilage des données exécute des requêtes SQL en arrière-plan pour afficher des informations sur une table ou une vue. Snowflake recommande d’utiliser un entrepôt X-Small pour exécuter ces requêtes ; toutefois, les charges de travail plus importantes peuvent présenter une amélioration des performances lorsqu’un entrepôt plus grand est utilisé. En règle générale, les entrepôts plus grands consomment plus de crédits.
Par défaut, le profilage des données utilise l’entrepôt qui est défini par défaut pour l’utilisateur actuel. Pour sélectionner un autre entrepôt, utilisez la liste déroulante en haut de la page.