Catégories :

Fonctions de métrique des données

DUPLICATE_COUNT (fonction de métrique des données système)

Renvoie le nombre de valeurs de colonne qui ont des doublons, y compris les valeurs NULL.

Cette rubrique fournit la syntaxe pour appeler la fonction directement. Pour savoir comment associer la fonction à une table ou à une vue afin qu’elle s’exécute à intervalles réguliers, voir Association d’une DMF pour automatiser les contrôles de qualité des données.

Syntaxe

SNOWFLAKE.CORE.DUPLICATE_COUNT(<query>)
Copy

Arguments

query

Spécifie une requête SQL qui projette une seule colonne.

Types de données autorisés

La colonne projetée par query doit posséder l’un des types de données suivants :

  • DATE

  • FLOAT

  • NUMBER

  • TIMESTAMP_LTZ

  • TIMESTAMP_NTZ

  • TIMESTAMP_TZ

  • VARCHAR

Renvoie

La fonction renvoie une valeur scalaire d’un type de données NUMBER.

Exemple

Déterminez le nombre de numéros de Sécurité sociale US en double dans la colonne SSN :

SELECT SNOWFLAKE.CORE.DUPLICATE_COUNT(
  SELECT
    ssn
  FROM hr.tables.empl_info
);
Copy
+---------------------------------------------------------------------+
| SNOWFLAKE.CORE.DUPLICATE_COUNT(SELECT ssn FROM hr.tables.empl_info) |
+---------------------------------------------------------------------+
| 0                                                                   |
+---------------------------------------------------------------------+