Catégories :

Fonctions de métrique des données

DUPLICATE_COUNT (fonction de métrique des données système)

Renvoie le nombre de valeurs de colonne qui ont des doublons, y compris les valeurs NULL. Si vous spécifiez plus d’un argument de colonne, renvoie le nombre de lignes dans lesquelles la combinaison des colonnes spécifiées est dupliquée.

Si vous souhaitez spécifier plus d’un argument de colonne, vous ne pouvez pas appeler directement la fonction. Pour un exemple d’association de la fonction à une table afin de pouvoir spécifier plusieurs arguments de colonne, voir Exemples.

Syntaxe

SNOWFLAKE.CORE.DUPLICATE_COUNT(<query>)
Copy

Arguments

query

Spécifie une requête SQL qui projette une ou plusieurs colonnes.

Types de données autorisés

Les colonnes projetées par query doivent posséder l’un des types de données suivants :

  • DATE

  • FLOAT

  • NUMBER

  • TIMESTAMP_LTZ

  • TIMESTAMP_NTZ

  • TIMESTAMP_TZ

  • VARCHAR

Renvoie

La fonction renvoie une valeur scalaire d’un type de données NUMBER.

Exemple

Déterminez le nombre de numéros de Sécurité sociale US en double dans la colonne SSN :

SELECT SNOWFLAKE.CORE.DUPLICATE_COUNT(
  SELECT
    ssn
  FROM hr.tables.empl_info
);
Copy

Associez la DMF à une table pour déterminer le nombre de doublons en fonction de la combinaison des colonnes first_name et last_name :

ALTER TABLE t
  ADD DATA METRIC FUNCTION SNOWFLAKE.CORE.DUPLICATE_COUNT
    ON (first_name, last_name);
Copy