Categorias:

Funções de métricas de dados

DUPLICATE_COUNT (função de métricas de dados do sistema)

Retorna a contagem de valores de coluna que possuem duplicatas, incluindo valores NULL.

This topic provides the syntax for calling the function directly. To learn how to associate the function with a table or view so it runs at regular intervals, see Associe uma DMF para automatizar as verificações de qualidade dos dados.

Sintaxe

SNOWFLAKE.CORE.DUPLICATE_COUNT(<query>)
Copy

Argumentos

query

Especifica uma consulta SQL que projeta uma única coluna.

Tipos de dados permitidos

A coluna projetada pela query deve ter um dos seguintes tipos de dados:

  • DATE

  • FLOAT

  • NUMBER

  • TIMESTAMP_LTZ

  • TIMESTAMP_NTZ

  • TIMESTAMP_TZ

  • VARCHAR

Retornos

A função retorna um valor escalar com um tipo de dados NUMBER.

Exemplo

Determinar o número de duplicatas nos números de segurança social dos US na coluna SSN:

SELECT SNOWFLAKE.CORE.DUPLICATE_COUNT(
  SELECT
    ssn
  FROM hr.tables.empl_info
);
Copy
+---------------------------------------------------------------------+
| SNOWFLAKE.CORE.DUPLICATE_COUNT(SELECT ssn FROM hr.tables.empl_info) |
+---------------------------------------------------------------------+
| 0                                                                   |
+---------------------------------------------------------------------+