Categorias:

Funções de métricas de dados

DUPLICATE_COUNT (função de métricas de dados do sistema)

Retorna a contagem de valores de coluna que possuem duplicatas, incluindo valores NULL.

Este tópico fornece a sintaxe para chamar a função diretamente. Para saber como associar a função a uma tabela ou visualização para que seja executada em intervalos regulares, consulte Associe uma DMF para automatizar as verificações de qualidade dos dados.

Sintaxe

SNOWFLAKE.CORE.DUPLICATE_COUNT(<query>)
Copy

Argumentos

query

Especifica uma consulta SQL que projeta uma única coluna.

Tipos de dados permitidos

A coluna projetada pela query deve ter um dos seguintes tipos de dados:

  • DATE

  • FLOAT

  • NUMBER

  • TIMESTAMP_LTZ

  • TIMESTAMP_NTZ

  • TIMESTAMP_TZ

  • VARCHAR

Retornos

A função retorna um valor escalar com um tipo de dados NUMBER.

Exemplo

Determinar o número de duplicatas nos números de segurança social dos US na coluna SSN:

SELECT SNOWFLAKE.CORE.DUPLICATE_COUNT(
  SELECT
    ssn
  FROM hr.tables.empl_info
);
Copy
+---------------------------------------------------------------------+
| SNOWFLAKE.CORE.DUPLICATE_COUNT(SELECT ssn FROM hr.tables.empl_info) |
+---------------------------------------------------------------------+
| 0                                                                   |
+---------------------------------------------------------------------+