Categorias:

Funções de métricas de dados

DUPLICATE_COUNT (função de métricas de dados do sistema)

Retorna a contagem de valores de coluna que possuem duplicatas, incluindo valores NULL. Se você especificar mais de um argumento de coluna, retorna o número das linhas em que a combinação das colunas especificadas foi duplicada.

Se você quiser especificar mais de um argumento de coluna, não será possível chamar a função diretamente. Para obter um exemplo de associação da função a uma tabela para que você possa especificar vários argumentos de coluna, consulte Exemplos.

Sintaxe

SNOWFLAKE.CORE.DUPLICATE_COUNT(<query>)
Copy

Argumentos

query

Especifica uma consulta SQL que projeta uma ou mais colunas.

Tipos de dados permitidos

A coluna projetada por query deve ter um dos seguintes tipos de dados:

  • DATE

  • FLOAT

  • NUMBER

  • TIMESTAMP_LTZ

  • TIMESTAMP_NTZ

  • TIMESTAMP_TZ

  • VARCHAR

Retornos

A função retorna um valor escalar com um tipo de dados NUMBER.

Exemplo

Determinar o número de duplicatas nos números de segurança social dos US na coluna SSN:

SELECT SNOWFLAKE.CORE.DUPLICATE_COUNT(
  SELECT
    ssn
  FROM hr.tables.empl_info
);
Copy

Associar a DMF a uma tabela para determinar o número de duplicatas com base na combinação das colunas first_name e last_name:

ALTER TABLE t
  ADD DATA METRIC FUNCTION SNOWFLAKE.CORE.DUPLICATE_COUNT
    ON (first_name, last_name);
Copy