- Kategorien:
DUPLICATE_COUNT (System-Datenmetrikfunktion)¶
Gibt die Anzahl der Spaltenwerte zurück, die Duplikate aufweisen, einschließlich NULL-Werte.
In diesem Thema wird die Syntax für den direkten Aufruf der Funktion bereitgestellt. Wie Sie die Funktion mit einer Tabelle oder Ansicht verknüpfen, sodass sie in regelmäßigen Abständen ausgeführt wird, erfahren Sie unter Eine DMF verknüpfen, um Datenqualitätsprüfungen zu automatisieren.
Syntax¶
SNOWFLAKE.CORE.DUPLICATE_COUNT(<query>)
Argumente¶
queryGibt eine SQL-Abfrage an, die eine einzelne Spalte projiziert.
Zulässige Datentypen¶
Die Spalte, die von der query projiziert wird, muss einen der folgenden Datentypen haben:
DATE
FLOAT
NUMBER
TIMESTAMP_LTZ
TIMESTAMP_NTZ
TIMESTAMP_TZ
VARCHAR
Rückgabewerte¶
Die Funktion gibt einen Einzelwert vom Datentyp NUMBER zurück.
Beispiel¶
Ermitteln der Anzahl der doppelten US-Sozialversicherungsnummern in der Spalte SSN:
SELECT SNOWFLAKE.CORE.DUPLICATE_COUNT(
SELECT
ssn
FROM hr.tables.empl_info
);
+---------------------------------------------------------------------+
| SNOWFLAKE.CORE.DUPLICATE_COUNT(SELECT ssn FROM hr.tables.empl_info) |
+---------------------------------------------------------------------+
| 0 |
+---------------------------------------------------------------------+