- Kategorien:
DUPLICATE_COUNT (System-Datenmetrikfunktion)¶
Gibt die Anzahl der Spaltenwerte zurück, die Duplikate aufweisen, einschließlich NULL-Werte. Wenn Sie mehr als ein Spaltenargument angeben, wird die Anzahl der Zeilen zurückgegeben, in denen die Kombination der angegebenen Spalten dupliziert wird.
Wenn Sie mehr als ein Spaltenargument angeben möchten, können Sie die Funktion nicht direkt aufrufen. Ein Beispiel für die Verknüpfung der Funktion mit einer Tabelle, sodass Sie mehrere Spaltenargumente angeben können, finden Sie unter Beispiele.
Syntax¶
SNOWFLAKE.CORE.DUPLICATE_COUNT(<query>)
Argumente¶
queryGibt eine SQL-Abfrage an, die eine oder mehrere Spalten projiziert.
Zulässige Datentypen¶
Die Spalten, die von der query projiziert werden, muss einen der folgenden Datentypen haben:
DATE
FLOAT
NUMBER
TIMESTAMP_LTZ
TIMESTAMP_NTZ
TIMESTAMP_TZ
VARCHAR
Rückgabewerte¶
Die Funktion gibt einen Einzelwert vom Datentyp NUMBER zurück.
Beispiel¶
Ermitteln der Anzahl der doppelten US-Sozialversicherungsnummern in der Spalte SSN:
SELECT SNOWFLAKE.CORE.DUPLICATE_COUNT(
SELECT
ssn
FROM hr.tables.empl_info
);
Verknüpfen Sie die DMF mit einer Tabelle, um die Anzahl der Duplikate basierend auf der Kombination der first_name- und``last_name``-Spalten zu bestimmen:
ALTER TABLE t
ADD DATA METRIC FUNCTION SNOWFLAKE.CORE.DUPLICATE_COUNT
ON (first_name, last_name);