System-Datenmetrikfunktion

Dieses Thema ist eine Referenz für die System-Datenmetrikfunktionen (DMFs), die Snowflake für alle Konten bereitstellt.

Sie können diese System-DMFs aufrufen, um sofort mit der Messung Ihrer Datenqualität zu beginnen.

Allgemeine Informationen zu System-DMFs

Snowflake stellt System-DMFs im Schema CORE der freigegebenen SNOWFLAKE-Datenbank bereit. System-DMFs werden von Snowflake verwaltet. Sie können den Namen oder die Funktionalität einer System-DMF nicht ändern.

Mit jeder System-DMF können Sie ein anderes Attribut der Datenqualität messen. Sie können einer Tabelle oder Ansicht mehr als eine System-DMF zuweisen, um eine umfassendere Messung der Datenqualität zu ermöglichen, die Ihren Anforderungen an Governance und Compliance entspricht.

Um eine System-DMF zu verwenden, wählen Sie eine der folgenden Zugriffssteuerungsmethoden aus:

  • Weisen Sie die Datenbankrolle DATA_METRIC_USER der Rolle des Tabelleneigentümers zu, d. h. der Rolle mit der Berechtigung OWNERSHIP für die Tabelle. Diese Datenbankrolle hat die USAGE-Berechtigung für das Schema SNOWFLAKE.CORE und die Berechtigung USAGE für alle System-DMFs im Schema SNOWFLAKE.CORE.

    Weisen Sie der Rolle des Tabelleneigentümers außerdem die folgenden Berechtigungen zu:

    Berechtigung

    Objekt

    Anmerkungen

    EXECUTE DATA METRIC FUNCTION

    Konto

    Mit dieser Berechtigung können Sie steuern, welche Rollen Zugriff auf serverlose Computeressourcen haben, um die System-DMF aufzurufen.

    USAGE

    Datenbank, Schema

    Diese Objekte sind die Datenbank und das Schema, die die „table.referenced“-Tabelle enthalten, mit der die DMF verknüpft ist.

  • Weisen Sie IMPORTED PRIVILEGES in der SNOWFLAKE-Datenbank der Rolle des Tabelleneigentümers zu. Weitere Informationen dazu finden Sie unter Ermöglicht anderen Rollen die Verwendung von Schemas in der SNOWFLAKE-Datenbank..

  • Verwenden Sie die Rolle ACCOUNTADMIN.

System-DMFs

Derzeit unterstützt Snowflake die folgenden System-DMFs, um gängige Kennzahlen zu messen, ohne sie definieren zu müssen:

Kategorie

System-DMF

Beschreibung

Genauigkeit

BLANK_COUNT

Ermitteln Sie, wie viele leere Werte in einer Spalte enthalten sind.

BLANK_PERCENT

Ermitteln Sie, wie viel Prozent der Werte in einer Spalte leer sind.

NULL_COUNT

Bestimmen Sie, wie viele NULL-Werte sich in einer Spalte befinden.

NULL_PERCENT

Ermitteln Sie, wie viel Prozent der Werte in einer Spalte NULL sind.

Aktualität

FRESHNESS

Bestimmen Sie die Aktualität der Daten einer Tabelle anhand einer Zeitstempelspalte.

DATA_METRIC_SCHEDULE_TIME

Definieren der benutzerdefinierten Aktualitäts-Metriken.

Statistiken

AVG

Bestimmen Sie den Durchschnittswert einer Spalte.

MAX

Bestimmen Sie den Höchstwert einer Spalte.

MIN

Bestimmen Sie den Mindestwert einer Spalte.

STDDEV

Bestimmen Sie den Wert der Standardabweichung für eine Spalte.

Eindeutigkeit

ACCEPTED_VALUES

Ermitteln Sie, ob Werte in einer Spalte mit einem booleschen Ausdruck übereinstimmen.

DUPLICATE_COUNT

Ermitteln Sie die Anzahl der doppelten Werte in einer Spalte, einschließlich der NULL-Werte.

UNIQUE_COUNT

Ermitteln Sie die Anzahl der Werte in einer Spalte, die eindeutig und nicht NULL sind.

Volume

ROW_COUNT

Ermitteln Sie, wie viele Datensätze sich in der Tabelle oder Ansicht befinden.