Verwenden einer Datenprofilerstellung, um Ihre Daten zu verstehen

Eine Datenprofilerstellung hilft Ihnen, die Struktur, den Inhalt und die Qualität Ihrer Datensets zu verstehen, indem es automatisch Statistiken wie Datentypen, Wertverteilungen, Anzahl von NULL-Werten und Eindeutigkeit erfasst. Das Datenprofil zeigt Muster, Anomalien und potenzielle Qualitätsprobleme auf, sodass Sie die Datenzuverlässigkeit bewerten und fundierte Entscheidungen darüber treffen können, wie Sie Ihre Daten bereinigen, transformieren oder effektiv nutzen können. Die Datenprofilerstellung vereinfacht den Weg zur kontinuierlichen Überwachung der Datenqualität, indem sie ohne manuelle Einrichtung Erkenntnisse liefert.

Das Datenprofil enthält die folgenden Statistiken:

  • Anzahl der Zeilen in der Tabelle.

  • Zeitpunkt der letzten Aktualisierung der Tabelle.

  • Wie viele NULL-Werte sich in einer Spalte befinden.

  • Mindest- und Maximalwerte in einer Spalte.

  • Die häufigsten Werte in einer Spalte.

Erste Schritte

Führen Sie die folgenden Schritte aus, um das Datenprofil einer Tabelle oder Ansicht anzuzeigen:

  1. Melden Sie sich bei Snowsight an.

  2. Wählen Sie im Navigationsmenü die Option Catalog » :ui:`Database Explorer`und dann die Tabelle oder Ansicht aus.

  3. Wählen Sie die Registerkarte Data Quality aus.

  4. Wählen Sie Data Profile aus.

Hinweise zu Warehouses

Die Datenprofilerstellung führt im Hintergrund SQL-Abfragen aus, um Informationen zu einer Tabelle oder Ansicht anzuzeigen. Snowflake empfiehlt die Verwendung eines Warehouse der Größe X-Small, um diese Abfragen auszuführen. Bei höheren Workloads kann die Leistung jedoch durch die Verwendung eines größeren Warehouse verbessert werden. Im Allgemeinen verbrauchen größere Warehouses mehr Credits.

Standardmäßig wird für die Datenprofilerstellung das Warehouse verwendet, das als Standard für den aktuellen Benutzer eingestellt ist. Um ein anderes Warehouse auszuwählen, verwenden Sie die Dropdown-Liste oben auf der Seite.