Continuous data pipeline examples¶
Unter diesem Thema finden Sie praktische Beispiele für Anwendungsfälle von Datenpipelines.
Voraussetzungen¶
Die Rolle, die zum Ausführen der SQL-Anweisungen in diesen Beispielen verwendet wird, erfordert die folgenden Zugriffssteuerungsrechte:
EXECUTE TASKGlobale EXECUTE TASK-Berechtigung zum Ausführen von Aufgaben
USAGEUSAGE-Berechtigungen für die Datenbank und das Schema, in denen die SQL-Anweisungen ausgeführt werden, sowie für das Warehouse, in dem in diesen Beispielen alle Aufgaben ausgeführt werden.
CREATE objectVerschiedene
CREATE object-Berechtigungen für das Schema, in dem die SQL-Anweisungen ausgeführt werden, um Objekte wie Tabellen, Streams und Aufgaben zu erstellen.
Weitere Informationen zur Zugriffssteuerung in Snowflake finden Sie unter Übersicht zur Zugriffssteuerung.
Transform loaded JSON data on a schedule¶
Im folgenden Beispiel werden JSON-Rohdaten in eine einzige Zieltabelle mit dem Namen raw geladen. Zwei Aufgaben führen Abfragen auf Tabellenstreams aus, die in der Tabelle raw erstellt wurden, und fügen Teilmengen von Zeilen in mehrere Tabellen ein. Da bei jeder Aufgabe die Change Data Capture-Datensätze eines Tabellenstreams verwendet werden, sind mehrere Datenstreams erforderlich.
Unload data on a schedule¶
Im folgenden Beispiel werden die Change Data Capture-Datensätze in einem Stream in eine interne (d. h. Snowflake) Stagingbereich entladen.
Refresh external table metadata on a schedule¶
Im folgenden Beispiel werden die Metadaten einer externen Tabelle mit dem Namen mydb.myschema.exttable (unter Verwendung von ALTER EXTERNAL TABLE … REFRESH) nach einem Zeitplan aktualisiert.
Bemerkung
Wenn eine externe Tabelle erstellt wird, wird der Parameter AUTO_REFRESH standardmäßig auf TRUE gesetzt. Wir empfehlen, diesen Standardwert für externe Tabellen zu akzeptieren, die auf Datendateien in Amazon S3- oder Microsoft Azure-Stagingbereichen verweisen. Die Option für die automatische Aktualisierung ist derzeit jedoch nicht für externe Tabellen verfügbar, die auf Google Cloud Storage-Stagingbereiche verweisen. Für diese externen Tabellen kann es hilfreich sein, die Metadaten nach einem Zeitplan manuell zu aktualisieren.