Massenladen aus Microsoft Azure¶
Wenn Sie bereits ein Microsoft Azure-Konto haben und Azure Blob-Speichercontainer für die Speicherung und Verwaltung Ihrer Datendateien verwenden, können Sie Ihre vorhandenen Container und Ordnerpfade für das Massenladen in Snowflake verwenden.
Unter diesem Thema wird beschrieben, wie Sie mit dem COPY-Befehl Daten aus einem Azure-Container in Tabellen laden können.
Snowflake unterstützt derzeit nur das Laden aus Blob-Speichern. Snowflake unterstützt die folgenden Typen von Speicherkonten:
Blob-Speicher
Data Lake Storage Gen2
General Purpose v1
General Purpose v2
Snowflake unterstützt nicht Data Lake Storage Gen1.
Bemerkung
Das Laden von Block-, Anhangs- und Seiten-Blobs wird unterstützt. Entladene Dateien werden als Block-Blobs erstellt. Informationen zu diesen Blob-Typen finden Sie in der Azure-Dokumentation zu Blob-Typen.
Wenn auf Data Lake Storage Gen2 ein hierarchischer Namespace aktiviert ist, unterstützt Snowflake nicht das Bereinigen von Dateien mit dem COPY-Befehl. Ein hierarchischer Namespace organisiert die Daten in Verzeichnissen und Unterverzeichnissen. In Azure können Sie nur leere Verzeichnisse löschen, was bedeutet, dass Sie Verzeichnisse nicht rekursiv löschen können, indem Sie die Option PURGE mit dem Befehl COPY verwenden.
Wie in der folgenden Abbildung dargestellt, erfolgt das Laden von Daten aus einem Azure-Container in zwei Schritten:
- Schritt 1::
Snowflake geht davon aus, dass die Datendateien bereits in einem Azure-Container bereitgestellt wurden. Wenn sie noch nicht bereitgestellt wurden, verwenden Sie die von Microsoft bereitgestellten Upload-Schnittstellen/Dienstprogramme, um die Dateien bereitzustellen.
- Schritt 2::
Verwenden Sie den Befehl COPY INTO <Tabelle>, um den Inhalt der bereitgestellten Datei(en) in eine Snowflake-Datenbanktabelle zu laden. Sie können direkt aus dem Bucket laden, aber Snowflake empfiehlt, einen externen Stagingbereich zu erstellen, der auf den Bucket verweist, und stattdessen den externen Stagingbereich zu verwenden.
Unabhängig davon, welche Methode Sie verwenden, erfordert dieser Schritt ein aktives, aktuelles virtuelles Warehouse für die Sitzung, wenn Sie den Befehl manuell oder aus einem Skript heraus ausführen. Das Warehouse stellt die Computeressourcen zur Verfügung, um das eigentliche Einfügen von Zeilen in die Tabelle durchzuführen.
Tipp
Die Anweisungen in diesem Themensatz gehen davon aus, dass Sie Vorbereiten des Ladens von Daten gelesen und ggf. ein benanntes Dateiformat erstellt haben.
Bevor Sie beginnen, sollten Sie vielleicht auch Hinweise zum Laden von Daten für bewährte Verfahren, Tipps und andere Hinweise lesen.
Nächste Themen:
Konfigurationsaufgaben (nach Bedarf ausführen):
Datenladeaufgaben (für jeden Satz von Dateien, die Sie laden, ausführen):