Übersicht der Funktionen zum Entladen von Daten¶
Unter diesem Thema wird ein kurzer Überblick über die unterstützten Funktionen bei Verwendung des Befehls COPY INTO <Speicherort> gegeben, der dem Entladen von Daten aus Snowflake-Tabellen in Flatfiles dient.
Beachten Sie, dass einige der unterstützten Funktionen, insbesondere Komprimierung und Verschlüsselung, davon abhängen, ob die Entladung an einen internen Snowflake-Speicherort oder einen externen Speicherort (Amazon S3, Google Cloud Storage oder Microsoft Azure) erfolgt.
Unter diesem Thema:
Details zur Ausgabedatendatei¶
In der folgenden Tabelle werden die allgemeinen Details für die Ausgabedateien beschrieben, die von Snowflake beim Entladen von Daten generiert werden:
Funktion |
Unterstützt |
Anmerkungen |
---|---|---|
Speicherort der Dateien |
Lokale Dateien |
Dateien werden zunächst an einen internen Speicherort von Snowflake entladen und können dann lokal mit GET heruntergeladen werden. |
Dateien in Amazon S3 |
Dateien können direkt in einen vom Benutzer in S3 bereitgestellten Bucket entladen und dann mit AWS-Dienstprogrammen lokal heruntergeladen werden. |
|
Dateien in Google Cloud Storage |
Dateien können direkt in einen vom Benutzer in Cloud Storage bereitgestellten Container entladen und dann mit Cloud Storage-Dienstprogrammen lokal heruntergeladen werden. |
|
Dateien in Microsoft Azure |
Dateien können direkt in einen vom Benutzer in Azure bereitgestellten Container entladen und dann lokal mit Azure-Dienstprogrammen heruntergeladen werden. |
|
Dateiformate |
Dateien mit Trennzeichen (CSV, TSV usw.) |
Es werden alle gültigen Trennzeichen unterstützt. Der Standard ist Komma (d. h. CSV). |
JSON |
||
Parquet |
||
Dateicodierung |
UTF-8 |
Ausgabedateien werden unabhängig vom Dateiformat immer mit UTF-8 codiert. Andere Zeichensätze werden nicht unterstützt. |
Bemerkung
Das Entladen von Daten, das auf Computern mit beschränktem Arbeitsspeicher ausgeführt wird, kann zu kleineren Dateien führen.
Komprimierung von Ausgabedatendateien¶
In der folgenden Tabelle wird beschrieben, wie Snowflake die Komprimierung der Ausgabedateien handhabt, die Snowflake beim Entladen von Daten generiert:
Speicherort der Dateien |
Unterstützt |
Anmerkungen |
---|---|---|
Interner oder externer Speicherort |
gzip |
Standardmäßig werden alle entladenen Datendateien mit gzip komprimiert, es sei denn, die Komprimierung ist explizit deaktiviert oder eine der anderen unterstützten Komprimierungsmethoden ist explizit angegeben. |
bzip2 |
||
Brotli |
||
Zstandard |
Bemerkung
Es ist ein bekanntes Problem, dass wir derzeit keine Unterstützung der Einstellung CONTENT-ENCODING für Azure und Google Cloud Platform unterstützen, wenn compression=gzip
.
Verschlüsselung von Ausgabedatendateien¶
In der folgenden Tabelle wird beschrieben, wie Snowflake die Verschlüsselung der Ausgabedateien handhabt, die Snowflake beim Entladen von Daten generiert. Die Optionen unterscheiden sich je nachdem, ob die Dateien an einen internen Speicherort (d. h. Snowflake-Stagingbereich) oder einen externen Speicherort (d. h. Amazon S3, Google Cloud Storage oder Microsoft Azure) entladen werden.
Speicherort der Dateien |
Unterstützt |
Anmerkungen |
---|---|---|
Interner Speicherort |
128-Bit- oder 256-Bit-Schlüssel |
Alle Datendateien, die an interne Speicherorte von Snowflake entladen werden, werden automatisch mit 128-Bit-Schlüsseln verschlüsselt. Die Dateien sind unverschlüsselt, wenn sie in das lokale Verzeichnis heruntergeladen werden. 256-Bit-Schlüssel können aktiviert werden (für eine stärkere Verschlüsselung), es ist jedoch eine zusätzliche Konfiguration erforderlich. |
Externer Speicherort |
Benutzerdefinierter Schlüssel |
Datendateien, die in Cloudspeicher entladen werden, können verschlüsselt werden, wenn Snowflake ein Sicherheitsschlüssel (zur Verschlüsselung der Dateien) zur Verfügung gestellt wird. |