Übersicht der Funktionen zum Entladen von Daten

Unter diesem Thema wird ein kurzer Überblick über die unterstützten Funktionen bei Verwendung des Befehls COPY INTO <Speicherort> gegeben, der dem Entladen von Daten aus Snowflake-Tabellen in Flatfiles dient.

Beachten Sie, dass einige der unterstützten Funktionen, insbesondere Komprimierung und Verschlüsselung, davon abhängen, ob die Entladung an einen internen Snowflake-Speicherort oder einen externen Speicherort (Amazon S3, Google Cloud Storage oder Microsoft Azure) erfolgt.

Unter diesem Thema:

Details zur Ausgabedatendatei

In der folgenden Tabelle werden die allgemeinen Details für die Ausgabedateien beschrieben, die von Snowflake beim Entladen von Daten generiert werden:

Funktion

Unterstützt

Anmerkungen

Speicherort der Dateien

Lokale Dateien

Dateien werden zunächst an einen internen Speicherort von Snowflake entladen und können dann lokal mit GET heruntergeladen werden.

Dateien in Amazon S3

Dateien können direkt in einen vom Benutzer in S3 bereitgestellten Bucket entladen und dann mit AWS-Dienstprogrammen lokal heruntergeladen werden.

Dateien in Google Cloud Storage

Dateien können direkt in einen vom Benutzer in Cloud Storage bereitgestellten Container entladen und dann mit Cloud Storage-Dienstprogrammen lokal heruntergeladen werden.

Dateien in Microsoft Azure

Dateien können direkt in einen vom Benutzer in Azure bereitgestellten Container entladen und dann lokal mit Azure-Dienstprogrammen heruntergeladen werden.

Dateiformate

Dateien mit Trennzeichen (CSV, TSV usw.)

Es werden alle gültigen Trennzeichen unterstützt. Der Standard ist Komma (d. h. CSV).

JSON

Parquet

Dateicodierung

UTF-8

Ausgabedateien werden unabhängig vom Dateiformat immer mit UTF-8 codiert. Andere Zeichensätze werden nicht unterstützt.

Bemerkung

Das Entladen von Daten, das auf Computern mit beschränktem Arbeitsspeicher ausgeführt wird, kann zu kleineren Dateien führen.

Komprimierung von Ausgabedatendateien

In der folgenden Tabelle wird beschrieben, wie Snowflake die Komprimierung der Ausgabedateien handhabt, die Snowflake beim Entladen von Daten generiert:

Speicherort der Dateien

Unterstützt

Anmerkungen

Interner oder externer Speicherort

gzip

Standardmäßig werden alle entladenen Datendateien mit gzip komprimiert, es sei denn, die Komprimierung ist explizit deaktiviert oder eine der anderen unterstützten Komprimierungsmethoden ist explizit angegeben.

bzip2

Brotli

Zstandard

Bemerkung

Es ist ein bekanntes Problem, dass wir derzeit keine Unterstützung der Einstellung CONTENT-ENCODING für Azure und Google Cloud Platform unterstützen, wenn compression=gzip.

Verschlüsselung von Ausgabedatendateien

In der folgenden Tabelle wird beschrieben, wie Snowflake die Verschlüsselung der Ausgabedateien handhabt, die Snowflake beim Entladen von Daten generiert. Die Optionen unterscheiden sich je nachdem, ob die Dateien an einen internen Speicherort (d. h. Snowflake-Stagingbereich) oder einen externen Speicherort (d. h. Amazon S3, Google Cloud Storage oder Microsoft Azure) entladen werden.

Speicherort der Dateien

Unterstützt

Anmerkungen

Interner Speicherort

128-Bit- oder 256-Bit-Schlüssel

Alle Datendateien, die an interne Speicherorte von Snowflake entladen werden, werden automatisch mit 128-Bit-Schlüsseln verschlüsselt. Die Dateien sind unverschlüsselt, wenn sie in das lokale Verzeichnis heruntergeladen werden.

256-Bit-Schlüssel können aktiviert werden (für eine stärkere Verschlüsselung), es ist jedoch eine zusätzliche Konfiguration erforderlich.

Externer Speicherort

Benutzerdefinierter Schlüssel

Datendateien, die in Cloudspeicher entladen werden, können verschlüsselt werden, wenn Snowflake ein Sicherheitsschlüssel (zur Verschlüsselung der Dateien) zur Verfügung gestellt wird.