Résumé des fonctions de déchargement de données

Ce chapitre fournit une référence rapide des fonctions prises en charge pour l’utilisation de la commande COPY INTO <emplacement> pour décharger des données de tables Snowflake vers des fichiers plats.

Notez que certaines des fonctions prises en charge, en particulier la compression et le chiffrement, sont dictées par le fait que vous déchargez vers un emplacement interne Snowflake ou vers un emplacement externe (c.-à-d. Amazon S3, Google Cloud Storage ou Microsoft Azure).

Dans ce chapitre :

Détails du fichier de données de sortie

Le tableau suivant décrit les détails généraux des fichiers de sortie générés par Snowflake lors du déchargement de données :

Fonctionnalité

Pris en charge

Remarques

Emplacement des fichiers

Fichiers locaux

Les fichiers sont d’abord déchargés vers un emplacement interne Snowflake, puis peuvent être téléchargés localement à l’aide de GET.

Fichiers dans Amazon S3

Les fichiers peuvent être déchargés directement vers un compartiment quelconque fourni par l’utilisateur dans S3, puis peuvent être téléchargés localement à l’aide des utilitaires AWS.

Fichiers dans Google Cloud Storage

Les fichiers peuvent être déchargés directement vers un conteneur quelconque fourni par l’utilisateur dans Cloud Storage, puis peuvent être téléchargés localement à l’aide des utilitaires Cloud Storage.

Fichiers dans Microsoft Azure

Les fichiers peuvent être déchargés directement vers un conteneur quelconque fourni par l’utilisateur dans Azure, puis peuvent être téléchargés localement à l’aide des utilitaires Azure.

Formats de fichier

Fichiers délimités (CSV, TSV, etc.)

Tout délimiteur valide est pris en charge. La valeur par défaut est la virgule (c-à-d. CSV).

JSON

Parquet

Codage de fichier

UTF-8

Les fichiers de sortie sont toujours encodés en UTF-8, quel que soit le format de fichier ; aucun autre jeu de caractères n’est pris en charge.

Note

Les décharges exécutées sur des machines dont la mémoire est saturée peuvent produire des fichiers de taille plus réduite.

Compression de fichiers de données de sortie

Le tableau suivant décrit comment Snowflake gère la compression des fichiers de sortie générés par Snowflake lors du déchargement de données :

Emplacement des fichiers

Pris en charge

Remarques

Emplacement interne ou externe

gzip

Par défaut, tous les fichiers de données déchargés sont compressés à l’aide de gzip, sauf si la compression est explicitement désactivée ou si l’une des autres méthodes de compression prises en charge est explicitement indiquée.

bzip2

Brotli

Zstandard

Note

Il est connu que nous ne prenons pas actuellement en charge le paramètre CONTENT-ENCODING pour Azure et Google Cloud Platform lorsque compression=gzip.

Chiffrement de fichiers de données de sortie

Le tableau suivant décrit comment Snowflake gère le chiffrement des fichiers de sortie générés par Snowflake lors du déchargement de données. Les options diffèrent selon que les fichiers sont déchargés vers un emplacement interne (c.-à-d. une zone de préparation Snowflake) ou un emplacement externe (Amazon S3, Google Cloud Storage ou Microsoft Azure) :

Emplacement des fichiers

Pris en charge

Remarques

Emplacement interne

Clés 128 bits ou 256 bits

Tous les fichiers de données déchargés vers des emplacements internes Snowflake sont automatiquement chiffrés à l’aide de clés 128 bits. Les fichiers ne sont pas chiffrés lorsqu’ils sont téléchargés dans le répertoire local.

Des clés 256 bits peuvent être activées (pour un chiffrement plus puissant), mais une configuration supplémentaire est nécessaire.

Emplacement externe

Clé fournie par l’utilisateur

Les fichiers de données déchargés vers un stockage Cloud peuvent être chiffrés si une clé de sécurité (pour chiffrer les fichiers) est fournie à Snowflake.