Préparation du déchargement de données

Ce chapitre fournit une vue d’ensemble des formats de fichier de données pris en charge pour le déchargement des données.

Dans ce chapitre :

Formats de fichier pris en charge

Les formats de fichiers suivants sont pris en charge :

Structuré/Semi-structuré

Type

Remarques

Structuré

Délimité (CSV, TSV, etc.)

Tout délimiteur à un seul octet valide est pris en charge. La valeur par défaut est la virgule (c.-à-d. CSV).

Semi-structuré

JSON, Parquet

Les options de format de fichier spécifient le type de données contenues dans un fichier, ainsi que d’autres caractéristiques relatives au format des données. Les options de format de fichier que vous pouvez spécifier sont différentes selon le type de données que vous déchargez. Snowflake fournit un ensemble complet d’options de format de fichier par défaut.

Données semi-structurées

Lorsque vous effectuez un déchargement vers des fichiers JSON, Snowflake sort vers le format standard ndjson (« Newline Delimited JSON »).

Spécification des options de format de fichier

Les options de format de fichier individuelles peuvent être spécifiées à l’un des emplacements suivants :

  • Dans la définition d’une table.

  • Dans la définition d’une zone de préparation nommée. Pour plus d’informations, voir CREATE STAGE.

  • Directement dans une commande COPY INTO <emplacement> lors du déchargement de données.

De plus, pour simplifier le déchargement de données, Snowflake prend en charge la création de formats de fichier nommé qui sont des objets de base de données encapsulant toutes les informations de format requises. Les formats de fichier nommé peuvent ensuite être utilisés comme entrée aux mêmes endroits où vous pouvez spécifier des options de format de fichier individuelles, aidant ainsi à simplifier le processus de déchargement de données pour des données formatées de façon similaire.

Les formats de fichier nommé sont facultatifs, mais sont recommandés lorsque vous prévoyez de décharger régulièrement des données au format similaire.

Création d’un format de fichier nommé

Vous pouvez créer un format de fichier en utilisant l’interface Web ou SQL :

Interface Web

Cliquez sur Databases Databases tab » <nom_bdd> » File Formats

SQL

CREATE FILE FORMAT

Pour des descriptions détaillées de toutes les options de format de fichier, voir CREATE FILE FORMAT.

Exemples

L’exemple suivant crée un format de fichier nommé CSV avec un délimiteur de champ spécifié :

CREATE OR REPLACE FILE FORMAT my_csv_unload_format
  TYPE = 'CSV'
  FIELD_DELIMITER = '|';

L’exemple suivant crée un format de fichier nommé JSON :

CREATE OR REPLACE FILE FORMAT my_json_unload_format
  TYPE = 'JSON';