Étape 1. Créer des objets de format de fichier

Lorsque vous chargez des fichiers de données d’un compartiment S3 dans une table, vous devez décrire le format du fichier et spécifier comment les données du fichier doivent être interprétées et traitées. Par exemple, si vous chargez des données délimitées par des barres verticales à partir d’un fichier CSV, vous devez spécifier que le fichier utilise le format CSV avec des symboles de barre verticale comme délimiteurs.

Lorsque vous exécutez la commande COPY INTO <table> vous spécifiez ces informations de format. Vous pouvez soit spécifier ces informations sous forme d’options dans la commande (par exemple TYPE = CSV, FIELD_DELIMITER = '|', etc.), soit spécifier un objet de format de fichier qui contient ces informations de format. Vous pouvez créer un objet de format de fichier nommé à l’aide de la commande CREATE FILE FORMAT.

Dans cette étape, vous créez des objets de format de fichier décrivant le format des données CSV et JSON d’exemple fournies pour ce tutoriel.

Création d’un objet de format de fichier pour des données CSV

Exécutez la commande CREATE FILE FORMAT pour créer le format de fichier mycsvformat.

CREATE OR REPLACE FILE FORMAT mycsvformat
   TYPE = 'CSV'
   FIELD_DELIMITER = '|'
   SKIP_HEADER = 1;
Copy

Où :

  • TYPE = 'CSV' indique le type de format du fichier source. CSV est le type de format de fichier par défaut.

  • FIELD_DELIMITER = '|' indique que le caractère « | » est un séparateur de champ. La valeur par défaut est « , ».

  • SKIP_HEADER = 1 indique que le fichier source comprend une ligne d’en-tête. La commande COPY ignore ces lignes d’en-tête lors du chargement des données. La valeur par défaut est 0.

Création d’un objet de format de fichier pour des données JSON

Exécutez la commande CREATE FILE FORMAT pour créer le format de fichier myjsonformat.

CREATE OR REPLACE FILE FORMAT myjsonformat
  TYPE = 'JSON'
  STRIP_OUTER_ARRAY = TRUE;
Copy

Où :

  • TYPE = 'JSON' indique le type de format du fichier source.

  • STRIP_OUTER_ARRAY = TRUE indique à la commande COPY d’exclure les crochets ([]) lors du chargement de données dans la table.

Suivant : Étape 2. Création d’objets préparés