Preparação para descarregar dados

Este tópico fornece uma visão geral dos formatos de arquivos de dados com suporte para descarregar dados.

Neste tópico:

Formatos de arquivo suportados

Os seguintes formatos de arquivo são suportados:

Estruturado/semiestruturado

Tipo

Notas

Estruturado

Delimitado (CSV, TSV, etc.)

Qualquer delimitador de byte único válido é suportado; o padrão é vírgula (ou seja, CSV).

Semiestruturado

JSON, Parquet

As opções de formato de arquivo especificam o tipo de dados contidos em um arquivo, assim como outras características relacionadas ao formato dos dados. As opções de formato de arquivo que você pode especificar são diferentes, dependendo do tipo de dados que você está descarregando. O Snowflake fornece um conjunto completo de padrões de opções de formato de arquivo.

Dados semiestruturados

Ao descarregar para arquivos JSON, o Snowflake usa o formato padrão ndjson (“Newline Delimited JSON“).

Especificação das opções de formato de arquivo

As opções de formato de arquivo individuais podem ser especificadas em qualquer um dos seguintes lugares:

  • Na definição de uma tabela.

  • Na definição de um estágio nomeado. Para obter mais informações, consulte CREATE STAGE.

  • Diretamente em um comando COPY INTO <local> ao descarregar dados.

Além disso, para simplificar o descarregamento de dados, o Snowflake suporta a criação de formatos de arquivos nomeados, que são objetos de banco de dados que encapsulam todas as informações de formato necessárias. Os formatos de arquivo nomeados podem então ser usados como entrada em todos os mesmos lugares onde você pode especificar opções individuais de formato de arquivo, ajudando assim a agilizar o processo de descarregamento de dados para dados com formato semelhante.

Os formatos de arquivos nomeados são opcionais, mas são recomendados quando você planeja descarregar regularmente dados com formatos semelhantes.

Criação de um formato de arquivo nomeado

Você pode criar um formato de arquivo usando ou a interface da Web ou SQL:

Classic Console

Clique em Databases Databases tab » <nome_bd> » File Formats

SQL

CREATE FILE FORMAT

Para descrições detalhadas de todas as opções de formato de arquivo, consulte CREATE FILE FORMAT.

Exemplos

O exemplo seguinte cria um formato de arquivo chamado CSV com um delimitador de campo especificado:

CREATE OR REPLACE FILE FORMAT my_csv_unload_format
  TYPE = 'CSV'
  FIELD_DELIMITER = '|';
Copy

O exemplo seguinte cria um formato de arquivo chamado JSON:

CREATE OR REPLACE FILE FORMAT my_json_unload_format
  TYPE = 'JSON';
Copy