Etapa 1. Criação de objetos de formato de arquivo¶
Quando você carrega arquivos de dados de um bucket S3 em uma tabela, você deve descrever o formato do arquivo e especificar como os dados no arquivo devem ser interpretados e processados. Por exemplo, se você estiver carregando dados delimitados por barras verticais de um arquivo CSV, você deverá especificar que o arquivo usa o formato CSV com símbolos de barras verticais como delimitadores.
Quando você executa o comando COPY INTO <tabela>, você especifica esta informação de formato. Você pode especificar estas informações como opções no comando (por exemplo, TYPE = CSV
, FIELD_DELIMITER = '|'
etc.) ou pode especificar um objeto de formato de arquivo que contenha estas informações de formato. Você pode criar um objeto de formato de arquivo nomeado usando o comando CREATE FILE FORMAT.
Nesta etapa, você cria objetos de formato de arquivo descrevendo o formato dos dados de amostra CSV e JSON fornecidos para este tutorial.
Criação de um objeto de formato de arquivo para dados CSV¶
Execute o comando CREATE FILE FORMAT para criar o formato de arquivo mycsvformat
.
CREATE OR REPLACE FILE FORMAT mycsvformat
TYPE = 'CSV'
FIELD_DELIMITER = '|'
SKIP_HEADER = 1;
Onde:
TYPE = 'CSV'
indica o tipo de formato do arquivo de origem. CSV é o tipo de formato de arquivo padrão.FIELD_DELIMITER = '|'
indica que o caractere “|” é um separador de campo. O valor padrão é “,”.SKIP_HEADER = 1
indica que o arquivo de origem inclui uma linha de cabeçalho. O comando COPY ignora essas linhas de cabeçalho ao carregar dados. O valor padrão é 0.
Criação de um objeto de formato de arquivo para dados JSON¶
Execute o comando CREATE FILE FORMAT para criar o formato de arquivo myjsonformat
.
CREATE OR REPLACE FILE FORMAT myjsonformat TYPE = 'JSON' STRIP_OUTER_ARRAY = TRUE;
Onde:
TYPE = 'JSON'
indica o tipo de formato do arquivo de origem.STRIP_OUTER_ARRAY = TRUE
direciona o comando COPY para excluir os colchetes ([]) ao carregar dados na tabela.
Próximo: Etapa 2. Criar objetos de preparação