Resumo dos recursos de carregamento de dados

Este tópico fornece uma referência rápida dos recursos com suporte para usar o comando COPY INTO <tabela> para carregar dados de arquivos em tabelas Snowflake.

Neste tópico:

Detalhes de arquivos de dados

A tabela a seguir descreve os detalhes gerais dos arquivos usados para carregar dados:

Recurso

Com suporte

Notas

Local de arquivos

Ambiente local

Os arquivos são primeiro copiados (“preparados”) para um estágio interno (Snowflake) e depois carregados em uma tabela.

Amazon S3

Os arquivos podem ser carregados diretamente de qualquer bucket fornecido pelo usuário.

Google Cloud Storage

Os arquivos podem ser carregados diretamente de qualquer bucket fornecido pelo usuário.

Armazenamento em nuvem Microsoft Azure

  • Armazenamento de blobs

  • Data Lake Storage Gen2

  • Uso geral v1

  • Uso geral v2

Os arquivos podem ser carregados diretamente de qualquer contêiner fornecido pelo usuário.

Formatos de arquivo

Arquivos delimitados (CSV, TSV, etc.)

Qualquer delimitador válido tem suporte; o padrão é vírgula (ou seja, CSV).

Formatos semiestruturados

Unstructured formats

Codificação de arquivos

Específico de formato de arquivo

Para arquivos delimitados (CSV, TSV, etc.), o conjunto de caracteres padrão é UTF-8. Para utilizar qualquer outro conjunto de caracteres, é necessário especificar explicitamente a codificação a ser utilizada para o carregamento. Para a lista de conjuntos de caracteres com suporte, consulte Conjuntos de caracteres com suporte para arquivos delimitados (neste tópico).

Para formatos de arquivo semiestruturados (JSON, Avro, etc.), o único conjunto de caracteres com suporte é UTF-8.

Conjuntos de caracteres com suporte para arquivos delimitados

A tabela a seguir lista os conjuntos de caracteres de codificação com suporte para carregar dados de arquivos delimitados (CSV, TSV, etc.):

Conjunto de caracteres

Valor ENCODING 

Linguagens suportadas

Notas

Big5

BIG5

Chinês Tradicional

EUC-JP

EUCJP

Japonês

EUC-KR

EUCKR

Coreano

GB18030

GB18030

Chinês

IBM420

IBM420

Árabe

IBM424

IBM424

Hebraico

IBM949

IBM949

Coreano

ISO-2022-CN

ISO2022CN

Chinês simplificado

ISO-2022-JP

ISO2022JP

Japonês

ISO-2022-KR

ISO2022KR

Coreano

ISO-8859-1

ISO88591

Alemão, Dinamarquês, Espanhol, Francês, Holandês, Inglês, Italiano, Norueguês, Português, Sueco

ISO-8859-2

ISO88592

Tcheco, Húngaro, Polonês, Romeno

ISO-8859-5

ISO88595

Russo

ISO-8859-6

ISO88596

Árabe

ISO-8859-7

ISO88597

Grego

ISO-8859-8

ISO88598

Hebraico

ISO-8859-9

ISO88599

Turco

ISO-8859-15

ISO885915

Alemão, Dinamarquês, Espanhol, Francês, Holandês, Inglês, Italiano, Norueguês, Português, Sueco

Idêntico a ISO-8859-1 exceto para 8 caracteres, incluindo o símbolo da moeda Euro.

KOI8-R

KOI8R

Russo

Shift_JIS

SHIFTJIS

Japonês

UTF-8

UTF8

Todos os idiomas

Para carregar dados de arquivos delimitados (CSV, TSV etc.), UTF-8 é o padrão. . . Para carregar dados de todos os outros formatos de arquivo suportados (JSON, Avro etc.), bem como descarregar dados, o UTF-8 é o único conjunto de caracteres suportado.

UTF-16

UTF16

Todos os idiomas

UTF-16BE

UTF16BE

Todos os idiomas

UTF-16LE

UTF16LE

Todos os idiomas

UTF-32

UTF32

Todos os idiomas

UTF-32BE

UTF32BE

Todos os idiomas

UTF-32LE

UTF32LE

Todos os idiomas

windows-949

WINDOWS949

Coreano

windows-1250

WINDOWS1250

Tcheco, Húngaro, Polonês, Romeno

windows-1251

WINDOWS1251

Russo

windows-1252

WINDOWS1252

Alemão, Dinamarquês, Espanhol, Francês, Holandês, Inglês, Italiano, Norueguês, Português, Sueco

windows-1253

WINDOWS1253

Grego

windows-1254

WINDOWS1254

Turco

windows-1255

WINDOWS1255

Hebraico

windows-1256

WINDOWS1256

Árabe

Compressão de arquivos preparados

A tabela a seguir descreve como o Snowflake lida com a compressão de arquivos de dados para carregamento. As opções são diferentes dependendo se os arquivos estão preparados, com compressão ou sem compressão:

Recurso

Com suporte

Notas

Arquivos sem compressão

gzip

Ao preparar arquivos sem compressão em um estágio do Snowflake, os arquivos são automaticamente comprimidos usando gzip, a menos que a compressão seja explicitamente desativada.

Arquivos com compressão

gzip

bzip2

deflate

raw_deflate

O Snowflake pode detectar automaticamente qualquer um destes métodos de compressão ou você pode especificar explicitamente o método que foi usado para comprimir os arquivos.

Brotli

Zstandard

A autodetecção não tem suporte ainda para arquivos com compressão Brotli; ao preparar ou carregar arquivos compactados com Brotli, você deve especificar explicitamente o método de compressão que foi usado.

Criptografia de arquivos preparados

A tabela a seguir descreve como o Snowflake lida com a criptografia dos arquivos de dados para carregamento. As opções são diferentes, dependendo se os arquivos são preparados com ou sem criptografia:

Recurso

Com suporte

Notas

Arquivos não criptografados

Chaves de 128 ou 256 bits

Todos os arquivos armazenados em estágios internos para operações de carregamento e descarregamento de dados são criptografados automaticamente usando criptografia forte AES-256 no lado do servidor. Por padrão, o Snowflake fornece criptografia adicional do lado do cliente com uma chave de 128 bits (com a opção de configurar uma chave de 256 bits).

Arquivos criptografados

Chave fornecida pelo usuário

Os arquivos que já estão criptografados podem ser carregados no Snowflake a partir do armazenamento em nuvem externo; a chave usada para criptografar os arquivos deve ser fornecida ao Snowflake.