Resumo dos recursos de carregamento de dados¶
Este tópico fornece uma referência rápida dos recursos com suporte para usar o comando COPY INTO <tabela> para carregar dados de arquivos em tabelas Snowflake.
Neste tópico:
Detalhes de arquivos de dados¶
A tabela a seguir descreve os detalhes gerais dos arquivos usados para carregar dados:
Recurso |
Com suporte |
Notas |
---|---|---|
Local de arquivos |
Ambiente local |
Os arquivos são primeiro copiados (“preparados”) para um estágio interno (Snowflake) e depois carregados em uma tabela. |
Amazon S3 |
Os arquivos podem ser carregados diretamente de qualquer bucket fornecido pelo usuário. |
|
Google Cloud Storage |
Os arquivos podem ser carregados diretamente de qualquer bucket fornecido pelo usuário. |
|
Armazenamento em nuvem Microsoft Azure
|
Os arquivos podem ser carregados diretamente de qualquer contêiner fornecido pelo usuário. |
|
Formatos de arquivo |
Arquivos delimitados (CSV, TSV, etc.) |
Qualquer delimitador válido tem suporte; o padrão é vírgula (ou seja, CSV). |
|
||
Codificação de arquivos |
Específico de formato de arquivo |
Para arquivos delimitados (CSV, TSV, etc.), o conjunto de caracteres padrão é UTF-8. Para utilizar qualquer outro conjunto de caracteres, é necessário especificar explicitamente a codificação a ser utilizada para o carregamento. Para a lista de conjuntos de caracteres com suporte, consulte Conjuntos de caracteres com suporte para arquivos delimitados (neste tópico). |
Para formatos de arquivo semiestruturados (JSON, Avro, etc.), o único conjunto de caracteres com suporte é UTF-8. |
Conjuntos de caracteres com suporte para arquivos delimitados¶
A tabela a seguir lista os conjuntos de caracteres de codificação com suporte para carregar dados de arquivos delimitados (CSV, TSV, etc.):
Conjunto de caracteres |
Valor |
Linguagens suportadas |
Notas |
---|---|---|---|
Big5 |
|
Chinês Tradicional |
|
EUC-JP |
|
Japonês |
|
EUC-KR |
|
Coreano |
|
GB18030 |
|
Chinês |
|
IBM420 |
|
Árabe |
|
IBM424 |
|
Hebraico |
|
ISO-2022-CN |
|
Chinês simplificado |
|
ISO-2022-JP |
|
Japonês |
|
ISO-2022-KR |
|
Coreano |
|
ISO-8859-1 |
|
Alemão, Dinamarquês, Espanhol, Francês, Holandês, Inglês, Italiano, Norueguês, Português, Sueco |
|
ISO-8859-2 |
|
Tcheco, Húngaro, Polonês, Romeno |
|
ISO-8859-5 |
|
Russo |
|
ISO-8859-6 |
|
Árabe |
|
ISO-8859-7 |
|
Grego |
|
ISO-8859-8 |
|
Hebraico |
|
ISO-8859-9 |
|
Turco |
|
ISO-8859-15 |
|
Alemão, Dinamarquês, Espanhol, Francês, Holandês, Inglês, Italiano, Norueguês, Português, Sueco |
Idêntico a ISO-8859-1 exceto para 8 caracteres, incluindo o símbolo da moeda Euro. |
KOI8-R |
|
Russo |
|
Shift_JIS |
|
Japonês |
|
UTF-8 |
|
Todos os idiomas |
Para carregar dados de arquivos delimitados (CSV, TSV etc.), UTF-8 é o padrão. . . Para carregar dados de todos os outros formatos de arquivo suportados (JSON, Avro etc.), bem como descarregar dados, o UTF-8 é o único conjunto de caracteres suportado. |
UTF-16 |
|
Todos os idiomas |
|
UTF-16BE |
|
Todos os idiomas |
|
UTF-16LE |
|
Todos os idiomas |
|
UTF-32 |
|
Todos os idiomas |
|
UTF-32BE |
|
Todos os idiomas |
|
UTF-32LE |
|
Todos os idiomas |
|
windows-1250 |
|
Tcheco, Húngaro, Polonês, Romeno |
|
windows-1251 |
|
Russo |
|
windows-1252 |
|
Alemão, Dinamarquês, Espanhol, Francês, Holandês, Inglês, Italiano, Norueguês, Português, Sueco |
|
windows-1253 |
|
Grego |
|
windows-1254 |
|
Turco |
|
windows-1255 |
|
Hebraico |
|
windows-1256 |
|
Árabe |
Compressão de arquivos preparados¶
A tabela a seguir descreve como o Snowflake lida com a compressão de arquivos de dados para carregamento. As opções são diferentes dependendo se os arquivos estão preparados, com compressão ou sem compressão:
Recurso |
Com suporte |
Notas |
---|---|---|
Arquivos sem compressão |
gzip |
Ao preparar arquivos sem compressão em um estágio do Snowflake, os arquivos são automaticamente comprimidos usando gzip, a menos que a compressão seja explicitamente desativada. |
Arquivos com compressão |
gzip bzip2 deflate raw_deflate |
O Snowflake pode detectar automaticamente qualquer um destes métodos de compressão ou você pode especificar explicitamente o método que foi usado para comprimir os arquivos. |
Brotli Zstandard |
A autodetecção não tem suporte ainda para arquivos com compressão Brotli; ao preparar ou carregar arquivos compactados com Brotli, você deve especificar explicitamente o método de compressão que foi usado. |
Criptografia de arquivos preparados¶
A tabela a seguir descreve como o Snowflake lida com a criptografia dos arquivos de dados para carregamento. As opções são diferentes, dependendo se os arquivos são preparados com ou sem criptografia:
Recurso |
Com suporte |
Notas |
---|---|---|
Arquivos não criptografados |
Chaves de 128 ou 256 bits |
Ao preparar arquivos não criptografados em um local interno do Snowflake, os arquivos são automaticamente criptografados usando chaves de 128 bits. Chaves de 256 bits podem ser habilitadas (para criptografia mais forte); no entanto, é necessária uma configuração adicional. |
Arquivos criptografados |
Chave fornecida pelo usuário |
Os arquivos que já estão criptografados podem ser carregados no Snowflake a partir do armazenamento em nuvem externo; a chave usada para criptografar os arquivos deve ser fornecida ao Snowflake. |