Resumo dos recursos de carregamento de dados¶
Este tópico fornece uma referência rápida dos recursos com suporte para usar o comando COPY INTO <tabela> para carregar dados de arquivos em tabelas Snowflake.
Neste tópico:
Detalhes de arquivos de dados¶
A tabela a seguir descreve os detalhes gerais dos arquivos usados para carregar dados:
Recurso |
Com suporte |
Notas |
---|---|---|
Local de arquivos |
Ambiente local |
Os arquivos são primeiro copiados (“preparados”) para um estágio interno (Snowflake) e depois carregados em uma tabela. |
Amazon S3 |
Os arquivos podem ser carregados diretamente de qualquer bucket fornecido pelo usuário. |
|
Google Cloud Storage |
Os arquivos podem ser carregados diretamente de qualquer bucket fornecido pelo usuário. |
|
Armazenamento em nuvem Microsoft Azure
|
Os arquivos podem ser carregados diretamente de qualquer contêiner fornecido pelo usuário. |
|
Formatos de arquivo |
Arquivos delimitados (CSV, TSV, etc.) |
Qualquer delimitador válido tem suporte; o padrão é vírgula (ou seja, CSV). |
|
||
Codificação de arquivos |
Específico de formato de arquivo |
Para arquivos delimitados (CSV, TSV, etc.), o conjunto de caracteres padrão é UTF-8. Para utilizar qualquer outro conjunto de caracteres, é necessário especificar explicitamente a codificação a ser utilizada para o carregamento. Para a lista de conjuntos de caracteres com suporte, consulte Conjuntos de caracteres com suporte para arquivos delimitados (neste tópico). |
Para formatos de arquivo semiestruturados (JSON, Avro, etc.), o único conjunto de caracteres com suporte é UTF-8. |
Conjuntos de caracteres com suporte para arquivos delimitados¶
A tabela a seguir lista os conjuntos de caracteres de codificação com suporte para carregar dados de arquivos delimitados (CSV, TSV, etc.):
Conjunto de caracteres |
Valor |
Linguagens suportadas |
Notas |
---|---|---|---|
Big5 |
|
Chinês Tradicional |
|
EUC-JP |
|
Japonês |
|
EUC-KR |
|
Coreano |
|
GB18030 |
|
Chinês |
|
IBM420 |
|
Árabe |
|
IBM424 |
|
Hebraico |
|
IBM949 |
|
Coreano |
|
ISO-2022-CN |
|
Chinês simplificado |
|
ISO-2022-JP |
|
Japonês |
|
ISO-2022-KR |
|
Coreano |
|
ISO-8859-1 |
|
Alemão, Dinamarquês, Espanhol, Francês, Holandês, Inglês, Italiano, Norueguês, Português, Sueco |
|
ISO-8859-2 |
|
Tcheco, Húngaro, Polonês, Romeno |
|
ISO-8859-5 |
|
Russo |
|
ISO-8859-6 |
|
Árabe |
|
ISO-8859-7 |
|
Grego |
|
ISO-8859-8 |
|
Hebraico |
|
ISO-8859-9 |
|
Turco |
|
ISO-8859-15 |
|
Alemão, Dinamarquês, Espanhol, Francês, Holandês, Inglês, Italiano, Norueguês, Português, Sueco |
Idêntico a ISO-8859-1 exceto para 8 caracteres, incluindo o símbolo da moeda Euro. |
KOI8-R |
|
Russo |
|
Shift_JIS |
|
Japonês |
|
UTF-8 |
|
Todos os idiomas |
Para carregar dados de arquivos delimitados (CSV, TSV etc.), UTF-8 é o padrão. . . Para carregar dados de todos os outros formatos de arquivo suportados (JSON, Avro etc.), bem como descarregar dados, o UTF-8 é o único conjunto de caracteres suportado. |
UTF-16 |
|
Todos os idiomas |
|
UTF-16BE |
|
Todos os idiomas |
|
UTF-16LE |
|
Todos os idiomas |
|
UTF-32 |
|
Todos os idiomas |
|
UTF-32BE |
|
Todos os idiomas |
|
UTF-32LE |
|
Todos os idiomas |
|
windows-949 |
|
Coreano |
|
windows-1250 |
|
Tcheco, Húngaro, Polonês, Romeno |
|
windows-1251 |
|
Russo |
|
windows-1252 |
|
Alemão, Dinamarquês, Espanhol, Francês, Holandês, Inglês, Italiano, Norueguês, Português, Sueco |
|
windows-1253 |
|
Grego |
|
windows-1254 |
|
Turco |
|
windows-1255 |
|
Hebraico |
|
windows-1256 |
|
Árabe |
Compressão de arquivos preparados¶
A tabela a seguir descreve como o Snowflake lida com a compressão de arquivos de dados para carregamento. As opções são diferentes dependendo se os arquivos estão preparados, com compressão ou sem compressão:
Recurso |
Com suporte |
Notas |
---|---|---|
Arquivos sem compressão |
gzip |
Ao preparar arquivos sem compressão em um estágio do Snowflake, os arquivos são automaticamente comprimidos usando gzip, a menos que a compressão seja explicitamente desativada. |
Arquivos com compressão |
gzip bzip2 deflate raw_deflate |
O Snowflake pode detectar automaticamente qualquer um destes métodos de compressão ou você pode especificar explicitamente o método que foi usado para comprimir os arquivos. |
Brotli Zstandard |
A autodetecção não tem suporte ainda para arquivos com compressão Brotli; ao preparar ou carregar arquivos compactados com Brotli, você deve especificar explicitamente o método de compressão que foi usado. |
Criptografia de arquivos preparados¶
A tabela a seguir descreve como o Snowflake lida com a criptografia dos arquivos de dados para carregamento. As opções são diferentes, dependendo se os arquivos são preparados com ou sem criptografia:
Recurso |
Com suporte |
Notas |
---|---|---|
Arquivos não criptografados |
Chaves de 128 ou 256 bits |
Todos os arquivos armazenados em estágios internos para operações de carregamento e descarregamento de dados são criptografados automaticamente usando criptografia forte AES-256 no lado do servidor. Por padrão, o Snowflake fornece criptografia adicional do lado do cliente com uma chave de 128 bits (com a opção de configurar uma chave de 256 bits). |
Arquivos criptografados |
Chave fornecida pelo usuário |
Os arquivos que já estão criptografados podem ser carregados no Snowflake a partir do armazenamento em nuvem externo; a chave usada para criptografar os arquivos deve ser fornecida ao Snowflake. |