Tabelas Apache Iceberg™¶

As tabelas Apache Iceberg™ do Snowflake combinam o desempenho e a semântica de consulta das tabelas típicas do Snowflake com o armazenamento em nuvem externo que você gerencia. Elas são ideais para data lakes existentes que você não pode ou optou por não armazenar no Snowflake.

As tabelas Iceberg usam a especificação de formato aberto de tabela Apache Iceberg™, que fornece uma camada de abstração em arquivos de dados armazenados em formatos abertos e oferece suporte a recursos como:

Transações ACID (atomicidade, consistência, isolamento, durabilidade)
Evolução do esquema
Particionamento oculto
Instantâneos de tabela

O Snowflake aceita tabelas Iceberg que usam o formato de arquivo Apache Parquet™.

Introdução¶

Para começar com as tabelas Iceberg, consulte Tutorial: Crie sua primeira tabela Apache Iceberg™.

Como funciona¶

Esta seção fornece informações específicas para trabalhar com tabelas Iceberg no Snowflake. Para saber mais sobre a especificação do formato da tabela Iceberg, consulte a documentação oficial do Apache Iceberg e as Especificações da tabela Iceberg.

Armazenamento de dados
Catálogo
Metadados e instantâneos
Suporte entre nuvens/entre regiões
Faturamento

Armazenamento de dados¶

As tabelas Iceberg armazenam seus dados e arquivos de metadados em um local de armazenamento em nuvem externo (Amazon S3, Google Cloud Storage ou Azure Storage). O armazenamento externo não faz parte do Snowflake. Você é responsável por todo o gerenciamento do local de armazenamento em nuvem externo, incluindo a configuração da proteção e recuperação de dados. O Snowflake não fornece armazenamento Fail-safe para tabelas Iceberg.

O Snowflake se conecta ao seu local de armazenamento usando um volume externo, e as tabelas Iceberg não incorrem em custos de armazenamento Snowflake. Para obter mais informações, consulte Faturamento.

Para saber mais sobre armazenamento para tabelas Iceberg, consulte Armazenamento para tabelas Apache Iceberg™.

Volume externo¶

Um volume externo é um objeto Snowflake nomeado ao nível de conta, que você usa para conectar o Snowflake ao seu armazenamento em nuvem externo para tabelas Iceberg. Um volume externo armazena uma entidade de gerenciamento de identidade e acesso (IAM) para seu local de armazenamento. O Snowflake usa a entidade de IAM para se conectar com segurança ao seu armazenamento e acessar dados de tabela, metadados Iceberg e arquivos de manifesto que armazenam o esquema de tabela, partições e outros metadados.

Um único volume externo pode oferecer suporte a uma ou mais tabelas Iceberg.

Para configurar um volume externo para tabelas Iceberg, consulte Configuração de um volume externo.

Catálogo¶

Um catálogo Iceberg permite que um mecanismo de computação gerencie e carregue tabelas Iceberg. O catálogo forma a primeira camada de arquitetura na especificação da tabela Iceberg e deve oferecer suporte ao seguinte:

Armazenar o ponteiro de metadados atual para uma ou mais tabelas Iceberg. Um ponteiro de metadados mapeia o nome de uma tabela para o local do arquivo de metadados atual dessa tabela.
Executar operações atômicas para que você possa atualizar o ponteiro de metadados atual de uma tabela.

Para saber mais sobre os catálogos Iceberg, consulte a documentação do Apache Iceberg.

O Snowflake oferece suporte a diferentes opções de catálogo. Por exemplo, você pode usar o Snowflake como o catálogo Iceberg ou usar uma integração de catálogo para conectar o Snowflake a um catálogo Iceberg externo.

Integração de catálogo¶

Uma integração de catálogo é um objeto Snowflake nomeado no nível de conta que armazena informações sobre como os metadados da tabela são organizados para os seguintes cenários:

Quando você não usa o Snowflake como catálogo Iceberg. Por exemplo, você precisa de uma integração de catálogo, se sua tabela for gerenciada pelo AWS Glue.
Quando você deseja fazer a integração ao Snowflake Open Catalog para:
- Consultar uma tabela Iceberg no Snowflake Open Catalog usando Snowflake.
- Sincronizar uma tabela Iceberg gerenciada pelo Snowflake com o Snowflake Open Catalog para que mecanismos de computação de terceiros possam consulta a tabela.

Uma única integração de catálogo pode oferecer suporte a uma ou mais tabelas Iceberg que usam o mesmo catálogo externo.

Para configurar uma integração de catálogo, consulte Configurar uma integração de catálogo.

Metadados e instantâneos¶

Iceberg usa um modelo de consulta baseado em instantâneo, onde os arquivos de dados são mapeados usando arquivos de manifesto e metadados. Um instantâneo representa o estado de uma tabela em um determinado momento e é usado para acessar o conjunto completo de arquivos de dados na tabela.

Para saber mais sobre metadados da tabela e suporte a Time Travel, consulte Metadados e retenção para tabelas Apache Iceberg™.

Suporte entre nuvens/entre regiões¶

O Snowflake oferece suporte ao uso de um local de armazenamento de volume externo com um provedor de nuvem diferente (em uma região diferente) daquele que hospeda sua conta Snowflake.


Tipo de tabela	Suporte entre nuvens/entre regiões	Notas
Tabelas que usam um catálogo externo com uma integração de catálogo	✔	Se sua conta Snowflake e seu volume externo estiverem em regiões diferentes, sua conta externa de armazenamento em nuvem incorrerá em custos de saída quando você consultar a tabela.
Tabelas que usam o Snowflake como o catálogo	✔	Se sua conta Snowflake e seu volume externo estiverem em regiões diferentes, sua conta externa de armazenamento em nuvem incorrerá em custos de saída quando você consultar a tabela. Essas tabelas incorrem em custos para o uso de transferência de dados entre regiões. Para obter mais informações, consulte Faturamento.

Faturamento¶

O Snowflake fatura sua conta pelo uso do warehouse virtual (computação) e pelos serviços de nuvem quando você trabalha com tabelas Iceberg. A Snowflake também cobra sua conta se você usar atualização automatizada ou um Mecanismo de consulta externa pelo Snowflake Horizon Catalog.

Se uma tabela Iceberg gerenciada pelo Snowflake estiver em uma nuvem/região diferente, o Snowflake cobrará o uso da transferência de dados entre nuvens/regiões sob o TRANSFER_TYPE de DATA_LAKE. Para saber mais, consulte:

Exibição DATA_TRANSFER_HISTORY no esquema ORGANIZATION_USAGE.
Exibição DATA_TRANSFER_HISTORY no esquema ACCOUNT_USAGE.

A Snowflake não fatura sua conta pelo seguinte:

Custos de armazenamento de tabela Iceberg quando a tabela usa um volume externo que você gerencia. Seu provedor de armazenamento em nuvem faz a cobrança diretamente pelo uso do armazenamento de dados. No entanto, se a tabela usar o armazenamento do Snowflake (EXTERNAL_VOLUME = SNOWFLAKE_MANAGED), a Snowflake cobrará pelo armazenamento. Para obter mais informações, consulte Armazenamento do Snowflake para tabelas Apache Iceberg™.
Bytes ativos usados pelas tabelas Iceberg. No entanto, as exibições INFORMATION_SCHEMA TABLE_STORAGE_METRICS e ACCOUNT_USAGE TABLE_STORAGE_METRICS exibem ACTIVE_BYTES para tabelas Iceberg para ajudar você a monitorar quanto armazenamento uma tabela ocupa. Para visualizar um exemplo, consulte Recuperar métricas de armazenamento.

Nota

Se sua conta Snowflake e seu volume externo estiverem em regiões diferentes, sua conta externa de armazenamento em nuvem incorrerá em custos de saída quando você consultar a tabela.

Opções de catálogo¶

O Snowflake oferece suporte às seguintes opções de catálogo Iceberg:

Uso do Snowflake como o catálogo Iceberg
Usar um catálogo externo do Iceberg

A tabela a seguir resume as diferenças entre essas opções de catálogo.


	Usar o Snowflake como catálogo	Use um catálogo externo
Acesso de leitura	✔	✔
Acesso de gravação	✔	✔
Credenciais fornecidas pelo catálogo		✔
Acesso de gravação entre regiões	✔	✔ com suporte de gravação para tabelas gerenciadas externamente
Armazenamento de dados e metadados	Volume externo (armazenamento em nuvem)	Volume externo (armazenamento em nuvem)
Suporte à plataforma Snowflake	✔
Integra-se com o Snowflake Open Catalog	✔ Você pode sincronizar uma tabela gerenciada pelo Snowflake com o Open Catalog para consulta uma tabela usando outros mecanismos de computação.	✔ Você pode usar o Snowflake para consultar ou gravar em tabelas Iceberg gerenciadas pelo Open Catalog.
Funciona com o SDK do catálogo Snowflake	✔	✔
Replicação para tabelas	✔ Consulte Configuração da replicação para tabelas Apache Iceberg™ gerenciadas pelo Snowflake.

Usar o Snowflake como catálogo¶

Uma tabela Iceberg que usa o Snowflake como catálogo Iceberg (tabela Iceberg gerenciada pelo Snowflake) oferece suporte completo à plataforma Snowflake com acesso de leitura e gravação. Os dados e metadados da tabela são armazenados em armazenamento em nuvem externo, que o Snowflake acessa usando um volume externo. O Snowflake cuida de toda a manutenção do ciclo de vida, como compactação, da tabela. No entanto, você pode desabilitar a compactação para a tabela, se necessário.

Use um catálogo externo¶

Uma tabela Iceberg que usa um catálogo externo oferece suporte limitado à plataforma Snowflake.

Com esse tipo de tabela, o Snowflake usa uma integração de catálogo para recuperar informações sobre os metadados e o esquema Iceberg.

Você pode usar essa opção para criar uma tabela Iceberg para as seguintes fontes:

Catálogo REST Iceberg remoto, incluindo AWS Glue e Snowflake Open Catalog. O Snowflake oferece suporte a gravações em tabelas gerenciadas externamente que usam um catálogo REST Iceberg remoto.
Dica

Para trazer seus dados externos de um catálogo REST Iceberg remoto para o Snowflake, você pode criar um banco de dados vinculado a catálogo. O banco de dados descobre automaticamente e permanece sincronizado com os namespaces e as tabelas do seu catálogo remoto. Você pode usar um banco de dados vinculado a catálogo para ler e gravar nas tabelas do seu catálogo remoto a partir do Snowflake, preservando a interoperabilidade completa com seu ecossistema Iceberg existente. Para obter mais informações, consulte os seguintes tópicos:
- Usar um banco de dados vinculado a catálogo para tabelas Apache Iceberg™
- Se os seus dados externos estiverem no Unity Catalog, consulte Tutorial: Configurar acesso bidirecional a tabelas Apache Iceberg™ no Databricks Unity Catalog
- Se os seus dados externos estiverem no AWS Glue, consulte Criar data lakes usando o Apache Iceberg com o Snowflake e o AWS Glue
Delta table files in object storage (Delta Direct; see CREATE ICEBERG TABLE (Delta files in object storage))
Arquivos de metadados Iceberg no armazenamento de objetos

Snowflake não assume nenhum gerenciamento de ciclo de vida.

Os dados e metadados da tabela são armazenados em armazenamento em nuvem externo, que o Snowflake acessa usando um volume externo.

Nota

Se quiser suporte total à plataforma Snowflake para uma tabela Iceberg que usa um catálogo externo, poderá convertê-la para usar o Snowflake como catálogo. Para obter mais informações, consulte Converter uma tabela Apache Iceberg™ para usar o Snowflake como catálogo.

O diagrama a seguir mostra como uma tabela Iceberg usa uma integração de catálogo com um catálogo Iceberg externo.

Compatibilidade com Apache Iceberg™ v3 (versão preliminar)¶

A compatibilidade com a v3 da especificação de tabelas Apache Iceberg™ está agora em versão preliminar pública. Para obter mais detalhes, consulte Tabelas Apache Iceberg™: Suporte para Apache Iceberg™ v3 (versão preliminar).

Considerações e limitações¶

As seguintes considerações e limitações se aplicam às tabelas Iceberg e estão sujeitas a alterações:

Nuvens e regiões

As tabelas Iceberg estão disponíveis para todas as contas Snowflake, em todas as plataformas de nuvem e em todas as regiões.

Há suporte para tabelas entre nuvens e entre regiões. Para obter mais informações, consulte Suporte entre nuvens/entre regiões.

Iceberg

As versões 1 e 2 da especificação Apache Iceberg são suportadas, excluindo os seguintes recursos:

Exclusões de igualdade em nível de linha. No entanto, tabelas que usam o Snowflake como catálogo oferecem suporte a instruções DELETE do Snowflake.

Usando a history.expire.min-snapshots-to-keep propriedade da tabela para especificar o número mínimo padrão de instantâneos a serem mantidos. Para obter mais informações, consulte Metadados e instantâneos.

O particionamento Iceberg com a função de transformação bucket afeta o desempenho de consultas que usam cláusulas condicionais para filtrar resultados.

Para tabelas Iceberg que não são gerenciadas pelo Snowflake, esteja ciente do seguinte:

O Time Travel para qualquer instantâneo gerado após a criação da tabela é compatível, desde que você atualize periodicamente a tabela antes que o instantâneo expire.

Não há suporte para a conversão de uma tabela que tenha uma coluna de partição de identidade não materializada. Uma coluna de partição de identidade não materializada é criada quando uma tabela define uma transformação de identidade usando uma coluna de origem que não existe em um arquivo Parquet.

Para , o nível de linha exclui:

O Snowflake é compatível com exclusões de posição apenas para tabelas Iceberg v2 e vetores de exclusão para tabelas Iceberg v3.

O Snowflake é compatível com exclusões de posição apenas com tabelas Iceberg gerenciadas externamente.

Para obter o melhor desempenho de leitura ao usar exclusões em nível de linha, execute a compactação regular e a manutenção da tabela para remover arquivos de exclusão antigos. Para obter mais informações, consulte Manter tabelas que usam um catálogo externo.

Exclusões de posição excessivas, especialmente exclusões de posição pendentes, podem impedir operações de criação e atualização de tabelas. Para evitar esse problema, execute a manutenção da tabela para remover exclusões de posição extras.

O método de manutenção de tabela a ser usado depende do seu mecanismo Iceberg externo. Por exemplo, você pode usar o método rewrite_data_files para Spark com as opções delete-file-threshold ou rewrite-all. Para obter mais informações, consulte rewrite_data_files na documentação Apache Iceberg™.

Formatos de arquivo

As tabelas Iceberg são compatíveis com arquivos Apache Parquet.

Arquivos Parquet que usam o tipo lógico inteiro não assinado não são aceitos.

Para arquivos Parquet que usam o tipo lógico LIST, esteja ciente do seguinte:

A estrutura de anotação de três níveis com a palavra-chave element é compatível. Para obter mais informações, consulte Definições do tipo lógico Parquet. Se o arquivo Parquet usar um formato obsoleto com a palavra-chave array, você deverá gerar novamente os dados com base no formato compatível.

Volumes externos

Você não pode acessar os locais de armazenamento em nuvem em volumes externos usando uma integração de armazenamento.

Você deve configurar uma relação de confiança separado para cada volume externo que criar.

É possível usar a conectividade privada saída para acessar tabelas Iceberg gerenciadas pelo Snowflake e tabelas Iceberg que usam uma integração de catálogo para armazenamento de objetos, mas não é possível usá-la para acessar tabelas Iceberg que usam outras integrações de catálogo.

Depois que você cria uma tabela gerenciada pelo Snowflake, o caminho para seus arquivos no armazenamento externo não muda, mesmo que você renomeie a tabela.

O Snowflake não é compatível com volumes externos com nomes de bucket S3 que contenham pontos (por exemplo, my.s3.bucket). O S3 não oferece suporte a SSL para buckets do tipo de hospedam virtual com pontos no nome, e o Snowflake usa caminhos do tipo de hospedam virtual e HTTPS para acessar dados no S3.

Arquivos de metadados

Os arquivos de metadados não identificam o instantâneo mais recente de uma tabela Iceberg.

Você não pode modificar o local dos arquivos de dados ou instantâneos usando o comando ALTER ICEBERG TABLE. Para modificar qualquer uma dessas configurações, você deve recriar a tabela (usando a sintaxe CREATE OR REPLACE ICEBERG TABLE).

Para tabelas que usam um catálogo externo:

Certifique-se de que os arquivos de manifesto não contenham duplicatas. Se houver arquivos duplicados no mesmo instantâneo, o Snowflake retornará um erro que inclui o caminho do arquivo duplicado.

Não é possível criar uma tabela se os metadados Parquet contiverem caracteres UTF-8 inválidos. Certifique-se de que seus metadados Parquet sejam compatíveis com UTF-8.

O Snowflake detecta corrupções e inconsistências nos metadados do Parquet produzidos fora do Snowflake e revela problemas por meio de mensagens de erro.

É possível criar, atualizar ou consultar tabelas gerenciadas externamente (ou convertidas), mesmo que os metadados da tabela sejam inconsistentes. Ao escrever dados Iceberg, certifique-se de que as estatísticas de metadados da tabela (por exemplo, RowCount ou NullCount) correspondam ao conteúdo dos dados.

Para tabelas que usam o Snowflake como catálogo, o Snowflake processa instruções DDL individualmente e produz metadados de uma maneira que pode ser diferente de outros catálogos. Para obter mais informações, consulte Instruções DDL.

Clustering

O suporte ao clustering depende do tipo de tabela Iceberg.

Tipo de tabela

Notas

Tabelas que usam Snowflake como catálogo Iceberg

Defina uma chave de clustering usando o comando CREATE ICEBERG TABLE ou ALTER ICEBERG TABLE. Para definir ou gerenciar uma chave de clustering, consulte CREATE ICEBERG TABLE (Snowflake como o catálogo Iceberg) e ALTER ICEBERG TABLE.

Tabelas que usam um catálogo externo

Clustering não é suportado.

Tabelas convertidas

O Snowflake apenas clusteriza arquivos se eles tiverem sido criados após a conversão da tabela ou se os arquivos tiverem sido modificados usando uma instrução DML.

Tipo de tabela	Notas
Tabelas que usam Snowflake como catálogo Iceberg	Defina uma chave de clustering usando o comando CREATE ICEBERG TABLE ou ALTER ICEBERG TABLE. Para definir ou gerenciar uma chave de clustering, consulte CREATE ICEBERG TABLE (Snowflake como o catálogo Iceberg) e ALTER ICEBERG TABLE.
Tabelas que usam um catálogo externo	Clustering não é suportado.
Tabelas convertidas	O Snowflake apenas clusteriza arquivos se eles tiverem sido criados após a conversão da tabela ou se os arquivos tiverem sido modificados usando uma instrução DML.

Delta

O Snowflake é compatível com o minReaderVersion 3 e pode ler todas as tabelas gravadas por mecanismos que usam a versão mais recente do Delta Lake, que é 4.0.0. A versão 4.0.0 do Delta Lake inclui suporte para vetores de exclusão e clustering líquido.

Os fluxos Snowflake não são compatíveis com tabelas Iceberg criadas a partir de arquivos de tabela Delta com colunas de partição. No entanto, os fluxos apenas de inserção para tabelas criadas a partir de arquivos Delta sem colunas de partição são compatíveis.

As tabelas Iceberg criadas a partir de arquivos delta criados antes do pacote de lançamento 2024_04 não são aceitas em tabelas dinâmicas.

Snowflake não oferece suporte à criação de tabelas Iceberg a partir de definições de tabela Delta no AWS Glue Data Catalog.

Arquivos Parquet (arquivos de dados para tabelas Delta) que usam qualquer um dos seguintes recursos ou tipos de dados não são compatíveis:

Campo IDs.

O tipo de dados INTERVAL.

O tipo de dados DECIMAL com precisão maior que 38.

Os tipos LIST ou MAP com representação de um ou dois níveis.

Tipos inteiros sem sinal (INT(signed = false)).

O tipo de dados FLOAT16.

Você pode usar o tipo físico Parquet int96 para TIMESTAMP, mas o Snowflake não oferece suporte a int96 para TIMESTAMP_NTZ.

Para obter mais informações sobre os tipos de dados Delta e tabelas Iceberg, consulte Tipos de dados Delta.

O Snowflake processa um máximo de 1.000 arquivos de confirmação Delta cada vez que você atualiza uma tabela usando CREATE/ALTER … REFRESH. Se sua tabela tiver mais de 1.000 arquivos de confirmação, é possível fazer atualizações manuais adicionais. A cada vez, o processo de atualização continua de onde o último parou.

Nota

O Snowflake usa arquivos de ponto de verificação Delta ao criar uma tabela Iceberg. O limite de 1.000 arquivo de confirmação se aplica somente a confirmações após o último ponto de verificação.

Quando você atualiza uma tabela existente, o Snowflake processa os arquivos de confirmação Delta, mas não os arquivos de ponto de verificação. Se a manutenção da tabela remover arquivos de log e de dados obsoletos da tabela Delta de origem, você deverá atualizar as tabelas Iceberg baseadas em Delta no Snowflake com mais frequência do que o período de retenção dos logs e arquivos de dados do Delta.

Os seguintes recursos do Delta Lake não são compatíveis atualmente: rastreamento de linhas, arquivos de dados de alteração, metadados de alteração, DataChange, CDC e evolução de protocolo.

Atualização automática

Para integrações de catálogo criadas antes da versão 8.22 do Snowflake (ou 9.2 para tabelas baseadas em Delta), você deve definir manualmente o parâmetro REFRESH_INTERVAL_SECONDS antes de ativar a atualização automática em tabelas que dependem dessa integração de catálogo. Para obter instruções, consulte ALTER CATALOG INTEGRATION … SET AUTO_REFRESH.

Para as integrações de catálogo para armazenamento de objetos, a atualização automatizada só é compatível com as integrações com TABLE_FORMAT = DELTA.

Para tabelas com atualizações frequentes, o uso de um intervalo de pesquisa mais curto (REFRESH_INTERVAL_SECONDS) pode causar degradação do desempenho.

A atualização automatizada sincroniza as alterações de esquema junto com as operações DML, como INSERT, UPDATE ou DELETE. Para aplicar as alterações de esquema feitas apenas por meio das operações DDL, execute uma atualização manual.

Bancos de dados vinculados a catálogos e descoberta automática de tabelas

Aceito apenas quando você usa uma integração de catálogo para o Iceberg REST (por exemplo, Snowflake Open Catalog).

Para limitar a descoberta automática de tabelas a um conjunto específico de namespaces, use o parâmetro ALLOWED_NAMESPACES. Você também pode usar o parâmetro BLOCKED_NAMESPACES para bloquear um conjunto de namespaces.

O Snowflake não sincroniza o controle de acesso a catálogo remoto para usuários ou funções.

Você pode criar esquemas, tabelas Iceberg gerenciadas externamente ou funções de banco de dados em um banco de dados vinculado a catálogo. Atualmente, não há suporte para a criação de outros objetos Snowflake.

Ao criar um banco de dados vinculado a catálogo, você não pode especificar a versão Iceberg padrão ou o comportamento de mesclagem na leitura a ser utilizado para tabelas Iceberg.

No entanto, você pode modificar essas propriedades para um banco de dados existente usando o comando ALTER DATABASE (vinculado a catálogo) para definir os seguintes parâmetros:

ICEBERG_VERSION_DEFAULT

ENABLE_ICEBERG_MERGE_ON_READ
Para tabelas Iceberg em um banco de dados vinculado a catálogo:
Snowflake bidirectionally syncs table and column descriptions between the remote catalog and Snowflake. Sync can update a description to a new value, but never replaces a non-empty description with an empty one. Other remote catalog table properties, such as retention policies or buffers, aren’t copied, and altering table properties isn’t currently supported.

A atualização automática está habilitada por padrão. Se o table-uuid de uma tabela externa e a tabela do banco de dados vinculado a catálogo não corresponderem, a atualização falhará e o Snowflake removerá a tabela do banco de dados vinculado a catálogo; o Snowflake não alterará a tabela remota.

Se você remover uma tabela do catálogo remoto, o Snowflake a removerá do banco de dados vinculado a catálogo. Essa ação é assíncrona; portanto, você pode não ver a alteração no catálogo remoto imediatamente.

Se você renomear uma tabela no catálogo remoto, o Snowflake removerá a tabela existente do banco de dados vinculado a catálogo e criará uma tabela com o novo nome.

Políticas de mascaramento e tags são aceitas. Outros recursos específicos do Snowflake, incluindo replicação e clonagem, não são suportados.

O caractere escolhido para o parâmetro NAMESPACE_FLATTEN_DELIMITER não pode aparecer em seus namespaces remotos. Durante o processo de descoberta automática, o Snowflake ignora qualquer namespace que contenha o delimitador e não cria um esquema correspondente no banco de dados vinculado ao catálogo.

Se você especificar algo diferente de _, $ ou números para o parâmetro NAMESPACE_FLATTEN_DELIMITER, deverá colocar o nome do esquema entre aspas ao consultar a tabela.
Para bancos de dados vinculados ao AWS Glue, você deve usar letras minúsculas e colocar os nomes do esquema, da tabela e das colunas entre aspas duplas. Isso também é necessário para outros catálogos Iceberg REST que aceitam apenas identificadores em minúsculas.

O exemplo a seguir mostra uma consulta válida:
CREATE SCHEMA "s1";
As instruções a seguir não são válidas porque usam letras maiúsculas ou omitem as aspas duplas:
CREATE SCHEMA s1;
CREATE SCHEMA "Schema1";
O uso de UNDROP ICEBERG TABLE não é aceito.

Compartilhamento:

Não há suporte para compartilhamento com uma listagem no momento

O compartilhamento direto é compatível
Para gravar em tabelas em um banco de dados vinculado a catálogo:

No momento, não é permitido criar tabelas em namespaces aninhados.

Gravações em tabelas em namespaces aninhados não são aceitas no momento.

Exclusões em nível de linha de posição são compatíveis com tabelas armazenadas no Amazon S3, Azure ou Google Cloud. Exclusões em nível de linha com arquivos de exclusão de igualdade não são aceitas. Para obter mais informações sobre exclusões em nível de linha, consulte Use as exclusões em nível de linha. Para desativar as exclusões de posição, que permitem a execução das operações da linguagem de manipulação de dados (DML) no modo de cópia na gravação, defina o parâmetro ENABLE_ICEBERG_MERGE_ON_READ como FALSE no nível da tabela, do esquema ou do banco de dados.

Suporte a gravação gerenciada externamente

O Snowflake oferece suporte a gravações gerenciadas externamente para tabelas Iceberg que usam a versão 2 da especificação de tabela Iceberg.

O Snowflake fornece comandos de Linguagem de Definição de Dados (DDL) e Linguagem de Manipulação de Dados (DML) para tabelas gerenciadas externamente. No entanto, você configura retenção de dados e metadados usando seu catálogo externo e as ferramentas fornecidas pelo seu provedor de armazenamento externo. Para obter mais informações, consulte Tabelas que usam um catálogo externo.

Para gravações, o Snowflake garante que as alterações sejam confirmadas no seu catálogo remoto antes de atualizar a tabela no Snowflake.

Se você usar um banco de dados vinculado a catálogo, poderá usar a sintaxe CREATE ICEBERG TABLE com definições de coluna para criar uma tabela no Snowflake e no seu catálogo remoto. Se você usar um banco de dados Snowflake padrão (não vinculado a catálogo), deverá primeiro criar uma tabela no seu catálogo remoto. Depois disso, você poderá usar a sintaxe CREATE ICEBERG TABLE (catálogo REST Iceberg) para criar uma tabela Iceberg no Snowflake e gravar nela.

Para o catálogo de dados do AWS Glue: Remover uma tabela gerenciada externamente por meio do Snowflake não exclui os arquivos da tabela subjacente. Esse comportamento é específico da implementação do catálogo de dados do AWS Glue.

Você não pode remover uma tabela do Amazon S3 pelo Snowflake. O serviço Amazon S3 Tables exige que a opção purge seja especificada com o comando DROP, com o qual o Snowflake não é compatível atualmente.

Exclusões em nível de linha de posição são compatíveis com tabelas armazenadas no Amazon S3, Azure ou Google Cloud. Exclusões em nível de linha com arquivos de exclusão de igualdade não são aceitas. Para obter mais informações sobre exclusões em nível de linha, consulte Use as exclusões em nível de linha. Para desativar as exclusões de posição, que permitem a execução das operações DML no modo de cópia na gravação, defina o parâmetro ENABLE_ICEBERG_MERGE_ON_READ como FALSE no nível da tabela, do esquema ou do banco de dados.

Não há suporte para gravação em tabelas gerenciadas externamente com os seguintes tipos de dados Iceberg:

uuid

fixed(L)

Os seguintes recursos não são aceitos atualmente quando você usa o Snowflake para gravar em tabelas Iceberg gerenciadas externamente:

Criptografia no servidor (SSE) para volumes externos do Azure.

Transações com várias instruções. O Snowflake oferece suporte apenas a transações de confirmação automática.

Conversão em tabelas gerenciadas pelo Snowflake.

Catálogos Iceberg externos que não estão em conformidade com o protocolo Iceberg REST.

Uso da opção OR REPLACE ao criar uma tabela.

Uso da sintaxe CREATE ICEBERG TABLE (banco de dados vinculado ao catálogo) … AS SELECT se você usar um dos seguintes catálogos como o seu catálogo remoto:

AWS Glue

Databricks Unity Catalog

Se preferir, use a sintaxe CREATE ICEBERG TABLE (catálogo REST Iceberg) para criar uma tabela Iceberg vazia e, em seguida, use uma instrução INSERT INTO … SELECT para inserir dados na tabela vazia. No entanto, essa alternativa usa duas transações separadas, portanto não garante atomicidade.

Para criar esquemas em um banco de dados vinculado a catálogo, esteja ciente do seguinte:

O comando CREATE SCHEMA cria um namespace correspondente no seu catálogo remoto somente quando você usa um banco de dados vinculado a catálogo.

As opções ALTER e CLONE não são aceitas.

Delimitadores não são aceitos para nomes de esquema. Somente nomes de esquema alfanuméricos são aceitos.

Você pode definir um tamanho de arquivo de destino para os arquivos Parquet de uma tabela. Para obter mais informações, consulte Definir um tamanho de arquivo de destino.

Para serviços de armazenamento em nuvem do Azure: O Snowflake oferece suporte apenas a gravações gerenciadas externamente para tabelas Iceberg que usam os seguintes serviços de armazenamento externo:

Armazenamento de blobs

Data Lake Storage Gen2

Recurso em versão preliminar – aberto

Disponível para todas as contas.

A conexão do Snowflake ao armazenamento do Data Lake Storage Gen2 usando um volume externo está em versão preliminar pública. Essa configuração permite gravações gerenciadas externamente em catálogos configurados apenas para usar o Data Lake Storage, como o Unity Catalog. Para obter mais informações, consulte Configuração de um volume externo para o Azure

Nota

Não é possível conectar o Snowflake ao armazenamento do Data Lake Storage Gen2 usando credenciais fornecidas pelo catálogo.

Uso geral v1

Uso geral v2

Microsoft Fabric OneLake

Compartilhamento:

No momento, não é possível compartilhar uma listagem.

No momento, não há suporte para compartilhamento direto.

Acesso de clientes terceiros aos dados e metadados do Iceberg

Clientes de terceiros não podem anexar, excluir ou atualizar dados em tabelas Iceberg que usam o Snowflake como catálogo.

Otimização de tabelas

O Snowflake não é compatível com a exclusão de arquivos órfãos para tabelas Iceberg gerenciadas pelo Snowflake. Se você observar uma discrepância entre o uso do seu armazenamento em nuvem externo e o Snowflake, poderá haver arquivos órfãos no seu armazenamento em nuvem externo. Para ver o uso de armazenamento do Snowflake, você pode usar Exibição TABLE_STORAGE_METRICS ou Exibição TABLE_STORAGE_METRICS. Se você observar alguma discrepância, entre em contato com o suporte Snowflake para obter ajuda na identificação de arquivos órfãos e na remoção deles.
Para tabelas Iceberg gerenciadas pelo Snowflake, se uma operação DML falhar inesperadamente e for revertida, alguns arquivos Parquet poderão ser gravados no seu armazenamento em nuvem externo, mas não serão rastreados ou referenciados pelos metadados da tabela Iceberg. Esses arquivos Parquet são arquivos órfãos.

Mecanismos de consulta externa por meio do Snowflake Horizon Catalog

Esta seção lista as considerações para acessar, consultar e gravar em tabelas Iceberg com um mecanismo de consulta externo.

Considere os seguintes itens ao acessar tabelas Iceberg com um mecanismo de consulta externo:

Iceberg
- Para tabelas no Snowflake:
  - Somente tabelas Iceberg gerenciadas pelo Snowflake são compatíveis.
Listagens:
- Tabelas Iceberg que você compartilha por meio de listagens de preenchimento automático não podem ser acessadas pela conta do consumidor da API Horizon Iceberg REST Catalog.
Rede e conectividade privada:
- o uso de políticas de rede definidas no nível do usuário não é compatível com esse recurso.
- Para Regras de rede gerenciadas pelo Snowflake, endereços IP de saída estáticos não são compatíveis.
- Não é possível conceder explicitamente acesso do ponto de extremidade do Horizon Catalog às suas contas de armazenamento. Recomendamos que você use conectividade privada para conectividade segura de mecanismos externos ao Horizon Catalog e do Horizon Catalog à sua conta de armazenamento.
Nuvens:
- Comercial: este recurso é compatível apenas com tabelas Iceberg gerenciadas pelo Snowflake e armazenadas no Amazon S3, Google Cloud ou Microsoft Azure para todas as regiões de nuvem comercial. O armazenamento não AWS compatível com S3 ainda não é suportado.
- FedRAMP (moderado): este recurso é compatível com tabelas Iceberg gerenciadas pelo Snowflake que são armazenadas em implantações FedRAMP (moderado) no AWS Commercial Gov (US) nas regiões us-east-1 e us-west-2.
- Para tabelas Iceberg armazenadas no Amazon S3:
  - Se você quiser usar criptografia SSE-KMS, entre em contato com o suporte ao cliente ou sua equipe de conta para obter assistência para ativar o acesso.
    
    Nota
    
    A gravação em volumes externos criptografados com KMS não é compatível.
- Para tabelas Iceberg armazenadas no Azure:
  - A rede virtual do Azure (VNet) não é compatível.
Autenticação:
- Para autenticação de par de chaves, não é possível rotacioná-las.
- A federação de identidade de carga de trabalho não é compatível com esse recurso.

Considere os seguintes itens ao consultar (ler) tabelas Iceberg com um mecanismo de consulta externo:

Iceberg
- Não há suporte para a consulta das tabelas a seguir:
  - Tabelas remotas
  - Tabelas nativas do Snowflake
  - Tabelas Iceberg gerenciadas externamente, incluindo tabelas Iceberg baseadas em Delta e tabelas Iceberg gerenciadas pelo Snowflake que você carregou com dados de arquivos de dados Parquet compatíveis com Iceberg usando o comando de tabela COPY INTO
- A leitura de tabelas Iceberg v2 é compatível.
- A leitura de tabelas Iceberg V3 (versão preliminar pública) é compatível com os seguintes recursos:
  - Tipo de dados de variante
  - Linhagem de linhas
  Nenhum outro recurso do Iceberg V3, incluindo valores padrão e o tipo de dados de geografia, é compatível.
Controle de acesso:
- As tabelas protegidas pelas seguintes políticas de dados refinadas podem ser acessadas pelo Apache Spark™ por meio do Snowflake Horizon Catalog:
  - Políticas de mascaramento
  - Políticas de mascaramento baseadas em tags
  - Políticas de acesso a linhas
  Para obter mais informações, consulte Aplicar políticas de proteção de dados ao consultar tabelas Apache Iceberg™ pelo Apache Spark™.
Tabelas clonadas e convertidas:
- A leitura de tabelas clonadas ou convertidas não é compatível com credenciais fornecidas. Para ler essas tabelas, use o acesso direto ao armazenamento de objetos.

Considere os seguintes itens ao gravar em tabelas Iceberg com um mecanismo de consulta externo:

Operações de tabela:
- Não é possível especificar um local base com sua instrução CREATE TABLE.
  
  Quando você cria uma tabela gerenciada pelo Snowflake sem especificar uma localização base, ele constrói o seguinte caminho para sua tabela: STORAGE_BASE_URL/database/schema/table_name.randomId/[data | metadata]/
- CREATE TABLE AS SELECT (CTAS) de um mecanismo externo não é compatível.
- Exclusões de igualdade não são compatíveis.
- Você não pode gravar em tabelas usando exclusões em nível de linha; somente o modo de cópia em gravação é compatível.
- A criação de tags e ramificações do Iceberg não é compatível.
- As gravações do mecanismo externo são compatíveis apenas com a versão 2 do Iceberg; a gravação em tabelas da versão 3 (v3) do Iceberg (versão preliminar pública) não é compatível no momento.
- A gravação em volumes externos criptografados com KMS não é compatível.
- A gravação em tabelas dinâmicas no Snowflake não é compatível.
- A gravação em tabelas Iceberg compartilhadas não é compatível.
- O registro de tabelas Iceberg não é compatível.
Operações de manutenção
- Não é possível reverter uma tabela para um instantâneo anterior.
- A operação de expiração de instantâneo não é compatível.
- Não é possível atualizar uma tabela Iceberg da v2 para a v3.
Tabelas clonadas e convertidas:
- A gravação em tabelas clonadas ou convertidas não é compatível com credenciais fornecidas. Para gravar nessas tabelas, conecte seu mecanismo de consulta externo diretamente ao armazenamento de objetos em que suas tabelas estão armazenadas.
- Não é possível gravar em uma tabela Iceberg que foi convertida de gerenciamento externo para gerenciamento pelo Snowflake.
Fluxos:
- Em tabelas Iceberg V2, as operações de cópia na gravação fazem com que os fluxos padrão representem uma linha atualizada ou realocada como um registro DELETE seguido por um registro INSERT para a mesma linha.
Políticas de controle de acesso refinado:
- A gravação em tabelas que têm políticas ou tags de controle de acesso refinado não é compatível.

Native App Framework

Você pode compartilhar tabelas Iceberg com consumidores por meio do Snowflake Native App Framework. Esteja ciente das seguintes restrições:

As tabelas Iceberg compartilhadas por meio de um Native App são somente leitura para consumidores.

O preenchimento automático entre nuvens não é compatível com apps que compartilham tabelas Iceberg.

Os consumidores devem habilitar explicitamente o recurso EXTERNAL_DATA restrito ao app antes de resolver tabelas Iceberg. Para obter mais informações, consulte Solicitação de acesso a tabelas externas e Apache Iceberg™.

Recursos não compatíveis

Os seguintes recursos do Snowflake não são aceitos atualmente para todas as tabelas Iceberg:

Agrupamento

Fail-safe

Tabelas híbridas

Criptografia do Snowflake

Evolução do esquema Snowflake

Uso de tags usando o procedimento armazenado ASSOCIATE_SEMANTIC_CATEGORY_TAGS

Tabelas temporárias e transitórias

Os seguintes recursos não são aceitos para tabelas Iceberg gerenciadas externamente:

Clonagem

Clustering

Fluxos padrão e apenas para anexação. Fluxos apenas de inserção são aceitos.

Replicação de de tabelas Iceberg, volumes externos ou integrações de catálogo.