Tabelas Apache Iceberg™: Gravando arquivos de dados em subdiretórios no Amazon S3

Atenção

Essa mudança de comportamento está no pacote 2024_06.

Para saber o status atual do pacote, consulte Histórico do pacote.

O Snowflake grava arquivos de dados Parquet no Amazon S3 para tabelas gerenciadas pelo Snowflake da seguinte forma:

Antes da mudança:

O Snowflake grava todos os arquivos de dados da tabela em um único diretório nomeado data/ em seu armazenamento em nuvem externo.

Caminho de exemplo para cada arquivo de dados:

s3://externalVolumeStorageLocation/tableBaseLocation/data/snow_externalFileId.parquet

Após a mudança:

O Snowflake oferece suporte à gravação de arquivos de dados para tabelas novas ou existentes em subdiretórios com nomes aleatórios no diretório data/. Isso ajuda a evitar a limitação do S3 e otimizar o desempenho de consulta.

Caminho de exemplo para cada arquivo de dados:

s3://externalVolumeStorageLocation/tableBaseLocation/data/randomPrefix/snow_externalFileId.parquet

Ref.: 1706