CREATE ICEBERG TABLE (catálogo REST Iceberg)¶

Cria ou substitui uma tabela Apache Iceberg™ no esquema atual/especificado para um catálogo REST Iceberg.

Use este comando para os seguintes cenários:

Você deseja usar um catálogo Iceberg remoto que esteja em conformidade com a especificação OpenAPI REST Apache Iceberg de código aberto.
Você deseja consultar uma tabela no Snowflake Open Catalog ou no Apache Polaris™. Para obter mais informações, consulte Consultar uma tabela no Snowflake Open Catalog usando o Snowflake.
Você deseja criar uma tabela gerenciada externamente em um banco de dados vinculado a catálogo. Consulte CREATE ICEBERG TABLE (banco de dados vinculado a catálogo).

Nota

Antes de criar uma tabela, você deve criar o volume externo onde os metadados e os arquivos de dados do Iceberg são armazenados. Para obter instruções, consulte Configuração de um volume externo.

Você também precisa de uma integração de catálogo para a tabela. Para obter mais informações, consulte Configurar uma integração de catálogo para catálogos Apache Iceberg™ REST ou Configurar uma integração de catálogo para o Snowflake Open Catalog.

Consulte também:: ALTER ICEBERG TABLE , DROP ICEBERG TABLE , SHOW ICEBERG TABLES , DESCRIBE ICEBERG TABLE , UNDROP ICEBERG TABLE

Sintaxe¶

CREATE [ OR REPLACE ] ICEBERG TABLE [ IF NOT EXISTS ] <table_name>
  [ EXTERNAL_VOLUME = '<external_volume_name>' ]
  [ CATALOG = '<catalog_integration_name>' ]
  CATALOG_TABLE_NAME = '<rest_catalog_table_name>'
  [ CATALOG_NAMESPACE = '<catalog_namespace>' ]
  [ PARTITION BY ( partitionExpression [ , partitionExpression , ... ] ) ]
  [ TARGET_FILE_SIZE = '{ AUTO | 16MB | 32MB | 64MB | 128MB }' ]
  [ REPLACE_INVALID_CHARACTERS = { TRUE | FALSE } ]
  [ AUTO_REFRESH = { TRUE | FALSE } ]
  [ COMMENT = '<string_literal>' ]
  [ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
  [ WITH CONTACT ( <purpose> = <contact_name> [ , <purpose> = <contact_name> ... ] ) ]
  [ STORAGE_SERIALIZATION_POLICY = { COMPATIBLE | OPTIMIZED } ]

Copy

Onde:

partitionExpression ::=
  <col_name> -- identity transform
  | BUCKET ( <num_buckets> , <col_name> )
  | TRUNCATE ( <width> , <col_name> )
  | YEAR ( <col_name> )
  | MONTH ( <col_name> )
  | DAY ( <col_name> )
  | HOUR ( <col_name> )

Copy

Sintaxe da variante¶

CREATE ICEBERG TABLE (banco de dados vinculado a catálogo)¶

CREATE [ OR REPLACE ] ICEBERG TABLE [ IF NOT EXISTS ] <table_name>
  [
    --Column definition
    <col_name> <col_type>
      [ [ WITH ] MASKING POLICY <policy_name> [ USING ( <col_name> , <cond_col1> , ... ) ] ]

    -- Additional column definitions
    [ , <col_name> <col_type> [ ... ] ]
  ]
  [ PARTITION BY ( partitionExpression [ , partitionExpression , ... ] ) ]
  [ TARGET_FILE_SIZE = '{ AUTO | 16MB | 32MB | 64MB | 128MB }' ]
  [ MAX_DATA_EXTENSION_TIME_IN_DAYS = <integer> ]
  [ AUTO_REFRESH = { TRUE | FALSE } ]
  [ REPLACE_INVALID_CHARACTERS = { TRUE | FALSE } ]
  [ COPY GRANTS ]
  [ COMMENT = '<string_literal>' ]
  [ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
  [ BASE_LOCATION = '<path_to_directory_for_table_files>' ]
  [ STORAGE_SERIALIZATION_POLICY = { COMPATIBLE | OPTIMIZED } ]

Copy

Onde:

partitionExpression ::=
  <col_name> -- identity transform
  | BUCKET ( <num_buckets> , <col_name> )
  | TRUNCATE ( <width> , <col_name> )
  | YEAR ( <col_name> )
  | MONTH ( <col_name> )
  | DAY ( <col_name> )
  | HOUR ( <col_name> )

Copy

CREATE ICEBERG TABLE (banco de dados vinculado a catálogo) … AS SELECT¶

CREATE [ OR REPLACE ] ICEBERG TABLE <table_name> [ ( <col_name> [ <col_type> ] , <col_name> [ <col_type> ] , ... ) ]
  [ ... ]
  AS SELECT <query>

Copy

É possível aplicar uma política de mascaramento a uma coluna em uma instrução CTAS. Especifique a política de mascaramento após o tipo de dados da coluna. Por exemplo:

CREATE [ OR REPLACE ] ICEBERG TABLE <table_name> ( <col1> <data_type> [ WITH ] MASKING POLICY <policy_name> [ , ... ] )
  [ ... ]
  AS SELECT <query>

Copy

Parâmetros obrigatórios¶

table_name

Especifica o identificador (nome) da tabela no Snowflake; deve ser exclusivo para o esquema no qual a tabela é criada.

Além disso, o identificador deve começar com um caractere alfabético e não pode conter espaços ou caracteres especiais, a menos que toda a cadeia de caracteres do identificador esteja entre aspas duplas (por exemplo, "My object"). Os identificadores delimitados por aspas duplas também diferenciam letras maiúsculas de minúsculas.

Para obter mais informações, consulte Requisitos para identificadores.

Nota

Para recuperar uma lista de tabelas ou namespaces em seu catálogo remoto, é possível usar as seguintes funções:

CATALOG_TABLE_NAME = 'rest_catalog_table_name'

Especifica o nome da tabela conforme reconhecido pelo seu catálogo externo. Este parâmetro não pode ser alterado após criar a tabela.

Nota

Não especifique um namespace com o nome da tabela (mynamespace.mytable). Para especificar um namespace para essa tabela e substituir o namespace padrão definido para a integração do catálogo, use o parâmetro CATALOG_NAMESPACE.

col_name

Para criar uma tabela em um banco de dados vinculado a catálogo (versão preliminar).

Especifica o identificador da coluna (nome). Todos os requisitos de identificadores de tabela também se aplicam aos identificadores de coluna.

Para obter mais informações, consulte Requisitos para identificadores e Palavras-chave reservadas e limitadas.

Nota

Além das palavras-chave padrão reservadas, as seguintes palavras-chave não podem ser usadas como identificadores de coluna porque são reservadas para funções de contexto padrão ANSI:

CURRENT_DATE
CURRENT_ROLE
CURRENT_TIME
CURRENT_TIMESTAMP
CURRENT_USER

Para a lista de palavras-chave reservadas, consulte Palavras-chave reservadas e limitadas.

col_type

Para criar uma tabela em um banco de dados vinculado a catálogo (versão preliminar).

Especifica o tipo de dados para a coluna.

Para obter mais informações sobre os tipos de dados que podem ser especificados para colunas de tabela, consulte Tipos de dados para tabelas Apache Iceberg™.

Parâmetros opcionais¶

PARTITION BY = ( partitionExpression [ , partitionExpression , ... ] )

Especifica uma ou mais expressões de partição.

MASKING POLICY = policy_name

Para criar uma tabela em um banco de dados vinculado a catálogo (versão preliminar).

Especifica a política de mascaramento a ser definida em uma coluna. A política de mascaramento deve pertencer a um banco de dados Snowflake padrão (não ao banco de dados vinculado a catálogo).

EXTERNAL_VOLUME = 'external_volume_name'

Especifica o identificador (nome) do volume externo onde a tabela Iceberg armazena seus arquivos de metadados e dados no formato Parquet. Os metadados e arquivos de manifesto do Iceberg armazenam o esquema da tabela, partições, instantâneos e outros metadados.

Se você não especificar esse parâmetro, o padrão da tabela Iceberg será o volume externo do esquema, banco de dados ou conta. O esquema tem precedência sobre o banco de dados e o banco de dados tem precedência sobre a conta.

CATALOG = 'catalog_integration_name'

Especifica o identificador (nome) da integração do catálogo para esta tabela.

Se você não especificar esse parâmetro, a tabela Iceberg assumirá como padrão a integração de catálogo para o esquema, banco de dados ou conta. O esquema tem precedência sobre o banco de dados e o banco de dados tem precedência sobre a conta.

CATALOG_NAMESPACE = 'catalog_namespace'

Opcionalmente, especifica o namespace (por exemplo, my_database) para a fonte do catálogo REST. Ao especificar um namespace com a integração do catálogo e, em seguida, no nível da tabela, você pode usar uma única integração do catálogo REST para criar tabelas Iceberg em diferentes bancos de dados. Se você não especificar um namespace com a tabela, a tabela usará o namespace padrão do catálogo associado à integração do catálogo.
Se um namespace padrão não for especificado com a integração do catálogo, você deverá especificar o namespace da origem do catálogo REST para definir um namespace de catálogo para a tabela.

Nota

Para recuperar uma lista de tabelas ou namespaces em seu catálogo remoto, é possível usar as seguintes funções:

TARGET_FILE_SIZE = '{ AUTO | 16MB | 32MB | 64MB | 128MB }'

Especifica um tamanho de arquivo Parquet de destino para a tabela.

'{ 16MB | 32MB | 64MB | 128MB }' especifica um tamanho de arquivo de destino fixo para a tabela.
'AUTO' funciona de forma diferente, dependendo do tipo de tabela:
- Tabelas gerenciadas pelo Snowflake: AUTO especifica que o Snowflake deve escolher o tamanho do arquivo para a tabela com base em características da tabela, como tamanho, DML padrões, carga de trabalho de ingestão e configuração de cluster. O Snowflake ajusta automaticamente o tamanho do arquivo, começando em 16 MB, para melhor desempenho de leitura e gravação no Snowflake. Use essa opção para otimizar o desempenho da tabela no Snowflake.
- Tabelas gerenciadas externamente: AUTO especifica que o Snowflake deve ser dimensionado agressivamente para o maior tamanho de arquivo (128 MB).

Para obter mais informações, consulte Definir um tamanho de arquivo de destino.

Padrão: AUTO

MAX_DATA_EXTENSION_TIME_IN_DAYS = integer

Parâmetro de objeto que especifica o número máximo de dias para os quais o Snowflake pode estender o período de retenção de dados da tabela para evitar que os fluxos na tabela se tornem obsoletos.

Para uma descrição detalhada deste parâmetro, consulte MAX_DATA_EXTENSION_TIME_IN_DAYS.

REPLACE_INVALID_CHARACTERS = { TRUE | FALSE }

Especifica se deve substituir os caracteres UTF-8 inválidos pelo caractere de substituição Unicode (�) nos resultados da consulta. Você só pode definir esse parâmetro para tabelas que usam um catálogo Iceberg externo.

TRUE substitui os caracteres UTF-8 inválidos pelo caractere de substituição Unicode.
FALSE deixa caracteres UTF-8 inválidos inalterados. O Snowflake retorna uma mensagem de erro do usuário quando encontra caracteres UTF-8 inválidos em um arquivo de dados Parquet.

Se não for especificado, a tabela Iceberg assumirá o valor do parâmetro para o esquema, banco de dados ou conta. O esquema tem precedência sobre o banco de dados e o banco de dados tem precedência sobre a conta.

Padrão: FALSE

AUTO_REFRESH = { TRUE | FALSE }

Especifica se o Snowflake deve pesquisar automaticamente o catálogo Iceberg externo associado à tabela para atualizações de metadados.

Se nenhum valor for especificado para o parâmetro REFRESH_INTERVAL_SECONDS na integração do catálogo, o Snowflake usará um intervalo de atualização padrão de 30 segundos.

Para obter mais informações, consulte atualização automatizada.

Padrão: FALSE

Nota

O uso de AUTO_REFRESH com INFER_SCHEMA não é compatível.

COPY GRANTS

Especifica manter os privilégios de acesso da tabela original quando uma nova tabela é criada usando qualquer uma das seguintes variantes CREATE TABLE:

CREATE OR REPLACE TABLE

O parâmetro copia todos os privilégios, exceto OWNERSHIP, da tabela existente para a nova tabela. A nova tabela não herda as concessões futuras definidas para o tipo de objeto no esquema. Por padrão, a função que executa a instrução CREATE TABLE é a proprietária da nova tabela.

Se o parâmetro não estiver incluído na instrução CREATE ICEBERG TABLE, então a nova tabela não herdará nenhum privilégio de acesso explícito concedido na tabela original, mas herda qualquer concessão futura definida para o tipo de objeto no esquema.

Nota:

Com compartilhamento de dados:
- Se a tabela existente foi compartilhada com outra conta, a tabela de substituição também será compartilhada.
- Se a tabela existente foi compartilhada com sua conta como consumidor de dados, e o acesso foi ainda concedido a outras funções na conta (usando GRANT IMPORTED PRIVILEGES no banco de dados pai), o acesso também é concedido à tabela de substituição.
A saída SHOW GRANTS para a tabela de substituição relaciona o cessionário para os privilégios copiados como a função que executou a instrução CREATE ICEBERG TABLE, com o carimbo de data/hora atual quando a instrução foi executada.
A operação de cópia de concessões ocorre atomicamente no comando CREATE ICEBERGTABLE (ou seja, dentro da mesma transação).

COMMENT = 'string_literal'

Especifica um comentário para a tabela.

Padrão: sem valor

TAG ( tag_name = 'tag_value' [ , tag_name = 'tag_value' , ... ] )

Especifica o nome da tag e o valor da cadeia de caracteres dela.

O valor de tag é sempre uma cadeia de caracteres, e o número máximo de caracteres do valor da tag é 256.

Para obter informações sobre como especificar tags em uma instrução, consulte Tag quotas.

WITH CONTACT ( purpose = contact [ , purpose = contact ...] ): Associe o novo objeto a um ou mais contatos.

BASE_LOCATION = 'path_to_directory_for_table_files'

O caminho para um diretório que o Snowflake usa para construir caminhos de gravação para os arquivos de dados e metadados da tabela.

Se você usar uma EXTERNAL_VOLUME, esse caminho deve ser incluído nos caminhos de armazenamento especificados para o volume externo e você tem a opção de especificar um caminho relativo. Se você especificar um caminho relativo, ele é relativo ao STORAGE_BASE_URL para o volume externo. Se não for especificado, o Snowflake constrói um caminho de gravação usando atributos como o valor do BASE_LOCATION_PREFIX Parâmetro e o nome da tabela.

Se estiver usando credenciais fornecidas, você também deverá especificar um caminho absoluto.

Nota

Este diretório não pode ser alterado depois que você cria uma tabela.

Parâmetros de expressão de partição (`partitionExpression`)¶

Snowflake supports all partition transforms in version 2 of the Apache Iceberg specification. For more information, see Partition Transforms.

Para obter mais informações sobre o particionamento de tabelas Iceberg, consulte Particionamento Iceberg.

col_name

Especifica o identificador (nome) da coluna de origem a ser particionada.

Quando usado sozinho, sem uma transformação como YEAR, especifica uma transformação de identidade na coluna de origem. Para obter mais informações, consulte identidade.

BUCKET

Especifica uma transformação de bucket. Para obter mais informações, consulte Detalhes da transformação de bucket.

num_buckets é o número de buckets nos quais os dados serão agrupados.

TRUNCATE

Especifica uma transformação de truncamento, que particiona os dados com base nos valores truncados da coluna de origem especificada. Para obter mais informações, consulte Detalhes da transformação de truncamento.

YEAR

Especifica uma transformação de ano, que extrai o ano de um valor de coluna de origem com data ou carimbo de data/hora. Para obter mais informações, consulte Transformações de partição.

MONTH

Especifica uma transformação de mês. Para obter mais informações, consulte Transformações de partição.

DAY

Especifica uma transformação de dia, que extrai o dia de um valor de coluna de origem com data ou carimbo de data/hora. Para obter mais informações, consulte Transformações de partição.

HOUR

Especifica uma transformação de hora, que extrai a hora de um valor de coluna de origem com carimbo de data/hora. Para obter mais informações, consulte Transformações de partição.

Requisitos de controle de acesso¶

A função usada para executar essa operação deve ter, no mínimo, os seguintes privilégios:

Privilégio	Objeto	Notas
CREATE ICEBERG TABLE	Esquema
CREATE EXTERNAL VOLUME	Conta	Necessário para criar um novo volume externo.
USAGE	Volume externo	Necessário para fazer referência a um volume externo existente.
CREATE INTEGRATION	Conta	Necessário para criar uma nova integração de catálogo.
USAGE	Integração de catálogo	Necessário para fazer referência a uma integração de catálogo existente.

O privilégio USAGE no banco de dados e no esquema pai é necessário para executar operações em qualquer objeto de um esquema. Observe que uma função com privilégio concedido em um esquema permite que essa função resolva o esquema. Por exemplo, uma função com privilégio CREATE concedido em um esquema pode criar objetos nesse esquema sem também ter USAGE concedido nesse esquema.

Para instruções sobre como criar uma função personalizada com um conjunto específico de privilégios, consulte Criação de funções personalizadas.

Para informações gerais sobre concessões de funções e privilégios para executar ações de SQL em objetos protegíveis, consulte Visão geral do controle de acesso.

Notas de uso¶

Exemplos¶

Crie uma tabela Iceberg que use um catálogo REST Iceberg remoto¶

CREATE OR REPLACE ICEBERG TABLE my_iceberg_table
  EXTERNAL_VOLUME = 'my_external_volume'
  CATALOG = 'my_rest_catalog_integration'
  CATALOG_TABLE_NAME = 'my_remote_table'
  AUTO_REFRESH = TRUE;

Copy

Crie uma tabela Iceberg para consultar uma tabela em Snowflake Open Catalog¶

Este exemplo cria uma tabela Iceberg que você pode usar para Consultar uma tabela no Snowflake Open Catalog usando o Snowflake.

CREATE ICEBERG TABLE open_catalog_iceberg_table
  EXTERNAL_VOLUME = 'my_external_volume'
  CATALOG = 'open_catalog_int'
  CATALOG_TABLE_NAME = 'my_open_catalog_table'
  AUTO_REFRESH = TRUE;

Copy

Criar uma tabela Iceberg em um banco de dados vinculado a catálogo¶

The following example creates a writable Iceberg table in a catalog-linked database with column definitions:

USE DATABASE my_catalog_linked_db;

USE SCHEMA 'my_namespace';

CREATE OR REPLACE ICEBERG TABLE my_iceberg_table (
  first_name string,
  last_name string,
  amount int,
  create_date date
);

Copy

Criar uma tabela particionada em um banco de dados vinculado a catálogo¶

O exemplo a seguir cria uma tabela Iceberg gerenciada externamente usando o valor de uma coluna de carimbo de data/hora denominada start_date para particionar a tabela por dia:

USE DATABASE my_catalog_linked_db;

USE SCHEMA 'my_namespace';

CREATE OR REPLACE ICEBERG TABLE iceberg_partitioned_date_time (start_date timestamp)
  PARTITION BY (DAY(start_date));

Copy

Você pode inserir dados na tabela usando os recursos de carregamento de tabela aceitos. Por exemplo, use uma instrução INSERT INTO para inserir os seguintes dados na tabela iceberg_partitioned_date_time vazia criada anteriormente:

INSERT INTO iceberg_partitioned_date_time (start_date)
  VALUES
    (to_timestamp_ntz('2023-01-02 00:00:00')),
    (to_timestamp_ntz('2023-02-03 00:00:00')),
    (to_timestamp_ntz('2023-01-02 01:00:00')),
    (to_timestamp_ntz('2023-02-03 02:00:00'));

Copy

Para obter mais informações, consulte Particionamento Iceberg.

CREATE ICEBERG TABLE (catálogo REST Iceberg)¶

Sintaxe¶

Sintaxe da variante¶

CREATE ICEBERG TABLE (banco de dados vinculado a catálogo)¶

CREATE ICEBERG TABLE (banco de dados vinculado a catálogo) … AS SELECT¶

Parâmetros obrigatórios¶

Parâmetros opcionais¶

Parâmetros de expressão de partição (partitionExpression)¶

Requisitos de controle de acesso¶

Notas de uso¶

Exemplos¶

Crie uma tabela Iceberg que use um catálogo REST Iceberg remoto¶

Crie uma tabela Iceberg para consultar uma tabela em Snowflake Open Catalog¶

Criar uma tabela Iceberg em um banco de dados vinculado a catálogo¶

Criar uma tabela particionada em um banco de dados vinculado a catálogo¶

Parâmetros de expressão de partição (`partitionExpression`)¶