CREATEICEBERGTABLE (Snowflake comme catalogue Iceberg)¶

Crée ou remplace une table Apache Iceberg qui utilise Snowflake comme catalogue Iceberg dans le schéma actuel/spécifié.

Cette commande prend en charge les variantes suivantes :

CREATE ICEBERGTABLE … AS SELECT (crée une table renseignée ; également appelé CTAS)
CREATE ICEBERGTABLE … LIKE (crée une copie vide d’une table existante)

Cette rubrique fait référence aux tables Iceberg en les appelant simplement « tables », sauf lorsque le fait de préciser tables Iceberg permet d’éviter toute confusion.

Note

Pour stocker des données et des métadonnées Iceberg dans votre stockage Cloud, créez un volume externe et faites-y référence à partir de la table. Pour obtenir des instructions, voir Configurer un volume externe.

Pour utiliser Snowflake Storage à la place, définissez EXTERNAL_VOLUME = 'SNOWFLAKE_MANAGED' (ou utilisez les valeurs par défaut lorsque le catalogue est Snowflake). Dans ce cas, il n’est pas nécessaire de créer un objet de volume externe distinct. Pour plus d’informations, voir Stockage Snowflake pour les tables Apache Iceberg™.

Voir aussi :: ALTER ICEBERG TABLE , DROP ICEBERG TABLE , SHOW ICEBERG TABLES , DESCRIBE ICEBERG TABLE , UNDROP ICEBERG TABLE

Syntaxe¶

CREATE [ OR REPLACE ] [ TRANSIENT ] ICEBERG TABLE [ IF NOT EXISTS ] <table_name> (
    -- Column definition
    <col_name> <col_type> [ DEFAULT <col_default> ]
      [ inlineConstraint ]
      [ NOT NULL ]
      [ [ WITH ] MASKING POLICY <policy_name> [ USING ( <col_name> , <cond_col1> , ... ) ] ]
      [ [ WITH ] PROJECTION POLICY <policy_name> ]
      [ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
      [ COMMENT '<string_literal>' ]

    -- Additional column definitions
    [ , <col_name> <col_type> [ DEFAULT <col_default> ] [ ... ] ]

    -- Out-of-line constraints
    [ , outoflineConstraint [ ... ] ]
  )
  [ PARTITION BY ( partitionExpression [, partitionExpression , ...] ) ]
  [ PATH_LAYOUT = { FLAT | HIERARCHICAL } ]
  [ CLUSTER BY ( <expr> [ , <expr> , ... ] ) ]
  [ EXTERNAL_VOLUME = '<external_volume_name>' ]
  [ CATALOG = 'SNOWFLAKE' ]
  [ BASE_LOCATION = '<directory_for_table_files>' ]
  [ TARGET_FILE_SIZE = '{ AUTO | 16MB | 32MB | 64MB | 128MB }' ]
  [ CATALOG_SYNC = '<open_catalog_integration_name>']
  [ STORAGE_SERIALIZATION_POLICY = { COMPATIBLE | OPTIMIZED } ]
  [ DATA_RETENTION_TIME_IN_DAYS = <integer> ]
  [ MAX_DATA_EXTENSION_TIME_IN_DAYS = <integer> ]
  [ CHANGE_TRACKING = { TRUE | FALSE } ]
  [ COPY GRANTS ]
  [ ERROR_LOGGING = { TRUE | FALSE } ]
  [ COMMENT = '<string_literal>' ]
  [ ICEBERG_VERSION = <integer> ]
  [ ENABLE_ICEBERG_MERGE_ON_READ = { TRUE | FALSE } ]
  [ [ WITH ] ROW ACCESS POLICY <policy_name> ON ( <col_name> [ , <col_name> ... ] ) ]
  [ [ WITH ] AGGREGATION POLICY <policy_name> ]
  [ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
  [ WITH CONTACT ( <purpose> = <contact_name> [ , <purpose> = <contact_name> ... ] ) ]
  [ ENABLE_DATA_COMPACTION = { TRUE | FALSE } ]

Où :

inlineConstraint ::=
  [ CONSTRAINT <constraint_name> ]
  {   UNIQUE
    | PRIMARY KEY
    | [ FOREIGN KEY ] REFERENCES <ref_table_name> [ ( <ref_col_name> ) ]
    | CHECK ( <expr> )
  }
  [ <constraint_properties> ]
Pour plus de détails sur les contraintes en ligne, voir CREATE | ALTER TABLE … CONSTRAINT.
outoflineConstraint ::=
  [ CONSTRAINT <constraint_name> ]
  {   UNIQUE [ ( <col_name> [ , <col_name> , ... ] ) ]
    | PRIMARY KEY [ ( <col_name> [ , <col_name> , ... ] ) ]
    | [ FOREIGN KEY ] [ ( <col_name> [ , <col_name> , ... ] ) ]
      REFERENCES <ref_table_name> [ ( <ref_col_name> [ , <ref_col_name> , ... ] ) ]
    | CHECK ( <expr> )
  }
  [ <constraint_properties> ]
Note

Snowflake représente les colonnes définies comme PRIMARY KEY comme champs d’identificateur dans les métadonnées Iceberg. Les IDs de ces colonnes figurent dans les métadonnées sous forme d”IDs de champ d’identificateur.

Snowflake n’impose pas de contraintes NOT NULL ni UNIQUE sur les colonnes PRIMARY KEY de tables Iceberg.

Pour plus de détails sur les contraintes hors ligne, voir CREATE | ALTER TABLE … CONSTRAINT.
partitionExpression ::=
  <col_name> -- identity transform
  | BUCKET ( <num_buckets> , <col_name> )
  | TRUNCATE ( <width> , <col_name> )
  | YEAR ( <col_name> )
  | MONTH ( <col_name> )
  | DAY ( <col_name> )
  | HOUR ( <col_name> )

Syntaxe des variantes¶

CREATE ICEBERG TABLE … AS SELECT (également appelé CTAS)¶

Crée une nouvelle table contenant les données renvoyées par une requête. Placez la clause AS SELECT à la fin de l’instruction.

CREATE [ OR REPLACE ] [ TRANSIENT ] ICEBERG TABLE <table_name> [ ( <col_name> [ <col_type> ] [ DEFAULT <col_default> ] , <col_name> [ <col_type> ] [ DEFAULT <col_default> ] , ... ) ]
  [ CLUSTER BY ( <expr> [ , <expr> , ... ] ) ]
  [ EXTERNAL_VOLUME = '<external_volume_name>' ]
  [ CATALOG = 'SNOWFLAKE' ]
  [ BASE_LOCATION = '<relative_path_from_external_volume>' ]
  [ COPY GRANTS ]
  [ ICEBERG_VERSION = <integer> ]
  [ ENABLE_ICEBERG_MERGE_ON_READ = { TRUE | FALSE } ]
  [ ... ]
  AS SELECT <query>

Une politique de masquage peut être appliquée à une colonne dans une instruction CTAS. Spécifiez la politique de masquage après le type de données de la colonne. De même, une politique d’accès aux lignes peut être appliquée à la table. Par exemple :

CREATE ICEBERG TABLE <table_name> ( <col1> <data_type> [ DEFAULT <col_default> ] [ WITH ] MASKING POLICY <policy_name> [ , ... ] )
  [ EXTERNAL_VOLUME = '<external_volume_name>' ]
  [ CATALOG = 'SNOWFLAKE' ]
  [ BASE_LOCATION = '<directory_for_table_files>' ]
  [ ICEBERG_VERSION = <integer> ]
  [ ENABLE_ICEBERG_MERGE_ON_READ = { TRUE | FALSE } ]
  [ WITH ] ROW ACCESS POLICY <policy_name> ON ( <col1> [ , ... ] )
  [ ... ]
  AS SELECT <query>

Note

Dans un CTAS, le paramètre COPY GRANTS n’est valide que lorsqu’elle est combinée avec la clause OR REPLACE. COPY GRANTS copie les privilèges de la table remplacée par CREATE OR REPLACE (si elle existe déjà), et non de la ou des tables sources interrogées dans l’instruction SELECT. CTAS avec COPY GRANTS vous permet d’écraser une table avec un nouvel ensemble de données tout en conservant les autorisations existantes sur cette table.

Pour plus d’informations sur le paramètre COPY GRANTS, voir COPY GRANTS.

Pour plus d’informations sur la syntaxe de cette variante, voir les Notes sur l’utilisation.

CREATE ICEBERG TABLE … LIKE¶

Crée une nouvelle table avec les mêmes définitions de colonnes qu’une table existante, mais sans copier les données de la table existante. Les noms de colonnes, les types, les valeurs par défaut et les contraintes sont copiés dans la nouvelle table :

CREATE [ OR REPLACE ] [ TRANSIENT ] ICEBERG TABLE <table_name> LIKE <source_table>
  [ CLUSTER BY ( <expr> [ , <expr> , ... ] ) ]
  [ COPY GRANTS ]
  [ ... ]

Pour plus d’informations sur le paramètre COPY GRANTS, voir COPY GRANTS.

Note

CREATE TABLE. .. LIKE n’est pas pris en charge pour les tables dont la séquence d’incrémentation automatique este accessible via un partage de données.

Pour plus d’informations sur la syntaxe de cette variante, voir les Notes sur l’utilisation.

CREATE ICEBERG TABLE … CLONE¶

Crée une table Iceberg avec les mêmes définitions de colonnes et contenant toutes les données existantes de la table source, sans réellement copier les données. Vous pouvez également utiliser cette variante pour cloner une table à un moment ou à un moment précis dans le passé (en utilisant Time Travel) :

CREATE [ OR REPLACE ] ICEBERG TABLE [ IF NOT EXISTS ] <name>
  CLONE <source_iceberg_table>
    [ { AT | BEFORE } ( { TIMESTAMP => <timestamp> | OFFSET => <time_difference> | STATEMENT => <id> } ) ]
    [COPY GRANTS]
    ...

Note

Si l’instruction remplace une table Iceberg existante du même nom, Snowflake copie les autorisations de la table remplacée. S’il n’existe aucune table de ce nom, Snowflake copie les autorisations à partir de la table source en cours de clonage.

Pour plus d’informations sur le paramètre COPY GRANTS, voir COPY GRANTS.

Pour plus d’informations sur le clonage, voir CREATE <objet> … CLONE et Clonage et tables Apache Iceberg™.

Paramètres requis¶

table_name

Indique l’identificateur (le nom) de la table ; doit être unique pour le schéma dans lequel la table est créée.

De plus, l’identificateur doit commencer par un caractère alphabétique et ne peut pas contenir d’espaces ou de caractères spéciaux à moins que toute la chaîne d’identificateur soit délimitée par des guillemets doubles (par exemple, "My object"). Les identificateurs entre guillemets doubles sont également sensibles à la casse.

Pour plus d’informations, voir Exigences relatives à l’identificateur.

col_name

Indique l’identificateur (le nom) de colonne. Toutes les exigences relatives aux identificateurs de table s’appliquent également aux identificateurs de colonne.

Pour plus d’informations, voir Exigences relatives à l’identificateur et Mots clés réservés et limités.

Note

En plus des mots clés réservés standard, les mots clés suivants ne peuvent pas être utilisés comme identificateurs de colonnes, car ils sont réservés aux fonctions de contexte standard ANSI :

CURRENT_DATE
CURRENT_ROLE
CURRENT_TIME
CURRENT_TIMESTAMP
CURRENT_USER

Pour la liste des mots clés réservés, voir Mots clés réservés et limités.

col_type

Spécifie le type de données pour la colonne.

Pour plus d’informations sur les types de données qui peuvent être spécifiés pour les colonnes de la table, voir Types de données des tables Apache Iceberg™.

Note

Vous ne pouvez pas utiliser float ni double comme clés primaires (conformément à la spécification Apache Iceberg).

Paramètres facultatifs¶

TRANSIENT

Crée une table Iceberg transitoire. Les tables transitoires n’ont pas de période Fail-safe, de sorte qu’elles n’encourent pas de coûts de stockage Fail-safe.

Pour les tables Iceberg qui utilisent le stockage fourni par Snowflake (EXTERNAL_VOLUME = 'SNOWFLAKE_MANAGED' ), le mot-clé TRANSIENT détermine si les données de la table sont protégées par Fail-safe. Pour plus d’informations, voir Stockage Snowflake pour les tables Apache Iceberg™.

Note

Les tables Iceberg transitoires ne sont prises en charge qu’avec le stockage fourni par Snowflake (EXTERNAL_VOLUME = 'SNOWFLAKE_MANAGED'). Vous ne pouvez pas créer une table Iceberg transitoire avec un autre volume externe.

col_name col_type DEFAULT col_default

Pour une table conforme à Iceberg v3, spécifie à la fois la valeur par défaut initiale et la valeur par défaut d’écriture pour la colonne spécifiée. Si le type de données de la colonne est une chaîne, vous devez entourer la valeur par défaut de guillemets simples.

Important

Lorsque vous spécifiez une valeur par défaut pour une colonne, vous devez spécifier une valeur statique ; vous ne pouvez pas spécifier une expression ou une fonction pour la valeur. Cette exigence est conforme à la spécification Iceberg v3 et s’applique à la fois à la valeur par défaut initiale et à la valeur par défaut d’écriture.

Les valeurs par défaut sont une fonctionnalité Iceberg v3, vous ne pouvez donc pas spécifier une valeur par défaut pour une table conforme à Iceberg v2. Pour plus d’informations sur l’utilisation des valeurs par défaut avec les tables Iceberg, voir Utiliser des valeurs par défaut avec des tables Iceberg.

Note

Pour modifier l’écriture par défaut de la colonne après la création de la table, exécutez ALTER ICEBERG TABLE … ALTER COLUMN … SET WRITE DEFAULT.

BASE_LOCATION = 'directory_for_table_files'

Le chemin d’accès à un répertoire, que Snowflake utilise pour construire les chemins d’écriture des fichiers de données et de métadonnées de la table. Spécifiez un chemin d’accès relatif à partir de l’emplacement EXTERNAL_VOLUME de la table.

S’il n’est pas spécifié, Snowflake construit un chemin d’écriture en utilisant des attributs tels que la valeur du paramètre BASE_LOCATION_PREFIX et le nom de la table.

Pour plus d’informations, voir Répertoires de données et de métadonnées.

Ce répertoire ne peut pas être modifié après la création d’une table.

TARGET_FILE_SIZE = '{ AUTO | 16MB | 32MB | 64MB | 128MB }'

Spécifie une taille de fichier Parquet cible pour la table.

'{ 16MB | 32MB | 64MB | 128MB }' spécifie une taille de fichier cible fixe pour la table.
'AUTO' fonctionne différemment, selon le type de table :
- Tables gérées par Snowflake : AUTO spécifie que Snowflake doit choisir la taille du fichier de la table en fonction de caractéristiques de la table telles que la taille, les modèles DML, la charge de travail d’ingestion et la configuration du clustering. Snowflake ajuste automatiquement la taille du fichier, à partir de 16 MB, pour de meilleures performances en lecture et en écriture dans Snowflake. Utilisez cette option pour optimiser les performances des tables dans Snowflake.
- Tables gérées en externe : AUTO spécifie que Snowflake doit être mis à l’échelle de manière dynamique jusqu’à la plus grande taille de fichier (128 MB).

Pour plus d’informations, voir Définir une taille de fichier cible.

Par défaut : AUTO

CONSTRAINT ...

Définit une contrainte en ligne ou hors ligne pour la ou les colonnes spécifiées dans la table.

Pour des informations sur la syntaxe, voir CREATE | ALTER TABLE … CONSTRAINT. Pour plus d’informations sur les contraintes, voir Contraintes.

MASKING POLICY = policy_name

Spécifie la politique de masquage à définir sur une colonne.

PROJECTION POLICY policy_name

Spécifie la politique de projection à définir sur une colonne.

COMMENT 'string_literal'

Spécifie un commentaire pour la colonne.

(Notez que les commentaires peuvent être spécifiés au niveau de la colonne ou de la table. La syntaxe de chacun est légèrement différente).

USING ( col_name , cond_col_1 ... )

Spécifie les arguments à transmettre dans l’expression SQL pour la politique de masquage conditionnelle.

La première colonne de la liste spécifie la colonne pour les conditions de la politique de masquage ou de tokenisation des données et doit correspondre à la colonne à laquelle la politique de masquage est définie.

Les colonnes supplémentaires spécifient les colonnes à évaluer pour déterminer s’il faut masquer ou tokeniser les données de chaque ligne du résultat de requête lorsqu’une requête effectue une sélection à partir de la première colonne.

Si la clause USING est omise, Snowflake traite la politique de masquage conditionnelle comme une politique de masquage normale.

PARTITION BY = ( partitionExpression [ , partitionExpression , ... ] )

Spécifie un ou plusieurs expressions de partition.

PATH_LAYOUT = { FLAT | HIERARCHICAL }

Spécifie la structure de chemin que Snowflake utilise lors de l’écriture de fichiers de données Parquet dans la table :

FLAT : Snowflake écrit tous les fichiers de données Parquet dans le répertoire data/ de la table.
HIERARCHICAL : Snowflake écrit des données partitionnées dans le répertoire data/ de la table en utilisant une structure de chemin hiérarchique. Avec cette disposition, chaque colonne de partition est représentée par un niveau de répertoire dans le chemin. Pour définir ces colonnes de partition, utilisez le paramètre PARTITION BY. Cette structure est également appelée partitionnement de « style Hive ».

Si vous spécifiez PATH_LAYOUT = HIERARCHICAL sans une clause PARTITION BY, Snowflake stocke les fichiers de données Parquet en utilisant un chemin d’accès à structure plate. Vous ne pouvez pas modifier la structure des chemins d’accès d’une table existante. Vous pouvez donc définir ce paramètre sur HIERARCHICAL sans spécifier de clause PARTITION BY si vous ne souhaitez pas utiliser le partitionnement avec des chemins d’accès hiérarchiques pour le moment, mais que vous pourriez le faire à l’avenir.

Note

Pour les tables gérées en externe que vous créez dans une base de données Snowflake standard, Snowflake déduit et respecte le schéma de partitionnement spécifié par le catalogue distant.

Par défaut : FLAT

CLUSTER BY ( expr [ , expr , ... ] )

Spécifie une ou plusieurs colonnes ou expressions de colonne dans la table comme clés de clustering. Pour plus d’informations, voir Clés de clustering et tables en cluster.

En cas d’utilisation d’une syntaxe de variante (LIKE, AS SELECT), voir les notes sur l’utilisation de la syntaxe de variante.

Par défaut : aucune valeur (aucune clé de clustering n’est définie pour la table)

Important

Les clés de clustering ne sont pas recommandées ni conçues pour toutes les tables. Elles sont généralement intéressantes pour les tables très importantes (de plusieurs téraoctets).

Avant de spécifier une clé de clustering pour une table, vous devez comprendre ce que sont les micro-partitions. Pour plus d’informations, voir Fonctionnement des structures de table dans Snowflake.

EXTERNAL_VOLUME = 'external_volume_name'

Spécifie l’endroit où la table Iceberg stocke ses fichiers de métadonnées et ses données au format Parquet. Les métadonnées et les fichiers manifestes Iceberg stockent le schéma de la table, les partitions, les instantanés et d’autres métadonnées.

Utilisez l’une des méthodes suivantes :

L’identificateur d’un volume externe que vous avez créé dans votre compte. Les données et métadonnées Iceberg sont stockées dans votre stockage Cloud en fonction des emplacements de stockage de ce volume.
La valeur réservée SNOWFLAKE_MANAGED pour utiliser le stockage fourni par Snowflake.:code:SNOWFLAKE_MANAGED n’est pas un objet de volume externe créé par l’utilisateur ; vous n’exécutez pas CREATE EXTERNAL VOLUME pour cette valeur. Pour plus d’informations, voir Stockage Snowflake pour les tables Apache Iceberg™.

Si vous ne spécifiez pas ce paramètre, la table Iceberg utilise par défaut le volume externe du schéma, de la base de données ou du compte. Le schéma est prioritaire sur la base de données, et la base de données est prioritaire sur le compte. Lorsque le catalogue effectif est Snowflake (CATALOG = 'SNOWFLAKE'), le volume externe par défaut est SNOWFLAKE_MANAGED sauf si un paramètre par défaut différent est défini au niveau du schéma, de la base de données ou du compte.

CATALOG = 'SNOWFLAKE'

Spécifie Snowflake comme catalogue Iceberg. Snowflake prend en charge la maintenance tout au long du cycle de vie de la table, comme le compactage.

CATALOG_SYNC = 'open_catalog_integration_name'

Spécifie éventuellement le nom d’une intégration de catalogue configurée pour Snowflake Open Catalog. Si spécifié, Snowflake synchronise la table avec un catalogue externe dans votre compte Snowflake Open Catalog. Pour plus d’informations sur la synchronisation des tables Iceberg gérées par Snowflake avec Open Catalog, voir Synchronisation d’une table gérée par Snowflake avec Snowflake Open Catalog.

Pour plus d’informations sur ce paramètre, voir CATALOG_SYNC.

ICEBERG_VERSION = integer

Spécifie la version de la spécification Apache Iceberg™ à laquelle la table est conforme.

Prudence

Avant d’utiliser d’autres moteurs pour mettre à niveau une version de format de tables Iceberg dans les propriétés de table vers la v3, assurez-vous que la table n’est pas utilisée par des moteurs ou des applications qui ne prennent pas encore en charge la v3. La rétrogradation des versions de format n’est pas prise en charge dans la spécification Apache Iceberg. Par conséquent, tous les lecteurs et rédacteurs doivent prendre en charge la v3. La version par défaut des tables Iceberg dans Snowflake est la v2, qui peut être configurée en v3 si nécessaire. L’utilisation de Snowflake pour effectuer des mises à niveau de version sur place n’est pas prise en charge pour le moment.

Si vous ne définissez pas ce paramètre, la table Iceberg utilise par défaut la version Iceberg du schéma, de la base de données ou du compte. Le schéma est prioritaire sur la base de données, et la base de données est prioritaire sur le compte.

2 : La table est conforme à la version 2 d’Iceberg.

3 : La table est conforme à la version 3 d’Iceberg.

Par défaut : 2

Pour plus d’informations sur ce paramètre, voir ICEBERG_VERSION.

ENABLE_ICEBERG_MERGE_ON_READ = { TRUE | FALSE }

Spécifie si la table utilise le comportement de fusion à la lecture.

Si vous ne définissez pas ce paramètre, la table Iceberg utilise par défaut le comportement de fusion à la lecture spécifié pour le schéma, la base de données ou le compte. Le schéma est prioritaire sur la base de données, et la base de données est prioritaire sur le compte.

Valeurs:

TRUE : La table utilise un comportement de fusion à la lecture. Selon que la table est conforme à la version 2 ou 3 de la spécification de table Apache Iceberg™, le comportement est celui décrit dans la liste suivante :

Si la table est conforme à v2, utilisez des fichiers de suppression positionnels.
Si la table est conforme à v3, utilisez des vecteurs de suppression.

FALSE : La table utilise le comportement copie à l’écriture.

Par défaut : TRUE

Pour une description détaillée de ce paramètre, voir ENABLE_ICEBERG_MERGE_ON_READ.

STORAGE_SERIALIZATION_POLICY = { COMPATIBLE | OPTIMIZED }

Spécifie la politique de sérialisation du stockage de la table. Si cela n’est pas spécifié lors de la création de la table, la table hérite de la valeur définie au niveau du schéma, de la base de données ou du compte. Si la valeur n’est spécifiée à aucun niveau, la table utilise la valeur par défaut.

Vous ne pouvez pas modifier la valeur de ce paramètre après la création de la table.

COMPATIBLE : Snowflake effectue un encodage et une compression qui garantissent l’interopérabilité avec les moteurs de calcul tiers.
OPTIMIZED : Snowflake effectue un encodage et une compression qui garantissent les performances optimales des tables au sein de Snowflake.

Par défaut : OPTIMIZED

DATA_RETENTION_TIME_IN_DAYS = integer

Spécifie la période de conservation de la table gérée par Snowflake pour que les actions Time Travel (SELECT, CLONE, UNDROP) puissent être effectuées sur les données historiques de la table. Pour plus d’informations, voir Compréhension et utilisation de la fonction Time Travel.

Pour une description détaillée de ce paramètre de niveau objet, ainsi que plus d’informations sur les paramètres d’objet, voir Paramètres.

Valeurs :

Édition Standard : 0 ou 1

Enterprise Edition : de 0 à 90 pour les tables permanentes

Par défaut :

Édition Standard : 1

Édition Enterprise (ou supérieure) : 1 (sauf si une valeur par défaut différente a été spécifiée au niveau du compte, du schéma ou de la base de données)

Note

Une valeur de 0 désactive effectivement Time Travel pour la table.

MAX_DATA_EXTENSION_TIME_IN_DAYS = integer

Paramètre d’objet qui spécifie le nombre maximum de jours pendant lesquels Snowflake peut prolonger la période de conservation des données de la table, afin d’éviter que les flux sur la table ne deviennent obsolètes.

Pour une description détaillée de ce paramètre, voir MAX_DATA_EXTENSION_TIME_IN_DAYS.

CHANGE_TRACKING = { TRUE | FALSE }

Spécifie s’il faut activer le suivi des modifications sur la table.

TRUE active le suivi des modifications sur la table. Ce paramètre ajoute une paire de colonnes masquées à la table source et commence à stocker les métadonnées de suivi des modifications dans les colonnes. Ces colonnes consomment une petite quantité de stockage.

Les métadonnées de suivi des modifications peuvent être interrogées à l’aide de la clause CHANGES pour les instructions SELECT, ou en créant et en interrogeant un ou plusieurs flux sur la table.
FALSE n’active pas le suivi des modifications sur la table.

Par défaut : FALSE

COPY GRANTS

Spécifie de conserver les privilèges d’accès de la table d’origine lorsqu’une nouvelle table est créée à l’aide de l’une des variables CREATE TABLE suivantes :

CREATE OR REPLACE TABLE

CREATE TABLE … LIKE

CREATE TABLE … CLONE

Ce paramètre copie tous les privilèges, excepté OWNERSHIP, de la table existante vers la nouvelle table. La nouvelle table n’hérite pas des attributions futures définies pour le type d’objet dans le schéma. Par défaut, le rôle qui exécute l’instruction CREATE TABLE possède la nouvelle table.

Si le paramètre n’est pas inclus dans l’instruction CREATE ICEBERG TABLE, la nouvelle table n’hérite pas des privilèges d’accès explicites accordés sur la table d’origine, mais des attributions futures définies pour le type d’objet dans le schéma.

Remarque :

Avec le partage des données :

Si la table existante a été partagée avec un autre compte, la table de remplacement est également partagée.

Si la table existante a été partagée avec votre compte en tant que consommateur de données et que l’accès a été accordé à d’autres rôles dans le compte (en utilisant GRANT IMPORTED PRIVILEGES sur la base de données mère), l’accès est également accordé à la table de remplacement.

La sortie SHOW GRANTS pour la table de remplacement liste le concessionnaire des privilèges copiés comme le rôle qui a exécuté l’instruction CREATE ICEBERG TABLE avec l’horodatage courant lorsque l’instruction a été exécutée.

L’opération de copie des accords s’effectue atomiquement dans la commande CREATE ICEBERG TABLE (c’est-à-dire dans la même transaction).

ERROR_LOGGING = { TRUE | FALSE }

Spécifie s’il faut activer la journalisation des erreurs DML pour la table.

TRUE active la journalisation des erreurs DML pour la table.
FALSE désactive la journalisation des erreurs DML pour la table.

Pour plus d’informations, voir Journalisation des erreurs DML.

Note

Si le paramètre OPT_OUT_ERROR_LOGGING est défini sur TRUE pour une session, la journalisation des erreurs DML n’est pas activée, qu’elle soit activée ou non pour des tables spécifiques.

COMMENT = 'string_literal'

Spécifie un commentaire. Vous pouvez spécifier un commentaire au niveau de la colonne ou de la table. La syntaxe de chacun est légèrement différente.

Par défaut : aucune valeur

WITH CONTACT ( purpose = contact [ , purpose = contact ...] )

Associez le nouvel objet à un ou plusieurs contacts.

Spécifiez la clause WITH CONTACT après toutes les autres clauses à l’exception de la clause AS (si cette clause est prise en charge par cette commande).

ROW ACCESS POLICY policy_name ON ( col_name [ , col_name ... ] ): Spécifie la politique d’accès aux lignes à définir sur une table.
AGGREGATION POLICY policy_name: Spécifie la politique d’agrégation à définir sur une table.

TAG ( tag_name = 'tag_value' [ , tag_name = 'tag_value' , ... ] )

Spécifie le nom de la balise et la valeur de la chaîne de la balise.

La valeur de la balise est toujours une chaîne de caractères et le nombre maximum de caractères pour la valeur de la balise est 256.

Pour plus d’informations sur la spécification des balises dans une instruction, voir Quotas de balises.

ENABLE_DATA_COMPACTION = { TRUE | FALSE }

Spécifie si Snowflake doit activer le compactage des données sur la table.

TRUE : Snowflake effectue le compactage des données sur la table.
FALSE : Snowflake n’effectue pas de compactage des données sur la table.

Par défaut : TRUE

Pour plus d’informations, voir ENABLE_DATA_COMPACTION et Définition du compactage des données.

ICEBERG_VERSION = integer

Spécifie la version de la spécification Apache Iceberg™ à laquelle la table est conforme.

Prudence

2 : La table est conforme à la version 2 d’Iceberg.

3 : La table est conforme à la version 3 d’Iceberg.

Par défaut : 2

Pour plus d’informations sur ce paramètre, voir ICEBERG_VERSION.

ENABLE_ICEBERG_MERGE_ON_READ = { TRUE | FALSE }

Spécifie s’il convient d’activer le comportement de fusion à la lecture pour les tables Apache Iceberg™.

Valeurs:

TRUE : Les nouvelles tables utilisent un comportement de fusion à la lecture.

FALSE : Les nouvelles tables utilisent un comportement de copie à l’écriture.

Par défaut:

TRUE

Pour une description détaillée de ce paramètre, voir ENABLE_ICEBERG_MERGE_ON_READ. Pour plus d’informations sur le comportement de fusion à la lecture et de copie à l’écriture dans Snowflake, consultez Utiliser les suppressions de niveau ligne.

Paramètres d’expression de partition (`partitionExpression`)¶

Snowflake prend en charge toutes les transformations de partition dans la version 2 de la spécification Apache Iceberg. Pour plus d’informations, voir Transformations de partition dans la spécification Apache Iceberg.

Pour plus d’informations sur le partitionnement des tables Iceberg, consultez Partitionnement Iceberg.

col_name

Spécifie l’ identificateur (le nom) de la colonne source à partitionner.

Lorsqu’il est utilisé seul, sans transformation comme YEAR, spécifie une transformation d’identité sur la colonne source. Pour plus d’informations, consultez l’identité.

BUCKET

Spécifie une transformation de compartiment. Pour plus d’informations, consultez Détails de la transformation du compartiment.

num_buckets est le nombre de compartiments dans lesquels regrouper les données.

TRUNCATE

Spécifie une transformation tronquée, qui partitionne les données en fonction des valeurs tronquées de la colonne source spécifiée. Pour plus d’informations, consultez Tronquer les détails de la transformation.

YEAR

Spécifie une transformation d’année, qui extrait l’année d’une valeur de colonne source de date ou d’horodatage. Pour plus d’informations, consultez Transformations de partition.

MONTH

Spécifie une transformation de mois. Pour plus d’informations, consultez Transformations de partition.

DAY

Spécifie une transformation de jour, qui extrait le jour d’une valeur de colonne source de date ou d’horodatage. Pour plus d’informations, consultez Transformations de partition.

HOUR

Spécifie une transformation d’heure, qui extrait l’heure d’une valeur de colonne source d’horodatage. Pour plus d’informations, consultez Transformations de partition.

Exigences en matière de contrôle d’accès¶

Un rôle utilisé pour exécuter cette opération doit au minimum disposer des privilèges suivants :


Privilège	Objet	Remarques
CREATE ICEBERG TABLE	Schéma
CREATE EXTERNAL VOLUME	Compte	Nécessaire pour créer un nouveau volume externe.
USAGE	Volume externe	Nécessaire pour référencer un volume externe existant.

Pour effectuer une opération sur un objet dans un schéma, il est nécessaire de disposer d’au moins un privilège sur la base de données parente et d’au moins un privilège sur le schéma parent.

Pour obtenir des instructions sur la création d’un rôle personnalisé avec un ensemble spécifique de privilèges, voir Création de rôles personnalisés.

Pour des informations générales sur les rôles et les privilèges accordés pour effectuer des actions SQL sur des objets sécurisables, voir Aperçu du contrôle d’accès.

Notes sur l’utilisation¶

Considérations relatives à l’exécution de cette commande :
- Les tables Iceberg inter-Cloud et interrégionales ne sont actuellement pas prises en charge lorsque vous utilisez Snowflake comme catalogue Iceberg. Si CREATE ICEBERG TABLE renvoie un message d’erreur tel que "External volume <volume_name> must have a STORAGE_LOCATION defined in the local region ...", assurez-vous que votre volume externe utilise un emplacement de stockage dans la même région que celle de votre compte Snowflake.
- Si vous avez créé votre volume externe via un identificateur entre guillemets doubles, vous devez spécifier l’identificateur exactement tel qu’il a été créé (y compris avec les guillemets doubles) dans votre instruction CREATE ICEBERG TABLE. Le fait de ne pas inclure de guillemets peut entraîner une erreur Object does not exist (ou un type d’erreur similaire).
  
  Pour un exemple, voir la section Exemples (dans cette rubrique).
- Pour créer une table Iceberg avec la clause USING TEMPLATE (et les définitions de colonnes dérivées de la sortie INFER_SCHEMA), vous devez spécifier KIND => 'ICEBERG' pour la fonction INFER_SCHEMA.
Considérations pour créer des tables :
- Un schéma ne peut pas contenir de tables et/ou de vues portant le même nom. Lors de la création d’une table :
  Si une vue portant le même nom existe déjà dans le schéma, une erreur est renvoyée et la table n’est pas créée.
  
  Si une table portant le même nom existe déjà dans le schéma, une erreur est renvoyée et la table n’est pas créée, sauf si le mot clé facultatif OR REPLACE est inclus dans la commande.
- Les instructions CREATE OR REPLACE <objet> sont atomiques. En d’autres termes, lorsqu’un objet est remplacé, l’ancien objet est supprimé et le nouvel objet est créé dans une seule transaction.
  
  Cela signifie que toutes les requêtes simultanées à l’opération CREATE OR REPLACE ICEBERG TABLE utilisent soit l’ancienne soit la nouvelle version de la table.
- Les clauses OR REPLACE et IF NOT EXISTS s’excluent mutuellement. Elles ne peuvent pas être utilisées dans la même instruction.
- Comme les mots clés réservés, les noms de fonctions réservés ANSI (CURRENT_DATE, CURRENT_TIMESTAMP, etc.) ne peuvent pas être utilisés comme noms de colonnes.
- La recréation d’une table (en utilisant le mot clé OR REPLACE facultatif) détruit son historique, ce qui rend tout flux sur la table périmé. Un flux périmé est illisible.

Pour résoudre les problèmes liés à la création d’une table gérée par Snowflake, consultez Impossible de créer une table gérée par Snowflake.

Exemples¶

Créer une table Iceberg avec Snowflake comme catalogue¶

Cet exemple crée une table Iceberg avec Snowflake comme catalogue Iceberg. La table obtenue est gérée par Snowflake et prend en charge l’accès en lecture et en écriture.

L’exemple définit le nom de table (my_iceberg_table) comme BASE_LOCATION. Ainsi, Snowflake écrit les données et les métadonnées dans un répertoire qui utilise le même nom que la table à l’emplacement de votre volume externe.

CREATE ICEBERG TABLE my_iceberg_table (amount int)
  CATALOG = 'SNOWFLAKE'
  EXTERNAL_VOLUME = 'my_external_volume'
  BASE_LOCATION = 'my_iceberg_table';

Créer une table Iceberg partitionnée¶

L’exemple suivant crée une table Iceberg gérée par Snowflake en utilisant la valeur d’une colonne nommée c_nationkey pour partitionner la table :

CREATE OR REPLACE ICEBERG TABLE customer_iceberg_partitioned (
  c_custkey INTEGER,
  c_name STRING,
  c_address STRING,
  c_nationkey INTEGER,
  c_phone STRING,
  c_acctbal INTEGER,
  c_mktsegment STRING,
  c_comment STRING
)
  PARTITION BY (c_nationkey)
  EXTERNAL_VOLUME = 'my_ext_vol'
  CATALOG = 'SNOWFLAKE'
  BASE_LOCATION = 'customer_iceberg_partitioned';

Pour plus d’informations, voir Partitionnement Iceberg.

Créer une table Iceberg partitionnée avec une structure hiérarchique¶

L’exemple suivant crée une table Iceberg gérée par Snowflake en utilisant la valeur d’une colonne nommée c_nationkey pour partitionner la table. Parce que PATH_LAYOUT = HIERARCHICAL, Snowflake écrit des données dans la table Iceberg partitionnée en utilisant une structure de chemin d’accès hiérarchique pour les fichiers où les informations de partitionnement sont incluses dans les chemins d’accès aux fichiers :

CREATE OR REPLACE ICEBERG TABLE customer_iceberg_partitioned (
  c_custkey INTEGER,
  c_name STRING,
  c_address STRING,
  c_nationkey INTEGER,
  c_phone STRING,
  c_acctbal INTEGER,
  c_mktsegment STRING,
  c_comment STRING
)
  PARTITION BY (c_nationkey)
  PATH_LAYOUT = HIERARCHICAL
  EXTERNAL_VOLUME = 'my_ext_vol'
  CATALOG = 'SNOWFLAKE'
  BASE_LOCATION = 'customer_iceberg_partitioned';

Pour plus d’informations, voir Partitionnement avec des chemins hiérarchiques.

Créer une table Iceberg via la syntaxe de variante CTAS¶

Cet exemple utilise la syntaxe de variante CREATE ICEBERG TABLE … AS SELECT pour créer une nouvelle table Iceberg à partir d’une table nommée base_iceberg_table. La clause AS SELECT doit se trouver à la fin de l’instruction.

CREATE OR REPLACE ICEBERG TABLE iceberg_table_copy (column1 int)
  EXTERNAL_VOLUME = 'my_external_volume'
  CATALOG = 'SNOWFLAKE'
  BASE_LOCATION = 'iceberg_table_copy'
  AS SELECT * FROM base_iceberg_table;

Spécifier un volume externe avec un identificateur entre guillemets doubles¶

Cet exemple crée une table Iceberg avec un volume externe dont l’identificateur contient des guillemets doubles. Les identificateurs entre guillemets doubles sont sensibles à la casse et contiennent souvent des caractères spéciaux.

L’identificateur "external_volume_1" est spécifié exactement tels qu’il a été créé (y compris avec les guillemets doubles). Le fait de ne pas inclure de guillemets peut entraîner une erreur Object does not exist (ou un type d’erreur similaire).

Pour en savoir plus, voir Identificateurs entre guillemets doubles.

CREATE OR REPLACE ICEBERG TABLE table_with_quoted_external_volume
  EXTERNAL_VOLUME = '"external_volume_1"'
  CATALOG = 'SNOWFLAKE'
  BASE_LOCATION = 'my/relative/path/from/external_volume';

Créer une table Iceberg v3¶

L’exemple suivant crée une table Apache Iceberg™ gérée par Snowflake conforme à la v3 de la spécification Apache Iceberg™ :

CREATE ICEBERG TABLE my_v3_iceberg_table (
  record VARIANT,
  event_timestamp TIMESTAMP_LTZ(6)
)
  CATALOG = 'SNOWFLAKE'
  EXTERNAL_VOLUME = 'my_external_volume'
  BASE_LOCATION = 'my_iceberg_table'
  ICEBERG_VERSION = 3;

CREATEICEBERGTABLE (Snowflake comme catalogue Iceberg)¶

Syntaxe¶

Syntaxe des variantes¶

CREATE ICEBERG TABLE … AS SELECT (également appelé CTAS)¶

CREATE ICEBERG TABLE … LIKE¶

CREATE ICEBERG TABLE … CLONE¶

Paramètres requis¶

Paramètres facultatifs¶

Paramètres d’expression de partition (partitionExpression)¶

Exigences en matière de contrôle d’accès¶

Notes sur l’utilisation¶

Exemples¶

Créer une table Iceberg avec Snowflake comme catalogue¶

Créer une table Iceberg partitionnée¶

Créer une table Iceberg partitionnée avec une structure hiérarchique¶

Créer une table Iceberg via la syntaxe de variante CTAS¶

Spécifier un volume externe avec un identificateur entre guillemets doubles¶

Créer une table Iceberg v3¶

Paramètres d’expression de partition (`partitionExpression`)¶