Apache Iceberg™ : nouveaux chemins d’accès en écriture pour les tables gérées par Snowflake (En attente)

Attention

Ce changement de comportement fait partie du 2025_01 bundle.

Pour connaître le statut actuel du bundle, reportez-vous à Historique du bundle.

Pour les tables Iceberg gérées par Snowflake (y compris les tables converties et les tables Iceberg dynamiques) :

Avant la modification:

Snowflake exige que vous spécifiiez un BASE_LOCATION pour la table et écrit les fichiers de données Parquet et les métadonnées de table au niveau des chemins d’accès suivants de votre stockage Cloud externe :

  • STORAGE_BASE_URL/BASE_LOCATION/data/

  • STORAGE_BASE_URL/BASE_LOCATION/metadata/

Après la modification:

Snowflake n’a plus besoin de BASE_LOCATION et crée des chemins d’accès en utilisant une chaîne aléatoire de 8 caractères ou la valeur d’un nouveau paramètre de chaîne au niveau du schéma appelé BASE_LOCATION_PREFIX.

Si vous spécifiez un BASE_LOCATION, Snowflake ignore et n’utilise pas BASE_LOCATION_PREFIX.

Snowflake crée des chemins d’accès selon les modèles suivants, en fonction des valeurs spécifiées pour BASE_LOCATION ou pour BASE_LOCATION_PREFIX :

  • Pas de BASE_LOCATION, pas de BASE_LOCATION_PREFIX : STORAGE_BASE_URL/<base de données>/<schéma>/<table_name>.<randomId>/<données | métadonnées>/

  • Pas de BASE_LOCATION, BASE_LOCATION_PREFIX = “my_prefix” : STORAGE_BASE_URL/my_prefix/<table_name>.<randomId>/<données | métadonnées>/

  • BASE_LOCATION = “my_base_loc” : STORAGE_BASE_URL/my_base_loc.<randomId>/<données | métadonnées>/

  • BASE_LOCATION = “” (chaîne vide) : STORAGE_BASE_URL/<randomId>/<données | métadonnées>/

Réf : 1873