Remarques relatives au clonage¶

Ce chapitre fournit des remarques importantes sur le clonage d’objets dans Snowflake, en particulier sur le clonage de bases de données, de schémas et de tables (hors tables temporaires). Des facteurs tels que les transactions DDL et DML (sur l’objet source), Time Travel et les périodes de conservation des données peuvent affecter le clone d’objet.

Privilèges de contrôle d’accès pour les objets clonés¶

Si l’objet source est une base de données ou un schéma, le clone hérite de tous les privilèges accordés sur les clones de tous les objets enfants contenus dans l’objet source :

Pour les bases de données, les objets contenus incluent les schémas, les tables, les vues, etc.
Pour les schémas, les objets contenus incluent les tables, les vues, etc.

Note

Le clone du conteneur lui-même (base de données ou schéma) n’hérite pas des privilèges accordés sur le conteneur source.
Pour les canaux, le rôle qui crée le clone dispose du privilège OWNERSHIP sur les canaux.

Les instructions CREATE <objet> … CLONE pour la plupart des objets ne copient pas les permissions de l’objet source vers l’objet clone. Toutefois, les commandes CREATE <objet> qui prennent en charge la clause COPY GRANTS (par exemple, CREATE TABLE, CREATE VIEW) vous permettent de copier facultativement des attributions sur des clones d’objets. Par exemple, la syntaxe de la commande CREATE TABLE … CLONE prend en charge le paramètre COPY GRANTS. Lorsque le paramètre COPY GRANTS est spécifié dans une instruction CREATE TABLE, l’opération de création copie tous les privilèges, sauf OWNERSHIP, de la table source vers la nouvelle table. Le même comportement est vrai pour les autres commandes CREATE qui prennent en charge la clause COPY GRANTS.

Dans tous les autres cas, vous devez accorder tous les privilèges requis au clone nouvellement créé (en utilisant GRANT <privilèges> … TO ROLE).

Clonage et objets Snowflake¶

Cette section décrit des considérations de clonage particulières concernant des objets Snowflake spécifiques.

Clonage et schémas d’accès gérés¶

Si vous clonez un schéma et que vous spécifiez la clause WITH MANAGED ACCESS, les privilèges requis varient selon que le schéma source est un schéma géré ou non géré. Pour plus de détails, voir les privilèges CREATE SCHEMA.

Clonage et paramètres des objets¶

Les objets clonés héritent de tous les paramètres d’objet qui ont été définis sur l’objet source lorsque cet objet a été cloné. Si un paramètre d’objet peut être défini sur des conteneurs d’objets (c’est-à-dire compte, base de données ou schéma) et n’est pas explicitement défini sur l’objet source, un clone d’objet hérite de la valeur par défaut du paramètre ou de la valeur remplacée au niveau le plus bas. Pour plus d’informations sur les paramètres des objets, voir Paramètres.

Clonage et séquences par défaut¶

Dans une table, une colonne peut faire référence à une séquence qui génère des valeurs par défaut. Lorsqu’une table est clonée, la table clonée fait référence à la séquence source ou clonée :

Si la base de données ou le schéma contenant à la fois la table et la séquence est cloné(e), la table clonée fait référence à la séquence clonée.
Sinon, la table clonée fait référence à la séquence source.

Par exemple, si la séquence est définie dans une base de données ou un schéma différent(e), la table clonée fait référence à la séquence source. Ou si vous clonez uniquement la table elle-même, la table clonée fait référence à la séquence source.

Si vous ne souhaitez pas que la nouvelle table continue à utiliser la séquence source, exécutez la commande suivante :
```
ALTER TABLE <table_name> ALTER COLUMN <column_name> SET DEFAULT <new_sequence>.nextval;
```

Clonage et contraintes de clé étrangère¶

Une table peut avoir une contrainte de clé étrangère qui fait référence à une table qui inclut la clé primaire. Lorsqu’une table avec une contrainte de clé étrangère est clonée, la table clonée fait référence à la table source ou clonée qui inclut la clé primaire :

Si la base de données ou le schéma contenant les deux tables est cloné, la table clonée avec la clé étrangère fait référence à la clé primaire de l’autre table clonée.
Si les tables se trouvent dans des bases de données ou des schémas distincts, la table clonée fait référence à la clé primaire de la table source.

Clonage et clés de clustering¶

Une table peut avoir un sous-ensemble de colonnes désigné comme une clé de clustering afin de co-localiser des lignes similaires dans la même micro-partition. Lorsqu’une table avec une clé de clustering est clonée, la nouvelle table est créée avec une clé de clustering. Par défaut, Clustering automatique est suspendu pour la nouvelle table. Pour reprendre le clustering automatique pour la nouvelle table, exécutez la commande suivante :

ALTER TABLE <name> RESUME RECLUSTER

Clonage et zones de préparation¶

Vous pouvez cloner individuellement des zones de préparation externes nommées. Une zone de préparation externe fait référence à un compartiment ou à un conteneur dans un stockage externe dans le Cloud ; le clonage d’une zone de préparation externe n’a pas d’impact sur le stockage dans le Cloud référencé.

Vous pouvez éventuellement cloner des zones de préparation internes nommées lorsque vous clonez une base de données ou un schéma.

Lors du clonage d’une base de données ou d’un schéma :

Les zones de préparation nommées externes présentes dans la source au démarrage de l’opération de clonage sont clonées.
Les tables sont clonées, ce qui signifie que la zone de préparation interne associée à chaque table est également clonée. Les fichiers de données présents dans une zone de préparation de table de la base de données ou du schéma source ne sont pas copiés dans le clone (c’est-à-dire que les zones de préparation de tables clonées sont vides).
Les zones de préparation internes nommées sont clonées si vous utilisez la clause INCLUDE INTERNAL STAGES. Pour plus d’informations, consultez les notes sur l’utilisation du clonage de zones de préparation internes.

Clonage et tables Apache Iceberg™¶

Stockage¶

Le stockage des tables Iceberg clonées fonctionne de la même manière que le stockage des autres objets Snowflake clonés ; les clones partagent le même stockage sous-jacent que la table source.

Pour plus d’informations sur le fonctionnement du stockage des objets clonés, voir Stockage de table, de schéma et de base de données clonés.

Pour plus d’informations sur le stockage des tables Iceberg, voir Stockage pour les tables Apache Iceberg™.

Commandes DML (Langage de manipulation de données)¶

Vous pouvez utiliser les commandes DML sur les tables Iceberg clonées comme vous le faites sur les tables classiques gérées par Snowflake. Pour des instructions et des exemples, voir Utiliser les commandes DML.

Pour des opérations DML sur les tables clonées, Snowflake génère de nouveaux fichiers de données et les stocke dans l’emplacement de base de la table source. Les fichiers de données divergents n’affectent pas la table source ; les opérations DML sur la table source ne sont reflétées que dans les fichiers de données de la table source.

Métadonnées Iceberg¶

Pour les tables clonées, Snowflake génère des fichiers de métadonnées Iceberg distincts de ceux de la table source. Par exemple, une table Iceberg clonée possède son propre fichier metadata.json avec un table-uuid unique, last-sequence-number, et d’autres propriétés. Les sauvegardes de tables clonées n’incluent aucune information de sauvegarde de la table source.

Tables Apache Iceberg™ avec stockage Snowflake¶

Pour les tables Iceberg qui utilisent le stockage fourni par Snowflake (EXTERNAL_VOLUME = 'SNOWFLAKE_MANAGED'), CREATE ICEBERG TABLE … CLONE réussit uniquement lorsque la table source et la nouvelle table sont toutes les deux transitoires ou toutes les deux permanentes. Si l’une est transitoire et l’autre permanente, l’instruction échoue.


Table source	Cloner	Résultat
Transitoire	Transitoire	Pris en charge
Permanent	Permanent	Pris en charge
Transitoire	Permanent	Non pris en charge
Permanent	Transitoire	Non pris en charge

Pour plus d’informations, voir Stockage Snowflake pour les tables Apache Iceberg™.

Clonage et tables d’événements¶

Lors du clonage d’une table d’événements, vous ne pouvez effectuer le clonage que depuis et vers des tables d’événements. En d’autres termes, vous ne pouvez pas effectuer de clonage depuis une table normale vers une table d’événements, ni depuis une table d’événements vers une table normale.

Clonage et canaux¶

Lorsqu’une base de données ou un schéma est cloné, tous les canaux du conteneur source qui font référence à une zone de préparation interne (c’est-à-dire à Snowflake) ne sont pas clonés.

Cependant, tous les canaux faisant référence à une zone de préparation externe sont clonés. Cela inclut tous les objets canal pour lesquels le paramètre INTEGRATION est défini. Ce paramètre pointe vers une intégration de notification pour activer l’auto-ingestion de Snowpipe lors du chargement de données à partir de fichiers dans Google Cloud Storage ou le stockage blob Microsoft Azure.

Lorsque vous clonez une base de données ou un schéma contenant des canaux via une commande CREATE .. CLONE, le rôle qui crée le clone devient propriétaire du canal cloné. Pour copier les attributions, en particulier la propriété du canal, vous pouvez ajouter l’option COPY GRANTS lors du clonage de bases de données ou de schémas contenant des objets de type canal.

Lorsqu’un fichier de données est créé dans un emplacement de zone de préparation (par exemple, un conteneur de stockage de données), une copie de la notification est envoyée à chaque canal correspondant à l’emplacement de préparation. Cela entraîne le comportement suivant :

Si une table est entièrement qualifiée dans l’instruction COPY de la définition du canal (sous la forme db_name.schema_name.table_name ou schema_name.table_name), Snowpipe charge des données en double dans la table source (c’est-à-dire database.schema.table dans l’instruction COPY) pour chaque canal.

Si une table n’est pas entièrement qualifiée dans la définition du canal, alors Snowpipe charge les données dans la table (par exemple, mytable) dans les bases de données/schémas sources et clonés.

L’état par défaut d’un clone de canal est le suivant :

Lorsque AUTO_INGEST = FALSE, un canal cloné est suspendu par défaut.

Lorsque AUTO_INGEST = TRUE, un canal cloné est défini sur l’état STOPPED_CLONED. Sous cet état, les canaux n’accumulent pas de notifications d’événements en raison des fichiers nouvellement placés en zone de préparation. Lorsqu’un canal est explicitement repris, il ne traite que les fichiers de données déclenchés à la suite de nouvelles notifications d’événements.

Un canal clone dans l’un ou l’autre état peut être repris en exécutant une instruction ALTER PIPE … RESUME.

Clonage et optimisation de la recherche¶

Vous pouvez cloner des tables dont le Service d’optimisation de la recherche est activé. Lorsque vous le faites, le chemin d’accès à la recherche correspondant est un clone à zéro copie. Cependant, si le chemin d’accès à la recherche n’est pas à jour, des coûts de maintenance peuvent être engendrés, même si la table clonée ne change pas, car le chemin d’accès à la recherche doit rattraper l’état actuel de la table clonée. Pour plus d’informations sur le clonage et l’optimisation de la recherche, voir Clonage de la table, du schéma ou de la base de données.

Clonage et flux¶

Actuellement, lorsqu’une base de données ou un schéma contenant des tables source et des flux est cloné(e), tous les enregistrements non consommés dans les flux (dans le clone) sont inaccessibles. Ce comportement est cohérent avec Time Travel pour les tables. Si une table est clonée, les données historiques pour le clone de table commencent à l’heure/le moment où le clone a été créé.

Clonage et tâches¶

Quand une base de données ou un schéma contenant des tâches est cloné(e), les tâches du clone sont suspendues par défaut. Les tâches peuvent être reprises individuellement (avec ALTER TASK … RESUME).

Clonage et alertes¶

Quand une base de données ou un schéma contenant des alertes est cloné(e), les alertes du clone sont suspendues par défaut.

Pour reprendre une alerte suspendue, vous pouvez utiliser la commande ALTER ALERT … RESUME.

Clonage et objets de gouvernance¶

Politiques de masquage et d’accès aux lignes :

L’approche suivante permet de protéger les données des utilisateurs avec le privilège SELECT sur la table ou la vue lors de l’accès à un objet cloné :

Le clonage d’un objet de politique individuel n’est pas pris en charge.

Le clonage d’un schéma entraîne le clonage de toutes les politiques au sein du schéma.

Une table clonée correspond aux mêmes politiques que la table source. En d’autres termes, si une politique est définie sur la table de base ou ses colonnes, la politique est attachée à la table clonée ou ses colonnes.

Si une table ou une vue existe dans le schéma/la base de données source et qu’elle a des références à des politiques dans le même schéma/la même base de données, la table ou la vue clonée est mappée à la politique clonée correspondante (dans le schéma/la base de données cible) au lieu de la politique dans le schéma/la base de données source.

Si la table source fait référence à une politique dans un schéma différent (c’est-à-dire une référence étrangère), la table clonée conserve la référence étrangère.

Pour plus d’informations, voir CREATE <objet> … CLONE.

Voir aussi :

Clonage des tables externes et des politiques de masquage.

Clonage des tables externes et des politiques d’accès aux lignes.

Balises :

Les associations de balises dans l’objet source (par ex. des tables) sont maintenues dans les objets clonés.

Pour une base de données ou un schéma :

Lorsqu’une base de données ou un schéma est cloné, les balises qui résident dans ce schéma ou cette base de données sont également clonées.

Si une table ou une vue existe dans le schéma/la base de données source et a des références à des balises dans le même schéma ou la même base de données, la table ou la vue clonée est mappée sur la balise clonée correspondante (dans le schéma ou la base de données cible) au lieu de la balise dans le schéma ou la base de données source.

Politiques de masquage basées sur les balises :

Dans le cas d’une politique de masquage basée sur des balises, où la balise est stockée dans un schéma différent de celui de la politique et de la table de masquage, le clonage du schéma contenant la politique et la table de masquage fait que la table clonée est protégée par la politique de masquage dans le schéma source et non dans le schéma cloné.

Cependant, pour une politique de masquage basée sur une balise, où la balise, la politique de masquage et la table existent toutes dans le schéma, le clonage du schéma fait que la table est protégée par la politique de masquage dans le schéma cloné, et non dans le schéma source.

Si la table est clonée ou déplacée vers un autre schéma ou une autre base de données et qu’elle était à l’origine protégée par une politique de masquage basée sur des balises définie sur le schéma ou la base de données, la table n’est pas protégée par la politique de masquage basée sur des balises définie sur le schéma ou la base de données source. La table est protégée par la politique de masquage basée sur les balises définie sur le schéma ou la base de données cible, s’il existe une politique de masquage basée sur les balises définie sur le schéma ou la base de données cible.

Clonage et confidentialité différentielle¶

Cloner une table ou une vue protégée par confidentialité différentielle entraîne le comportement suivant.

Politiques de confidentialité¶

Lorsque vous clonez une table ou une vue protégée par confidentialité, l’objet est également protégé par confidentialité. Le clonage de la politique de confidentialité dépend de ce que vous clonez :

Si vous ne clonez que la table protégée à des fins de confidentialité, la politique de confidentialité n’est pas clonée.
Si vous clonez un schéma contenant à la fois la table et la politique de confidentialité, la politique de confidentialité est clonée.
Si vous clonez une base de données contenant un schéma contenant à la fois la table et la politique de confidentialité, la politique de confidentialité est clonée.

Si la politique de confidentialité et la table se trouvent dans des schémas différents, le clonage de la base de données ou du schéma de la table ne clone pas la politique de confidentialité. Dans ce cas, la politique de confidentialité est automatiquement associée aux objets clonés.

Domaines de confidentialité¶

Lorsque vous clonez une table ou une vue protégée par la confidentialité, les domaines de confidentialité définis sur les colonnes sont également clonés.

Gardez les points suivants à l’esprit lorsque vous clonez une table ou une vue protégée par la confidentialité avec un domaine de confidentialité REFERENCE :

Si vous clonez une table protégée par la confidentialité mais pas la table référencée, la nouvelle table continue de référencer la même table.
Si vous clonez à la fois la table protégée par la confidentialité et la table référencée, la nouvelle table protégée par la confidentialité référence la nouvelle version clonée de la table référencée.
Si le domaine de confidentialité REFERENCE fait référence à lui-même, la table nouvellement clonée fait référence à elle-même, et non à la table d’origine.

Clonage et rôles de base de données¶

Vous pouvez cloner un rôle de base de données à l’aide de la commande CREATE DATABASE ROLE … CLONE si le rôle de base de données n’existe pas encore dans la base de données cible. Pour plus de détails, voir CREATE <objet> … CLONE.

Clonage et UDFs Java¶

Une UDF Java peut être clonée lorsque la base de données ou le schéma contenant l’UDF Java est cloné(e). Pour être clonée, l’UDF Java doit remplir certaines conditions. Pour plus d’informations, voir Limites du clonage.

Clonage et instances de classes Snowflake¶

Une instance du CUSTOM_CLASSIFIER est cloné lorsque le schéma qui contient l’instance est cloné. Le clonage d’instances d’autres classes Snowflake n’est pas pris en charge.

Clonage et sauvegardes WORM¶

L’ensemble de sauvegardes et les objets de politiques de sauvegarde utilisés dans les sauvegardes Write Once Read Many (WORM) ne peuvent pas être clonés. Si vous clonez un schéma ou une base de données contenant de tels objets, ils ne sont pas inclus dans le schéma ou la base de données cloné(e).

Impact de DDL sur le clonage¶

Le clonage est rapide, mais pas instantané, en particulier pour les objets de grande taille (par exemple, les tables). Ainsi, si des instructions DDL sont exécutées sur des objets sources (par exemple, renommer des tables dans un schéma) pendant que l’opération de clonage est en cours, les modifications peuvent ne pas être représentées dans le clone. La raison est que les instructions DDL sont atomiques et ne font pas partie des transactions à plusieurs instructions.

En outre, Snowflake n’enregistre pas les noms d’objets qui étaient présents au début de l’opération de clonage et ceux qui ont changé. Ainsi, les instructions DDL qui renomment (ou détruisent et recréent) les objets enfants sources sont en concurrence avec toute opération de clonage en cours et peuvent provoquer des conflits de nom.

Dans l’exemple suivant, la table t_sales est détruite, et une autre table est modifiée et reçoit le même nom que la table détruite pendant le clonage de la base de données mère, produisant une erreur :

CREATE OR REPLACE DATABASE staging_sales CLONE sales;

DROP TABLE sales.public.t_sales;

ALTER TABLE sales.public.t_sales_20170522 RENAME TO sales.public.t_sales;

002002 (42710): None: SQL compilation error: Object 'T_SALES' already exists.

Astuce

Pour éviter les conflits dans la résolution des noms au cours d’une opération de clonage, nous vous suggérons de ne pas renommer les objets par un nom précédemment utilisé par un objet détruit jusqu’à ce que le clonage soit terminé.

Impact de DML et de la conservation des données sur le clonage¶

La période de conservation des données spécifie le nombre de jours pendant lesquels Snowflake conserve les données historiques pour effectuer des actions de Time Travel sur un objet. Étant donné que les données conservées pour Time Travel entraînent des coûts de stockage au niveau de la table, certains utilisateurs donnent à ce paramètre la valeur 0 pour certaines tables, désactivant ainsi la conservation des données pour ces tables (c’est-à-dire que lorsque la valeur est 0, les données Time Travel conservées pour les transactions DML sont purgées, ce qui entraîne des coûts de stockage supplémentaires négligeables).

Les opérations de clonage nécessitent du temps, en particulier pour les grandes tables. Pendant cette période, les transactions DML peuvent modifier les données d’une table source. Par la suite, Snowflake tente de cloner les données de la table telles qu’elles existaient lorsque l’opération a commencé. Cependant, si les données sont purgées pour les transactions DML qui se produisent pendant le clonage (car la durée de conservation de la table est 0), les données ne sont pas disponibles pour terminer l’opération, ce qui produit une erreur similaire à ce qui suit :

ProgrammingError occurred: "000707 (02000): None: Data is not available." with query id None

Astuce

Comme solution, nous vous recommandons l’une des pratiques suivantes pour le clonage d’un objet :

S’abstenir, si possible, d’exécuter des transactions DML sur l’objet source (ou l’un de ses enfants) avant la fin de l’opération de clonage.
Si ce n’est pas possible, avant de commencer le clonage, définissez DATA_RETENTION_TIME_IN_DAYS=1 pour toutes les tables du schéma (ou de la base de données si vous clonez une base entière). Une fois l’opération terminée, n’oubliez pas de réinitialiser la valeur du paramètre sur 0 pour les tables de la source, si vous le souhaitez.

Vous pouvez également définir la valeur à 0 pour les tables clonées (si vous planifiez d’apporter des modifications de DML aux tables clonées et que vous ne souhaitez pas supporter des coûts de stockage supplémentaires pour Time Travel sur les tables).

Clonage avec Time Travel (bases de données, schémas, tables, tables dynamiques, tables d’événements et flux uniquement)¶

Cette section fournit des informations à prendre en compte lors de l’utilisation de Time Travel pour cloner des objets à un moment ou à un point précis dans le passé.

Clonage d’objets historiques¶

Si l’objet source n’existait pas au moment fixé dans la clause AT | BEFORE, une erreur est renvoyée.

Dans l’exemple suivant, une instruction CREATE TABLE … CLONE tente de cloner la table source à un moment dans le passé (30 minutes avant) où elle n’existait pas :

CREATE TABLE t_sales (numeric integer) data_retention_time_in_days=1;

CREATE OR REPLACE TABLE sales.public.t_sales_20170522 CLONE sales.public.t_sales at(offset => -60*30);

002003 (02000): SQL compilation error:
Object 'SALES.PUBLIC.T_SALES' does not exist.

Tout objet enfant d’une base de données ou d’un schéma cloné qui n’existait pas au moment spécifié n’est pas cloné.

L’opération de clonage échoue dans les scénarios suivants :

Si la durée Time Travel spécifiée est supérieure à la durée de conservation de tout enfant actuel de la base de données ou du schéma cloné.

En guise de solution de contournement pour les objets enfants qui ont été purgés de Time Travel, utilisez le paramètre IGNORE TABLES WITH INSUFFICIENT DATA RETENTION de la commande CREATE <objet> … CLONE. Pour plus d’informations, voir Objets enfants et durée de conservation des données.

Si un objet canal avec AUTO_INGEST = TRUE défini a été recréé (en utilisant la syntaxe CREATE OR REPLACE PIPE) ou détruit depuis le point dans le temps spécifié dans la clause AT | BEFORE . Cette limite ne s’applique pas aux objets de canaux créés pour l’ingestion manuelle de Snowpipe à l’aide de l’API REST (c’est-à-dire avec AUTO_INGEST = FALSE).

Si le paramètre IGNORE HYBRID TABLES n’est pas spécifié et que des tables hybrides existent dans la base de données ou le schéma spécifié.

Objets enfants et durée de conservation des données¶

Si un objet enfant (par exemple, une table) a une période de conservation des données plus courte que la période de conservation des données de son objet parent (par exemple, une base de données ou un schéma), les données historiques de l’objet enfant sont retirées de Time Travel avant que les données historiques de l’objet parent ne soient retirées de Time Travel.

Par exemple, la période de conservation des données pour la base de données db1 est de sept jours et la période de conservation des données pour la table t1 dans db1 est d’un jour. Si vous clonez db1 en utilisant Time Travel à un moment 12 heures dans le passé, l’opération de clonage crée avec succès un clone de db1 qui contient la table clonée t1.

Toutefois, si vous essayez de cloner db1 deux jours plus tard, les données historiques de la table t1 à ce moment-là ne sont plus disponibles dans Time Travel et l’opération de clonage échoue.

Pour contourner le problème, utilisez le paramètre IGNORE TABLES WITH INSUFFICIENT DATA RETENTION de la commande CREATE <objet> … CLONE pour cloner une base de données ou un schéma. Ce paramètre permet d’ignorer les tables dont les données historiques ne sont plus disponibles dans Time Travel au moment spécifié pour l’opération de clonage.

Clonage de métadonnées d’objets historiques¶

Un clone d’objet hérite de la structure et du nom de l’objet source actuel au moment de l’exécution de l’instruction CREATE <objet> … CLONE ou à l’heure/au point spécifié dans le passé à l’aide de Time Travel. Un clone d’objet hérite de toutes les autres métadonnées, telles que les commentaires ou les clés de clustering de table, qui sont actuels dans l’objet source au moment de l’exécution de l’instruction, que l’on utilise ou non Time Travel.

Note

Pour garantir un comportement cohérent dans les opérations de clonage de longue durée, lorsqu’une clause AT ou BEFORE n’est pas spécifiée pour une instruction CREATE <objet> … CLONE, l’opération de clonage définit en interne la valeur de la clause AT comme étant l’horodatage du moment où l’instruction a été lancée.

Clonage et réplication¶

Pour plus d’informations, voir Réplication et clonage.