Politiques de cycle de vie du stockage

Note

Les politiques de cycle de vie du stockage ne sont actuellement pas disponibles dans les régions gouvernementales.

Une politique de cycle de vie du stockage est un objet de niveau schéma qui gère automatiquement le cycle de vie des données pour les tables Snowflake standard. Utilisez ces politiques pour archiver ou expirer des lignes de table spécifiques en fonction des conditions que vous définissez, telles que l’ancienneté des données ou d’autres critères. Snowflake exécute automatiquement ces politiques quotidiennement en utilisant des ressources de calcul partagées.

Fonctionnement des politiques de cycle de vie du stockage

Vue d’ensemble du workflow des politiques de cycle de vie du stockage

Pour commencer à utiliser des politiques de cycle de vie du stockage, suivez les étapes suivantes :

  1. Créez une politique avec une expression qui identifie les lignes à archiver ou à expirer.

  2. Associez cette politique à une ou plusieurs tables.

Une fois que vous avez associé une politique de cycle de vie du stockage à une table, Snowflake attend environ 24 heures avant d’exécuter la politique pour la première fois. Après ce délai initial, Snowflake exécute automatiquement la politique quotidiennement en utilisant des ressources de calcul partagées pour identifier et traiter les lignes qui répondent aux conditions que vous avez définies.

Lorsque la politique s’exécute, elle vérifie chaque ligne par rapport à votre expression et archive les données dans un stockage COOL ou COLD, ou les expire (c’est-à-dire les supprime définitivement). Vous pouvez récupérer des données archivées en utilisant la commande CREATE TABLE … FROM ARCHIVE OF avant l’expiration. Snowflake attend que la période d’archivage spécifiée soit écoulée avant d’expirer les données du stockage d’archives.

Vue d’ensemble du flux des politiques de cycle de vie du stockage, de l’archivage à l’expiration.

Capacités clés

Les politiques de cycle de vie du stockage offrent les avantages suivants pour la gestion de vos données Snowflake.

Coûts de stockage réduits

Les politiques de cycle de vie du stockage permettent d’optimiser les coûts en déplaçant automatiquement les données plus anciennes vers des niveaux d’archivage plus rentables. Pour les données qui doivent être conservées à long terme mais qui sont rarement consultées, le stockage d’archives peut réduire considérablement les coûts de stockage par rapport aux niveaux de stockage standard.

Conformité réglementaire

Répondez automatiquement aux exigences de conformité en configurant des politiques pour archiver ou expirer les données conformément aux normes réglementaires. Vous pouvez archiver les données pour une durée spécifique avant leur expiration, ou les expirer directement sans les archiver. Cela garantit que la gestion de vos données respecte les normes de gouvernance de votre organisation.

Gestion simple des données

Les politiques de cycle de vie du stockage éliminent les tâches manuelles de gestion des données en exécutant automatiquement les règles d’archivage et d’expiration. Pour plus d’informations, voir Surveillance des politiques de cycle de vie du stockage.

Récupération flexible des données

Récupérez des données archivées avec précision en créant une nouvelle table qui contient uniquement les lignes dont vous avez besoin. Utilisez une commande simple avec une clause WHERE pour spécifier exactement les données archivées à restaurer.

Niveaux du stockage d’archives

Snowflake prend en charge l’archivage des données dans les niveaux de stockage suivants :

Niveau d’archivage

Description

COOL

Offre un temps de récupération rapide, de sorte que les données sont facilement disponibles. La période minimale d’archivage est de 90 jours.

COLD

Permet de réaliser de meilleures économies que le niveau COOL (quatre fois moins cher). La période minimale d’archivage est de 180 jours. Comparé au niveau COOL, le niveau COLD présente un temps de récupération des données plus long (jusqu’à 48 heures). Les opérations de récupération de données à partir du niveau de stockage COLD prennent en charge un maximum d’un million de fichiers par opération de restauration.

Sélectionner un niveau d’archivage

Lorsque vous sélectionnez un niveau d’archivage, tenez compte des éléments suivants :

  • Coûts d’archivage : Le coût unique d’archivage des données est le même pour les deux niveaux.

  • Coûts de stockage : le stockage de niveau COLD est moins coûteux que le stockage de niveau COOL.

  • Coûts de récupération : la récupération de données de niveau COLD est moins coûteuse que la récupération de niveau COOL.

  • Temps de récupération : Le niveau de stockage COOL offre une récupération instantanée des données, tandis que la récupération de niveau COLD peut prendre jusqu’à 48 heures.

Pour obtenir des informations détaillées sur les tarifs, consultez les tableaux 3(e) et 4(f) dans le Tableau de consommation du service Snowflake.

Pour plus d’informations sur l’archivage des données, consultez Créer une politique de cycle de vie du stockage et Considérations relatives au stockage d’archives.

Considérations

Tenez compte des points suivants lorsque vous utilisez des politiques de cycle de vie du stockage.

Prise en charge des fournisseurs Cloud

  • Politiques d’expiration : Prises en charge pour les comptes hébergés sur tous les fournisseurs Cloud (AWS, Azure et Google Cloud).

  • Politiques d’archivage : Actuellement disponibles uniquement pour les comptes hébergés sur AWS.

Tables et fonctionnalités prises en charge

  • Tables prises en charge : Les politiques de cycle de vie du stockage sont prises en charge pour les tables standard Snowflake. Afin d’évaluer et d’appliquer les expressions de politiques de cycle de vie du stockage, Snowflake contourne en interne et temporairement toutes les politiques de gouvernance sur une table.

  • Réplication :

    • Snowflake réplique les politiques de cycle de vie du stockage et leurs associations avec les tables vers les comptes cibles, mais n’exécute pas les politiques.

    • Après le basculement vers un compte cible, Snowflake suspend l’exécution des politiques de cycle de vie du stockage dans le compte principal d’origine. Après le retour au compte principal d’origine, Snowflake reprend l’exécution des politiques.

    • Snowflake n’exécute jamais automatiquement les politiques de cycle de vie du stockage secondaires sur les tables secondaires, même après le basculement. Cependant, vous pouvez utiliser des politiques secondaires dans un compte cible en les attachant à de nouvelles tables. Pour ces nouvelles tables, Snowflake exécute les politiques.

  • Clonage : Snowflake n’applique pas automatiquement des politiques de cycle de vie du stockage aux tables clonées. Si vous appliquez une politique de cycle de vie du stockage à une table dans un groupe de clones, Snowflake archive uniquement les lignes de cette table spécifique. La politique n’affecte pas les clones. Cela crée des copies des données dans les niveaux de stockage standard et d’archivage, et vous payez le stockage dans chaque niveau. Pour obtenir des informations sur les coûts, consultez Facturation des politiques de cycle de vie du stockage.

  • Fonctionnalités non prises en charge

    Les politiques de cycle de vie du stockage ne sont pas prises en charge pour les éléments suivants :

    • Tous les types d’objets autres que les tables Snowflake et les tables dynamiques ordinaires.

    • Les instantanés Write Once Read Many (WORM), qui sont des instantanés immuables qui ne peuvent pas être modifiés après la création.

    • Les tables partagées via le partage de données Snowflake (tables des fournisseurs et des consommateurs).

    • Apps natives.

    • Les fonctions définies par l’utilisateur (UDFs) avec un accès externe et des fonctions externes.

    • Les UDFs Python, Java ou Scala.

Comportement et exécution des politiques

Les politiques de cycle de vie du stockage utilisent des directives de performance qui sont similaires aux directives pour les politiques d’accès aux niveaux des lignes et fonctionnent automatiquement avec les caractéristiques suivantes :

  • Lorsque vous associez une politique de cycle de vie du stockage à une table, Snowflake attend environ 24 heures avant de l’exécuter pour la première fois.

  • Snowflake exécute des politiques de cycle de vie du stockage tous les jours en utilisant des ressources de calcul partagées. Pour obtenir des informations sur le coût des politiques de cycle de vie du stockage, consultez Facturation des politiques de cycle de vie du stockage.

  • Pour éviter des exécutions d’archivage ou d’expiration excessivement longues, Snowflake traite les opérations de données volumineuses de manière incrémentielle, par morceaux plus petits. Une opération volumineuse peut ne pas se terminer en une seule exécution quotidienne, mais nécessiter plutôt plusieurs exécutions quotidiennes.

  • Lorsqu’une politique de cycle de vie du stockage est exécutée sur une table, Snowflake verrouille les opérations UPDATE, DELETE et MERGE. Vous pouvez toujours effectuer les opérations INSERT et COPY pendant cette période. Pour plus d’informations, consultez Verrouillage des ressources.

Politiques du stockage d’archives

Pour travailler avec des tables auxquelles est associée une politique de cycle de vie du stockage d’archives :

  • Accès aux données archivées : Après l’archivage des lignes par Snowflake, vous ne pouvez pas les interroger directement. Pour y accéder, utilisez la commande CREATE TABLE … FROM ARCHIVE OF pour créer une nouvelle table avec une copie des données archivées. Pour plus d’informations, consultez Récupération des données archivées.

  • Sécurité : Vous pouvez utiliser Tri-Secret Secure (TSS) pour protéger les données archivées avec une rotation régulière des clés.

  • Re-saisie : Snowflake ne re-saisit pas les données archivées. Si vous suspectez un compromis de clé, utilisez la solution de contournement suivante :

    1. Récupérez les données archivées dans une nouvelle table à l’aide de la commande CREATE TABLE … FROM ARCHIVE OF.

    2. Archivez les données dans la nouvelle table si nécessaire. Chaque table dispose de sa propre clé de chiffrement, de sorte que la nouvelle table utilise effectivement une nouvelle clé.

    3. Supprimez l’archive de la table d’origine dans laquelle les clés ont été compromises.

  • Limitations du niveau d’archivage :

    • Vous ne pouvez pas modifier le niveau d’archivage pour une politique de COOL à COLD (ou l’inverse). Créez plutôt une nouvelle politique (voir Recréer une politique de cycle de vie du stockage).

    • Une table ne peut utiliser qu’un seul niveau d’archivage. Vous ne pouvez pas associer une politique COLD à une table qui utilise déjà un archivage COOL.

  • Suppression de politiques : Lorsque vous supprimez une politique d’une table, les données archivées restent dans le stockage d’archives et peuvent toujours être récupérées.

  • Suppression ou troncation d’une table :

    • Tronquer une table n’affecte pas les données archivées de cette table. Vous pouvez toujours récupérer des données à partir du stockage d’archives après avoir tronqué la table.

    • Lorsque vous utilisez UNDROP TABLE pour restaurer une table dans une période de conservation des données Time Travel applicable, Snowflake restaure également les données dans le stockage d’archives.

    • Lorsqu’une table se situe dans la période Fail-safe, les données dans le stockage d’archives peuvent être récupérées à l’aide des étapes de récupération des données Fail-safe via le support Snowflake.

    • Les données de table dans le stockage d’archives que vous supprimez avant que la période ARCHIVE_FOR_DAYS ne soit écoulée sont soumises à des coûts de stockage. Pour plus d’informations, voir Frais de durée de stockage minimale.