Politiques de cycle de vie du stockage

Note

Les politiques de cycle de vie du stockage ne sont actuellement pas disponibles dans les régions gouvernementales.

A storage lifecycle policy is a schema-level object that automatically manages the data lifecycle for standard Snowflake tables. Use these policies to archive or expire specific table rows that are based on conditions that you define, such as data age or other criteria. Snowflake automatically executes these policies daily by using shared compute resources.

Fonctionnement des politiques de cycle de vie du stockage

Vue d’ensemble du workflow des politiques de cycle de vie du stockage

To get started with storage lifecycle policies, complete the following steps:

  1. Créez une politique avec une expression qui identifie les lignes à archiver ou à expirer.

  2. Associez cette politique à une ou plusieurs tables.

After you attach a storage lifecycle policy to a table, Snowflake waits approximately 24 hours before running the policy for the first time. Following this initial delay, Snowflake automatically runs the policy daily by using shared compute resources to identify and process rows that meet your defined conditions.

When the policy runs, it checks each row against your expression, and then either archives the data to COOL or COLD storage or expires the data, which deletes it permanently. You can retrieve archived data by using the CREATE TABLE … FROM ARCHIVE OF command before expiration occurs. Snowflake waits until the specified archive period elapses before expiring the data from archive storage.

Vue d’ensemble du flux des politiques de cycle de vie du stockage, de l’archivage à l’expiration.

Capacités clés

Les politiques de cycle de vie du stockage offrent les avantages suivants pour la gestion de vos données Snowflake.

Coûts de stockage réduits

Storage lifecycle policies help optimize costs by automatically moving older data to more cost-effective archival tiers. For data that must be retained long-term but accessed infrequently, archival storage can significantly reduce storage costs compared to standard storage tiers.

Conformité réglementaire

Répondez automatiquement aux exigences de conformité en configurant des politiques pour archiver ou expirer les données conformément aux normes réglementaires. Vous pouvez archiver les données pour une durée spécifique avant leur expiration, ou les expirer directement sans les archiver. Cela garantit que la gestion de vos données respecte les normes de gouvernance de votre organisation.

Gestion simple des données

Les politiques de cycle de vie du stockage éliminent les tâches manuelles de gestion des données en exécutant automatiquement les règles d’archivage et d’expiration. Pour plus d’informations, voir Monitor storage lifecycle policies.

Récupération flexible des données

Récupérez des données archivées avec précision en créant une nouvelle table qui contient uniquement les lignes dont vous avez besoin. Utilisez une commande simple avec une clause WHERE pour spécifier exactement les données archivées à restaurer.

Niveaux du stockage d’archives

Snowflake prend en charge l’archivage des données dans les niveaux de stockage suivants :

Niveau d’archivage

Description

COOL

Offre un temps de récupération rapide, de sorte que les données sont facilement disponibles. La période minimale d’archivage est de 90 jours.

COLD

Offers greater cost savings than the COOL tier; it is four times less expensive. The minimum archival period is 180 days. Compared to the COOL tier, COLD has a longer data retrieval time, which is up to 48 hours. Data retrieval operations from the COLD storage tier support a maximum of 1 million files per restore operation.

Sélectionner un niveau d’archivage

When you select an archive tier, consider the following factors:

  • Coûts d’archivage : Le coût unique d’archivage des données est le même pour les deux niveaux.

  • Coûts de stockage : le stockage de niveau COLD est moins coûteux que le stockage de niveau COOL.

  • Coûts de récupération : la récupération de données de niveau COLD est moins coûteuse que la récupération de niveau COOL.

  • Temps de récupération : Le niveau de stockage COOL offre une récupération instantanée des données, tandis que la récupération de niveau COLD peut prendre jusqu’à 48 heures.

Pour obtenir des informations détaillées sur les tarifs, consultez les tableaux 3(e) et 4(f) dans le Tableau de consommation du service Snowflake.

For more information about archiving data, see Create a storage lifecycle policy and Archive storage considerations.

Considérations

Consider the following information when you work with storage lifecycle policies.

Prise en charge des fournisseurs Cloud

  • Expiration policies: Supported for accounts hosted on all cloud providers (Amazon Web Services (AWS), Microsoft Azure, and Google Cloud).

  • Politiques d’archivage : Actuellement disponibles uniquement pour les comptes hébergés sur AWS.

Tables et fonctionnalités prises en charge

  • Supported tables: Storage lifecycle policies are supported for standard Snowflake tables. To evaluate and apply storage lifecycle policy expressions, Snowflake internally and temporarily bypasses any governance policies on a table.

  • Réplication :

    • Snowflake réplique les politiques de cycle de vie du stockage et leurs associations avec les tables vers les comptes cibles, mais n’exécute pas les politiques.

    • Après le basculement vers un compte cible, Snowflake suspend l’exécution des politiques de cycle de vie du stockage dans le compte principal d’origine. Après le retour au compte principal d’origine, Snowflake reprend l’exécution des politiques.

    • Snowflake n’exécute jamais automatiquement les politiques de cycle de vie du stockage secondaires sur les tables secondaires, même après le basculement. Cependant, vous pouvez utiliser des politiques secondaires dans un compte cible en les attachant à de nouvelles tables. Pour ces nouvelles tables, Snowflake exécute les politiques.

  • Clonage : Snowflake n’applique pas automatiquement des politiques de cycle de vie du stockage aux tables clonées. Si vous appliquez une politique de cycle de vie du stockage à une table dans un groupe de clones, Snowflake archive uniquement les lignes de cette table spécifique. La politique n’affecte pas les clones. Cela crée des copies des données dans les niveaux de stockage standard et d’archivage, et vous payez le stockage dans chaque niveau. Pour obtenir des informations sur les coûts, consultez Facturation des politiques de cycle de vie du stockage.

  • Fonctionnalités non prises en charge

    Storage lifecycle policies aren’t supported for the following features:

    • Tous les types d’objets autres que les tables Snowflake et les tables dynamiques ordinaires.

    • Write once read many (WORM) snapshots, which are immutable snapshots that can’t be modified after creation.

    • Both provider and consumer tables shared through Snowflake data sharing.

    • Apps natives.

    • Les fonctions définies par l’utilisateur (UDFs) avec un accès externe et des fonctions externes.

    • Les UDFs Python, Java ou Scala.

Comportement et exécution des politiques

Les politiques de cycle de vie du stockage utilisent des directives de performance qui sont similaires aux directives pour les politiques d’accès aux niveaux des lignes et fonctionnent automatiquement avec les caractéristiques suivantes :

  • Lorsque vous associez une politique de cycle de vie du stockage à une table, Snowflake attend environ 24 heures avant de l’exécuter pour la première fois.

  • Snowflake exécute des politiques de cycle de vie du stockage tous les jours en utilisant des ressources de calcul partagées. Pour obtenir des informations sur le coût des politiques de cycle de vie du stockage, consultez Facturation des politiques de cycle de vie du stockage.

  • To prevent excessively long archive or expiration runs, Snowflake processes large data operations incrementally in smaller chunks. A large operation might not complete in one daily run and might instead complete across multiple daily runs.

  • Lorsqu’une politique de cycle de vie du stockage est exécutée sur une table, Snowflake verrouille les opérations UPDATE, DELETE et MERGE. Vous pouvez toujours effectuer les opérations INSERT et COPY pendant cette période. Pour plus d’informations, consultez Verrouillage des ressources.

Politiques du stockage d’archives

Consider the following information when you work with tables that have an archival storage lifecycle policy attached:

  • Accès aux données archivées : Après l’archivage des lignes par Snowflake, vous ne pouvez pas les interroger directement. Pour y accéder, utilisez la commande CREATE TABLE … FROM ARCHIVE OF pour créer une nouvelle table avec une copie des données archivées. Pour plus d’informations, consultez Récupération des données archivées.

  • Sécurité : Vous pouvez utiliser Tri-Secret Secure (TSS) pour protéger les données archivées avec une rotation régulière des clés.

  • Rekeying: Snowflake doesn’t rekey archived data. If you suspect a key compromise, perform the following steps:

    1. Récupérez les données archivées dans une nouvelle table à l’aide de la commande CREATE TABLE … FROM ARCHIVE OF.

    2. Archive data in the new table when needed.

      Each table has its own encryption key, so the new table effectively uses a new key.

    3. Supprimez l’archive de la table d’origine dans laquelle les clés ont été compromises.

  • Limitations du niveau d’archivage :

    • You can’t change the archive tier for a policy from COOL to COLD or from COLD to COOL. Create a new policy instead. For instructions, see Recréer une politique de cycle de vie du stockage.

    • Une table ne peut utiliser qu’un seul niveau d’archivage. Vous ne pouvez pas associer une politique COLD à une table qui utilise déjà un archivage COOL.

  • Suppression de politiques : Lorsque vous supprimez une politique d’une table, les données archivées restent dans le stockage d’archives et peuvent toujours être récupérées.

  • Suppression ou troncation d’une table :

    • Tronquer une table n’affecte pas les données archivées de cette table. Vous pouvez toujours récupérer des données à partir du stockage d’archives après avoir tronqué la table.

    • Lorsque vous utilisez UNDROP TABLE pour restaurer une table dans une période de conservation des données Time Travel applicable, Snowflake restaure également les données dans le stockage d’archives.

    • Lorsqu’une table se situe dans la période Fail-safe, les données dans le stockage d’archives peuvent être récupérées à l’aide des étapes de récupération des données Fail-safe via le support Snowflake.

    • Les données de table dans le stockage d’archives que vous supprimez avant que la période ARCHIVE_FOR_DAYS ne soit écoulée sont soumises à des coûts de stockage. Pour plus d’informations, voir Frais de durée de stockage minimale.