Speicherlebenszyklusrichtlinien¶
Bemerkung
Speicherlebenszyklusrichtlinien sind derzeit nicht in Regionen für Regierungsbehörden verfügbar.
A storage lifecycle policy is a schema-level object that automatically manages the data lifecycle for standard Snowflake tables. Use these policies to archive or expire specific table rows that are based on conditions that you define, such as data age or other criteria. Snowflake automatically executes these policies daily by using shared compute resources.
Funktionsweise von Speicherlebenszyklusrichtlinien¶
To get started with storage lifecycle policies, complete the following steps:
Erstellen Sie eine Richtlinie mit einem Ausdruck, der die Zeilen identifiziert, die archiviert werden oder ablaufen sollen.
Verknüpfen Sie die Richtlinie mit einer oder mehreren Tabellen.
After you attach a storage lifecycle policy to a table, Snowflake waits approximately 24 hours before running the policy for the first time. Following this initial delay, Snowflake automatically runs the policy daily by using shared compute resources to identify and process rows that meet your defined conditions.
When the policy runs, it checks each row against your expression, and then either archives the data to COOL or COLD storage or expires the data, which deletes it permanently. You can retrieve archived data by using the CREATE TABLE … FROM ARCHIVE OF command before expiration occurs. Snowflake waits until the specified archive period elapses before expiring the data from archive storage.
Wichtige Funktionen¶
Speicherlebenszyklusrichtlinien bieten bei der Verwaltung Ihrer Snowflake-Daten die folgenden Vorteile.
- Reduzierte Speicherkosten
Storage lifecycle policies help optimize costs by automatically moving older data to more cost-effective archival tiers. For data that must be retained long-term but accessed infrequently, archival storage can significantly reduce storage costs compared to standard storage tiers.
- Einhaltung von gesetzlicher Vorschriften
Erfüllen Sie automatisch Compliance-Anforderungen, indem Sie Richtlinien konfigurieren, um Daten gemäß den Regulierungsstandards zu archivieren oder ablaufen zu lassen. Sie können Daten für einen bestimmten Zeitraum vor deren Ablauf archivieren oder sie direkt ohne Archivierung verfallen lassen. So wird sichergestellt, dass Ihre Datenverwaltung den Governance-Standards Ihrer Organisation entspricht.
- Einfache Datenverwaltung
Durch Speicherlebenszyklusrichtlinien entfallen manuelle Datenverwaltungsaufgaben, da automatisch Archivierungs- und Ablaufregeln ausgeführt werden. Weitere Informationen dazu finden Sie unter Monitor storage lifecycle policies.
- Flexibler Datenabruf
Das Abrufen archivierter Daten erfolgt mit hoher Genauigkeit, da eine neue Tabelle erstellt wird, die nur die Zeilen enthält, die Sie benötigen. Verwenden Sie einen einfachen Befehl mit einer WHERE-Klausel, um genau anzugeben, welche archivierten Daten wiederhergestellt werden sollen.
Archivspeicher-Ebenen¶
Snowflake unterstützt die Archivierung von Daten der folgenden Storage Tiers:
Archivierungsebene |
Beschreibung |
|---|---|
COOL |
Bietet schnelle Abrufzeiten, sodass die Daten sofort verfügbar sind. Die Mindestarchivierungsfrist beträgt 90 Tage. |
COLD |
Offers greater cost savings than the COOL tier; it is four times less expensive. The minimum archival period is 180 days. Compared to the COOL tier, COLD has a longer data retrieval time, which is up to 48 hours. Data retrieval operations from the COLD storage tier support a maximum of 1 million files per restore operation. |
Auswahl einer Archivierungsebene¶
When you select an archive tier, consider the following factors:
Archivierungskosten: Die einmaligen Kosten für die Archivierung von Daten sind bei beiden Ebenen gleich.
Speicherkosten: COLD Tier Storage ist kostengünstiger als COOL Tier Storage.
Abrufkosten: Der Datenabruf vom COLD Tier Storage ist kostengünstiger als vom COOL Tier Storage.
Abrufzeit: Der COOL Tier Storage ermöglicht einen sofortigen Datenabruf, während der Abruf vom COLD Tier Storage bis zu 48 Stunden dauern kann.
Ausführliche Preisinformationen finden Sie in den Tabellen 3(e) und 4(f) unter Snowflake Service Consumption Table.
For more information about archiving data, see Create a storage lifecycle policy and Archive storage considerations.
Hinweise¶
Consider the following information when you work with storage lifecycle policies.
Unterstützung von Cloudanbietern¶
Expiration policies: Supported for accounts hosted on all cloud providers (Amazon Web Services (AWS), Microsoft Azure, and Google Cloud).
Archivierungsrichtlinien: Derzeit nur für Konten verfügbar, die auf AWS gehostet werden.
Unterstützte Tabellen und Features¶
Supported tables: Storage lifecycle policies are supported for standard Snowflake tables. To evaluate and apply storage lifecycle policy expressions, Snowflake internally and temporarily bypasses any governance policies on a table.
Replikation:
Snowflake repliziert Speicherlebenszyklusrichtlinien und deren Zuordnungen zu Tabellen in Zielkonten, führt die Richtlinien jedoch nicht aus.
Nach einem Failover auf ein Zielkonto hält Snowflake die Ausführung der Speicherlebenszyklusrichtlinie im ursprünglichen Primärkonto an. Nach dem Failback auf das ursprüngliche Primärkonto setzt Snowflake die Ausführung der Richtlinien fort.
Snowflake führt Speicherlebenszyklusrichtlinien niemals automatisch auf sekundären Tabellen aus, auch nicht nach einem Failover. Sie können jedoch sekundäre Richtlinien in einem Zielkonto verwenden, indem Sie sie an neue Tabellen anhängen. Für diese neuen Tabellen führt Snowflake die Richtlinien aus.
Klonen: Speicherlebenszyklusrichtlinien werden von Snowflake nicht automatisch auf geklonte Tabellen angewendet. Wenn Sie auf eine Tabelle in einer Klongruppe eine Speicherlebenszyklusrichtlinie anwenden, archiviert Snowflake nur Zeilen aus dieser spezifischen Tabelle. Die Richtlinie wirkt sich nicht auf Klone aus. So werden Kopien der Daten sowohl auf Standard- als auch auf Archivspeicherebenen erstellt, und Sie zahlen für die Speicherung auf jeder Ebene. Informationen zu den Kosten finden Sie unter Abrechnung für Speicherlebenszyklusrichtlinien.
Nicht unterstützte Features
Storage lifecycle policies aren’t supported for the following features:
Alle Objekttypen außer regulären Snowflake-Tabellen und dynamischen Tabellen
Write once read many (WORM) snapshots, which are immutable snapshots that can’t be modified after creation.
Tabellen, die über die Snowflake-Datenfreigabe freigegeben wurden (sowohl Anbieter- als auch Verbrauchertabellen)
Native Apps.
Benutzerdefinierte Funktionen (UDFs) mit externem Zugriff und externen Funktionen
Python-, Java- oder Scala-UDFs
Verhalten und Ausführung von Richtlinien¶
Speicherlebenszyklusrichtlinien verwenden Leistungsrichtlinien, die den Richtlinien für Zugriffsrichtlinien auf Zeilenebene ähneln und werden automatisch mit den folgenden Eigenschaften ausgeführt:
Wenn Sie einer Tabelle eine Speicherlebenszyklusrichtlinie hinzufügen, wartet Snowflake etwa 24 Stunden, bevor sie sie zum ersten Mal ausführt.
Snowflake führt Speicherlebenszyklusrichtlinien täglich unter Verwendung von freigegebenen Computeressourcen aus. Informationen zu den Kosten für Speicherlebenszyklusrichtlinien finden Sie unter Abrechnung für Speicherlebenszyklusrichtlinien.
To prevent excessively long archive or expiration runs, Snowflake processes large data operations incrementally in smaller chunks. A large operation might not complete in one daily run and might instead complete across multiple daily runs.
Wenn eine Speicherlebenszyklusrichtlinie für eine Tabelle ausgeführt wird, werden UPDATE-, DELETE- und MERGE-Vorgänge von Snowflake gesperrt. Die Vorgänge INSERT und COPY können während dieser Zeit trotzdem ausgeführt werden. Weitere Informationen dazu finden Sie unter Ressourcensperrung.
Archivierungsspeicherrichtlinien¶
Consider the following information when you work with tables that have an archival storage lifecycle policy attached:
Zugriff auf archivierte Daten: Nachdem Snowflake Zeilen archiviert hat, können Sie diese nicht direkt abfragen. Wenn Sie auf diese Zeilen zugreifen müssen, verwenden Sie den Befehl CREATE TABLE … FROM ARCHIVE OF, um eine neue Tabelle mit einer Kopie der archivierten Daten zu erstellen. Weitere Informationen dazu finden Sie unter Archivierte Daten abrufen.
Sicherheit: Sie können Tri-Secret Secure (TSS) verwenden, um archivierte Daten mit regelmäßiger Schlüsselrotation zu schützen.
Rekeying: Snowflake doesn’t rekey archived data. If you suspect a key compromise, perform the following steps:
Rufen Sie die archivierten Daten mit dem Befehl CREATE TABLE … FROM ARCHIVE OF in eine neue Tabelle ab.
Archivieren Sie die Daten bei Bedarf in der neuen Tabelle.
Each table has its own encryption key, so the new table effectively uses a new key.
Löschen Sie das Archiv der ursprünglichen Tabelle, in der die Schlüssel kompromittiert wurden.
Beschränkungen für Archivierungsebenen:
You can’t change the archive tier for a policy from COOL to COLD or from COLD to COOL. Create a new policy instead. For instructions, see Neuerstellung einer Speicherlebenszyklusrichtlinie.
Eine Tabelle kann nur genau eine Archivierungsebene verwenden. Sie können eine COLD-Richtlinie nicht zu einer Tabelle hinzufügen, die bereits die COOL-Archivierung verwendet.
Entfernen von Richtlinien: Wenn Sie eine Richtlinie aus einer Tabelle entfernen, bleiben die archivierten Daten im Archivspeicher und können weiterhin abgerufen werden.
Löschen oder Kürzen einer Tabelle:
Das Kürzen einer Tabelle hat keine Auswirkungen auf die archivierten Daten dieser Tabelle. Nach dem Kürzen der Tabelle können Sie weiterhin Daten aus dem Archivspeicher abrufen.
Wenn Sie UNDROP TABLE verwenden, um eine Tabelle innerhalb einer gültigen Time Travel-Datenaufbewahrungsfrist wiederherzustellen, stellt Snowflake auch alle Daten im Archivspeicher wieder her.
Wenn sich eine Tabelle innerhalb des Fail-safe-Zeitraums befindet, können die Daten im Archivspeicher möglicherweise mit Fail-safe-Datenwiederherstellungsschritten über den Snowflake-Support wiederhergestellt werden.
Für Tabellendaten im Archivspeicher, die Sie vor Ablauf des ARCHIVE_FOR_DAYS-Zeitraums löschen, fallen Speicherkosten an. Weitere Informationen dazu finden Sie unter Gebühren für die Mindestspeicherdauer.