Initialisierung und Aktualisierung dynamischer Tabellen verstehen¶

Der Inhalt einer dynamischen Tabelle wird durch eine Abfrage definiert und automatisch aktualisiert – Aktualisierung genannt – wenn sich die zugrunde liegenden Daten ändern. Dieser Prozess analysiert die Abfrage, um die Tabelle auf dem neuesten Stand zu halten.

Bemerkung

Die Informationen unter diesem Thema gelten für dynamische Tabellen mit dem SCHEDULER-Attribut, das auf ENABLE festgelegt ist oder nicht explizit festgelegt ist. Dynamische Tabellen mit dem SCHEDULER-Attribut, das auf DISABLE festgelegt ist, können nur manuell aktualisiert werden. Weitere Informationen dazu finden Sie unter Dynamische Tabellen manuell aktualisieren.

In den folgenden Abschnitten wird das Aktualisieren dynamischer Tabellen näher erläutert:


Abschnitt	Beschreibung
Erläuterungen zur Initialisierung dynamischer Tabellen	Führt die Initialisierung ein, d. h. die anfängliche Datenbefüllung, wenn Sie eine dynamische Tabelle erstellen. Sie können festlegen, wann die erste Aktualisierung erfolgt.
Manuelle und geplante Aktualisierungsoptionen verstehen	Ein Überblick über die Aktualisierung dynamischer Tabellen. Dynamische Tabellen werden nach einem Zeitplan aktualisiert, sofern sie nicht manuell aktualisiert werden.
Aktualisierungsmodi für dynamische Tabellen	Dynamische Tabellen unterstützen verschiedene Aktualisierungsmodi: inkrementell, vollständig und AUTO.
Aktualisierung von Daten, wenn eine dynamische Tabelle von anderen abhängt	Erfahren Sie, wie dynamische Tabellen in Abhängigkeit von ihren Abhängigkeiten aktualisiert werden.
Erläuterungen zu den Auswirkungen von Änderungen an Spalten in Basistabellen

Erläuterungen zur Initialisierung dynamischer Tabellen¶

Wenn Sie eine dynamische Tabelle erstellen, erfolgt ihre erste Aktualisierung entweder synchron bei der Erstellung oder zu einem geplanten Zeitpunkt. Die erstmalige Datenbefüllung oder Initialisierung hängt davon ab, wann diese erste Aktualisierung stattfindet.

Dynamische Tabellen werden auf der Grundlage der angegebenen Zielverzögerung aktualisiert. Diese legt die maximal zulässige Verzögerung zwischen Aktualisierungen der Basistabellen und dem Inhalt der dynamischen Tabelle fest. Wenn Sie INITIALIZE = ON_CREATE (Standard) einstellen, wird die Tabelle sofort initialisiert. Wenn Sie INITIALIZE = ON_SCHEDULE einstellen, erfolgt die Initialisierung innerhalb des angegebenen Zeitrahmens für die Zielverzögerung.

Nehmen wir zum Beispiel eine dynamische Tabelle, DT1, mit einer Zielverzögerung von 30 Minuten. Die Grundgesamtheit der Daten für DT1 kann wie folgt aussehen:

Wenn DT1 so eingestellt ist, dass sie bei der Erstellung synchron aktualisiert wird (ON_CREATE), wird sie bei der Erstellung initialisiert.
Wenn DT1 so eingestellt ist, dass sie zu einer geplanten Zeit aktualisiert wird (ON_SCHEDULE), wird sie innerhalb von 30 Minuten initialisiert.

In Szenarien mit nachgelagerten Abhängigkeiten hängt das Aktualisierungsverhalten von den Abhängigkeiten ab. Wenn zum Beispiel die dynamische Tabelle DT1 eine nachgelagerte Zielverzögerung hat und DT2, die von DT1 abhängt, eine Zielverzögerung von 30 Minuten hat, wird DT1 nur aktualisiert, wenn DT2 aktualisiert wird.

DT1:

Wenn Sie bei der Erstellung eine synchrone Aktualisierung einstellen, wird sie sofort initialisiert. Wenn die Initialisierung fehlschlägt, wird der Erstellungsprozess angehalten und es wird sofort eine Fehlermeldung angezeigt.
Wenn Sie die Aktualisierung zu einem bestimmten Zeitpunkt festlegen, hängt die Initialisierung davon ab, wann DT2 aktualisiert wird.

Die Initialisierung kann einige Zeit dauern, je nachdem, wie viele Daten gescannt werden. Um den Fortschritt zu verfolgen, siehe Probleme beim Erstellen dynamischer Tabellen lösen.

Manuelle und geplante Aktualisierungsoptionen verstehen¶

Dynamische Tabellen werden nach einem Zeitplan aktualisiert, der von der Zielverzögerung bestimmt wird. Jedes Mal, wenn eine dynamische Tabelle gelesen wird, liegt die Datenaktualität innerhalb des durch die Zielverzögerung definierten Zeitraums.

Sie können Ihre dynamischen Tabellen manuell mit dem Befehl ALTER DYNAMIC TABLE … REFRESH oder Snowsight aktualisieren, um die neuesten Daten zu erhalten. Weitere Informationen dazu finden Sie unter Dynamische Tabellen manuell aktualisieren.

Zeitüberschreitungen bei der Aktualisierung von dynamischen Tabellen werden durch den Parameter STATEMENT_TIMEOUT_IN_SECONDS gesteuert, der die maximal zulässige Dauer auf Konto- oder Warehouse-Ebene festlegt, bevor eine Aktualisierung automatisch abgebrochen wird.

Auswirkung der Zielverzögerung auf geplante Aktualisierungen¶

Die Zielverzögerung steuert die Häufigkeit der geplanten Aktualisierungen. Um Aktualisierungen manuell zu verwalten, setzen Sie die Zielverzögerung Ihrer dynamischen Tabelle auf DOWNSTREAM und stellen Sie sicher, dass alle nachgelagerten dynamischen Tabellen ebenfalls auf DOWNSTREAM gesetzt sind.

Wenn Sie die Zielverzögerung des gesamten gerichteten azyklischen Graphen (DAG) auf DOWNSTREAM setzen, werden geplante Aktualisierungen im Wesentlichen deaktiviert, da die endgültige dynamische Tabelle den Aktualisierungszeitplan steuert. Wenn keine dynamische Tabelle eine zeitbasierte Zielverzögerung hat, wird die Pipeline für geplante Aktualisierungen ausgesetzt. In diesem Fall werden durch die manuelle Aktualisierung der am weitesten nachgelagerten Tabelle automatisch alle vorgelagerten Abhängigkeiten aktualisiert.

Wenn Sie die Zielverzögerung auf DOWNSTREAM einstellen, werden keine genauen Zeiten angegeben. Stattdessen wählt Snowflake eine Aktualisierungskadenz, um zu versuchen, die Verzögerung unter dem Zielwert zu halten. Eine dynamische Tabelle mit einer Zielverzögerung von 4 Stunden könnte zum Beispiel alle 3,5 Stunden aktualisiert werden.

Um genaue Zeiten anzugeben, können Sie eine Aufgabe mit einem CRON-Zeitplan verwenden. Weitere Informationen dazu finden Sie unter Dynamische Tabellen manuell aktualisieren.

Aktualisierungsmodi für dynamische Tabellen¶

Dynamische Tabellen unterstützen drei Aktualisierungsmodi: automatisch, inkrementell und vollständig. Sie können den Aktualisierungsmodus entweder auf AUTO festlegen, oder Sie können ihn explizit festlegen:

AUTO Aktualisierungsmodus: Bei Verwendung des Parameters AUTO wählt Snowflake automatisch den kosten- und zeiteffizientesten Aktualisierungsmodus aus, der auf der Komplexität der Abfrage, den unterstützten Konstrukten, Operatoren, Funktionen und der erwarteten Leistung basiert. Diese Entscheidung wird nur einmal zum Zeitpunkt der Tabellenerstellung getroffen. Wenn die inkrementelle Aktualisierung nicht unterstützt wird oder ineffizient ist, verwendet Snowflake stattdessen die vollständige Aktualisierung.

Wenn beispielsweise eine dynamische Tabelle auf eine Ansicht verweist und sich die Definition der Ansicht asynchron ändert, bleibt der Aktualisierungsmodus unverändert. Wenn die ursprüngliche Entscheidung inkrementell war, aber nicht mehr unterstützt wird (z. B. aufgrund einer Änderung der vorgelagerten Ansicht), schlägt die Aktualisierung mit einem Fehler wie Dynamic table can no longer be refreshed incrementally because an upstream view changed. fehl.

Um den Aktualisierungsmodus zu ändern, erstellen Sie die dynamische Tabelle mit dem Befehl CREATE OR REPLACE DYNAMIC TABLE erneut.
Inkrementeller Aktualisierungsmodus: Dieser Modus analysiert die Abfrage der dynamischen Tabelle und berechnet die Änderungen seit der letzten Aktualisierung. Anschließend werden diese Änderungen in die Tabelle eingefügt.
Vollständiger Aktualisierungsmodus: In diesem Modus wird die Abfrage der dynamischen Tabelle ausgeführt und die zuvor materialisierten Ergebnisse werden vollständig ersetzt.

Hinweise, wann Sie die inkrementelle Aktualisierung oder die vollständige Aktualisierung verwenden sollten, finden Sie unter Auswählen eines Aktualisierungsmodus. Um zu prüfen, welchen Aktualisierungsmodus eine vorhandene dynamische Tabelle verwendet, siehe Aktualisierungsmodus.

Wichtig

Dynamische Tabellen im inkrementellen Aktualisierungsmodus können nur nachgelagert von dynamischen Tabellen im Full-Refresh-Modus sein, wenn die vorgelagerte Full-Refresh-Tabelle über einen systemseitig abgeleiteten eindeutigen Schlüssel oder eine Unveränderlichkeitsbeschränkung verfügt.

Weitere Informationen dazu finden Sie unter Erläuterungen zu Primärschlüsseln in dynamischen Tabellen und Erläuterungen zu Unveränderlichkeitseinschränkungen.

Aktualisierung von Daten, wenn eine dynamische Tabelle von anderen abhängt¶

Wenn die Verzögerung einer dynamischen Tabelle als Zeitmaß festgelegt wird, plant der automatische Aktualisierungsprozess die Aktualisierungen so, dass die Zielverzögerungszeiten bestmöglich eingehalten werden.

Um die Daten konsistent zu halten, wenn eine dynamische Tabelle von einer anderen abhängt, aktualisiert der Prozess alle dynamischen Tabellen in einem Konto zu kompatiblen Zeiten. Der Zeitpunkt der weniger häufigen Aktualisierungen stimmt mit dem Zeitpunkt der häufigeren Aktualisierungen überein. Wenn die Aktualisierungen zu lange dauern, überspringt der Planer möglicherweise Aktualisierungen, um auf dem neuesten Stand zu bleiben. Die Snapshot-Isolation bleibt jedoch erhalten.

Angenommen, die dynamische Tabelle DT1 hat eine Zielverzögerung von zwei Minuten und fragt die dynamische Tabelle DT2 ab, die eine Zielverzögerung von einer Minute hat. Der Prozess könnte festlegen, dass DT1 alle 96 Sekunden und DT2 alle 48 Sekunden aktualisiert werden soll. Im Ergebnis könnte der Prozess folgenden Zeitplan anwenden:


Spezifischer Zeitpunkt	Dynamische Tabellen aktualisiert
2022-12-01 00:00:00	DT1, DT2
2022-12-01 00:00:48	DT2
2022-12-01 00:01:36	DT1, DT2
2022-12-01 00:02:24	DT2

Die Zielverzögerung einer dynamischen Tabelle kann nicht kürzer sein als die Zielverzögerung der dynamischen Tabellen, von denen sie abhängt, es sei denn, die vorgelagerte dynamische Tabelle wird über DYNAMIC_TABLE_REFRESH_BOUNDARY() referenziert. Folgendes wird angenommen:

DT1 fragt die dynamischen Tabellen DT2 und DT3 ab.
DT2 hat eine Zielverzögerung von fünf Minuten.
DT3 hat eine Zielverzögerung von einer Minute.

Das bedeutet, dass die Zielverzögerung für DT1 nicht kürzer als fünf Minuten sein darf (d. h. nicht kürzer als die längere der Verzögerungszeiten für DT2 und DT3).

Wenn Sie die Verzögerung für DT1 auf fünf Minuten einstellen, wird ein Aktualisierungsplan mit diesen Zielen erstellt:

Aktualisieren von DT3 häufig genug, um die Verzögerung unter einer Minute zu halten.
Aktualisieren von DT1 und DT2 zusammen und häufig genug, um ihre Verzögerungen unter fünf Minuten zu halten.
Stellen Sie sicher, dass die Aktualisierung von DT1 und DT2 mit einer Aktualisierung von DT3 zusammenfällt, um die Snapshot-Isolation zu gewährleisten.

Wichtig

Weitere Informationen dazu finden Sie unter Erläuterungen zu Primärschlüsseln in dynamischen Tabellen und Erläuterungen zu Unveränderlichkeitseinschränkungen.

Snapshot-Isolation¶

Wenn eine dynamische Tabelle aktualisiert wird, stellt sie durch Time Travel einen konsistenten Status sicher, indem über alle vorgelagerten Abhängigkeiten hinweg derselbe Zeitstempel verwendet wird.

Für nicht dynamische Basistabellen funktioniert Time Travel wie gewohnt, wobei die Commit-Zeit der „Wanduhr“ berücksichtigt wird. Das bedeutet, dass der Inhalt einer dynamischen Tabelle immer mit einem „Snapshot“ der Daten in den Basistabellen konsistent ist.

Für vorgelagerte dynamische Tabellen sucht Snowflake die spezifische Tabellenversion, die mit diesem Zeitstempel getaggt ist. Dadurch wird sichergestellt, dass nachgelagerte Tabellen immer mit ihren übergeordneten Tabellen konsistent sind. Sie müssen keine Zeitpläne für die Aktualisierung koordinieren oder sich wegen verschiedener Verzögerungen Gedanken machen. Snowflake gleicht die Snapshots automatisch ab, um die Datenintegrität in der gesamten Pipeline sicherzustellen.

Die Snapshot-Isolation wird in den folgenden Fällen nicht garantiert:

Manuelle SELECT-Anweisungen: Wenn Sie mehrere dynamische Tabellen mit einer manuellen SELECT-Anweisung verknüpfen, verwenden Ad-hoc-Abfragen die aktuelle Version jeder Tabelle. Da jede dynamische Tabelle ihre Aktualisierung unabhängig übergibt, kann eine manuelle Verknüpfung unterschiedliche Aktualisierungsstatus erfassen, selbst wenn die dynamischen Tabellen die gleiche Zielverzögerung haben oder eine vorgelagerte Aktualisierung verzögert wird. Das bedeutet, dass die Ergebnisse möglicherweise keinen einzelnen, konsistenten Snapshot der Basisdaten widerspiegeln.
Aktualisierungsgrenzen: Wenn eine dynamische Tabelle über DYNAMIC_TABLE_REFRESH_BOUNDARY() auf eine vorgelagerte dynamische Tabelle verweist, wird die vorgelagerte dynamische Tabelle als zu einer separaten Pipeline gehörend behandelt. Die nachgelagerte dynamische Tabelle liest jede Version der Upstream-Daten, die zum Aktualisierungszeitpunkt verfügbar ist, und nicht einen koordinierten Datenzeitstempel.

Erläuterungen zu den Auswirkungen von Änderungen an Spalten in Basistabellen¶

Wenn sich die zugrunde liegenden Objekte, die mit einer dynamischen Tabelle verbunden sind, ändern, hat dies folgende Auswirkungen:


Änderung	Auswirkung
Neue Spalte zur Basistabelle hinzugefügt. Vorhandene ungenutzte Spalte in der Basistabelle entfernt.	Keine. Wenn der Basistabelle eine neue Spalte hinzugefügt wurde oder eine nicht genutzte Spalte gelöscht wurde, werden keine Aktionen ausgeführt, und die Aktualisierungen werden wie zuvor fortgesetzt.
Die zugrunde liegende Basistabelle wird mit identischen Spaltennamen und -typen neu erstellt. Eine Spalte der zugrunde liegenden Basistabelle wird mit demselben Namen und Typ neu erstellt. Änderungen an den Richtlinien für zugrunde liegende Basistabellen von dynamischen Tabellen mit inkrementeller Aktualisierung.	Reinitialisierung: Die erste Aktualisierung nach der Neuerstellung ist die Initialisierung.
Änderungen an der zugrunde liegenden Basistabelle für dynamische Tabellen, die mit `SELECT *` aus der Basistabelle erstellt wurden.	Die dynamische Tabelle kann nicht aktualisiert werden und muss neu erstellt werden, um die Änderung zu berücksichtigen.
Änderungen an der zugrunde liegenden Basistabelle für dynamische Tabellen, die mit einer Spaltendefinition erstellt wurden.	Keine Auswirkungen auf die dynamische Tabelle.