Automatisiertes Aktualisieren der Metadaten von Verzeichnistabellen

Sie können die Metadaten für eine Verzeichnistabelle auf einem internen oder externen Stagingbereich automatisch aktualisieren.

Die Aktualisierungsoperation synchronisiert die Metadaten mit dem neuesten Satz zugehöriger Dateien im Speicher und erfolgt als Reaktion auf die folgenden Typen von Änderungen:

  • Neue Dateien im Pfad werden zu den Tabellenmetadaten hinzugefügt.

  • Änderungen an Dateien im Pfad werden in den Tabellenmetadaten aktualisiert.

  • Dateien, die sich nicht mehr im Pfad befinden, werden aus den Tabellenmetadaten entfernt.

Interne Stagingbereiche

Die automatische Aktualisierung der Verzeichnistabelle auf einem internen Stagingbereich synchronisiert die Metadaten mit dem neuesten Satz von zugehörigen Dateien im internen Stagingbereich und Pfad, wenn Folgendes eintritt:

  • Neue Dateien im Pfad werden zu den Tabellenmetadaten hinzugefügt.

  • Änderungen an Dateien im Pfad werden in den Tabellenmetadaten aktualisiert.

  • Dateien, die sich nicht mehr im Pfad befinden, werden aus den Tabellenmetadaten entfernt.

Internen benannten Stagingbereich mit einer aktivierten Verzeichnistabelle erstellen

Erstellen Sie einen internen benannten Stagingbereich mit einer aktivierten Verzeichnistabelle, indem Sie den Befehl CREATE STAGE verwenden. Snowflake liest Ihre Staging-Datendateien in die Metadaten der externen Tabelle.

CREATE STAGE my_int_stage
  DIRECTORY = (
    ENABLE = TRUE
    AUTO_REFRESH = TRUE
  );
Copy

Externe Stagingbereiche

Sie können die Metadaten einer Verzeichnistabelle automatisch aktualisieren, indem Sie die folgenden Ereignisbenachrichtigungsdienste verwenden:

Eine Anleitung zum Einrichten automatischer Aktualisierungen finden Sie unter dem Thema für den Cloudspeicherdienst, in dem sich Ihre Dateien befinden.

Cloud-übergreifende Unterstützung

Snowflake unterstützt die automatische Aktualisierung von Verzeichnistabellen für externe Stagingbereiche über mehrere Clouds und Regionen hinweg.

Die folgende Tabelle zeigt die Cloud-übergreifenden Optionen, die Snowflake für die automatische Aktualisierung der Verzeichnistabellen unterstützt, basierend auf der Cloudplattform, die Ihr Snowflake-Konto hostet.

Amazon S3

Google Cloud Storage

Microsoft Azure Blob-Speicher

Microsoft Data Lake Storage Gen2

Microsoft Azure General Purpose v2

Auf AWS gehostet Konten

Auf GCP gehostet Konten

Auf Azure gehostete Konten

Hinweise

  • Automatische Aktualisierungen sind ereignisbasiert und bieten eine bessere Leistung als manuelle Aktualisierungen für große oder schnell wachsende Stagingbereiche.

  • Automatisierte Aktualisierungen für interne Stagingbereiche sind derzeit für Konten verfügbar, die auf AWS gehostet werden. Snowflake unterstützt die Aktualisierung der Metadaten der Verzeichnistabelle im internen Stagingbereich nicht, wenn Ihr Konto in der Google Cloud oder Azure gehostet wird.

Nächste Themen: