Verwenden einer mit dem Katalog verbundene Datenbank für Apache Iceberg™-Tabellen¶

Mit einer katalogverknüpften Datenbank können Sie von Snowflake aus auf mehrere Remote-Iceberg-Tabellen zugreifen, ohne einzelne extern verwaltete Tabellen erstellen zu müssen.

Eine mit einem Katalog verknüpfte Datenbank ist eine Snowflake-Datenbank, die mit einem externen Iceberg REST-Katalog verbunden ist. Snowflake synchronisiert automatisch mit dem externen Katalog, um Namespaces und Iceberg-Tabellen zu erkennen, und registriert die Remotetabellen in der mit dem Katalog verknüpften Datenbank. Mit einem Katalog verknüpfte Datenbanken unterstützen auch das Erstellen und Löschen von Schemas oder Iceberg-Tabellen.

Abrechnung für katalogverknüpfte Datenbanken¶

Snowflake stellt Ihrem Konto die folgende Nutzung in Rechnung:

Automatische Tabellenerkennung, Erstellen von Schemas, Löschen von Schemas und Löschen von Tabellen. Snowflake stellt Ihrem Konto diese Nutzung unter der Nutzungsart CREDITS_USED_CLOUD_SERVICES in Rechnung. Die Nutzung von Clouddiensten wird nur berechnet, wenn der tägliche Verbrauch der Clouddienste 10 % des täglichen Verbrauchs der virtuellen Warehouses überschreitet. Weitere Informationen dazu finden Sie unter Erläuterungen zur Abrechnung der Nutzung von Clouddiensten.
Erstellen von Tabellen. Snowflake stellt Ihrem Konto diese Nutzung unter Nutzungsart CREDITS_USED_COMPUTE durch automatische Aktualisierung in Rechnung. Die Kosten für diese Nutzung sind in Tabelle 5 der Snowflake Service Consumption Table auf der Snowflake-Website beschrieben. Die Zeilen „Automatische Aktualisierung“ und „Datenregistrierung“ finden Sie in der Spalte für Snowflake-verwaltete Computeressourcen.

Snowflake stellt Ihnen keine Clouddienste in Rechnung, die Sie während der Tabellenerstellung verwenden.

Bemerkung

Verwenden Sie zum Anzeigen der Credit-Nutzung für die katalogverknüpften Datenbanken Ansicht CATALOG_LINKED_DATABASE_USAGE_HISTORY.

Workflow zur Konfiguration des Zugriffs auf Ihren externen Katalog und Tabellenspeicher¶

Die folgenden Schritte beschreiben, wie Sie eine mit dem Katalog verknüpfte Datenbank erstellen, den Synchronisierungsstatus zwischen Snowflake und dem Katalog überprüfen und eine Tabelle in der Datenbank erstellen oder abfragen.

Bemerkung

Wenn sich Ihre externen Daten in Unity Catalog befinden, finden Sie entsprechende Informationen zum Einstieg in katalogverknüpfte Datenbanken unter Tutorial: Einrichten des bidirektionalen Zugriffs auf Apache Iceberg™-Tabellen in Databricks Unity Catalog.
Wenn sich Ihre externen Daten in AWS Glue befinden, finden Sie entsprechende Informationen unter Erstellen von Data Lakes mit Apache Iceberg mit Snowflake und AWS Glue.

Konfigurieren des Zugriffs auf den externen Katalog und Tabellenspeicher¶

Bevor Sie eine mit einem Katalog verknüpfte Datenbank erstellen, müssen Sie den Zugriff auf den externen Katalog und Tabellenspeicher konfigurieren. Um diesen Zugriff zu konfigurieren, konfigurieren Sie eine Katalogintegration mit automatisch erzeugten Anmeldeinformationen. Mit dieser Option muss Ihr Remote-Iceberg-Katalog die automatische Erzeugung von Anmeldeinformationen unterstützen.

Eine Anweisung dazu finden Sie unter Verwenden Sie vom Katalog automatisch erzeugte Anmeldeinformationen für Apache Iceberg™-Tabellen.

Bemerkung

Wenn Ihr Remote-Iceberg-Katalog die automatische Erzeugung von Anmeldeinformationen nicht unterstützt, müssen Sie ein externes Volumen und eine Katalogintegration konfigurieren, um den Zugriff auf Ihren externen Katalog und Tabellenspeicher zu konfigurieren. Konfigurieren Sie zuerst ein externes Volumen für Ihren Cloudspeicher-Anbieter. Konfigurieren Sie dann eine Apache Iceberg™-REST-Katalogintegration für Ihren Remote-Iceberg-Katalog.

Eine mit dem Katalog verbundene Datenbank erstellen¶

Erstellen Sie eine mit einem Katalog verknüpfte Datenbank mit dem Befehl CREATE DATABASE (katalogverknüpft):

Im folgenden Beispiel wird eine mit einem Katalog verknüpfte Datenbank erstellt, die automatisch erzeugte Anmeldeinformationen verwendet Das Synchronisierungsintervall beträgt 30 Sekunden, was die Standardeinstellung ist. Das Synchronisierungsintervall teilt Snowflake mit, wie oft Ihr Remote-Katalog abgefragt werden soll.

CREATE DATABASE my_linked_db
  LINKED_CATALOG = (
    CATALOG = 'my_catalog_int'
  );

Bemerkung

Weitere Informationen zum Erstellen einer katalogverknüpften Datenbank, die ein externes Volume verwendet, finden Sie unter CREATE DATABASE (katalogverknüpft), zusammen mit dem Beispiel.

Ihre mit dem Katalog verknüpfte Datenbank enthält ein Link-Symbol.

Formular zum Einreichen eines neuen Falls

Überprüfen der Konfiguration einer katalogverknüpften Datenbank¶

Nachdem Sie eine katalogverknüpfte Datenbank erstellt haben, verwenden Sie die Funktion SYSTEM$GET_CATALOG_LINKED_DATABASE_CONFIG zum Überprüfen der Konfiguration der Datenbank.

SELECT SYSTEM$GET_CATALOG_LINKED_DATABASE_CONFIG('my_linked_db');

Überprüfen des Status der Katalogsynchronisierung¶

Um zu überprüfen, ob Snowflake den Remote-Katalog erfolgreich mit der Datenbank verknüpft hat, verwenden Sie die SYSTEM$CATALOG_LINK_STATUS-Funktion.

Die Funktion liefert auch Informationen, die Ihnen helfen, Tabellen im Remote-Katalog zu identifizieren, die nicht synchronisiert werden können.

SELECT SYSTEM$CATALOG_LINK_STATUS('my_linked_db');

Identifizieren von Tabellen, die erstellt wurden, aber nicht initialisiert werden konnten¶

Um Tabellen im Remote-Katalog zu identifizieren, die erfolgreich synchronisiert wurden, aber nicht automatisch aktualisiert werden, führen Sie den Befehl SHOW ICEBERG TABLES aus und sehen Sie sich dann die Spalte:code:auto_refresh_status in der Ausgabe an. Diese Tabellen weisen den executionState ICEBERG_TABLE_NOT_INITIALIZED in der Ausgabe auf.

Beispielsweise könnte Snowflake erfolgreich eine Tabelle in Ihrem Remote-Katalog erkennen und für Ihre mit dem Katalog verknüpften Datenbank erstellen, aber diese Tabelle weist eine beschädigte Datendatei in Ihrem Remote-Katalog auf. Daher kann Snowflake die Tabelle nicht automatisch aktualisieren, bis Sie den Fehler behoben haben.

Die automatische Aktualisierung ist für diese Art von Tabellen deaktiviert, sodass die Abfrage der Tabelle in Snowflake einen Fehler zurückgibt, der besagt, dass die Tabelle nie initialisiert wurde. Um die Tabelle abzufragen, müssen Sie den Fehler beheben und dann die automatische Aktualisierung für die Tabelle aktivieren.

Eine Tabelle in die mit dem Katalog verknüpfte Datenbank abfragen¶

Nachdem Sie eine mit dem Katalog verknüpfte Datenbank erstellt haben, startet Snowflake den Erkennungsprozess für Tabellen und fragt den verknüpften Katalog automatisch mit dem Wert des SYNC_INTERVAL_SECONDS-Parameters ab (mit einem Standardintervall von 30 Sekunden), um auf Änderungen zu prüfen.

In der Datenbank werden zulässige Namespaces aus dem Remote-Katalog als Schemas angezeigt, und Iceberg-Tabellen werden unter ihren jeweiligen Schemas angezeigt.

Sie können die Remotetabellen mithilfe einer SELECT-Anweisung abfragen.

Bemerkung

Die Anforderungen für das Identifizieren von Objekten in einer mit dem Katalog verknüpften Datenbank finden Sie unter Anforderungen an die Bezeichnerauflösung in einer katalogverknüpften Datenbank.

Weitere Informationen zu Objektparametern finden Sie unter Anforderungen an Bezeichner.

Beispiel:

USE DATABASE my_linked_db;

SELECT * FROM my_namespace.my_iceberg_table
  LIMIT 20;

In den Remote-Katalog schreiben¶

Sie können Snowflake verwenden, um Namespaces und Iceberg-Tabellen in Ihrem verknüpften Katalog zu erstellen. Weitere Informationen dazu finden Sie unter folgenden Themen:

Anforderungen an die Bezeichnerauflösung in einer katalogverknüpften Datenbank¶

Die Anforderung für das Auflösen eines Bezeichners hängt von Folgendem ab:

Dem Wert, den Sie für den Parameter CATALOG_CASE_SENSITIVITY angegeben haben, als Sie Ihre katalogverknüpfte Datenbank erstellt haben
Ob Ihr externer Iceberg-Katalog Bezeichner verwendet, bei denen Groß-/Kleinschreibung unterschieden wird oder nicht.

Bemerkung

Diese Anforderungen gelten für die Identifizierung vorhandener Schemas, Tabellen und Tabellenspalten. Sie enthalten auch einige Sonderfälle für das Erstellen oder Ändern eines Objekts.
Wenn Sie ein neues Schema, eine neue Tabelle oder eine neue Spalte in einem Katalog erstellen, bei dem die Groß-/Kleinschreibung beachtet wird, wie z. B. AWS Glue oder Unity Catalog, müssen Sie Kleinbuchstaben verwenden und die Schema-, Tabellen- und Spaltennamen in doppelte Anführungszeichen setzen. Dies ist auch für andere Iceberg REST-Kataloge erforderlich, die nur Bezeichner in Kleinbuchstaben unterstützen.

Die folgende Tabelle zeigt die Anforderungen für jedes Szenario:


CATALOG_CASE_SENSITIVITY-Wert	Externer Iceberg-Katalog verwendet	Anforderung
CASE_SENSITIVE	Bezeichner unter Berücksichtigung der Groß- und Kleinschreibung	Snowflake gleicht Bezeichner genau so ab, wie sie angezeigt werden, einschließlich der Groß-/Kleinschreibung. Snowflake konvertiert Bezeichner ohne Anführungszeichen automatisch in Großbuchstaben, aber Bezeichner in Anführungszeichen müssen genau der Groß-/Kleinschreibung in Ihrem externen Katalog entsprechen. Das folgende Beispiel zeigt eine gültige Abfrage zum Erstellen einer Tabelle: CREATE TABLE "Table1" (id INT, name STRING); Snowflake erstellt die Tabelle im externen Katalog als `Table1` mit der von Ihnen verwendeten Großschreibung. Beachten Sie, dass Sie auch eine Tabelle `table1` in Kleinbuchstaben erstellen können, falls erforderlich. Das folgende Beispiel zeigt eine gültige Abfrage für die Auswahl der Tabelle `Table1`: SELECT * FROM "Table1"; Im vorherigen Beispiel sind die doppelten Anführungszeichen erforderlich, um die Großschreibung genau abzugleichen. Das folgende Beispiel zeigt eine ungültige Abfrage, es sei denn, es ist eine Tabelle `TABLE1` vorhanden: SELECT * FROM table1; Im vorherigen Beispiel ist die Abfrage ungültig, wenn `TABLE1` nicht existiert, da der Bezeichner nicht in doppelte Anführungszeichen gesetzt ist. Infolgedessen wandelt Snowflake den Bezeichner in Großbuchstaben um. Das folgende Beispiel zeigt eine ungültige Abfrage für den Fall, wenn eine Tabelle `TABLE1` in Großbuchstaben nicht vorhanden ist: SELECT * FROM TABLE1;
CASE_SENSITIVE	Bezeichner unter Nichtberücksichtigung der Groß- und Kleinschreibung	Wenn der externe Iceberg-Katalog tatsächlich nicht zwischen Groß- und Kleinschreibung unterscheidet und in Kleinbuchstaben normalisiert, müssen Sie Bezeichner in doppelte Anführungszeichen setzen. Das folgende Beispiel zeigt eine gültige Abfrage: SELECT * from "s1"; SELECT * from "lowercasetablename";
CASE_INSENSITIVE	Bezeichner unter Nichtberücksichtigung der Groß- und Kleinschreibung	Wenn Ihr Katalog, der nicht zwischen Groß-/Kleinschreibung unterscheidet, eine Tabelle `table1` in Kleinbuchstaben enthält, sind alle der folgenden Abfragen gültig: SELECT * from table1; SELECT * from TABLE1; SELECT * from Table1; SELECT * from "table1"; Bei den folgenden Befehle müssen Sie die Schema-, Tabellen- und Spaltennamen in doppelte Anführungszeichen setzen: CREATE ICEBERG TABLE CREATE SCHEMA ALTER ICEBERG TABLE ADD COLUMN ALTER ICEBERG TABLE RENAME COLUMN
CASE_INSENSITIVE	Bezeichner unter Berücksichtigung der Groß- und Kleinschreibung	Wenn der externe Iceberg-Katalog zwischen Groß- und Kleinschreibung unterscheidet, behandelt Snowflake nicht in Anführungszeichen gesetzte Bezeichner als nicht zwischen Groß- und Kleinschreibung unterscheidend und wandelt sie automatisch in Großbuchstaben um. Wenn Sie Objekte erstellen oder abfragen, gleicht Snowflake Bezeichner unabhängig von der Groß-/Kleinschreibung ab, solange sie nicht in Anführungszeichen gesetzt sind. Eine Verwendung dieses Musters wird nicht empfohlen, da Snowflake nicht zwei verschiedene Bezeichner auflösen kann, die sich nur in der Groß-/Kleinschreibung unterscheiden. Dieses Muster funktioniert nur, wenn sich keine zwei Bezeichner nur in der Groß-/Kleinschreibung unterscheiden. Stellen Sie sich vor, der Remote-Katalog weist eine Tabelle `Table1` auf. Alle der folgenden Abfragen sind bei der Abfrage dieser Tabelle gültig. SELECT * from table1; SELECT * from TABLE1; SELECT * from Table1; SELECT * from "Table1"; Bezeichner in Anführungszeichen behalten die Groß-/Kleinschreibung bei und stimmen genau überein. Allerdings werden im CASE_INSENSITIVE-Modus sowohl Formen ohne als auch mit Anführungszeichen unterstützt.

Hinweise zur Verwendung einer mit einem Katalog verknüpften Datenbank für Iceberg-Tabellen¶

Beachten Sie Folgendes, wenn Sie eine mit einem Katalog verknüpfte Datenbank verwenden: