CREATE DATABASE¶
Erstellt eine neue Datenbank im System.
Darüber hinaus kann dieser Befehl für folgende Aufgaben verwendet werden:
Erstellen Sie einen Klon einer vorhandenen Datenbank, entweder in ihrem aktuellen Status oder zu einem bestimmten Zeitpunkt/Punkt in der Vergangenheit (mit Time Travel). Weitere Informationen zum Klonen einer Datenbank finden Sie unter Hinweise zum Klonen.
Erstellen einer Datenbank aus einer Freigabe, die von einem anderen Snowflake-Konto bereitgestellt wird. Weitere Informationen zu Freigaben finden Sie unter Einführung in Secure Data Sharing.
Erstellen eines Replikats einer vorhandenen Primärdatenbank (d. h. einer Sekundärdatenbank). Weitere Informationen zur Datenbankreplikation finden Sie unter Einführung in die Datenbankreplikation über mehrere Konten.
- Siehe auch:
ALTER DATABASE, DESCRIBE DATABASE, DROP DATABASE, SHOW DATABASES, UNDROP DATABASE
Syntax¶
Standarddatenbank
CREATE [ OR REPLACE ] [ TRANSIENT ] DATABASE [ IF NOT EXISTS ] <name>
[ CLONE <source_db>
[ { AT | BEFORE } ( { TIMESTAMP => <timestamp> | OFFSET => <time_difference> | STATEMENT => <id> } ) ] ]
[ DATA_RETENTION_TIME_IN_DAYS = <integer> ]
[ MAX_DATA_EXTENSION_TIME_IN_DAYS = <integer> ]
[ EXTERNAL_VOLUME = <external_volume_name> ]
[ CATALOG = <catalog_integration_name> ]
[ DEFAULT_DDL_COLLATION = '<collation_specification>' ]
[ COMMENT = '<string_literal>' ]
[ [ WITH ] TAG ( <tag_name> = '<tag_value>' [ , <tag_name> = '<tag_value>' , ... ] ) ]
Freigegebene Datenbank (aus einer Freigabe)
CREATE DATABASE <name> FROM SHARE <provider_account>.<share_name>
Sekundäre Datenbank (Datenbankreplikation)
CREATE DATABASE <name>
AS REPLICA OF <account_identifier>.<primary_db_name>
[ DATA_RETENTION_TIME_IN_DAYS = <integer> ]
Erforderliche Parameter¶
name
Gibt den Bezeichner für die Datenbank an. Dieser muss für Ihr Konto eindeutig sein.
Darüber hinaus muss der Bezeichner mit einem Buchstaben beginnen und darf keine Leer- oder Sonderzeichen enthalten, es sei denn, die gesamte Bezeichnerzeichenfolge wird in doppelte Anführungszeichen gesetzt (z. B.
"My object"
). Bei Bezeichnern, die in doppelte Anführungszeichen eingeschlossen sind, ist auch die Groß-/Kleinschreibung zu beachten.Weitere Details dazu finden Sie unter Anforderungen an Bezeichner.
Wichtig
Als bewährte Methode für Datenbankreplikation und Failover empfehlen wir, jeder sekundären Datenbank denselben Namen wie ihrer primären Datenbank zu geben. Diese Vorgehensweise unterstützt das Verweisen auf vollständig qualifizierte Objekte (d. h.
'<Datenbank>.<Schema>.<Objekt>'
) durch andere Objekte in derselben Datenbank, z. B. das Abfragen eines vollständig qualifizierten Tabellennamens in einer Ansicht.Wenn eine sekundäre Datenbank einen anderen Namen als die primäre Datenbank hat, werden diese Objektreferenzen in der sekundären Datenbank unterbrochen.
Parameter für Secure Data Sharing¶
provider_account.share_name
Gibt den Bezeichner der Freigabe an, aus der die Datenbank erstellt werden soll. Wie dokumentiert, muss der Name der Freigabe mit dem Namen des Kontos, das die Freigabe bereitstellt, vollqualifiziert sein.
Parameter für Datenbankreplikationen¶
AS REPLICA OF account_identifier.primary_db_name
Gibt den Bezeichner für eine Primärdatenbank an, von der ein Replikat (d. h. eine Sekundärdatenbank) erstellt werden soll. Wenn der Bezeichner Leerzeichen, Sonderzeichen oder Zeichen in Groß-/Kleinschreibung enthält, muss die gesamte Zeichenfolge in doppelte Anführungszeichen eingeschlossen werden.
Erfordert den Kontobezeichner und den Namen der Primärdatenbank.
account_identifier
Eindeutiger Bezeichner des Kontos, in dem die Primärdatenbank gespeichert ist. Der bevorzugte Bezeichner hat das Format
organization_name.account_name
. Fragen Sie SHOW REPLICATION ACCOUNTS ab, um die Liste der Konten in Ihrer Organisation anzuzeigen.Obwohl der alte Konto-Locator auch als Kontobezeichner verwendet werden kann, wird davon abgeraten, da dies in Zukunft möglicherweise nicht mehr funktioniert. Weitere Informationen zur Verwendung des Konto-Locators als Kontobezeichner finden Sie unter Nutzungshinweise zur Datenbankreplikation.
primary_db_name
Name der primären Datenbank. Als bewährte Methode empfehlen wir, jeder sekundären Datenbank denselben Namen wie ihrer primären Datenbank zu geben.
Bemerkung
Als bewährte Methode für Datenbankreplikation und Failover wird empfohlen, den optionalen Parameter DATA_RETENTION_TIME_IN_DAYS der sekundären Datenbank auf denselben Wert wie auf der primären Datenbank zu setzen.
Optionale Parameter¶
TRANSIENT
Gibt eine Datenbank als transient an. Transiente Datenbanken haben keine Fail-safe-Frist, sodass ihnen nach Verlassen von Time Travel keine zusätzlichen Speicherkosten entstehen; das bedeutet aber auch, dass sie bei einem Datenverlust nicht durch Fail-safe geschützt sind. Weitere Informationen dazu finden Sie unter Erläuterungen zu und Anzeigen von Fail-safe.
Darüber hinaus sind per Definition alle Schemas (und damit alle Tabellen), die in einer transienten Datenbank erstellt werden, transient. Weitere Informationen zu transienten Tabellen finden Sie unter CREATE TABLE.
Standard: Kein Wert (d. h. die Datenbank ist permanent)
CLONE source_db
Gibt an, dass ein Klon der angegebenen Quelldatenbank erstellt wird. Weitere Informationen zum Klonen einer Datenbank finden Sie unter CREATE <Objekt> … CLONE.
AT | BEFORE ( TIMESTAMP => timestamp | OFFSET => time_difference | STATEMENT => id )
Beim Klonen einer Datenbank gibt die AT | BEFORE-Klausel an, dass Time Travel verwendet wird, um die Datenbank an oder vor einem bestimmten Zeitpunkt der Vergangenheit zu klonen. Wenn die angegebene Time Travel-Zeit zu oder vor dem Zeitpunkt liegt, an dem das Objekt erstellt wurde, schlägt die Klonoperation mit einem Fehler fehl.
DATA_RETENTION_TIME_IN_DAYS = integer
Gibt die Anzahl der Tage an, für die Time Travel-Aktionen (CLONE und UNDROP) auf der Datenbank durchgeführt werden können, sowie die standardmäßige Time Travel-Aufbewahrungsdauer für alle in der Datenbank erstellten Schemas. Weitere Details dazu finden Sie unter Verstehen und Verwenden von Time Travel.
Eine ausführliche Beschreibung dieses Parameters auf Objektebene sowie weitere Informationen zu Objektparametern finden Sie unter Parameter.
Werte:
Standardausführung:
0
oder1
Enterprise Edition:
0
bis90
für permanente Datenbanken0
oder1
für transiente Datenbanken
Standard:
Standardausführung:
1
Enterprise Edition (oder höher):
1
(es sei denn, auf Kontoebene wurde ein anderer Standardwert angegeben)
Bemerkung
Mit dem Wert
0
wird Time Travel für die Datenbank deaktiviert.MAX_DATA_EXTENSION_TIME_IN_DAYS = integer
Objektparameter, der die maximale Anzahl von Tagen angibt, für die Snowflake die Datenaufbewahrungsfrist für Tabellen in der Datenbank verlängern kann, um zu verhindern, dass Streams auf den Tabellen veraltet sind.
Eine detaillierte Beschreibung dieses Parameters finden Sie unter MAX_DATA_EXTENSION_TIME_IN_DAYS.
EXTERNAL_VOLUME = external_volume_name
Objektparameter, der das externe Standardvolume angibt, das für Iceberg-Tabellen verwendet werden soll.
Weitere Informationen zu diesem Parameter finden Sie unter EXTERNAL_VOLUME.
CATALOG = catalog_integration_name
Objektparameter, der die Standard-Katalogintegration angibt, die für Iceberg-Tabellen verwendet werden soll.
Weitere Informationen zu diesem Parameter finden Sie unter CATALOG.
DEFAULT_DDL_COLLATION = 'collation_specification'
Gibt eine Standardsortierungsspezifikation für alle zur Datenbank hinzugefügten Schemas und Tabellen an. Der Standardwert kann auf der Ebene des Schemas und der einzelnen Tabelle überschrieben werden.
Weitere Informationen zu diesem Parameter finden Sie unter DEFAULT_DDL_COLLATION.
COMMENT = 'string_literal'
Gibt einen Kommentar für die Datenbank an.
Standard: Kein Wert
TAG ( tag_name = 'tag_value' [ , tag_name = 'tag_value' , ... ] )
Gibt den Namen des Tags und den Wert der Tag-Zeichenfolge an.
Der Tag-Wert ist immer eine Zeichenfolge, die maximale 256 Zeichen lang sein kann.
Weitere Informationen zur Angabe von Tags in einer Anweisung finden Sie unter Tag-Kontingente für Objekte und Spalten.
Anforderungen an die Zugriffssteuerung¶
Eine Rolle, die zur Ausführung dieses SQL-Befehls verwendet wird, muss mindestens die folgenden Berechtigungen haben:
Berechtigung |
Objekt |
Anmerkungen |
---|---|---|
CREATE DATABASE |
Konto |
Only the SYSADMIN role, or a higher role, has this privilege by default. The privilege can be granted to additional roles as needed. |
USAGE |
Externes Volume, Katalogintegration |
Erforderlich beim Festlegen der Objektparameter |
Eine Anleitung zum Erstellen einer kundenspezifischen Rolle mit einem bestimmten Satz von Berechtigungen finden Sie unter Erstellen von kundenspezifischen Rollen.
Allgemeine Informationen zu Rollen und Berechtigungen zur Durchführung von SQL-Aktionen auf sicherungsfähigen Objekten finden Sie unter Übersicht zur Zugriffssteuerung.
Allgemeine Nutzungshinweise¶
Das Erstellen einer Datenbank setzt die Datenbank automatisch als aktiv/aktuell für die aktuelle Sitzung (entspricht der Verwendung des Befehls USE DATABASE für die Datenbank).
Wenn bereits eine Datenbank mit dem gleichen Namen vorhanden ist, wird ein Fehler zurückgegeben, und die Datenbank wird nicht erstellt, es sei denn, im Befehl ist das optionale Schlüsselwort
OR REPLACE
angegeben.Wichtig
Die Verwendung von
OR REPLACE
entspricht der Verwendung von DROP DATABASE für die vorhandene Datenbank und dem Erstellen einer neuen Datenbank mit dem gleichen Namen. Die entfernte Datenbank wird jedoch nicht dauerhaft aus dem System gelöscht. Stattdessen wird sie in Time Travel aufbewahrt. Dies ist wichtig, da in Time Travel gelöschte Datenbanken den Datenspeicher für Ihr Konto beeinflussen. Weitere Informationen dazu finden Sie unter Speicherkosten für Time Travel und Fail-safe.CREATE OR REPLACE <Objekt>-Anweisungen sind atomar. Das heißt, wenn ein Objekt ersetzt wird, erfolgt das Löschen des alten Objekts und das Erstellen des neuen Objekts in einer einzigen Transaktion.
Beim Erstellen einer neuen Datenbank werden automatisch zwei Schemas in der Datenbank erstellt:
PUBLIC: Standardschema für die Datenbank.
INFORMATION_SCHEMA: Schema, das Ansichten und Tabellenfunktionen enthält, die für die Abfrage von Metadaten über die Objekte in der Datenbank sowie über alle Objekte im Konto verwendet werden kann.
Datenbanken, die aus Freigaben erstellt werden, unterscheiden sich von Standarddatenbanken durch folgende Punkte:
Sie haben nicht die PUBLIC- oder INFORMATION_SCHEMA-Schemas, es sei denn, diese Schemas wurden der Freigabe ausdrücklich gewährt.
Sie können nicht geklont werden.
Eigenschaften wie
TRANSIENT
undDATA_RETENTION_TIME_IN_DAYS
gelten nicht.
Wenn eine Datenbank aktiv/aktuell ist, ist das PUBLIC-Schema standardmäßig ebenfalls aktiv/aktuell, es sei denn, es wird ein anderes Schema verwendet oder das PUBLIC-Schema wurde gelöscht.
Metadaten:
Achtung
Kunden müssen sicherstellen, dass bei der Nutzung des Snowflake-Dienstes keine personenbezogenen Daten (außer für ein Objekt „Benutzer“), sensible Daten, exportkontrollierte Daten oder andere regulierte Daten als Metadaten eingegeben werden. Weitere Informationen dazu finden Sie unter Metadatenfelder in Snowflake.
Nutzungshinweise zur Datenbankreplikation¶
Bemerkung
Snowflake empfiehlt die Verwendung des Features Kontoreplikation zum Replizieren von Datenbanken. Replikations- und Failover-Gruppen ermöglichen die Replikation von mehreren Datenbanken und anderen Kontoobjekten mit zeitpunktbezogener Konsistenz für Objekte in der Gruppe. Eine vollständige Liste der Feature-Verfügbarkeit und der unterstützten Objekte finden Sie unter Einführung in Replikation und Failover über mehrere Konten.
Bei der Datenbankreplikation werden zum Kopieren von Objekten und Daten die von Snowflake bereitgestellten Computeressourcen anstelle Ihres eigenen virtuellen Warehouse verwendet. Der Sitzungs-/Objektparameter STATEMENT_TIMEOUT_IN_SECONDS steuert jedoch weiterhin, wie lange eine Anweisung ausgeführt wird, bevor sie abgebrochen wird. Der Standardwert ist
172800
(2 Tage). Da die erstmalige Replikation einer Primärdatenbank länger als 2 Tage dauern kann (abhängig von der Menge der Metadaten in der Datenbank sowie der Menge der Daten in den Datenbankobjekten), empfehlen wir, den Wert STATEMENT_TIMEOUT_IN_SECONDS für die Sitzung, in der Sie den Replikationsoperation ausführen, auf604800
(7 Tage, Maximalwert) zu erhöhen.Führen Sie die folgende ALTER SESSION-Anweisung aus, bevor Sie in derselben Sitzung die Anweisung
ALTER DATABASE secondary_db_name REFRESH
(Name_der_Sekundärdatenbank) ausführen:ALTER SESSION SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
Beachten Sie, dass der Parameter STATEMENT_TIMEOUT_IN_SECONDS auch für das aktive Warehouse einer Sitzung gilt. Der Parameter berücksichtigt den niedrigeren Wert, der auf Sitzungs- oder Warehouse-Ebene festgelegt wurde. Wenn Sie in der aktuellen Sitzung ein aktives Warehouse haben, setzen Sie STATEMENT_TIMEOUT_IN_SECONDS auch für dieses Warehouse auf
604800
(mithilfe von ALTER WAREHOUSE).Beispiel:
-- determine the active warehouse in the current session (if any) SELECT CURRENT_WAREHOUSE(); +---------------------+ | CURRENT_WAREHOUSE() | |---------------------| | MY_WH | +---------------------+ -- change the STATEMENT_TIMEOUT_IN_SECONDS value for the active warehouse ALTER WAREHOUSE my_wh SET STATEMENT_TIMEOUT_IN_SECONDS = 604800;
Sie können den Parameterwert nach Abschluss der Replikationsoperation auf den Standardwert zurücksetzen:
ALTER WAREHOUSE my_wh UNSET STATEMENT_TIMEOUT_IN_SECONDS;
Bei der bevorzugten Methode zum Identifizieren des Kontos, das die Primärdatenbank speichert, werden der Name der Organisation und der Kontoname als Kontobezeichner verwendet. Wenn Sie sich entscheiden, stattdessen den alten Konto-Locator zu verwenden, muss dieser möglicherweise zusätzliche Segmente enthalten, um das Konto eindeutig zu identifizieren. Siehe Tabelle unten als Referenz:
Kontobezeichner
Speicherort des Remotekontos
organization_name.account_name
Bevorzugter Kontobezeichner, der unabhängig von der Region oder Regionsgruppe des Kontos, das die Primärdatenbank speichert, verwendet werden kann.
account_locator
Dieselbe Region, aber ein anderes Konto als das Konto, in dem die Primärdatenbank gespeichert ist.
snowflake_region.account_locator
Dieselbe Regionsgruppe, aber eine andere Region als das Konto, in dem die Primärdatenbank gespeichert ist.
region_group.snowflake_region.account_locator
Andere Regionsgruppe des Kontos, in dem die Primärdatenbank gespeichert ist.
Der Befehl CREATE DATABASE … AS REPLICA bietet keine Unterstützung für die WITH TAG-Klausel.
Diese Klausel wird nicht unterstützt, da die Sekundärdatenbank schreibgeschützt ist. Wenn Ihre Primärdatenbank die WITH TAG-Klausel enthält, entfernen Sie die Klausel, bevor Sie die Sekundärdatenbank erstellen. Um zu überprüfen, ob Ihre Datenbank über die WITH TAG-Klausel verfügt, rufen Sie in Ihrem Snowflake-Konto die Funktion GET_DDL auf und geben die Primärdatenbank im Funktionsargument an. Wenn ein Tag auf der Datenbank gesetzt ist, enthält die Funktionsausgabe eine ALTER DATABASE … SET TAG-Anweisung.
Weitere Informationen dazu finden Sie unter Replikation und Tags.
Beispiele¶
Erstellen Sie zwei permanente Datenbanken, eine mit einer Datenaufbewahrungsfrist von 10 Tagen:
CREATE DATABASE mytestdb; CREATE DATABASE mytestdb2 DATA_RETENTION_TIME_IN_DAYS = 10; SHOW DATABASES LIKE 'my%'; +---------------------------------+------------+------------+------------+--------+----------+---------+---------+----------------+ | created_on | name | is_default | is_current | origin | owner | comment | options | retention_time | |---------------------------------+------------+------------+------------+--------+----------+---------+---------+----------------| | Tue, 17 Mar 2016 16:57:04 -0700 | MYTESTDB | N | N | | PUBLIC | | | 1 | | Tue, 17 Mar 2016 17:06:32 -0700 | MYTESTDB2 | N | N | | PUBLIC | | | 10 | +---------------------------------+------------+------------+------------+--------+----------+---------+---------+----------------+
Erstellen Sie eine transiente Datenbank:
CREATE TRANSIENT DATABASE mytransientdb; SHOW DATABASES LIKE 'my%'; +---------------------------------+---------------+------------+------------+--------+----------+---------+-----------+----------------+ | created_on | name | is_default | is_current | origin | owner | comment | options | retention_time | |---------------------------------+---------------+------------+------------+--------+----------+---------+-----------+----------------| | Tue, 17 Mar 2016 16:57:04 -0700 | MYTESTDB | N | N | | PUBLIC | | | 1 | | Tue, 17 Mar 2016 17:06:32 -0700 | MYTESTDB2 | N | N | | PUBLIC | | | 10 | | Tue, 17 Mar 2015 17:07:51 -0700 | MYTRANSIENTDB | N | N | | PUBLIC | | TRANSIENT | 1 | +---------------------------------+---------------+------------+------------+--------+----------+---------+-----------+----------------+
Erstellen Sie eine Datenbank aus einer Freigabe, die vom Konto ab67890
bereitgestellt wird:
CREATE DATABASE snow_sales FROM SHARE ab67890.sales_s;Ausführlichere Beispiele zum Erstellen einer Datenbank aus einer Freigabe finden Sie unter Verwenden von freigegebenen Daten.
Beispiele für die Datenbankreplikation¶
Im folgenden Beispiel wird ein Replikat der Primärdatenbank myorg.account1.mydb1
im Konto account1
der Organisation myorg
erstellt und die automatische Aktualisierung der materialisierten Ansichten im Replikat aktiviert. Die SQL-Anweisung wird in derselben AWS-Regionsgruppe (public
) ausgeführt, jedoch in einer anderen Region als das Konto, in dem die primäre Datenbank gespeichert ist:
CREATE DATABASE mydb1
AS REPLICA OF myorg.account1.mydb1
DATA_RETENTION_TIME_IN_DAYS = 10;