Einführung in Geschäftskontinuität und Notfallwiederherstellung¶

Unter diesem Thema werden die wichtigsten Anwendungsfälle für Replikation und Failover über Regionen und Cloudplattformen hinweg beschrieben. Die Snowflake-Funktionalität für Replikation und Failover/Failback weist die folgenden Features auf:

Replikation und Failover/Failback
Clientumleitung

Diese einzelnen Features sind so konzipiert, dass sie zusammengenommen eine Reihe verschiedener grundlegender Szenarios für die Geschäftskontinuität unterstützen, darunter:

Geplante Failovers: Für Übungen zur Notfallwiederherstellung, um die Bereitschaft zu testen und um den Wiederherstellungspunkt und die Wiederherstellungszeit zu messen.
Ungeplante Failovers: Bei einem Ausfall in einer Region oder bei einer Cloudplattform können Sie sekundäre Kontoobjekte und Datenbanken in einer anderen Region oder auf einer anderen Cloudplattform zu primären Objekten mit Lese- und Schreibzugriff heraufstufen.
Migration: Verschieben des Snowflake-Kontos in eine andere Region oder auf eine andere Cloudplattform ohne Unterbrechung der Geschäftstätigkeit, um beispielsweise die Geschäftskontinuität bei Fusionen und Übernahmen aufrechtzuerhalten oder um eine Änderung der Cloudstrategie zu erleichtern.
Mehrere lesbare Sekundärobjekte: Kontoobjekte und Datenbanken können auf mehrere Konten in verschiedenen Regionen und auf verschiedenen Cloudplattformen repliziert werden, wodurch das Risiko von Ausfällen in mehreren Regionen oder auf mehreren Cloudplattformen gemindert wird.

Darüber hinaus ermöglichen Snowflake Secure Data Sharing und Datenbankreplikation die sichere gemeinsame Nutzung von Daten über Regionen und Cloudplattformen hinweg.

Features für Kontoreplikation und Failover/Failback¶

Replikation und Failover/Failback¶

Die Replikation verwendet die beiden Snowflake-Objekte Replikationsgruppe und Failover-Gruppe, um eine Gruppe von Objekten mit zeitpunktbezogender Konsistenz von einem Quellkonto in ein oder mehrere Zielkonten zu replizieren. Mit einer Replikationsgruppe können Kunden angeben, was repliziert werden soll, wohin repliziert werden soll und wie oft. Das bedeutet, dass Sie festlegen können, welche Objekte in welchen Regionen oder auf welchen Cloudplattformen in anpassbaren Zeitabständen repliziert werden sollen. Eine Failover-Gruppe ermöglicht die Replikation und Failover der Objekte in der Gruppe.

Zu den Kontoobjekten können Warehouses, Benutzer und Rollen sowie Datenbanken und Freigaben gehören (eine vollständige Liste der Objekte, die in eine Replikations- oder Failover-Gruppe aufgenommen werden können, finden Sie unter Replizierte Objekte). Kontoobjekte können einer oder mehreren Gruppen angehören.

Im Falle eines Failover ermöglicht die Kontoreplikation die Ausfallsicherung Ihres Kontos in eine andere Region oder auf eine andere Cloudplattform. Jede Replikations- und Failover-Gruppe verfügt über einen eigenen Replikationsplan, mit dem die Häufigkeit der Replikation für verschiedene Objektgruppen in unterschiedlichen Intervallen festgelegt werden kann. Im Falle von Failover-Gruppen ist auch die Ausfallsicherung einzelner Gruppen möglich. Sie können wählen, ob ein Failover für alle Failover-Gruppen oder nur für ausgewählte Failover-Gruppen erfolgen soll.

Clientumleitung¶

Eine Clientumleitung stellt eine Verbindungs-URL bereit, die von Snowflake-Clients für die Verbindung zu Snowflake verwendet werden kann. Die Verbindungs-URL kann Snowflake-Clients bei Bedarf auf ein anderes Snowflake-Konto umleiten.

Geschäftskontinuität und Notfallwiederherstellung¶

Im Falle eines massiven Ausfalls (aufgrund eines Netzwerkproblems, eines Softwarefehlers usw.), der die Clouddienste in einer bestimmten Region unterbricht, ist der Zugriff auf Snowflake unterbrochen, bis die Ursache des Ausfalls behoben und die Services wiederhergestellt wurden. Um die kontinuierliche Verfügbarkeit und Datendauerhaftigkeit in einem solchen Szenario sicherzustellen, können Sie kritische Kontoobjekte auf ein anderes Snowflake-Konto Ihrer Organisation in einer anderen Region replizieren.

Bei der asynchronen Replikation bleiben die sekundären Replikate in der Regel hinter den Primärobjekten zurück, je nach dem von Ihnen konfigurierten Replikationsplan. Sekundäre Replikatobjekte liegen höchstens 2 × so weit hinter den geplanten Aktualisierungen der Primärobjekte zurück. Wenn Sie sich beispielsweise dafür entscheiden, eine primäre Replikations- oder Failover-Gruppe alle 30 Minuten zu replizieren, liegen die sekundären Objekte der Gruppe während eines Ausfalls höchstens 60 Minuten hinter der primären zurück.

Je nach den Anforderungen Ihres Unternehmens haben Sie folgende Optionen:

Lesevorgänge zuerst wiederherstellen, damit Clientanwendungen Daten lesen können, die 30 Minuten veraltet sind.

Schreibvorgänge zuerst wiederherstellen, um die Daten der letzten 30 Minuten auf dem neuen Primärobjekt abzustimmen, bevor Sie die Lesevorgänge von Clientanwendungen öffnen.

Lese- und Schreibvorgänge gleichzeitig wiederherstellen, d. h. Lesezugriffe der Clientanwendungen auf Daten, die 30 Minuten veraltet sind, werden geöffnet, während zugleich die letzten 30 Minuten an Daten auf dem neuen Primärobjekt abgestimmt werden.

Normaler Status: Region ist betriebsbereit¶

Kontoobjektreplikation: Replizieren Sie Failover-Gruppen mit kritischen Kontoobjekten in ein oder mehrere Snowflake-Konten, die sich in anderen Regionen als das Konto befinden, in dem die primären Failover-Gruppen gespeichert sind. Aktualisieren Sie die Failover-Gruppen regelmäßig.

Ausfall der Region¶

Um Lese- oder Schreibvorgänge oder beides gleichzeitig zu priorisieren, folgen Sie den Schritten in einem der folgenden Beispielszenarios.

Lesen vor Schreiben¶

Wenn ein Ausfall in einer Region zu einem vollständigen oder teilweisen Verlust der Snowflake-Verfügbarkeit führt, können Sie über diesen Pfad Snowflake-Clients zunächst auf schreibgeschützte Replikate von Kontoobjekten in kritischen Failover-Gruppen umleiten, um die Ausfallzeit zu minimieren. Bei kurzfristigen Ausfällen ist es oft wünschenswert, im Nur-Lese-Modus zu arbeiten.

Ein längerfristiger Ausfall in Verbindung mit dem Bedarf an aktuellen Daten erfordert den Schreib-Lese-Modus.

Clientumleitung: Lassen Sie die von den Clients verwendete Verbindungs-URL auf ein Snowflake-Konto verweisen, in dem Ihre schreibgeschützten replizierten (sekundären) Failover-Gruppen gespeichert sind.
Failover (bei Bedarf): Im Falle eines längerfristigen Ausfalls können Sie die sekundären Failover-Gruppen in dem Snowflake-Konto, auf das Ihre Verbindungs-URL verweist, als primäre Failover-Gruppen mit Lese-Schreib-Zugriff verwenden.

Schreiben vor Lesen¶

Wenn ein Ausfall in einer Region zu einem vollständigen oder teilweisen Verlust der Snowflake-Verfügbarkeit führt, können Sie über diesen Pfad Failover-Gruppen mit kritischen Kontoobjekten wiederherstellen und zunächst mit der Verarbeitung von Daten fortfahren. Diese Option ist von Kontoadministratoren zu bevorzugen, die zuerst das Failover ihrer Datenbanken und ETL-Prozesse (Extrahieren, Transformieren, Laden) verarbeiten möchten und die Snowflake-Clients erst dann umleiten möchten, wenn die Daten aktuell sind.

Failover: Stufen Sie die sekundären Failover-Gruppen mit kritischen Kontoobjekten in einer anderen Region herauf, um als primäre Failover-Gruppen zu dienen, was das Schreiben in die in jeder Failover-Gruppe enthaltenen Objekte ermöglicht. Sobald die Datenbanken in der/den Gruppe(n) beschreibbar sind, können Sie Ihre ETL-Prozesse verwenden, um Schreibvorgänge zu priorisieren und Daten abzugleichen.

Wenn Sie Snowflake Datenpipelineobjekte für ETL-Prozesse verwenden, können Sie diese Objekte replizieren und bei einem Ausfall darauf umschalten. Weitere Informationen dazu finden Sie unter Replikation von Stagingbereichen, Pipes und des Ladeverlaufs.

Andernfalls konfigurieren Sie separate Verbindungs-URLs für Ihre Datenaufnahmepipeline und für Ihre Clients (z. B. ein BI-Dashboard). Nach dem Failover der Failover-Gruppe übernehmen Sie die Verbindungs-URL für die Datenaufnahme und schreiben Daten in die neu beförderten primären Objekte. Nachdem die Daten abgeglichen wurden, schalten Sie die Verbindungs-URL für Ihre Clients aus, um das Lesen zu ermöglichen.
Clientumleitung (bei Bedarf): Lassen Sie die von den Clients verwendete Verbindungs-URL auf das Snowflake-Konto verweisen, in dem die neuen primären Failover-Gruppen gespeichert sind.

Sowohl Lese- als auch Schreibvorgänge priorisieren¶

Um Lese- und Schreibvorgänge gleichzeitig zu priorisieren, führen Sie einen Failover sowohl für die Client-Verbindung als auch für die sekundäre(n) Failover-Gruppe(n) durch, ohne darauf zu warten, dass die sekundären Objekte auf dem neuesten Stand sind. Dies ermöglicht Clients den sofortigen Zugriff auf potenziell veraltete Daten, während die neu heraufgestuften Datenbanken mit der erneuten Aufnahme von Daten aus Datenpipelines beginnen können.

Clientumleitung: Lassen Sie die von den Clients verwendete Verbindungs-URL auf ein Snowflake-Konto verweisen, in dem Ihre schreibgeschützten replizierten (sekundären) Failover-Gruppen gespeichert sind.
Failover: Stufen Sie die sekundären Failover-Gruppen mit kritischen Kontoobjekten in einer anderen Region herauf, um als primäre Failover-Gruppen zu dienen, was das Schreiben in die in jeder Failover-Gruppe enthaltenen Objekte ermöglicht.

Normaler Status: Ausfall ist behoben¶

Replikation: Aktualisieren Sie die Failover-Gruppen im Snowflake-Konto in der Region, in der der Ausfall aufgetreten ist.
Failback: Stufen Sie die Failover-Gruppen in dem Snowflake-Konto, in dem der Ausfall aufgetreten ist, wieder zu primären Failover-Gruppen herauf.
Clientumleitung: Lassen Sie die von Clients verwendete Verbindungs-URL wieder auf das Snowflake-Konto in der Region verweisen, in der der Ausfall aufgetreten ist.

Kontenmigration¶

Die Kontenmigration ist der einmalige Prozess der Migration (oder Übertragung) der Snowflake-Objekte und Ihrer gespeicherten Daten in ein Konto in einer anderen Region oder auf einer anderen Cloudplattform. Typische Gründe für die Migration Ihres Kontos sind eine größere Nähe zu Ihrer Benutzerbasis oder die Präferenz für eine andere Cloudplattform auf der Grundlage Ihrer Unternehmensstrategie oder die gemeinsame Nutzung mit anderen Cloudressourcen (z. B. einem Data Lake).

Die Kontoobjektreplikation unterstützt die Replikation von Kontoobjekten wie Warehouses, Benutzern und Rollen sowie von Datenbanken und Freigaben. Unter Replizierte Objekte finden Sie eine vollständige Liste der replizierten Objekte.

Bemerkung

Für Kontoobjektreplikation und Failover/Failback ist eine Business Critical Edition (oder höher) von Snowflake erforderlich. Bei Kontomigrationen kann der Snowflake-Support diese Einschränkung vorübergehend aufheben und dieses Feature für Ihr Konto aktivieren, ohne Ihre Snowflake-Edition zu ändern. Dieser Dienst ist nur einmalig verfügbar.