Einführung in Geschäftskontinuität und Notfallwiederherstellung

Unter diesem Thema werden die wichtigsten Anwendungsfälle für Replikation und Failover über Regionen und Cloudplattformen hinweg beschrieben. Die Snowflake-Funktionalität für Replikation und Failover/Failback weist die folgenden Features auf:

Diese einzelnen Features sind so konzipiert, dass sie zusammengenommen eine Reihe verschiedener grundlegender Szenarios für die Geschäftskontinuität unterstützen, darunter:

  • Geplante Failovers: Für Übungen zur Notfallwiederherstellung, um die Bereitschaft zu testen und um den Wiederherstellungspunkt und die Wiederherstellungszeit zu messen.

  • Ungeplante Failovers: Bei einem Ausfall in einer Region oder bei einer Cloudplattform können Sie sekundäre Kontoobjekte und Datenbanken in einer anderen Region oder auf einer anderen Cloudplattform zu primären Objekten mit Lese- und Schreibzugriff heraufstufen.

  • Migration: Verschieben des Snowflake-Kontos in eine andere Region oder auf eine andere Cloudplattform ohne Unterbrechung der Geschäftstätigkeit, um beispielsweise die Geschäftskontinuität bei Fusionen und Übernahmen aufrechtzuerhalten oder um eine Änderung der Cloudstrategie zu erleichtern.

  • Mehrere lesbare Sekundärobjekte: Kontoobjekte und Datenbanken können auf mehrere Konten in verschiedenen Regionen und auf verschiedenen Cloudplattformen repliziert werden, wodurch das Risiko von Ausfällen in mehreren Regionen oder auf mehreren Cloudplattformen gemindert wird.

Darüber hinaus ermöglichen Snowflake Secure Data Sharing und Datenbankreplikation die sichere gemeinsame Nutzung von Daten über Regionen und Cloudplattformen hinweg.

Unter diesem Thema:

Features für Kontoreplikation und Failover/Failback

Replikation und Failover/Failback

Die Replikation verwendet die beiden Snowflake-Objekte Replikationsgruppe und Failover-Gruppe, um eine Gruppe von Objekten mit zeitpunktbezogender Konsistenz von einem Quellkonto in ein oder mehrere Zielkonten zu replizieren. Mit einer Replikationsgruppe können Kunden angeben, was repliziert werden soll, wohin repliziert werden soll und wie oft. Das bedeutet, dass Sie festlegen können, welche Objekte in welchen Regionen oder auf welchen Cloudplattformen in anpassbaren Zeitabständen repliziert werden sollen. Eine Failover-Gruppe ermöglicht Replikation und Failover für alle Kontoobjekte einer Gruppe.

Zu den Kontoobjekten können Warehouses, Benutzer und Rollen sowie Datenbanken und Freigaben gehören (eine vollständige Liste der Objekte, die in eine Replikations- oder Failover-Gruppe aufgenommen werden können, finden Sie unter Replizierte Objekte). Kontoobjekte können einer oder mehreren Gruppen angehören.

Im Falle eines Failover ermöglicht die Kontoreplikation die Ausfallsicherung Ihres Kontos in eine andere Region oder auf eine andere Cloudplattform. Jede Replikations- und Failover-Gruppe verfügt über einen eigenen Replikationsplan, mit dem die Häufigkeit der Replikation für verschiedene Objektgruppen in unterschiedlichen Intervallen festgelegt werden kann. Im Falle von Failover-Gruppen ist auch die Ausfallsicherung einzelner Gruppen möglich. Sie können wählen, ob ein Failover für alle Failover-Gruppen oder nur für ausgewählte Failover-Gruppen erfolgen soll.

Clientumleitung

Eine Clientumleitung stellt eine Verbindungs-URL bereit, die von Snowflake-Clients für die Verbindung zu Snowflake verwendet werden kann. Die Verbindungs-URL kann Snowflake-Clients bei Bedarf auf ein anderes Snowflake-Konto umleiten.

Geschäftskontinuität und Notfallwiederherstellung

Im Falle eines massiven Ausfalls (aufgrund eines Netzwerkproblems, eines Softwarefehlers usw.), der die Clouddienste in einer bestimmten Region unterbricht, ist der Zugriff auf Snowflake unterbrochen, bis die Ursache des Ausfalls behoben und die Services wiederhergestellt wurden. Um die kontinuierliche Verfügbarkeit und Datendauerhaftigkeit in einem solchen Szenario sicherzustellen, können Sie kritische Kontoobjekte auf ein anderes Snowflake-Konto Ihrer Organisation in einer anderen Region replizieren.

Bei der asynchronen Replikation bleiben die sekundären Replikate in der Regel hinter den Primärobjekten zurück, je nach dem von Ihnen konfigurierten Replikationsplan. Wenn Sie sich beispielsweise dafür entscheiden, eine primäre Replikations- oder Failover-Gruppe alle 30 Minuten zu replizieren, liegen die sekundären Replikationsobjekte der Gruppe während eines Ausfalls höchstens 30 Minuten hinter der primären zurück.

Je nach den Anforderungen Ihres Unternehmens haben Sie folgende Optionen:

  • Lesevorgänge zuerst wiederherstellen, damit Clientanwendungen Daten lesen können, die 30 Minuten veraltet sind.

  • Schreibvorgänge zuerst wiederherstellen, um die Daten der letzten 30 Minuten auf dem neuen Primärobjekt abzustimmen, bevor Sie die Lesevorgänge von Clientanwendungen öffnen.

  • Lese- und Schreibvorgänge gleichzeitig wiederherstellen, d. h. Lesezugriffe der Clientanwendungen auf Daten, die 30 Minuten veraltet sind, werden geöffnet, während zugleich die letzten 30 Minuten an Daten auf dem neuen Primärobjekt abgestimmt werden.

Normaler Status: Region ist betriebsbereit

  1. Kontoobjektreplikation: Replizieren Sie Failover-Gruppen mit kritischen Kontoobjekten in ein oder mehrere Snowflake-Konten, die sich in anderen Regionen als das Konto befinden, in dem die primären Failover-Gruppen gespeichert sind. Aktualisieren Sie die Failover-Gruppen regelmäßig.

Ausfall der Region

Um Lese- und Schreibvorgänge gleichermaßen zu priorisieren, führen Sie die Schritte aus einem der folgenden Beispielszenarios aus. Wenn es in einer Region zu einem Ausfall kommt, können Sie wählen, ob Sie das Failover Ihrer kritischen Failover-Gruppen und Snowflake-Clientverbindungen gleichzeitig ausführen möchten.

Lesen vor Schreiben

Wenn ein Ausfall in einer Region zu einem vollständigen oder teilweisen Verlust der Snowflake-Verfügbarkeit führt, können Sie über diesen Pfad Snowflake-Clients zunächst auf schreibgeschützte Replikate von Kontoobjekten in kritischen Failover-Gruppen umleiten, um die Ausfallzeit zu minimieren. Bei kurzfristigen Ausfällen ist es oft wünschenswert, im Nur-Lese-Modus zu arbeiten.

Ein längerfristiger Ausfall in Verbindung mit dem Bedarf an aktuellen Daten erfordert den Schreib-Lese-Modus.

  1. Clientumleitung: Lassen Sie die von den Clients verwendete Verbindungs-URL auf ein Snowflake-Konto verweisen, in dem Ihre schreibgeschützten replizierten (sekundären) Failover-Gruppen gespeichert sind.

  2. Failover (bei Bedarf): Im Falle eines längerfristigen Ausfalls können Sie die sekundären Failover-Gruppen in dem Snowflake-Konto, auf das Ihre Verbindungs-URL verweist, als primäre Failover-Gruppen mit Lese-Schreib-Zugriff verwenden.

Schreiben vor Lesen

Wenn ein Ausfall in einer Region zu einem vollständigen oder teilweisen Verlust der Snowflake-Verfügbarkeit führt, können Sie über diesen Pfad Failover-Gruppen mit kritischen Kontoobjekten wiederherstellen und zunächst mit der Verarbeitung von Daten fortfahren. Diese Option ist von Kontoadministratoren zu bevorzugen, die zuerst das Failover ihrer Datenbanken und ETL-Prozesse (Extrahieren, Transformieren, Laden) verarbeiten möchten und die Snowflake-Clients erst dann umleiten möchten, wenn die Daten aktuell sind.

  1. Failover: Stufen Sie die sekundären Failover-Gruppen mit kritischen Kontoobjekten in einer anderen Region herauf, um als primäre Failover-Gruppen zu dienen, was das Schreiben in die in jeder Failover-Gruppe enthaltenen Kontoobjekte ermöglicht. Sobald die Datenbanken in den Gruppen beschreibbar sind, können Sie Ihre ETL-Prozesse verwenden, um Schreibvorgänge zu priorisieren und Daten abzustimmen.

  2. Clientumleitung (bei Bedarf): Lassen Sie die von den Clients verwendete Verbindungs-URL auf das Snowflake-Konto verweisen, in dem die neuen primären Failover-Gruppen gespeichert sind.

Normaler Status: Ausfall ist behoben

  1. Replikation: Aktualisieren Sie die Failover-Gruppen im Snowflake-Konto in der Region, in der der Ausfall aufgetreten ist.

  2. Failback: Stufen Sie die Failover-Gruppen in dem Snowflake-Konto, in dem der Ausfall aufgetreten ist, wieder zu primären Failover-Gruppen herauf.

  3. Clientumleitung: Lassen Sie die von Clients verwendete Verbindungs-URL wieder auf das Snowflake-Konto in der Region verweisen, in der der Ausfall aufgetreten ist.

Kontenmigration

Die Kontenmigration ist der einmalige Prozess der Migration (oder Übertragung) der Snowflake-Objekte und Ihrer gespeicherten Daten in ein Konto in einer anderen Region oder auf einer anderen Cloudplattform. Typische Gründe für die Migration Ihres Kontos sind eine größere Nähe zu Ihrer Benutzerbasis oder die Präferenz für eine andere Cloudplattform auf der Grundlage Ihrer Unternehmensstrategie oder die gemeinsame Nutzung mit anderen Cloudressourcen (z. B. einem Data Lake).

Die Kontoobjektreplikation unterstützt die Replikation von Kontoobjekten wie Warehouses, Benutzern und Rollen sowie von Datenbanken und Freigaben. Unter Replizierte Objekte finden Sie eine vollständige Liste der replizierten Objekte.

Bemerkung

Für Kontoobjektreplikation und Failover/Failback ist die Business Critical Edition (oder höher) erforderlich. Snowflake kann für eine einmalige Kontenmigration vorübergehend auf diese Anforderung verzichten.