Informationen zu Snowflake Collaboration Data Clean Rooms

Übersicht

Snowflake Data Clean Rooms zeigt eine Vorschau auf eine neue Clean Room-Architektur namens Collaboration Data Clean Rooms. Mit Collaboration Data Clean Rooms können Kunden in einer vollständig symmetrischen Umgebung mit mehreren Parteien zusammenarbeiten. Im Gegensatz zu herkömmlichen Anbieter-Verbraucher-Modellen, bei denen die Rollen und die Anzahl der Teilnehmenden begrenzt sind, unterstützt die Collaboration-API flexible Rollen und fein abgestufte Datenzugriffssteuerungen für eine beliebige Anzahl von Teilnehmenden.

Anbieter- und Verbraucher-Data Clean Rooms im Vgl. zu Collaboration Data Clean Rooms

Anbieter- und Verbraucher-Clean Rooms – die erste Clean Room-Architektur – wurden hauptsächlich für die Zusammenarbeit zwischen zwei Parteien entwickelt. Collaboration Data Clean Rooms unterstützen die Zusammenarbeit von mehreren Parteien ohne zusätzliche Komplexität. Das neue Design wird die Konzepte von Anbietern und Verbrauchern, vom Anbieter durchgeführten Analysen im Vgl. zu Verbraucheranalysen und einfacher Zusammenarbeit statt der Zusammenarbeit mit mehreren Parteien durch einen konfigurierbaren Clean Room ersetzen, der es jeder Partei ermöglicht, Daten und Vorlagen beizusteuern und Analysen auszuführen.

Allgemeiner Überblick über die Zusammenarbeit mit zwei Teilnehmenden

 

Sowohl Anbieter- und Verbraucher-Clean Rooms als auch Collaboration Data Clean Rooms werden für einige Zeit nebeneinander existieren. Ihre Anbieter- und Verbraucher-Clean Rooms sind weiterhin benutzbar und werden nicht geändert oder entfernt. Wir empfehlen Ihnen jedoch, die neuen Collaboration Data Clean Rooms auszuprobieren. Unser Ziel ist es, alle Benutzenden zu Collaboration Data Clean Rooms zu migrieren, die eine viel einfachere und stabilere Zusammenarbeit bieten.

Einführung in Collaboration Data Clean Rooms

In der neuen Architektur für Data Clean Rooms wird ein Clean Room als Zusammenarbeit bezeichnet, und alle Benutzenden mit Zugriff auf die Zusammenarbeit werden als Teilnehmende bezeichnet. Jeder Teilnehmende hat eine oder mehrere Rollen in der Zusammenarbeit. In diesem Fall bezieht sich der Begriff Rolle nicht auf eine RBAC-Rolle ([*]), sondern auf eine Reihe von Berechtigungen, die definieren, was der Benutzende tun kann. In einer Zusammenarbeit gibt es die folgenden Rollen:

  • Eigentümer: Erstellt die Zusammenarbeit und bestimmt, wer welche Rollen in einer Zusammenarbeit hat.

  • Datenanbieter: Kann Daten zur Verwendung durch einen bestimmten Analyseausführenden importieren.

  • Analyseausführender: Kann Abfragen in der Zusammenarbeit ausführen, indem er Datenangebote verwendet, die von bestimmten Datenanbietern bereitgestellt werden.

Jeder Teilnehmende kann mehrere Rollen haben, und eine Zusammenarbeit kann mehrere Datenanbieter und Analyseausführende haben, aber nur einen Eigentümer.

Zusammenarbeiten können viele Arten von Ressourcen umfassen:

  • Vorlage: Eine JinjaSQL-Vorlage, die in eine SQL-Abfrage ausgewertet wird. Vorlagen können von jedem Teilnehmenden zu einer Zusammenarbeit hinzugefügt werden, aber Vorlagen können nur von den Analyseausführenden ausgeführt werden, die der Anbieter der Vorlage bestimmt.

  • Datenangebot: Ein Paket mit einer oder mehreren Ansichten, die von einem Datenanbieter mit bestimmten Analyseausführenden in dieser Zusammenarbeit freigegeben werden.

Alle Ressourcen sowie die Definition der Zusammenarbeit selbst werden mit angegeben YAML-Spezifikationsdateien, die von Teilnehmenden registriert sind, angegeben. Teilnehmende können Ressourcen hinzufügen oder entfernen, nachdem die Zusammenarbeit erstellt wurde. Rollen können jedoch nicht mehr geändert oder neue Mitglieder eingeladen werden, nachdem der Eigentümer die Zusammenarbeit erstellt hat.

Anforderungen und aktuelle Einschränkungen

Systemarchitektur

Dieser Abschnitt bietet eine allgemeine Beschreibung dazu, wie die Zusammenarbeit in Snowflake Data Clean Rooms funktioniert.

Die folgende Abbildung ist eine vereinfachte Darstellung einer Zusammenarbeit mit zwei Parteien:

Allgemeiner Überblick über die Zusammenarbeit mit zwei Teilnehmenden

Anmerkungen zum Diagramm:

Dieses Diagramm zeigt zwei Teilnehmende, die die Data Clean Rooms Collaboration-API zum Erstellen und Verwalten einer Zusammenarbeit nutzen.

Teilnehmender A ist der Eigentümer und Ersteller, wie in der YAML der Zusammenarbeitsdefinition im Diagramm angegeben. Teilnehmender A ist auch ein Datenanbieter, was durch die Datenangebotsfreigabe gekennzeichnet ist.

Teilnehmender B ist ein Datenanbieter, was durch die Freigabe des Datenangebots in der Abbildung angegeben ist.

Sowohl A als auch B können als Analyseausführende fungieren, wenn die Definition der Zusammenarbeit dies zulässt.

Der Secure Collaboration Orchestrator (SCO) ist ein Konto, das Zusammenarbeiten verwaltet. Der SCO erstellt ein individuelles App-Paket pro Zusammenarbeit. Dieses App-Paket ist eine Anwendung, die alle potenziellen Teilnehmenden installieren (verknüpfen) können. Alle Teilnehmenden können mit der Collaboration-App über die DCR-Zusammenarbeits-API interagieren. Kosten im Zusammenhang mit dem SCO werden den Benutzenden nicht in Rechnung gestellt.

Mitarbeitende erstellen Datenangebote, und die SCO gibt diese Daten für die Teilnehmenden gemäß der Definition der Zusammenarbeit frei. Der SCO verwendet die Spezifikationen für Zusammenarbeit, Datenangebot, Vorlage und Analyse, um Richtlinien für die Zusammenarbeit durchzusetzen, z. B. wer mit welchen Vorlagen auf welche Daten zugreifen kann; welche Daten aktiviert werden können und für wen, und ob Zugriff auf Freiform-SQL bereitgestellt wird.