Glossar der Snowflake Data Clean Room-Begriffe

Machen Sie sich mit diesen Begriffen vertraut, die in Snowflake Data Clean Rooms verwendet werden. Einige Begriffe werden hier anders verwendet als im Rest von Snowflake.

Aktivieren / Aktivierung

Exportieren der Ergebnistabelle einer Abfrage aus dem Clean Room, entweder zu einem Beitragenden oder einem Dritten. Wenn die andere Partei und die Clean Room-Einstellungen dies zulassen, können Sie Abfrageergebnisse in Ihr eigenes Konto oder zu einem zugelassenen Drittpartner wie Google Ads oder Meta Ads Manager exportieren.

Analyseausführender

Eine Rolle für die Zusammenarbeit, die es einem Teilnehmenden ermöglicht, Vorlagen auszuführen und Ergebnisse in einer Zusammenarbeit anzuzeigen. Ein Analyseausführender kann Datenangebote nutzen, die für ihn von Datenanbietern freigegeben wurden.

Code-Bundle

Ein registriertes Paket mit einer oder mehreren kundenspezifischen Python-Funktionen oder -Prozeduren, die von einer Vorlage aufgerufen werden können. Code-Bundles werden mithilfe einer YAML-Spezifikation definiert und durch Aufrufen von REGISTRY.REGISTER_CODE_SPEC registriert. Eine Vorlage verweist auf ein Code-Bundle über die dazugehörige ID, und die Vorlage ruft Funktionen mithilfe der Syntax cleanroom.code_spec_name$function_name auf.

Zusammenarbeit

Eine sichere Umgebung für die Datenfreigabe mit mehreren Parteien. Eine Zusammenarbeit wird durch eine YAML-Spezifikation definiert, die die Teilnehmenden, ihre Rollen für die Zusammenarbeit und alle Ressourcen (Vorlagen, Datenangebote usw.) auflistet, die für die Zusammenarbeit verfügbar sind. Der Besitzende der Zusammenarbeit erstellt die Zusammenarbeit, indem dieser INITIALIZE aufruft, und andere Teilnehmende schließen sich an, indem sie JOIN aufrufen.

Besitzender der Zusammenarbeit

Eine Rolle für die Zusammenarbeit ist dem Teilnehmenden zugewiesen, der eine Zusammenarbeit durch Aufrufen von INITIALIZE erstellt. Der Besitzende definiert die Zusammenarbeitsspezifikation, einschließlich der Liste der Teilnehmenden, der dazugehörigen Rollen und der anfänglichen Ressourcen. Besitzende können standardmäßig nicht als Analyseausführende oder Datenanbieter agieren, es sei denn, die Zusammenarbeitsspezifikation weist ihnen diese Rollen ausdrücklich zu.

Zusammenarbeitsrolle

Eine Rolle, die den Satz von Aktionen beschreibt, den ein Benutzender in einer bestimmten Zusammenarbeit ausführen kann. Ein Benutzender kann viele Zusammenarbeitsrollen in einer Zusammenarbeit haben. Zu den Rollen gehören Besitzender, Datenanbieter und Analyseausführender. Nicht dasselbe wie eine RBAC-Rolle. Erfahren Sie mehr über Rollen unter Teilnehmerrollen in Collaboration Data Clean Rooms.

Teilnehmer

Jeder Teilnehmende in einer Zusammenarbeit. Jeder Teilnehmende wird durch einen Alias identifiziert und hat eine oder mehrere Zusammenarbeitsrollen (Besitzender, Datenanbieter, Analyseausführender).

Spaltenrichtlinie

Von einem Teilnehmenden angegeben, um anzugeben, welche seiner Datenspalten von anderen Teilnehmenden projiziert werden können. Eine Clean Room-Spaltenrichtlinie wird ausschließlich innerhalb eines Clean Rooms festgelegt und nicht von Richtlinien abgeleitet, die außerhalb des Clean Rooms auf die Quelltabelle angewendet werden könnten. Erfahren Sie mehr über Spaltenrichtlinien.

Datenangebot

Ein Paket mit einem oder mehreren Datensets, die ein Datenanbieter mit bestimmten Analyseausführenden im Rahmen einer Zusammenarbeit freigibt. Jedes Datenset repräsentiert eine Quelltabelle oder Ansicht, die im Besitz des Datenanbieters ist. Ein Datenangebot ist eine Live-Ansicht der Daten und kein Snapshot, sodass alle Änderungen an den Quelldaten in der Zusammenarbeit berücksichtigt werden. Datenangebote werden in einer Registry registriert und dann mit einer Zusammenarbeit verknüpft.

Datenanbieter

Eine Rolle für die Zusammenarbeit, die es einem Teilnehmenden ermöglicht, Datenangebote mit bestimmten Analyseausführenden in einer Zusammenarbeit zu teilen. Ein Datenanbieter registriert und verknüpft Datenangebote mit der Zusammenarbeit, damit andere Teilnehmende sie nutzen können.

Datensatz

Eine sichere Ansicht einer einzelnen Quelltabelle oder Ansicht eines Datenanbieters. Ein Datenangebot besteht aus einem oder mehreren Datensets. Die Spezifikation des Datenangebots definiert, welche Spalten verfügbar gemacht werden sollen, welche Richtlinien angewendet werden sollen und ob die Daten nur per Vorlage oder auch per Freiform-SQL für jedes Datenset abgefragt werden können.

Berechtigung DCR

Eine konzeptionelle Berechtigungszeichenfolge, die verwendet wird, um Zugriff auf bestimmte API-Prozeduren einer Zusammenarbeit für eine Rolle zu gewähren. DCR-Berechtigungen können für einzelne Objekte oder allgemeinere Aktionen erteilt werden. Zu den DCR-Berechtigungen gehören READ, CREATE COLLABORATION und JOIN COLLABORATION. Diese Berechtigungszeichenfolgen werden an GRANT_PRIVILEGE_ON_OBJECT_TO_ROLE und GRANT_PRIVILEGE_ON_ACCOUNT_TO_ROLE übergeben. Weitere Informationen dazu finden Sie unter Verwalten des Zugriffs auf Collaborations, Ressourcen und Daten.

Freiform-SQL

Ein Modus des Datenzugriffs, bei dem ein Analyseausführender beliebige SQL-Abfragen direkt auf dem Datenset eines Datenanbieters ausführen kann, ohne eine Vorlage zu verwenden. Der Datenanbieter aktiviert dies durch Einstellen von allowed_analyses: template_and_freeform_sql in der dazugehörigen Datenangebotsspezifikation. Snowflake-Richtlinien, die im Abschnitt freeform_sql_policies des Datenangebots definiert sind, werden bei diesen Abfragen erzwungen. Siehe SQL-Freiformabfragen.

Differential Privacy

Ein algorithmisches und mathematisches System, das einzelne Zeilen oder Entitäten in einem Datensatz schützt, indem es numerische Ergebnisse mit Rauschen versieht und eine Gruppierung in Abfragen erfordert, um zu verhindern, dass exakte Werte mit exakten Zeilen oder Entitäten in den Daten in Verbindung gebracht werden.

Verknüpfungsrichtlinie

Eine von einem Clean Room-Teilnehmenden festgelegte Richtlinie, die angibt, mit welchen seiner Spalten in Abfragen in diesem Clean Room verknüpft werden können. Eine Clean Room-Verknüpfungsrichtlinie ist völlig unabhängig von Snowflake-Verknüpfungsrichtlinien. Erfahren Sie mehr über Verknüpfungsrichtlinien.

Verknüpfung

Das Importieren einer Ressource in eine Zusammenarbeit. Siehe Ressourcen.

Lokales Datenangebot

Lokale Datenangebote ermöglichen es Konten der Standard Edition, ihre eigenen Tabellen für eine Zusammenarbeit zu verwenden. Diese Angebote sind für andere Teilnehmende nicht sichtbar, und die Richtlinien für die Vorlagen werden nicht durchgesetzt. Siehe Ausführen einer Analyse mit Ihren eigenen Daten, wenn Sie die Standard Edition verwenden.

Verknüpfung

Importieren einer geschützten Ansicht von Daten in einen Reinraum. Sowohl der Anbieter als auch der Verbraucher können ihre eigenen Daten mit einem Clean Room verknüpfen, um sie für alle von diesem Clean Room unterstützten Abfragen verfügbar zu machen. Die Verknüpfung einer Tabelle oder Ansicht bedeutet, dass eine Kopie (eine Ansicht) der Quelldaten innerhalb des Reinraums erstellt wird, die dynamisch mit der Quelltabelle oder Ansicht außerhalb des Reinraums verknüpft ist.

Registry

Ein Container auf Kontoebene, in dem Ressourcen wie Vorlagen, Datenangebote und Code-Bundles gespeichert werden. Sie müssen eine Ressource erst in einer Registry registrieren, bevor Sie sie mit einer Zusammenarbeit verknüpfen können. Jedes Konto verfügt über eine Standard-Registry, auf die alle Benutzenden zugreifen können, und Sie können kundenspezifische Registrys erstellen, um den Zugriff auf Ressourcen zu gruppieren und zu verwalten. Kundenspezifische Registrys sind für den Erstellenden privat, bis der Zugriff explizit für andere Rollen gewährt wird. Mehr erfahren unter Registrys.

Ressource

Eine wiederverwendbare Komponente, die in einer Registry registriert und mit einer Zusammenarbeit verknüpft werden kann. Zu den Ressourcen gehören Vorlagen, Datenangebote und Code-Bundles. Jede Ressource wird durch eine YAML-Spezifikation definiert, hat einen Namen und eine Version und wird durch Aufrufen der entsprechenden REGISTRY-Prozedur registriert. Ressourcen können zum Zeitpunkt der Erstellung mit einer Zusammenarbeit verknüpft oder später hinzugefügt werden.

SCO

Secure Collaboration Orchestrator. Ein von Snowflake verwaltetes Konto, das die Zusammenarbeit im Hintergrund verwaltet. Das SCO erstellt ein individuelles Anwendungspaket pro Zusammenarbeit, gibt Daten mit Teilnehmenden gemäß der Definition der Zusammenarbeit frei und setzt Richtlinien für die Zusammenarbeit durch, z. B. wer mit welchen Vorlagen auf welche Daten zugreifen kann. Kosten im Zusammenhang mit dem SCO werden den Benutzenden nicht in Rechnung gestellt.

Sichere Ansicht

Wenn Sie eine Tabelle oder Ansicht mit dem Reinraum verknüpfen, wird eine sichere Ansicht erstellt. Dies ist eine verschlüsselte Ansicht, die auf der Quelltabelle oder der Ansicht außerhalb des Reinraums basiert. Die sichere Ansicht ist im Allgemeinen für Sie unsichtbar, kann aber manchmal in einer Fehlermeldung erscheinen, oder wenn Sie die Datenbankobjekte mit verschiedenen Tools durchsuchen, wo Sie einige Namensmanipulationen des ursprünglichen verknüpften Datensatzes sehen. Sofern nicht anders angegeben, beziehen Sie sich auf Ihre Daten immer mit dem Namen des Datensatzes, der mit der verknüpften Quelltabelle oder Ansicht identisch ist.

Definition von Spezifikationen

Ein YAML-Dokument, das eine Ressource für die Zusammenarbeit definiert. Jeder Ressourcentyp hat sein eigenes Spezifikationsschema, einschließlich Zusammenarbeitsspezifikationen, Datenangebotsspezifikationen, Vorlagenspezifikationen, Spezifikationen der Analyseanfragen und Code-Bundle-Spezifikationen. Spezifikationen werden an API-Prozeduren, wie beispielsweise INITIALIZE, REGISTER_DATA_OFFERING und REGISTER_TEMPLATE, übergeben. Siehe Schemareferenz für Details.

Vorlage

Jeder Clean Room verfügt über eine oder mehrere Vorlagen, bei denen es sich um SQL-Abfragen handelt, die in JinjaSQL geschrieben sind und die von Teilnehmenden bereitgestellt werden. Der Anbietende der Vorlage legt fest, welche Analyseausführenden die dazugehörigen Vorlagen verwenden können. Je nachdem, wie sie geschrieben sind, kann es sich bei einer Vorlage entweder um eine Analysevorlage handeln, die Ergebnisse sofort liefert, oder um eine Aktivierungsvorlage, die die Ergebnisse im Snowflake-Konto des gewünschten Teilnehmenden speichert.

Begriffe für ältere Anbietende und Verbrauchende von Clean Rooms

Die folgenden Begriffe werden bei älteren Anbietenden und Verbrauchenden von Clean Rooms verwendet. Die aktuelle Terminologie finden Sie oben.

Anbieter

Ein Ersteller von Reinräumen. Der Anbietende gibt in der Regel einige Daten und die Liste der zulässigen Abfragen frei, die in diesem Clean Room ausgeführt werden können, und legt High-Level-Clean-Room-Konfigurationen fest.

Verbraucher

Eine Person oder ein Konto, das vom Anbieter zur Nutzung eines Reinraums eingeladen wird. Verbraucher importieren in der Regel ihre eigenen Daten und führen eine oder mehrere Abfragen aus, die von diesem Clean Room unterstützt werden. Ein Reinraum kann jedoch so konfiguriert werden, dass die Verbraucher ihre eigene Abfrage vorschlagen können, sofern sie vom Anbieter genehmigt wurde.

Clean Room UI

Oder kurz „UI“. Die Clean Room-Umgebung unterstützt eine browserbasierte Webanwendung, mit der Sie die Snowflake Clean Room-Umgebung verwalten, neue Clean Rooms erstellen oder Clean Rooms nutzen können, zu denen Sie eingeladen wurden. Dies wurde früher als „Web-App“ bezeichnet, und diese Terminologie wird unter Umständen an einigen Stellen immer noch verwendet.