Differentielle Privatsphäre in Snowflake Data Clean Rooms

Eine der entscheidenden Technologien zur Verbesserung der Datenschutzes, die Snowflake Data Clean Rooms bietet, ist Differential Privacy oder differentielle Privatsphäre. Um den Schutz der Privatsphäre von Datenanbietern zu verbessern, mathematische Garantien für die Privatsphäre der Benutzer zu geben und vor wiederholten Abfragen zu schützen, die versuchen, individuelle Informationen zu erhalten, implementiert Snowflake Data Clean Rooms modernste Techniken für Differential Privacy (differentielle Privatsphäre) und schafft so einen besonders starken End-zu-End-Schutz. Da Datenreinräume als vertrauenswürdige Umgebungen fungieren, implementieren Snowflake Data Clean Rooms eine globale differentielle Privatsphäre [^1] mit starken Datenschutzgarantien und niedrigen Rauschpegeln. Snowflake Data Clean Rooms bieten differentielle Privatsphäre, die vollständig auf Bereitstellungen in großem Maßstab abgestimmt ist.

Differential Privacy-Techniken bieten hochwertige Einblicke in die Daten, ohne die einzelnen Bestandteile auf Zeilenebene preiszugeben. Eine Alternative, bei der einfache Aggregationen verwendet werden, um Informationen auf Zeilenebene zu verbergen, könnte private Informationen preisgeben, wenn Angreifer „enge“ Abfragen auf den Daten erstellen können, die sich nur um eine Zeile unterscheiden. Die Ergebnisdifferenz dieser Abfragen kann personenbezogene Daten kompromittieren (auch als differencing attack bezeichnet).

Die differentielle Privatsphäre überwindet dies und bietet starke mathematische Garantien für den Datenschutz, indem bei jeder Abfrage auf vertraulichen Daten in den Rückgabewert auf sorgfältige Weise ein Rauschen beigefügt wird. Unter solchen Rauschmechanismen und strategisch gesetzten Datenschutzbudgets ist es statistisch unmöglich, die Ergebnisse solcher „enger“ Abfragen zu unterscheiden.

Differentielle Privatsphäre in Developer Edition

Der Benutzer kann zu jeder benutzerdefinierten Vorlage, die in der Developer Edition eines Snowflake Data Clean Room eingesetzt wird, differentielle Privatsphäre hinzufügen. Wenn Sie den SQL-Jinja-Mechanismus für benutzerdefinierte Vorlagen nutzen, fügt der folgende Befehl Rauschen gemäß dem gewünschten Mechanismus zur Ausgabe hinzu:

cleanroom.addNoise(QUERY_RESULT,EPSILON,RANDOM_NUMBER,MECHANISM,...)
Copy

Das Besondere an der Developer Edition eines Snowflake Data Clean Room ist, dass jeder beliebige benutzerdefinierte Noise-Mechanismus in der benutzerdefinierten Vorlage entworfen und implementiert werden kann. Benutzer können also ganz einfach ihre eigenen Mechanismen der differentielle Privatsphäre entwickeln und sie ohne Änderungen am Reinraum-Backend bereitstellen.

Verwendung

Ein Beispiel für eine in einer Analysevorlage implementierten differenzierten Privatsphäre finden Sie unter Snowflake Data Clean Rooms: Überlappungsanalyse.