Confidentialité différentielle dans les Snowflake Data Clean Rooms¶
L’une des technologies cruciales d’amélioration de la confidentialité que propose Snowflake Data Clean Rooms est la confidentialité différentielle. Pour renforcer la protection de la confidentialité des fournisseurs de données, fournir des garanties mathématiques sur la vie privée des utilisateurs et apporter une protection contre les requêtes répétées visant à obtenir des informations individuelles, Snowflake Data Clean Rooms met en œuvre des techniques de pointe en matière de confidentialité différentielle, créant ainsi des protections de bout en bout incroyablement robustes. Étant donné que les salles blanches de données agissent comme des environnements de confiance, Snowflake Data Clean Rooms met en œuvre une confidentialité différentielle globale [^1], avec de solides garanties de confidentialité et de faibles niveaux de bruit. Snowflake Data Clean Rooms déploie une confidentialité différentielle en totale adéquation avec les déploiements à grande échelle.
Les techniques de confidentialité différentielle permettent d’obtenir des informations de haut niveau sur les données sans révéler aucun de leurs éléments constitutifs au niveau des lignes. Une autre solution, qui consiste à utiliser une simple agrégation pour masquer les informations au niveau des lignes, pourrait exposer des informations privées si des adversaires peuvent générer des requêtes « proches » sur les données qui diffèrent d’une ligne. La différence de résultat de ces requêtes peut compromettre des informations personnelles (on parle souvent d’attaque par différenciation).
La confidentialité différentielle permet de surmonter ce problème et fournit d’importantes garanties mathématiques de confidentialité des données en injectant soigneusement du bruit dans les valeurs de retour de toute requête portant sur des données privées. Avec de tels mécanismes de bruit et des budgets de protection de la confidentialité stratégiquement définis, il est statistiquement impossible de distinguer les résultats de telles requêtes « proches ».
Confidentialité différentielle dans l’édition développeur¶
L’utilisateur peut ajouter la confidentialité différentielle à tout modèle personnalisé déployé dans l’édition développeur d’une Snowflake Data Clean Room. Lorsqu’elle est utilisée avec le mécanisme de modèle personnalisé SQL Jinja, la commande suivante ajoute du bruit à la sortie selon le mécanisme souhaité :
cleanroom.addNoise(QUERY_RESULT,EPSILON,RANDOM_NUMBER,MECHANISM,...)
La puissance de l’édition développeur d’une Snowflake Data Clean Room réside dans le fait que tout mécanisme de bruit personnalisé peut être conçu et déployé dans le modèle personnalisé. En conséquence, les utilisateurs peuvent donc facilement développer ses propres mécanismes de confidentialité différentielle et les déployer sans modifier le backend de la salle blanche.
Utilisation¶
Pour un exemple de confidentialité différentielle implémentée dans un modèle d’analyse, voir Snowflake Data Clean Rooms : Analyse de chevauchement.