Privacidade diferencial nas Snowflake Data Clean Rooms

Uma das tecnologias cruciais para melhorar a privacidade que as Snowflake Data Clean Rooms oferecem é a privacidade diferencial. Para aumentar as proteções de privacidade dos provedores de dados, fornecer garantias matemáticas sobre a privacidade do usuário e proteger contra consultas repetidas que tentam obter informações individuais, as Snowflake Data Clean Rooms implementam técnicas de ponta em privacidade diferencial, criando proteções incrivelmente fortes de ponta a ponta. Como as salas limpas de dados atuam como ambientes confiáveis, as Snowflake Data Clean Rooms implementam privacidade diferencial global [^1], com sólidas garantias de privacidade e baixos níveis de ruído. As Snowflake Data Clean Rooms implementam privacidade diferencial em alinhamento completo com instalações em grande escala.

Técnicas de privacidade diferencial publicam insights de alto nível sobre dados sem revelar nenhum de seus constituintes individuais ao nível da linha. Uma alternativa, usando a agregação simples para ocultar informações em nível de linha, poderia expor informações privadas se os adversários pudessem gerar consultas «próximas» nos dados que diferem em uma linha. A diferença de resultado dessas consultas pode comprometer as informações pessoais (geralmente chamada de ataque de diferenciação).

A privacidade diferencial supera isso e oferece garantias matemáticas sólidas de privacidade de dados, injetando cuidadosamente ruído nos valores de retorno de qualquer consulta a dados privados. Com esses mecanismos de ruído e orçamentos de privacidade estrategicamente definidos, é estatisticamente impossível distinguir os resultados de quaisquer consultas «próximas».

A privacidade diferencial na edição do desenvolvedor

O usuário pode adicionar privacidade diferencial a qualquer modelo personalizado implantado na edição de desenvolvedor de uma Snowflake Data Clean Room. Quando usado com o mecanismo de modelo personalizado SQL Jinja, o comando a seguir adiciona ruído conforme o mecanismo desejado à saída:

cleanroom.addNoise(QUERY_RESULT,EPSILON,RANDOM_NUMBER,MECHANISM,...)
Copy

O poder da edição de desenvolvedor de uma Snowflake Data Clean Room reside no fato de que qualquer mecanismo de ruído personalizado pode ser projetado e implantado no modelo personalizado. Como resultado, os usuários podem desenvolver facilmente seus próprios mecanismos de privacidade diferencial e implantá-los sem alterações no back-end da sala limpa.

Uso

Para um exemplo de privacidade diferencial implementada em um modelo de análise, consulte Snowflake Data Clean Rooms: análise de sobreposição.