Snowflake Data Clean Rooms의 차등 개인정보 보호

Snowflake Data Clean Rooms가 제공하는 중요한 개인정보 보호 강화 기술 중 하나는 차등 개인정보 보호 입니다. 데이터 공급자의 개인정보 보호를 강화하고, 사용자 개인정보에 대한 수학적 보장을 제공하며, 개별 정보를 획득하려면 반복 쿼리로부터 보호하기 위해 Snowflake Data Clean Rooms는 차등 개인정보 보호에 최신 기술을 구현하여 놀랍도록 강력한 엔드투엔드 보호 기능을 제공합니다. 데이터 클린룸은 신뢰할 수 있는 환경으로 작동하기 때문에 Snowflake Data Clean Rooms는 전역 차등 개인정보 보호[^1]를 구현하여 강력한 개인정보 보안을 보장하고 낮은 노이즈 수준을 달성합니다. Snowflake Data Clean Rooms는 대규모 배포에 완벽하게 부합하는 차등 개인정보 보호 기능을 배포합니다.

차등 개인정보 보호 기술은 개별 행 수준 구성 요소를 공개하지 않고도 데이터에 대한 높은 수준의 인사이트를 게시합니다. 행 수준 정보를 숨기기 위해 단순 집계를 사용하는 한 가지 대안은 공격자가 한 행씩 다른 데이터에 대해 “닫기” 쿼리를 생성할 수 있는 경우 비공개 정보가 노출될 수 있다는 것입니다. 이러한 쿼리의 결과 차이로 인해 개인정보가 유출될 수 있습니다(차등 공격 이라고도 함).

차등 개인정보 보호는 이를 극복하고 개인 데이터에 대한 모든 쿼리의 반환 값에 노이즈를 신중하게 주입하여 데이터 개인정보 보호를 수학적으로 강력하게 보장합니다. 이러한 노이즈 메커니즘과 전략적으로 설정된 개인정보 보호 예산 하에서는 이러한 “닫기” 쿼리의 결과를 통계적으로 구분하는 것이 불가능합니다.

개발자 에디션의 차등 개인정보 보호

사용자는 Snowflake Data Clean Room 개발자 에디션에 배포된 모든 사용자 지정 템플릿에 차등 개인정보 보호 기능을 추가할 수 있습니다. SQL Jinja 사용자 지정 템플릿 메커니즘과 함께 사용되는 경우 다음 명령은 원하는 메커니즘에 따라 출력에 노이즈를 추가합니다.

cleanroom.addNoise(QUERY_RESULT,EPSILON,RANDOM_NUMBER,MECHANISM,...)
Copy

Snowflake Data Clean Room 개발자 에디션의 장점은 사용자 지정 노이즈 메커니즘을 사용자 지정 템플릿에서 설계하고 배포할 수 있다는 것입니다. 따라서 사용자는 자체 차등 개인정보 보호 메커니즘을 쉽게 개발하고 클린룸 백엔드를 변경하지 않고도 이를 배포할 수 있습니다.

사용법

분석 템플릿에 구현된 차등 개인정보 보호의 예는 Snowflake Data Clean Rooms: 중복 분석을 참조하십시오.