개인정보 보호 제어 조정하기

이 항목에서는 데이터 소유자가 Snowflake가 결과에 노이즈를 추가하는 데 사용하는 개인정보 보호 제어를 조정하는 데 사용할 수 있는 기술에 대해 설명합니다. Snowflake에서는 이 항목에 제시된 순서대로 옵션을 시도해 볼 것을 권장합니다.

Snowflake는 개인정보 보호 예산의 개인정보 손실 한도와 집계당 사용되는 개인정보 보호 예산의 최대 금액(차등 개인정보 보호 관련 문헌에서는 이를 통틀어 엡실론 이라고 함)을 조정하는 매개 변수를 제공합니다.

1단계: 개인정보 도메인 조정

개인정보 보호 예산을 조정하기 전에 개인정보 보호 테이블의 열에 설정된 개인정보 보호 도메인을 조정하는 것을 고려해야 합니다. Snowflake는 열의 모든 값을 가릴 만큼 충분한 노이즈를 발생시키므로 값의 범위가 넓을수록 발생시켜야 하는 노이즈도 많아집니다. 다음 지침을 따르십시오.

  • 노이즈를 증가시키려면 실제 값보다 크거나 작은 값을 포함하도록 범위를 넓히십시오. 개인정보 보호 도메인은 실제 값이 아닌 모든 가능한 값을 정의한다는 점을 기억하십시오.

  • 노이즈를 줄이려면 개인정보 보호 도메인을 좁혀서 유용한 범위를 벗어나는 값을 제외하거나 제한합니다. 개인정보 보호 도메인 외부에서 값이 처리되는 방식에 대한 정보는 개인정보 도메인 외부의 값 섹션을 참조하십시오.

참고

분석가는 노이즈를 줄이기 위해 개인정보 보호 도메인을 좁힐 수도 있습니다. 자세한 내용은 결과를 개선하기 위해 개인정보 보호 도메인 좁히기 섹션을 참조하십시오.

2단계: MAX_BUDGET_PER_AGGREGATE 매개 변수 조정

개인정보 보호 도메인을 조정했지만 여전히 개인정보 보호 제어를 미세 조정해야 하는 경우, 개인정보 보호 예산에 영향을 미치는 설정을 수정할 수 있습니다. 개인정보 처리방침 본문에서 MAX_BUDGET_PER_AGGREGATE 매개 변수를 조정하면 쿼리의 각 집계에 사용할 수 있는 개인정보 보호 예산의 양(즉, 집계에서 발생할 수 있는 개인정보 손실의 양)을 제어할 수 있습니다. 이 매개 변수를 조정하면 각 집계 쿼리에 추가되는 노이즈 양이 변경되고, 개인정보 보호 예산 한도에 도달하기 전에 실행할 수 있는 집계 수도 변경됩니다.

매개 변수는 각 쿼리가 아닌 각 집계에 대한 수준을 설정합니다. 예를 들어, SELECT COUNT(*), AVG(a) ... 쿼리에는 COUNT(*)AVG(a) 라는 두 집계가 있습니다.

쿼리의 각 집계에서 발생하는 최대 개인정보 손실량을 조정하려면 ALTER PRIVACY POLICY 명령을 사용하여 MAX_BUDGET_PER_AGGREGATE 매개 변수의 새 값을 설정합니다. 예:

ALTER PRIVACY POLICY users_policy SET BODY ->
  PRIVACY_BUDGET(BUDGET_NAME=>'analysts', MAX_BUDGET_PER_AGGREGATE=>0.1);
Copy

3단계: 개인정보 보호 예산 한도 조정

다른 개인정보 보호 제어를 조정해도 원하는 결과를 얻을 수 없는 경우, 개인정보 보호 예산의 개인정보 손실 한도를 조정할 수 있습니다. 다른 개인정보 보호 제어 기능은 쿼리 결과의 노이즈 양에 영향을 미치는 반면, 예산 한도를 조정하면 분석가가 실행할 수 있는 쿼리 수에 영향을 미칩니다.

분석가가 개인정보가 보호된 테이블에 대해 집계 함수가 포함된 쿼리를 실행할 때마다 분석가의 누적 개인정보 손실이 증가하고 남아 있는 집계의 추정 수는 감소합니다. 누적된 개인정보 손실이 개인정보 예산 한도에 도달하면 분석가는 추가 쿼리를 실행할 수 없습니다. 분석가에게 데이터의 유용성을 극대화하려면 각 예산 윈도우 동안 분석가가 실행할 것으로 예상되는 쿼리 수를 기준으로 예산 한도를 설정할 수 있습니다.

참고

누적 개인정보 손실은 예산 윈도우 에 정의된 일정에 따라 0으로 초기화된다는 점을 기억하십시오. 개인정보 보호 예산이 재설정되면 분석가는 이전 예산 창에 예산 한도에 도달한 경우에도 새로운 쿼리 세트를 실행할 수 있습니다.

ESTIMATE_REMAINING_DP_AGGREGATES 함수는 개인정보 보호 예산의 남은 쿼리 수를 추정하는 데 도움이 됩니다. 일반적으로 이 숫자는 각 쿼리의 집계 수와 개인정보 보호정책의 본문에서 지정한 MAX_BUDGET_PER_AGGREGATE 매개 변수의 값을 기준으로 합니다. ESTIMATE_REMAINING_DP_AGGREGATES 함수를 사용하여 쿼리가 개인정보 보호 예산에 미치는 영향을 살펴보는 확장된 예는 개인정보 보호 예산 지출 추적하기 섹션을 참조하십시오.

ESTIMATE_REMAINING_DP_AGGREGATES 함수를 사용하여 일련의 쿼리에 얼마나 많은 개인정보 보호 예산이 사용되는지 파악한 후에는 개인정보 보호정책 본문에서 BUDGET_LIMIT 매개 변수를 조정하여 새로운 개인정보 보호 예산 한도를 설정할 수 있습니다. 예:

ALTER PRIVACY POLICY users_policy SET BODY ->
  PRIVACY_BUDGET(BUDGET_NAME=>'analysts',
  BUDGET_LIMIT=>300,
  MAX_BUDGET_PER_AGGREGATE=>0.1);
Copy

중요

이 명령에는 이전에 설정한 MAX_BUDGET_PER_AGGREGATE 매개 변수가 포함되어 있습니다. ALTER PRIVACY POLICY 문에 매개 변수가 포함되지 않은 경우 기본값으로 재설정됩니다.