SQL을 사용하여 민감한 데이터 분류 설정하기¶

The following sections describe how to use SQL to set up the automatic classification of sensitive data within a database. If you want to use a web interface to set up sensitive data classification, see Trust Center를 사용하여 민감한 데이터 분류 설정하기. After classification runs, you can use the Trust Center to review classification results and view classification errors.

SQL을 사용하여 민감한 데이터를 분류하는 기본 워크플로는 다음 단계로 구성됩니다.

민감한 데이터 분류 중에 발생하는 작업을 제어하는 *분류 프로필*을 생성합니다.
데이터베이스 또는 스키마에 분류 프로필을 설정하여 엔터티의 테이블을 자동으로 분류합니다.

이 워크플로의 전체 예제는 예 섹션을 참조하십시오.

분류 프로필 정보¶

A classification profile defines the criteria that are used to automatically classify tables in a database. These criteria include:

테이블을 자동으로 분류하기 전에 테이블이 존재해야 하는 기간입니다.
이전에 분류된 테이블을 재분류해야 하는 기간입니다.
분류 후 시스템 및 사용자 정의 태그를 열에 자동으로 설정할지 여부입니다. 추천 태그를 자동으로 적용할지, 아니면 제안된 태그 할당을 검토한 후 직접 적용할지 결정할 수 있습니다.
시스템 분류 태그와 사용자 정의 오브젝트 태그 간의 매핑 을 통해 사용자 정의 태그를 자동으로 적용할 수 있습니다.
데이터를 분류하는 데 :doc:`사용자 지정 분류기</user-guide/classify-custom>`를 사용할지 여부입니다.

데이터 엔지니어가 데이터베이스에 분류 프로필을 할당하면 데이터베이스에 속하는 테이블에 있는 민감한 데이터가 프로필에 정의된 일정에 따라 자동으로 분류됩니다. 데이터 엔지니어는 여러 데이터베이스에 동일한 분류 프로필을 할당하거나 여러 분류 프로필을 생성하여 데이터베이스마다 다른 분류 기준을 설정할 수 있습니다.

SQL을 사용하여 분류 프로필을 생성하려면 CREATE CLASSIFICATION_PROFILE 명령을 실행하여 CLASSIFICATION_PROFILE :doc:`클래스</sql-reference/snowflake-db-classes>`의 인스턴스를 생성합니다.

CREATE CLASSIFICATION_PROFILE 명령을 사용하여 분류 프로필을 생성하는 예제는 예 섹션을 참조하세요.

태그 매핑 정보¶

분류 프로필을 사용하여 SEMANTIC_CATEGORY 시스템 태그<label-classify_classification_tags>`를 하나 이상의 :doc:`오브젝트 태그</user-guide/object-tagging/introduction>`에 매핑할 수 있습니다. 이 태그 매핑을 사용하면 민감한 데이터가 있는 열에 분류에 따라 사용자 정의 태그를 자동으로 할당할 수 있습니다. 태그 맵은 분류 프로필을 생성하는 동안 또는 그 이후에 :doc:/sql-reference/classes/classification_profile/methods/set_tag_map` 메서드를 호출하여 추가할 수 있습니다.

분류 프로필을 생성하는 동안 태그 맵을 정의하든 그 이후에 정의하든 관계없이 맵의 내용은 JSON 오브젝트로 지정됩니다. 이 JSON 오브젝트에는 사용자 정의 태그, 해당 태그의 문자열 값, 태그가 매핑되는 의미 체계 카테고리를 지정하는 오브젝트의 배열인 'column_tag_map' 키가 포함되어 있습니다.

다음은 태그 매핑의 예입니다.

'tag_map': {
  'column_tag_map': [
    {
      'tag_name':'tag_db.sch.pii',
      'tag_value':'Highly Confidential',
      'semantic_categories':[
        'NAME',
        'NATIONAL_IDENTIFIER'
      ]
    },
    {
      'tag_name': 'tag_db.sch.pii',
      'tag_value':'Confidential',
      'semantic_categories': [
        'EMAIL'
      ]
    }
  ]
}

이 매핑을 기반으로 이메일 주소 열이 있고 분류 프로세스에서 해당 열에 이러한 주소가 포함되어 있다고 판단되면 이메일 주소가 포함된 열에 tag_db.sch.pii = 'Confidential' 태그가 설정됩니다.

여러 개의 JSON 오브젝트가 태그 맵에 포함되어 있고, 태그, 태그 값, 범주 값을 매핑하는 경우, JSON 오브젝트의 순서에 따라 충돌이 발생할 때 열에 설정할 태그와 값이 결정됩니다. JSON 오브젝트를 왼쪽에서 오른쪽으로, JSON 형식으로 지정하는 경우 위에서 아래로 원하는 할당 순서대로 지정합니다.

팁

column_tag_map 필드의 각 오브젝트에는 1개의 필수 키(tag_name)만 있습니다. tag_value 및 semantic_categories 키를 생략하면 SEMANTIC_CATEGORY 시스템 태그가 적용되는 모든 열에 사용자 정의 태그가 적용되며, 사용자 정의 태그의 값은 지정된 열의 SEMANTIC_CATEGORY 태그 값과 일치합니다.

수동으로 할당된 태그와 자동 분류로 적용된 태그가 충돌하는 경우 오류가 발생합니다. 이러한 오류 추적에 대한 자세한 내용은 민감한 데이터 분류 문제 해결하기 섹션을 참조하십시오.

네이티브 의미 체계 카테고리의 하위 세트를 사용하여 데이터 분류¶

기본적으로 Snowflake는 민감한 데이터를 식별할 때마다 데이터를 :doc:`네이티브 의미 체계 카테고리 </user-guide/classify-native>`로 분류합니다. 의미 체계 카테고리는 이메일 주소, 신용 카드 번호 또는 사회 보장 번호와 같은 데이터 타입을 나타냅니다.

분류 프로필을 구성하여 민감한 데이터로 분류할 데이터 타입(의미 체계 카테고리)을 제한할 수 있습니다. Snowflake는 데이터가 프로필에 지정하는 의미 체계 카테고리의 하위 세트에 속하는 경우에만 데이터를 분류합니다.

분류 프로필 구성 오브젝트의 snowflake_semantic_categories 키는 분류하려는 의미 체계 카테고리 목록을 정의합니다. 다음 두 가지 방법으로 분류할 데이터를 지정할 수 있습니다.

의미 체계 카테고리별로 분류: NAME 또는 EMAIL과 같은 카테고리를 지정하여 위치에 관계없이 해당 유형의 모든 데이터를 분류합니다.
의미 체계 카테고리 및 국가별로 분류: 국가별 하위 카테고리(예: TAX_IDENTIFIER 또는 PASSPORT)로 분류하는 경우 country_codes 키를 사용하여 특정 국가의 데이터만 분류할 수 있습니다. 두 글자로 된 국가 코드와 지원되는 의미 체계 하위 카테고리의 목록은 민감한 데이터 분류의 네이티브 의미 체계 카테고리 섹션을 참조하세요.

동일한 분류 프로필에서 두 접근 방식을 혼합할 수 있습니다. 다음 예제는 각 변형을 보여줍니다.

예 1: 특정 의미 체계 카테고리 분류¶

이 예제에서는 Snowflake가 의미 체계 카테고리 NAME 및 NATIONAL_IDENTIFIER에 속하는 것으로 식별하는 경우에만 데이터가 분류되도록 분류 프로필을 구성합니다. 다른 모든 유형의 데이터는 분류되지 않습니다.

CREATE OR REPLACE SNOWFLAKE.DATA_PRIVACY.CLASSIFICATION_PROFILE
  my_classification_profile(
    {
      'minimum_object_age_for_classification_days': 0,
      'snowflake_semantic_categories':
        [
          {'category': 'NAME'},
          {'category': 'NATIONAL_IDENTIFIER'}
        ]
    });

예 2: 특정 국가 코드로 카테고리 분류¶

국가별 하위 카테고리가 있는 의미 체계 카테고리의 경우 country_codes 키를 사용하여 특정 국가로 분류를 제한할 수 있습니다. country_codes 값은 두 글자로 된 국가 코드입니다.

이 예제에서는 Snowflake가 이탈리아(IT) 또는 프랑스(FR)의 세금 식별자를 식별하는 경우에만 데이터를 분류합니다.

CREATE OR REPLACE SNOWFLAKE.DATA_PRIVACY.CLASSIFICATION_PROFILE
  my_classification_profile(
    {
      'minimum_object_age_for_classification_days': 0,
      'snowflake_semantic_categories':
        [
          {
            'category': 'TAX_IDENTIFIER',
            'country_codes': ['IT', 'FR']
          }
        ]
    });

예 3: 글로벌 카테고리 및 국가별 카테고리 결합¶

국가별 하위 카테고리가 없는 의미 체계 카테고리를 국가별 하위 카테고리가 있는 카테고리와 결합할 수 있습니다. 이 예제에서는 데이터가 미국 여권과 관련된 경우 Snowflake가 NAME 카테고리에 속하는 데이터를 항상 분류하고 PASSPORT 카테고리를 분류하도록 지정합니다.

CREATE OR REPLACE SNOWFLAKE.DATA_PRIVACY.CLASSIFICATION_PROFILE
  my_classification_profile(
    {
      'minimum_object_age_for_classification_days': 0,
      'snowflake_semantic_categories':
        [
          {
            'category': 'NAME'
          },
          {
            'category': 'PASSPORT',
            'country_codes': ['US']
          }
        ]
    });

데이터베이스에 분류 프로필 설정¶

데이터베이스에 분류 프로필을 설정하여 민감한 데이터 분류를 구현합니다. 데이터베이스에 분류 프로필을 설정하면 해당 데이터베이스 내의 모든 테이블과 뷰가 민감한 데이터 분류를 통해 자동으로 모니터링됩니다.

스키마에도 분류를 설정할 수 있습니다. 분류 프로필에도 연결된 데이터베이스 내에 존재하는 스키마에 분류 프로필을 설정하면, 스키마에 설정된 프로필이 데이터베이스에 설정된 프로필을 재정의합니다.

분류 프로필을 설정하려면 ALTER DATABASE 또는 ALTER SCHEMA 명령을 사용하여 CLASSIFICATION_PROFILE 매개 변수를 설정합니다. 예를 들어 my_db 데이터베이스의 모든 테이블과 뷰가 민감한 데이터 분류를 통해 모니터링되도록 분류 프로필 ``my_profile``을 설정하려면 다음 명령을 실행합니다.

ALTER DATABASE my_db
  SET CLASSIFICATION_PROFILE = 'governance_db.classify_sch.my_profile';

Unset a classification profile on a database¶

To remove a classification profile from a database so that tables and views in the database are no longer associated with that profile, use ALTER DATABASE with UNSET CLASSIFICATION_PROFILE. You need the same privileges as for setting the profile (for example EXECUTE AUTO CLASSIFICATION on the database).

For example, to unset the classification profile on the my_db database, run the following command:

ALTER DATABASE my_db UNSET CLASSIFICATION_PROFILE;

For the full ALTER DATABASE syntax and unset options, see ALTER DATABASE.

액세스 제어¶

분류 프로필로 작업하고 민감한 데이터 분류를 활성화할 수 있는 권한과 역할은 다음과 같습니다.


작업	필수 권한/역할	참고
분류 프로필 만들기	SNOWFLAKE.CLASSIFICATION_ADMIN 데이터베이스 역할	이 데이터베이스 역할을 다른 역할에 부여하는 방법에 대한 자세한 내용은 SNOWFLAKE 데이터베이스 역할 사용하기 섹션을 참조하십시오.
	스키마에 대한 CREATE SNOWFLAKE.DATA_PRIVACY.CLASSIFICATION_PROFILE	이 권한은 분류 프로필 인스턴스를 생성할 스키마에 필요합니다.
	데이터베이스 및 스키마에 대한 USAGE	분류 프로필 인스턴스를 생성할 스키마에 권한이 필요합니다.
데이터베이스 및 스키마에 분류 프로필 설정하기	다음 중 하나: 계정에 대한 EXECUTE AUTO CLASSIFICATION 데이터베이스 및 스키마에 대한 EXECUTE AUTO CLASSIFICATION	기본적으로 데이터베이스 및 스키마의 소유자에게는 해당 EXECUTE AUTO CLASSIFICATION 권한이 있습니다.
	스키마의 데이터베이스에 대한 모든 권한	스키마에 분류 프로필을 설정하는 경우 해당 스키마가 포함된 데이터베이스에 대해 하나 이상의 권한이 필요합니다.
	데이터베이스 및 스키마에 대한 모든 권한	자동으로 분류할 테이블이 포함된 데이터베이스 및 스키마에 대해 하나 이상의 권한이 필요합니다. EXECUTE AUTO CLASSIFICATION 권한이 이 요구 사항을 충족합니다.
	다음 중 하나: 분류 프로필 인스턴스에 대한 OWNERSHIP 분류 프로필의 <classification_profile>!PRIVACY_USER 인스턴스 역할.	PRIVACY_USER 인스턴스 역할을 다른 역할에 부여하는 방법에 대한 자세한 내용은 인스턴스 역할 섹션을 참조하십시오.
	계정에 대한 APPLY TAG
분류 프로필 인스턴스에서 메서드 를 호출합니다	<classification_profile>!PRIVACY_USER 인스턴스 역할	이 인스턴스 역할을 다른 역할에 부여하는 방법에 대한 자세한 내용은 인스턴스 역할 섹션을 참조하십시오.
분류 프로필 나열	<classification_profile>!PRIVACY_USER 인스턴스 역할
분류 프로필 삭제	분류 프로필 인스턴스에 대한 OWNERSHIP

데이터 엔지니어 역할에 이러한 권한과 데이터베이스 역할을 부여하는 예제는 기본 예제: 데이터베이스에서 테이블 자동 분류 섹션을 참조하십시오.

기본 예제: 데이터베이스에서 테이블 자동 분류¶

데이터베이스에서 테이블을 자동으로 분류하려면 다음 단계를 완료합니다.

관리자 역할로 데이터 엔지니어에게 데이터베이스의 테이블을 자동으로 분류하는 데 필요한 :ref:`역할과 권한<label-classify_auto_access_control>`을 부여합니다.

USE ROLE ACCOUNTADMIN;

GRANT USAGE ON DATABASE mydb TO ROLE data_engineer;
GRANT EXECUTE AUTO CLASSIFICATION ON DATABASE mydb TO ROLE data_engineer;

GRANT DATABASE ROLE SNOWFLAKE.CLASSIFICATION_ADMIN TO ROLE data_engineer;
GRANT CREATE SNOWFLAKE.DATA_PRIVACY.CLASSIFICATION_PROFILE ON SCHEMA mydb.sch TO ROLE data_engineer;

GRANT APPLY TAG ON ACCOUNT TO ROLE data_engineer;

데이터 엔지니어 역할로 전환합니다.
```
USE ROLE data_engineer;
```

분류 프로필 을 CLASSIFICATION_PROFILE 클래스의 인스턴스로 생성합니다.

CREATE OR REPLACE SNOWFLAKE.DATA_PRIVACY.CLASSIFICATION_PROFILE
  my_classification_profile(
    {
      'minimum_object_age_for_classification_days': 0,
      'maximum_classification_validity_days': 30,
      'auto_tag': true,
      'classify_views': false
    });

인스턴스에서 DESCRIBE 메서드를 호출하여 속성을 확인합니다.
```
SELECT my_classification_profile!DESCRIBE();
```
스키마에 분류 프로필 인스턴스를 설정하면 스키마에서 테이블을 모니터링하고 민감한 데이터를 자동으로 분류하는 백그라운드 프로세스가 시작됩니다.
```
ALTER DATABASE mydb
 SET CLASSIFICATION_PROFILE = 'mydb.sch.my_classification_profile';
```
참고

스키마에 분류 프로필을 설정한 후 Snowflake가 스키마 분류를 시작하기까지 1시간 정도의 지연이 있습니다.
1시간 정도 기다린 후 SYSTEM$GET_CLASSIFICATION_RESULT 저장 프로시저를 호출하여 자동 분류 결과를 확인합니다.
```
CALL SYSTEM$GET_CLASSIFICATION_RESULT('mydb.sch.t1');
```

예제: 태그 매핑 및 사용자 지정 분류기 사용하기¶

관리자 역할로 데이터 엔지니어에게 데이터베이스의 테이블을 자동으로 분류하고 열에 태그를 설정하는 데 필요한 :ref:`역할과 권한<label-classify_auto_access_control>`을 부여합니다.

분류 프로필을 만듭니다.

CREATE OR REPLACE SNOWFLAKE.DATA_PRIVACY.CLASSIFICATION_PROFILE
  my_classification_profile(
    {
      'minimum_object_age_for_classification_days': 0,
      'maximum_classification_validity_days': 30,
      'auto_tag': true,
      'classify_views': false
    });

인스턴스에서 SET_TAG_MAP 메서드를 호출하여 태그 매핑 을 분류 프로필에 추가합니다. 이렇게 하면 민감한 데이터가 포함된 열에 사용자 지정 태그를 자동으로 적용할 수 있습니다.
```
CALL my_classification_profile!SET_TAG_MAP(
  {'column_tag_map':[
    {
      'tag_name':'my_db.sch1.pii',
      'tag_value':'sensitive',
      'semantic_categories':['NAME']
    }]});
```
또는 분류 프로필을 만들 때 이 태그 매핑을 추가할 수도 있습니다.
SET_CUSTOM_CLASSIFIERS 메서드를 호출하여 사용자 정의 분류기 를 분류 프로필에 추가합니다. 이를 통해 민감한 데이터를 사용자가 정의한 의미 체계 및 개인정보 보호 범주로 자동 분류할 수 있습니다.
```
CALL my_classification_profile!set_custom_classifiers(
  {
    'medical_codes': medical_codes!list(),
    'finance_codes': finance_codes!list()
  });
```
또는 분류 프로필을 만들 때 사용자 지정 분류자를 추가할 수도 있습니다.
인스턴스에서 DESCRIBE 메서드를 호출하여 태그 매핑과 사용자 정의 분류기가 분류 프로필에 추가되었는지 확인합니다.
```
SELECT my_classification_profile!DESCRIBE();
```
데이터베이스에서 분류 프로필 인스턴스를 설정합니다.
```
ALTER DATABASE mydb
 SET CLASSIFICATION_PROFILE = 'mydb.sch.my_classification_profile';
```
tag_db.sch.pii 태그에 마스킹 정책을 첨부하여 태그 기반 마스킹을 사용하도록 설정합니다.
```
ALTER TAG tag_db.sch.pii SET MASKING POLICY pii_mask;
```

예제: 자동 분류를 활성화하기 전에 분류 프로필 테스트하기¶

관리자로 데이터 엔지니어에게 스키마의 테이블을 자동으로 분류하고 열에 태그를 설정하는 데 필요한 역할과 권한 을 부여하십시오.

태그 매핑과 사용자 지정 분류기로 분류 프로필을 만듭니다.

CREATE OR REPLACE SNOWFLAKE.DATA_PRIVACY.CLASSIFICATION_PROFILE my_classification_profile(
  {
    'minimum_object_age_for_classification_days':0,
    'auto_tag':true,
    'tag_map': {
      'column_tag_map':[
        {
          'tag_name':'tag_db.sch.pii',
          'tag_value':'highly sensitive',
          'semantic_categories':['NAME','NATIONAL_IDENTIFIER']
        },
        {
          'tag_name':'tag_db.sch.pii',
          'tag_value':'sensitive',
          'semantic_categories':['EMAIL','MEDICAL_CODE']
        }
      ]
    },
    'classify_views': false,
    'custom_classifiers': {
      'medical_codes': medical_codes!list(),
      'finance_codes': finance_codes!list()
    }
  }
);

자동 분류를 활성화하기 전에 SYSTEM$CLASSIFY 저장 프로시저를 호출하여 table1 테이블의 태그 매핑을 테스트하십시오.

CALL SYSTEM$CLASSIFY(
 'db.sch.table1',
 'db.sch.my_classification_profile'
);

출력의 tags 키에는 태그 설정 여부(설정된 경우 true, 그렇지 않은 경우 false), 설정된 태그의 이름 및 태그 값에 대한 세부 정보가 포함되어 있습니다.

{
  "classification_profile_config": {
    "classification_profile_name": "db.schema.my_classification_profile"
  },
  "classification_result": {
    "EMAIL": {
      "alternates": [],
      "recommendation": {
        "confidence": "HIGH",
        "coverage": 1,
        "details": [],
        "privacy_category": "IDENTIFIER",
        "semantic_category": "EMAIL",
        "tags": [
          {
            "tag_applied": true,
            "tag_name": "snowflake.core.semantic_category",
            "tag_value": "EMAIL"
          },
          {
            "tag_applied": true,
            "tag_name": "snowflake.core.privacy_category",
            "tag_value": "IDENTIFIER"
          },
          {
            "tag_applied": true,
            "tag_name": "tag_db.sch.pii",
            "tag_value": "sensitive"
          }
        ]
      },
      "valid_value_ratio": 1
    },
    "FIRST_NAME": {
      "alternates": [],
      "recommendation": {
        "confidence": "HIGH",
        "coverage": 1,
        "details": [],
        "privacy_category": "IDENTIFIER",
        "semantic_category": "NAME",
        "tags": [
          {
            "tag_applied": true,
            "tag_name": "snowflake.core.semantic_category",
            "tag_value": "NAME"
          },
          {
            "tag_applied": true,
            "tag_name": "snowflake.core.privacy_category",
            "tag_value": "IDENTIFIER"
          },
          {
            "tag_applied": true,
            "tag_name": "tag_db.sch.pii",
            "tag_value": "highly sensitive"
          }
        ]
      },
      "valid_value_ratio": 1
    }
  }
}

분류 프로필을 기준으로 한 자동 분류가 원하는 결과를 가져오는지 확인한 후 데이터베이스에 분류 프로필 인스턴스를 설정합니다.
```
ALTER DATABASE mydb
 SET CLASSIFICATION_PROFILE = 'mydb.sch.my_classification_profile';
```
When you no longer want automatic sensitive data classification on the database, unset the classification profile from the database. Unsetting removes the association between the database and the profile, which stops the background process that monitors tables and views for automatic classification. For more information, see Unset a classification profile on a database.
```
ALTER DATABASE mydb UNSET CLASSIFICATION_PROFILE;
```