SYSTEM$CLASSIFY¶

샘플링할 행 수를 지정하고 지정된 오브젝트의 각 열에 권장 :ref:`분류 태그<label-classify_classification_tags>`를 할당하는 옵션을 사용하여 지정된 오브젝트를 분류합니다.

구문¶

SYSTEM$CLASSIFY( '<object_name>' ,
  { '<classification_profile>' | <options> } )

인자¶

'object_name'

분류할 열을 포함하는 테이블, 외부 테이블, 뷰 또는 구체화된 뷰의 이름입니다. 데이터베이스와 스키마가 현재 세션에서 사용되지 않는 경우 이름은 정규화되어야 합니다.

이름은 데이터베이스에 저장된 대로 정확하게 지정해야 합니다. 이름에 특수 문자, 대문자 또는 공백이 포함된 경우 이름은 먼저 큰따옴표로 묶은 다음 작은따옴표로 묶어야 합니다.

'classification_profile'

프로필에 지정된 기준에 따라 분류하기 위해 분류 프로필 을 지정합니다.

options

분류 프로세스 작동 방식을 결정하는 JSON OBJECT 를 지정합니다. 다음 중 하나:

NULL

Snowflake는 지정된 오브젝트의 행 수에 따라 기본 구성을 사용합니다. 지정된 오브젝트의 어떤 열에도 시스템 태그가 설정되지 않았습니다.

{}

NULL 을 지정하는 것과 기능적으로 동일한 빈 오브젝트입니다.

{'sample_count': integer}

지정된 오브젝트에서 샘플링할 행 수를 지정합니다. 1 부터 10000 (포함)까지의 범위에 있는 임의의 숫자입니다.

{'auto_tag': true}

분류 프로세스가 완료되면 지정된 오브젝트의 열에 권장되는 분류 시스템 태그를 설정합니다.

이 인자를 사용하는 경우 스키마에 대한 OWNERSHIP 권한이 있는 역할로 저장 프로시저를 호출하십시오.

{'sample_count': integer, 'auto_tag': true}

샘플링할 행 수를 지정하면서 지정된 오브젝트를 분류하고, 분류 프로세스가 완료되면 지정된 오브젝트의 각 열에 권장 시스템 태그를 설정합니다.

이 인자를 사용하는 경우 스키마에 대한 OWNERSHIP 권한이 있는 역할로 저장 프로시저를 호출하십시오.

{'use_all_custom_classifiers': true}

Snowflake는 모든 사용자 지정 분류 인스턴스를 평가하고 분류 결과에 따라 사용자 지정 분류 인스턴스와 연관된 태그를 추천합니다.

이 옵션은 저장 프로시저(현재 역할, 호출자 권한)를 호출하는 사용 중인 역할에 액세스할 수 있는 사용자 지정 분류자를 사용합니다. 자세한 내용은 호출자 권한 및 소유자 권한 저장 프로시저 이해하기 섹션을 참조하십시오.

{'custom_classifiers': ['instance_name1' [ , 'instance_name2' ... ] ]}

열에 설정할 권장 태그의 원본으로 평가할 사용자 지정 분류 인스턴스를 지정합니다.

목록에 여러 인스턴스를 지정하고 각 인스턴스를 쉼표로 구분할 수 있습니다.

반환¶

다음 형식으로 JSON 오브젝트를 반환합니다. 예:

{
  "classification_profile_config": {
    "classification_profile_name": "db1.sch.sensitive_data_detection_profile"
  },
  "classification_result": {
    "col1_name": {
      "alternates": [],
      "recommendation": {
        "confidence": "HIGH",
        "coverage": 1,
        "details": [],
        "privacy_category": "QUASI_IDENTIFIER",
        "semantic_category": "DATE_OF_BIRTH",
        "tags": [
          {
            "tag_applied": true,
            "tag_name": "snowflake.core.semantic_category",
            "tag_value": "DATE_OF_BIRTH"
          },
          {
            "tag_applied": true,
            "tag_name": "snowflake.core.privacy_category",
            "tag_value": "QUASI_IDENTIFIER"
          }
        ]
      },
      "valid_value_ratio": 1
    }
  }
}

가능한 필드:

classification_profile_config: 자동 분류가 구성된 경우 분류 결과를 생성하는 데 사용된 구성 프로필의 정규화된 이름을 포함합니다.
classification_result: 분류된 각 열에 대한 세부 정보를 제공합니다.
object_path_results: 열에 민감한 필드가 있는 반정형 데이터가 포함된 경우 object_path_results 키는 네이티브 또는 사용자 지정 의미 체계 카테고리로 분류된 필드를 나열합니다. 자세한 내용은 JSON 열에 대한 분류 결과 확인 섹션을 참조하십시오.
alternates: 각 태그에 대한 정보와 권장 태그 외에 고려해야 할 값을 제공합니다.
recommendation: 분류 프로세스에 따라 각 태그 및 값에 대한 정보를 기본으로 제공합니다.

이러한 값은 대체 항목과 권장 사항 모두에 나타날 수 있습니다.

classifier_name
분류된 열에 태그를 지정하는 데 사용된 사용자 지정 분류 인스턴스의 정규화된 이름입니다.

이 필드는 사용자 지정 분류 인스턴스를 열에 설정할 태그의 원본으로 사용하는 경우에만 나타납니다.

confidence
HIGH, MEDIUM 또는 LOW 값 중 하나를 제공합니다. 이 값은 Snowflake가 열 샘플링 프로세스를 기반으로 한 상대적 신뢰도와 열 데이터가 Snowflake의 데이터 분류 방식에 맞춰 조정되는 방식을 나타냅니다.

coverage
특정 카테고리에 대한 규칙과 일치하는 샘플 셀 값의 비율을 제공합니다.

details
지리별 분류와 관련된 필드 및 값을 제공합니다. semantic_category 필드에는 로캘에 대한 :ref:`의미 체계 하위 카테고리<label-classify_native_subcategories>`가 포함되어 있습니다.

privacy_category
개인정보 보호 카테고리를 제공합니다.

가능한 값은 IDENTIFIER, QUASI-IDENTIFIER, SENSITIVE 입니다.

semantic_category
의미 체계 카테고리를 제공합니다. 네이티브 의미 체계 카테고리 목록은 민감한 데이터 분류의 네이티브 의미 체계 카테고리 섹션을 참조하세요.

값이 ``MULTIPLE``인 경우는 반정형 데이터에서 민감한 데이터가 발견된 것입니다. 분류 중에 발견된 네이티브 및 사용자 지정 의미 체계 카테고리에 대한 자세한 분석을 확인하려면 결과 오브젝트의 object_path_results 필드를 검사합니다. 자세한 내용은 JSON 열에 대한 분류 결과 확인 섹션을 참조하십시오.

tags
분류 프로세스의 결과로 열에 적용된 태그에 대한 정보를 제공합니다.

valid_value_ratio
샘플 크기에서 유효한 값의 비율을 제공합니다.

정형 데이터의 경우 유효하지 않은 값에는 NULL, 빈 문자열, 256자를 초과하는 문자열이 포함됩니다.

반정형 데이터의 경우 유효하지 않은 값에는 NULL 및 빈 문자열이 포함됩니다.

사용법 노트¶

Snowflake가 제공하는 저장 프로시저는 호출자 권한을 활용합니다. 자세한 내용은 호출자 권한 및 소유자 권한 저장 프로시저 이해하기 섹션을 참조하십시오.
대체 시스템 태그 값을 적용하려면 ALTER TABLE … MODIFY COLUMN … SET TAG 문을 사용하여 태그 값을 업데이트하십시오.
열에서 분류 시스템 태그를 설정 해제하려면 ALTER TABLE … MODIFY COLUMN … UNSET TAG 문을 사용하십시오.

예¶

테이블을 분류합니다.

CALL SYSTEM$CLASSIFY('hr.tables.empl_info', null);

테이블을 분류하고 샘플링할 행 수를 지정합니다.

CALL SYSTEM$CLASSIFY('hr.tables.empl_info', {'sample_count': 1000});

테이블을 분류하고 열에 시스템 태그를 설정합니다.

CALL SYSTEM$CLASSIFY('hr.tables.empl_info', {'auto_tag': true});

테이블을 분류하고, 샘플링할 행 수를 지정하고, 테이블의 각 열에 권장 시스템 태그를 설정합니다.

CALL SYSTEM$CLASSIFY('hr.tables.empl_info', {'sample_count': 1000, 'auto_tag': true});

my_config_profile 분류 프로필에 지정된 기준에 따라 테이블을 분류합니다.

CALL SYSTEM$CLASSIFY('hr.tables.empl_info, 'my_config_profile');