SYSTEM$CLASSIFY

샘플링할 행 수를 지정하고 지정된 오브젝트의 각 열에 권장 Data Classification 시스템 태그 를 할당하는 옵션을 사용하여 지정된 오브젝트를 분류합니다.

구문

CALL SYSTEM$CLASSIFY( '<object_name>' , <arg> )
Copy

인자

object_name

분류할 열을 포함하는 테이블, 외부 테이블, 뷰 또는 구체화된 뷰의 이름입니다. 데이터베이스와 스키마가 현재 세션에서 사용되지 않는 경우 이름은 정규화되어야 합니다.

이름은 데이터베이스에 저장된 대로 정확하게 지정해야 합니다. 이름에 특수 문자, 대문자 또는 공백이 포함된 경우 이름은 먼저 큰따옴표로 묶은 다음 작은따옴표로 묶어야 합니다.

arg

분류 프로세스의 작동 방식을 결정하는 인자를 지정합니다. 다음 중 하나:

NULL

Snowflake는 지정된 오브젝트의 행 수에 따라 기본 구성을 사용합니다. 지정된 오브젝트의 어떤 열에도 시스템 태그가 설정되지 않았습니다.

{}

NULL 을 지정하는 것과 기능적으로 동일한 빈 목록입니다.

{'sample_count': integer}

지정된 오브젝트에서 샘플링할 행 수를 지정합니다. 1 부터 10000 (포함)까지의 범위에 있는 임의의 숫자입니다.

{'auto_tag': true}

분류 프로세스가 완료되면 지정된 오브젝트의 열에 권장되는 분류 시스템 태그를 설정합니다.

이 인자를 사용하는 경우 스키마에 대한 OWNERSHIP 권한이 있는 역할로 저장 프로시저를 호출하십시오.

{'sample_count': integer, 'auto_tag': true}

샘플링할 행 수를 지정하면서 지정된 오브젝트를 분류하고, 분류 프로세스가 완료되면 지정된 오브젝트의 각 열에 권장 시스템 태그를 설정합니다.

이 인자를 사용하는 경우 스키마에 대한 OWNERSHIP 권한이 있는 역할로 저장 프로시저를 호출하십시오.

{'use_all_custom_classifiers': true}

Snowflake는 모든 사용자 지정 분류 인스턴스를 평가하고 분류 결과에 따라 사용자 지정 분류 인스턴스와 연관된 태그를 추천합니다.

이 옵션은 저장 프로시저(현재 역할, 호출자 권한)를 호출하는 사용 중인 역할에 액세스할 수 있는 사용자 지정 분류자를 사용합니다. 자세한 내용은 Understanding Caller’s Rights and Owner’s Rights Stored Procedures 섹션을 참조하십시오.

{'custom_classifiers': ['instance_name1' [ , 'instance_name2' ... ] ]}

열에 설정할 권장 태그의 원본으로 평가할 사용자 지정 분류 인스턴스를 지정합니다.

목록에 여러 인스턴스를 지정하고 각 인스턴스를 쉼표로 구분할 수 있습니다.

반환

다음 형식으로 JSON 오브젝트를 반환합니다. 예:

{
  "classification_result": {
    "col1_name": {
      "alternates": [],
      "recommendation": {
        "confidence": "HIGH",
        "coverage": 1,
        "details": [
          {
            "coverage": 1,
            "semantic_category": "US_PASSPORT"
          }
        ],
        "privacy_category": "IDENTIFIER",
        "semantic_category": "PASSPORT"
      },
      "valid_value_ratio": 1
    },  
    "col2_name": { ... },
    ...
  }
}
Copy

여기서

alternates

권장 태그 외에 고려해야 할 각 태그와 값에 대한 정보를 지정합니다.

recommendation

분류 프로세스에 따라 기본 선택으로 각 태그 및 값에 대한 정보를 지정합니다.

이러한 값은 대체 항목과 권장 사항 모두에 나타날 수 있습니다.

classifier_name

분류된 열에 태그를 지정하는 데 사용된 사용자 지정 분류 인스턴스의 정규화된 이름입니다.

이 필드는 사용자 지정 분류 인스턴스를 열에 설정할 태그의 원본으로 사용하는 경우에만 나타납니다.

confidence

HIGH, MEDIUM 또는 LOW 중 하나의 값을 지정합니다. 이 값은 Snowflake가 열 샘플링 프로세스를 기반으로 한 상대적 신뢰도와 열 데이터가 Snowflake의 데이터 분류 방식에 맞춰 조정되는 방식을 나타냅니다.

coverage

특정 카테고리에 대한 규칙과 일치하는 샘플링된 셀 값의 백분율을 지정합니다.

details

SEMANTIC_CATEGORY 태그의 지리적 태그 값 을 참조하는 필드와 값을 지정합니다.

privacy_category

개인정보 보호 카테고리 태그 값을 지정합니다.

가능한 값은 IDENTIFIER, QUASI-IDENTIFIER, SENSITIVE 입니다.

semantic_category

의미 체계 카테고리 태그 값을 지정합니다.

가능한 태그 값은 시스템 태그 및 카테고리시스템 태그 및 카테고리 섹션을 참조하십시오.

valid_value_ratio

샘플 크기에서 유효한 값의 비율을 지정합니다. 유효하지 않은 값에는 NULL, 빈 문자열, 256자를 초과하는 문자열이 포함됩니다.

사용법 노트

테이블을 분류합니다.

CALL SYSTEM$CLASSIFY('hr.tables.empl_info', null);
Copy

테이블을 분류하고 샘플링할 행 수를 지정합니다.

CALL SYSTEM$CLASSIFY('hr.tables.empl_info', {'sample_count': 1000});
Copy

테이블을 분류하고 열에 시스템 태그를 설정합니다.

CALL SYSTEM$CLASSIFY('hr.tables.empl_info', {'auto_tag': true});
Copy

테이블을 분류하고, 샘플링할 행 수를 지정하고, 테이블의 각 열에 권장 시스템 태그를 설정합니다.

CALL SYSTEM$CLASSIFY('hr.tables.empl_info', {'sample_count': 1000, 'auto_tag': true});
Copy