EXTRACT_SEMANTIC_CATEGORIES 함수: 국제 태그 값¶
EXTRACT_SEMANTIC_CATEGORIES 함수는 다음과 같이 작동합니다.
- 이전:
함수의 출력은 다음 형식을 띱니다.
- 현재:
함수 출력은 형식 지정 과정에서 변경되며 이 출력에는 호주, 캐나다, 영국, 미국과 관련된 SEMANTIC_CATEGORY 태그 값에 대한 지원이 포함됩니다. 이러한 국가를 지원하기 위해 태그 값은 특정 상위 카테고리 그룹 에 해당합니다. 상위 카테고리에는 열이 주로 한 국가 또는 다른 국가의 값으로 구성되어 있는지 여부를 포함하여, 분류 결과에 대한 정보가 포함됩니다.
형식 지정 변경 사항은 다음과 같습니다.
extra_info및probability필드를 제거합니다.alternates필드를 출력의 다른 위치로 이동합니다.다음 새 필드를 추가하십시오.
valid_value_ratio: 샘플 크기에서 유효한 값의 비율을 지정합니다. 유효하지 않은 값에는 NULL, 빈 문자열, 256자를 초과하는 문자열이 포함됩니다.recommendation: 각 태그와 값에 대한 정보를 포함합니다.confidence: 여기서 가능한 값은HIGH,MEDIUM또는LOW입니다.coverage: 특정 카테고리에 대한 규칙과 일치하는 샘플링된 셀 값의 백분율을 나타냅니다.details: SEMANTIC_CATEGORY 태그의 지리적 태그 값을 지정할 수 있는 필드와 값을 포함합니다.
예:
다음 표에는 분류 태그, 새 카테고리 그룹 및 그룹 구성원, 지원되는 국가 간의 관계가 요약되어 있습니다. 국가 코드는 ISO-3166-1 alpha-2 표준을 기반으로 합니다. EMAIL 및 GENDER와 같은 다른 의미 체계 카테고리는 영향을 받지 않습니다.
PRIVACY_CATEGORY 태그 값
SEMANTIC_CATEGORY 태그 값(상위 그룹)
그룹 구성원
국가 코드
IDENTIFIERBANK_ACCOUNTCA_BANK_ACCOUNT.US_BANK_ACCOUNT.IBANCA . US
ORGANIZATION_IDENTIFIERAU_BUSINESS_NUMBER.AU_COMPANY_NUMBERAU
DRIVERS_LICENSEAU_DRIVERS_LICENSE.CA_DRIVERS_LICENSE.US_DRIVERS_LICENSEAU . CA . US
MEDICARE_NUMBERAU_MEDICARE_NUMBERAU
PASSPORTAU_PASSPORT.CA_PASSPORT.US_PASSPORTAU . CA . US
PHONE_NUMBERAU_PHONE_NUMBER.CA_PHONE_NUMBER.UK_PHONE_NUMBER.US_PHONE_NUMBERAU . CA . GB . US
STREET_ADDRESSCA_STREET_ADDRESS.US_STREET_ADDRESSCA . US
TAX_IDENTIFIERAU_TAX_NUMBERAU
NATIONAL_IDENTIFIERCA_SOCIAL_INSURANCE_NUMBER.UK_NATIONAL_INSURANCE_NUMBER.US_SSNCA . GB . US
QUASI_IDENTIFIERCITYUS_CITY.CA_CITY.US . CA .
POSTAL_CODEAU_POSTAL_CODE.CA_POSTAL_CODE.UK_POSTAL_CODE.US_POSTAL_CODEAU . CA . GB . US
ADMINISTRATIVE_AREA_1CA_PROVINCE_OR_TERRITORY.US_STATE_OR_TERRITORYCA . US
ADMINISTRATIVE_AREA_2US_COUNTYUS
데이터 엔지니어는 ALTER TABLE 또는 ALTER VIEW 문에 태그 값을 수동으로 지정하여 보류 중인 태그 값을 사용할 수 있습니다. 또는 데이터 엔지니어가 ASSOCIATE_SEMANTIC_CATEGORY_TAGS 저장 프로시저를 호출하여 태그를 설정할 수 있습니다.
예를 들어, ALTER TABLE 문을 사용하여 PASSPORT 테이블 열의
PASSPORT태그 값을 수동으로 설정합니다.There are no changes to the overall classification process or the steps to classify a table, all tables in a schema, or all tables in a database.
팁
EXTRACT_SEMANTIC_CATEGORIES 함수를 ASSOCIATE_SEMANTIC_CATEGORY_TAGS 저장 프로시저에 대한 인자로 전달하는 경우 보류 중인 형식 지정 변경 사항으로 인해 워크플로가 중단되지 않도록 보장하려고 구성했을 수 있는 사용자 지정 처리를 다시 확인해야 합니다.
참조: 1110