Categorias semânticas nativas da classificação de dados confidenciais

Uma categoria semântica é um rótulo que descreve o significado ou o tipo de informação em uma coluna de dados, além do tipo de dados fundamental. Você pode usar categorias semânticas para adicionar contexto de negócios e aprimorar a governança de dados. O Snowflake fornece as seguintes categorias semânticas que identificam tipos comuns de atributos confidenciais, como nomes e endereços. Essas categorias semânticas nativas podem ser divididas nas seguintes categorias de privacidade:

Importante

De acordo com diversas leis e regulamentos, várias categorias semânticas podem ser consideradas «dados pessoais confidenciais», «categorias especiais de dados» ou termos semelhantes. Essas categorias semânticas podem exigir proteções ou controles adicionais.

Para classificar atributos que não são compatíveis nativamente, consulte Criar categorias personalizadas para dados confidenciais.

Sobre subcategorias semânticas

Se o Snowflake identificar que o tipo de dados confidenciais é específico de um país, ele registrará uma subcategoria semântica nos detalhes da classificação. Por exemplo, um número do seguro social (social security number, SSN) é um identificador nos Estados Unidos (US), e a subcategoria semântica dele é NATIONAL_IDENTIFIER.

Você pode encontrar a subcategoria semântica no campo Details do objeto JSON retornado pelo processo de classificação. Para obter mais informações sobre como visualizar esse objeto de resposta, consulte Usar SQL para visualizar os resultados.

Se o tipo de dados confidenciais não for específico de um país e for aplicável globalmente, ele não terá uma subcategoria semântica. Esse tipo de dados confidenciais é categorizado como um identificador global.

Identificadores

As categorias semânticas de identificadores representam informações de identificação pessoal (personally identifiable information, PII) ou elementos de dados confidenciais que podem ser utilizados ​​para identificar indivíduos ou entidades.

Identificadores globais

As categorias de identificadores globais são categorias semânticas que não são específicas de um país e são aplicáveis ​​globalmente.

Categoria semântica

Notas

BANK_ACCOUNT

Para países fora do Canadá, Nova Zelândia e Estados Unidos, a subcategoria semântica é número internacional de conta bancária (international bank account number, IBAN).

EMAIL

IMEI

Uma identidade internacional de equipamento móvel (international mobile equiment identity, IMEI) é um número único que identifica o modelo e o número de série de um telefone.

IP_ADDRESS

NAME

PAYMENT_CARD

URL

Um localizador uniforme de recursos (uniform resource locator, URL) é o endereço único de um recurso (como um documento ou site) na Internet.

VIN

O número de identificação do veículo.

Identificadores específicos de cada país

Categoria semântica

País

Subcategoria semântica

Notas

BANK_ACCOUNT

Canadá (CA)

CA_BANK_ACCOUNT

Nova Zelândia (NZ)

NZ_BANK_ACCOUNT

Estados Unidos (US)

US_BANK_ACCOUNT

DRIVERS_LICENSE

Áustria (AT)

AT_DRIVERS_LICENSE

Austrália (AU)

AU_DRIVERS_LICENSE

Bélgica (BE)

BE_DRIVERS_LICENSE

Bulgária (BG)

BG_DRIVERS_LICENSE

Canadá (CA)

CA_DRIVERS_LICENSE

Croácia (HR)

HR_DRIVERS_LICENSE

Chipre (CY)

CY_DRIVERS_LICENSE

Tchéquia (CZ)

CZ_DRIVERS_LICENSE

Dinamarca (DK)

DK_DRIVERS_LICENSE

Estônia (EE)

EE_DRIVERS_LICENSE

Finlândia (FI)

FI_DRIVERS_LICENSE

França (FR)

FR_DRIVERS_LICENSE

Alemanha (DE)

DE_DRIVERS_LICENSE

Grécia (GR)

GR_DRIVERS_LICENSE

Hungria (HU)

HU_DRIVERS_LICENSE

Índia (IN)

IN_DRIVERS_LICENSE

Irlanda (IE)

IE_DRIVERS_LICENSE

Itália (IT)

IT_DRIVERS_LICENSE

Letônia (LV)

LV_DRIVERS_LICENSE

Lituânia (LT)

LT_DRIVERS_LICENSE

Luxemburgo (LU)

LU_DRIVERS_LICENSE

Malta (MT)

MT_DRIVERS_LICENSE

Países Baixos (NL)

NL_DRIVERS_LICENSE

Nova Zelândia (NZ)

NZ_DRIVERS_LICENSE

Polônia (PL)

PL_DRIVERS_LICENSE

Portugal (PT)

PT_DRIVERS_LICENSE

Romênia (RO)

RO_DRIVERS_LICENSE

Eslováquia (SK)

SK_DRIVERS_LICENSE

Eslovênia (SI)

SI_DRIVERS_LICENSE

Espanha (ES)

ES_DRIVERS_LICENSE

Suécia (SE)

SE_DRIVERS_LICENSE

Estados Unidos (US)

US_DRIVERS_LICENSE

MEDICARE_NUMBER

Austrália (AU)

AU_MEDICARE_NUMBER

Nova Zelândia (NZ)

NZ_NHI_NUMBER

NATIONAL_IDENTIFIER

Áustria (AT)

AT_IDENTITY_CARD
AT_SSN

Bélgica (BE)

BE_NATIONAL_NUMBER

Bulgária (BG)

BG_UNIFORM_CIVIL_NUMBER

Canadá (CA)

CA_SOCIAL_INSURANCE_NUMBER

Croácia (HR)

HR_PERSONAL_IDENTIFICATION_NUMBER

Chipre (CY)

CY_IDENTITY_CARD

Tchéquia (CZ)

CZ_PERSONAL_IDENTITY_NUMBER

Dinamarca (DK)

DK_PERSONAL_IDENTIFICATION_NUMBER

Estônia (EE)

EE_PERSONAL_IDENTIFICATION_CODE

Finlândia (FI)

FI_NATIONAL_IDENTITY_CARD

França (FR)

FR_CNI
FR_SSN

O FR_SSN também é conhecido como o número INSEE.

Alemanha (DE)

DE_IDENTITY_CARD

Grécia (GR)

GR_NATIONAL_IDENTITY_CARD
GR_SSN

O GR_SSN também é conhecido como o número AMKA.

Hungria (HU)

HU_PERSONAL_IDENTIFICATION_NUMBER
HU_SSN

O HU_SSN também é conhecido como o número TAJ.

Índia (IN)

IN_PAN
IN_AADHAAR
IN_VOTER_ID

Irlanda (IE)

IE_PERSONAL_PUBLIC_SERVICE_NUMBER

Letônia (LV)

LV_PERSONAL_CODE

Lituânia (LT)

LT_PERSONAL_CODE

Luxemburgo (LU)

LU_NATIONAL_IDENTIFICATION_NUMBER_NATURAL_PERSONS
LU_NATIONAL_IDENTIFICATION_NUMBER_NON_NATURAL_PERSONS

Malta (MT)

MT_IDENTITY_CARD

Países Baixos (NL)

NL_CITIZEN_SERVICE_NUMBER

Nova Zelândia (NZ)

NZ_STUDENT_NUMBER

Polônia (PL)

PL_NATIONAL_ID

Portugal (PT)

PT_CITIZEN_CARD_NUMBER

Romênia (RO)

RO_PERSONAL_NUMERIC_CODE

Singapura (SG)

SG_NATIONAL_REGISTRATION_IDENTITY_CARD

Eslováquia (SK)

SK_PERSONAL_NUMBER

Eslovênia (SI)

SI_UNIQUE_MASTER_CITIZEN_NUMBER

Espanha (ES)

ES_DNI
ES_SSN

Suécia (SE)

SE_NATIONAL_ID

Reino Unido (UK)

UK_NATIONAL_INSURANCE_NUMBER

Estados Unidos (US)

US_SSN

ORGANIZATION_IDENTIFIER

Austrália (AU)

AU_BUSINESS_NUMBER
AU_COMPANY_NUMBER

Nova Zelândia (NZ)

NZ_BUSINESS_NUMBER

Singapura (SG)

SG_UNIQUE_ENTITY_NUMBER

PASSPORT

Austrália (AU)

AU_PASSPORT

Áustria (AT)

AT_PASSPORT

Bélgica (BE)

BE_PASSPORT

Bulgária (BG)

BG_PASSPORT

Canadá (CA)

CA_PASSPORT

Croácia (HR)

HR_PASSPORT

Chipre (CY)

CY_PASSPORT

Tchéquia (CZ)

CZ_PASSPORT

Dinamarca (DK)

DK_PASSPORT

Estônia (EE)

EE_PASSPORT

Finlândia (FI)

FI_PASSPORT

França (FR)

FR_PASSPORT

Alemanha (DE)

DE_PASSPORT

Grécia (GR)

GR_PASSPORT

Hungria (HU)

HU_PASSPORT

Irlanda (IE)

IE_PASSPORT

Itália (IT)

IT_PASSPORT

Letônia (LV)

LV_PASSPORT

Lituânia (LT)

LT_PASSPORT

Luxemburgo (LU)

LU_PASSPORT

Malta (MT)

MT_PASSPORT

Países Baixos (NL)

NL_PASSPORT

Nova Zelândia (NZ)

NZ_PASSPORT

Polônia (PL)

PL_PASSPORT

Portugal (PT)

PT_PASSPORT

Romênia (RO)

RO_PASSPORT

Singapura (SG)

SG_PASSPORT

Eslováquia (SK)

SK_PASSPORT

Eslovênia (SI)

SI_PASSPORT

Espanha (ES)

ES_PASSPORT

Suécia (SE)

SE_PASSPORT

Estados Unidos (US)

US_PASSPORT

PHONE_NUMBER

Austrália (AU)

AU_PHONE_NUMBER

Canadá (CA)

CA_PHONE_NUMBER

Japão (JP)

JP_PHONE_NUMBER

Reino Unido (UK)

UK_PHONE_NUMBER

Estados Unidos (US)

US_PHONE_NUMBER

STREET_ADDRESS

Canadá (CA)

CA_STREET_ADDRESS

Nova Zelândia (NZ)

NZ_STREET_ADDRESS

Estados Unidos (US)

US_STREET_ADDRESS

TAX_IDENTIFIER

Austrália (AU)

AU_TAX_NUMBER

Áustria (AT)

AT_TAX_ID_NUMBER

Chipre (CY)

CY_TAX_ID_NUMBER

França (FR)

FR_TAX_ID_NUMBER

Alemanha (DE)

DE_TAX_ID_NUMBER

Grécia (GR)

GR_TAX_ID_NUMBER

Hungria (HU)

HU_TAX_ID_NUMBER

Índia (IN)

IN_GST_NUMBER

Itália (IT)

IT_FISCAL_CODE

Malta (MT)

MT_TAX_ID_NUMBER

Países Baixos (NL)

NL_TAX_ID_NUMBER

Nova Zelândia (NZ)

NZ_INLAND_REVENUE_NUMBER

Polônia (PL)

PL_TAX_ID_NUMBER

Portugal (PT)

PT_TAX_ID_NUMBER

Eslovênia (SI)

SI_TAX_ID_NUMBER

Espanha (ES)

ES_TAX_ID_NUMBER

Suécia (SE)

SE_TAX_ID_NUMBER

Estados Unidos (US)

US_TAX_IDENTIFIER

A subcategoria semântica US_TAX_IDENTIFIER é um identificador porque é o ITIN de um indivíduo. A subcategoria EMPLOYER_IDENTIFICATION_NUMBER da categoria TAX_IDENTIFIER é quase um identificador porque se trata do EIN de uma empresa.

Quase identificadores

Quase identificadores são atributos que, por si só, não identificam exclusivamente um indivíduo, mas, quando combinados com outros dados, podem ser utilizados ​​para reidentificar alguém. Exemplos de quase identificadores incluem informações demográficas, dados geográficos e regiões administrativas.

Quase identificadores globais

Quase identificadores globais são categorias semânticas de quase identificadores que não são específicas de um país e são aplicáveis ​​globalmente.

Subcategoria semântica

AGE

COUNTRY

DATE_OF_BIRTH

ETHNICITY

GENDER

LATITUDE

LAT_LONG

LONGITUDE

MARITAL_STATUS

OCCUPATION

YEAR_OF_BIRTH

Quase identificadores específicos de cada país

Categoria semântica

País

Subcategoria semântica

Notas

ADMINISTRATIVE_AREA_1

Canadá (CA)

CA_PROVINCE_OR_TERRITORY

Nova Zelândia (NZ)

NZ_REGION

Estados Unidos (US)

US_STATE_OR_TERRITORY

ADMINISTRATIVE_AREA_2

Estados Unidos (US)

US_COUNTY

CITY

Canadá (CA)

CA_CITY

Nova Zelândia (NZ)

NZ_CITY

Estados Unidos (US)

US_CITY

POSTAL_CODE

Austrália (AU)

AU_POSTAL_CODE

Canadá (CA)

CA_POSTAL_CODE

Japão (JP)

JP_POSTAL_CODE

Nova Zelândia (NZ)

NZ_POSTAL_CODE

Suíça (CH)

CH_POSTAL_CODE

Reino Unido (UK)

UK_POSTAL_CODE

Contém informações do setor público licenciadas conforme a Open Government Licence v3.0.

Estados Unidos (US)

US_POSTAL_CODE

TAX_IDENTIFIER

Estados Unidos (US)

EMPLOYER_IDENTIFICATION_NUMBER

A subcategoria EMPLOYER_IDENTIFICATION_NUMBER é quase um identificador, não um identificador, porque se trata do EIN de uma empresa. A subcategoria US_TAX_IDENTIFIER da categoria TAX_IDENTIFIER representa o ITIN de um indivíduo e é um identificador.

Informações confidenciais

Informações confidenciais incluem elementos de dados que contêm detalhes confidenciais ou privados. Embora os dados não identifiquem diretamente um indivíduo, eles exigem proteção devido à natureza sensível que eles têm.

Informações confidenciais globais

Categoria semântica

SALARY