Catégories sémantiques natives de la classification des données sensibles

Une catégorie sémantique est une étiquette qui décrit la signification ou le type d’informations dans une colonne de données, au-delà du type de données fondamental. Vous pouvez utiliser des catégories sémantiques pour ajouter un contexte métier et améliorer la gouvernance des données. Snowflake fournit les catégories sémantiques suivantes qui identifient les types courants d’attributs sensibles, tels que les noms et les adresses. Ces catégories sémantiques natives peuvent être regroupées dans les catégories de confidentialité suivantes :

Important

En application de diverses lois et réglementations, plusieurs catégories sémantiques peuvent être considérées comme des « données personnelles sensibles », des « catégories spéciales de données » ou des termes similaires. Ces catégories sémantiques peuvent nécessiter des protections ou des contrôles supplémentaires.

Pour catégoriser des attributs qui ne sont pas pris en charge de manière native, consultez Créer des catégories personnalisées pour les données sensibles.

À propos des sous-catégories sémantiques

Si Snowflake identifie que le type de données sensibles est spécifique à un pays, il enregistre une sous-catégorie sémantique dans les détails de la classification. Par exemple, un numéro de sécurité sociale (SSN) est un identificateur aux États-Unis (US), et sa sous-catégorie sémantique est NATIONAL_IDENTIFIER.

Vous pouvez trouver la sous-catégorie sémantique dans le champ Details de l’objet JSON renvoyé par le processus de classification. Pour plus d’informations sur l’affichage de cet objet de réponse, consultez Utiliser SQL pour voir les résultats.

Si le type de données sensibles n’est pas spécifique à un pays et est applicable à l’échelle globale, il n’a pas de sous-catégorie sémantique. Ce type de données sensibles est classé comme un identificateur global.

Identificateurs

Les catégories sémantiques d’identificateurs représentent des informations personnelles identifiables (PII) ou des éléments de données sensibles qui peuvent être utilisés pour identifier des personnes ou des entités.

Identificateurs globaux

Les catégories d’identificateurs globaux sont des catégories sémantiques qui ne sont pas spécifiques à un pays et qui sont applicables globalement.

Catégorie sémantique

Remarques

BANK_ACCOUNT

Pour les pays en dehors du Canada, de la Nouvelle-Zélande et des États-Unis, la sous-catégorie sémantique est Numéro de compte bancaire internationale (IBAN).

EMAIL

IMEI

Un numéro d’identification international d’équipement mobile (IMEI) est un numéro unique qui identifie le modèle et le numéro de série d’un téléphone.

IP_ADDRESS

NAME

PAYMENT_CARD

URL

Un identifiant uniforme de ressource (URL) est l’adresse unique d’une ressource (telle qu’un document ou un site Web) sur Internet.

VIN

Numéro d’identification d’un véhicule.

Identificateurs spécifiques au pays

Catégorie sémantique

Pays

Sous-catégorie sémantique

Remarques

BANK_ACCOUNT

Canada (CA)

CA_BANK_ACCOUNT

Nouvelle-Zélande (NZ)

NZ_BANK_ACCOUNT

États-Unis (US)

US_BANK_ACCOUNT

DRIVERS_LICENSE

Autriche (AT)

AT_DRIVERS_LICENSE

Australie (AU)

AU_DRIVERS_LICENSE

Belgique (BE)

BE_DRIVERS_LICENSE

Bulgarie (BG)

BG_DRIVERS_LICENSE

Canada (CA)

CA_DRIVERS_LICENSE

Croatie (HR)

HR_DRIVERS_LICENSE

Chypre (CY)

CY_DRIVERS_LICENSE

Tchéquie (CZ)

CZ_DRIVERS_LICENSE

Danemark (DK)

DK_DRIVERS_LICENSE

Estonie (EE)

EE_DRIVERS_LICENSE

Finlande (FI)

FI_DRIVERS_LICENSE

France (FR)

FR_DRIVERS_LICENSE

Allemagne (DE)

DE_DRIVERS_LICENSE

Grèce (GR)

GR_DRIVERS_LICENSE

Hongrie (HU)

HU_DRIVERS_LICENSE

Inde (IN)

IN_DRIVERS_LICENSE

Irlande (IE)

IE_DRIVERS_LICENSE

Italie (IT)

IT_DRIVERS_LICENSE

Lettonie (LV)

LV_DRIVERS_LICENSE

Lituanie (LT)

LT_DRIVERS_LICENSE

Luxembourg (LU)

LU_DRIVERS_LICENSE

Malte (MT)

MT_DRIVERS_LICENSE

Pays-Bas (NL)

NL_DRIVERS_LICENSE

Nouvelle-Zélande (NZ)

NZ_DRIVERS_LICENSE

Pologne (PL)

PL_DRIVERS_LICENSE

Portugal (PT)

PT_DRIVERS_LICENSE

Roumanie (RO)

RO_DRIVERS_LICENSE

Slovaquie (SK)

SK_DRIVERS_LICENSE

Slovénie (SI)

SI_DRIVERS_LICENSE

Espagne (ES)

ES_DRIVERS_LICENSE

Suède (SE)

SE_DRIVERS_LICENSE

États-Unis (US)

US_DRIVERS_LICENSE

MEDICARE_NUMBER

Australie (AU)

AU_MEDICARE_NUMBER

Nouvelle-Zélande (NZ)

NZ_NHI_NUMBER

NATIONAL_IDENTIFIER

Autriche (AT)

AT_IDENTITY_CARD
AT_SSN

Belgique (BE)

BE_NATIONAL_NUMBER

Bulgarie (BG)

BG_UNIFORM_CIVIL_NUMBER

Canada (CA)

CA_SOCIAL_INSURANCE_NUMBER

Croatie (HR)

HR_PERSONAL_IDENTIFICATION_NUMBER

Chypre (CY)

CY_IDENTITY_CARD

Tchéquie (CZ)

CZ_PERSONAL_IDENTITY_NUMBER

Danemark (DK)

DK_PERSONAL_IDENTIFICATION_NUMBER

Estonie (EE)

EE_PERSONAL_IDENTIFICATION_CODE

Finlande (FI)

FI_NATIONAL_IDENTITY_CARD

France (FR)

FR_CNI
FR_SSN

Le FR_SSN est également connu sous le nom de numéro INSEE.

Allemagne (DE)

DE_IDENTITY_CARD

Grèce (GR)

GR_NATIONAL_IDENTITY_CARD
GR_SSN

Le GR_SSN est également connu sous le nom de numéro AMKA.

Hongrie (HU)

HU_PERSONAL_IDENTIFICATION_NUMBER
HU_SSN

Le HU_SSN est également connu sous le nom de numéro TAJ.

Inde (IN)

IN_PAN
IN_AADHAAR
IN_VOTER_ID

Irlande (IE)

IE_PERSONAL_PUBLIC_SERVICE_NUMBER

Lettonie (LV)

LV_PERSONAL_CODE

Lituanie (LT)

LT_PERSONAL_CODE

Luxembourg (LU)

LU_NATIONAL_IDENTIFICATION_NUMBER_NATURAL_PERSONS
LU_NATIONAL_IDENTIFICATION_NUMBER_NON_NATURAL_PERSONS

Malte (MT)

MT_IDENTITY_CARD

Pays-Bas (NL)

NL_CITIZEN_SERVICE_NUMBER

Nouvelle-Zélande (NZ)

NZ_STUDENT_NUMBER

Pologne (PL)

PL_NATIONAL_ID

Portugal (PT)

PT_CITIZEN_CARD_NUMBER

Roumanie (RO)

RO_PERSONAL_NUMERIC_CODE

Singapour (SG)

SG_NATIONAL_REGISTRATION_IDENTITY_CARD

Slovaquie (SK)

SK_PERSONAL_NUMBER

Slovénie (SI)

SI_UNIQUE_MASTER_CITIZEN_NUMBER

Espagne (ES)

ES_DNI
ES_SSN

Suède (SE)

SE_NATIONAL_ID

Royaume-Uni (UK)

UK_NATIONAL_INSURANCE_NUMBER

États-Unis (US)

US_SSN

ORGANIZATION_IDENTIFIER

Australie (AU)

AU_BUSINESS_NUMBER
AU_COMPANY_NUMBER

Nouvelle-Zélande (NZ)

NZ_BUSINESS_NUMBER

Singapour (SG)

SG_UNIQUE_ENTITY_NUMBER

PASSPORT

Australie (AU)

AU_PASSPORT

Autriche (AT)

AT_PASSPORT

Belgique (BE)

BE_PASSPORT

Bulgarie (BG)

BG_PASSPORT

Canada (CA)

CA_PASSPORT

Croatie (HR)

HR_PASSPORT

Chypre (CY)

CY_PASSPORT

Tchéquie (CZ)

CZ_PASSPORT

Danemark (DK)

DK_PASSPORT

Estonie (EE)

EE_PASSPORT

Finlande (FI)

FI_PASSPORT

France (FR)

FR_PASSPORT

Allemagne (DE)

DE_PASSPORT

Grèce (GR)

GR_PASSPORT

Hongrie (HU)

HU_PASSPORT

Irlande (IE)

IE_PASSPORT

Italie (IT)

IT_PASSPORT

Lettonie (LV)

LV_PASSPORT

Lituanie (LT)

LT_PASSPORT

Luxembourg (LU)

LU_PASSPORT

Malte (MT)

MT_PASSPORT

Pays-Bas (NL)

NL_PASSPORT

Nouvelle-Zélande (NZ)

NZ_PASSPORT

Pologne (PL)

PL_PASSPORT

Portugal (PT)

PT_PASSPORT

Roumanie (RO)

RO_PASSPORT

Singapour (SG)

SG_PASSPORT

Slovaquie (SK)

SK_PASSPORT

Slovénie (SI)

SI_PASSPORT

Espagne (ES)

ES_PASSPORT

Suède (SE)

SE_PASSPORT

États-Unis (US)

US_PASSPORT

PHONE_NUMBER

Australie (AU)

AU_PHONE_NUMBER

Canada (CA)

CA_PHONE_NUMBER

Japon (JP)

JP_PHONE_NUMBER

Royaume-Uni (UK)

UK_PHONE_NUMBER

États-Unis (US)

US_PHONE_NUMBER

STREET_ADDRESS

Canada (CA)

CA_STREET_ADDRESS

Nouvelle-Zélande (NZ)

NZ_STREET_ADDRESS

États-Unis (US)

US_STREET_ADDRESS

TAX_IDENTIFIER

Australie (AU)

AU_TAX_NUMBER

Autriche (AT)

AT_TAX_ID_NUMBER

Chypre (CY)

CY_TAX_ID_NUMBER

France (FR)

FR_TAX_ID_NUMBER

Allemagne (DE)

DE_TAX_ID_NUMBER

Grèce (GR)

GR_TAX_ID_NUMBER

Hongrie (HU)

HU_TAX_ID_NUMBER

Inde (IN)

IN_GST_NUMBER

Italie (IT)

IT_FISCAL_CODE

Malte (MT)

MT_TAX_ID_NUMBER

Pays-Bas (NL)

NL_TAX_ID_NUMBER

Nouvelle-Zélande (NZ)

NZ_INLAND_REVENUE_NUMBER

Pologne (PL)

PL_TAX_ID_NUMBER

Portugal (PT)

PT_TAX_ID_NUMBER

Slovénie (SI)

SI_TAX_ID_NUMBER

Espagne (ES)

ES_TAX_ID_NUMBER

Suède (SE)

SE_TAX_ID_NUMBER

États-Unis (US)

US_TAX_IDENTIFIER

La sous-catégorie sémantique US_TAX_IDENTIFIER est un identificateur, car c’est l’ITIN d’un individu. La sous-catégorie EMPLOYER_IDENTIFICATION_NUMBER de la catégorie TAX_IDENTIFIER est un quasi-identificateur, car c’est l’EIN d’une entreprise.

Quasi-identificateurs

Les quasi-identificateurs sont des attributs qui, pris isolément, ne permettent pas d’identifier de manière unique un individu, mais qui, combinés à d’autres données, peuvent être utilisés pour réidentifier une personne. Parmi les exemples de quasi-identificateurs, citons les informations démographiques, les données géographiques et les régions administratives.

Quasi-identificateurs globaux

Les quasi-identificateurs globaux sont des catégories sémantiques de quasi-identificateurs qui ne sont pas spécifiques à un pays et qui sont applicables à l’échelle globale.

Sous-catégorie sémantique

AGE

COUNTRY

DATE_OF_BIRTH

ETHNICITY

GENDER

LATITUDE

LAT_LONG

LONGITUDE

MARITAL_STATUS

OCCUPATION

YEAR_OF_BIRTH

Quasi-identificateurs spécifiques au pays

Catégorie sémantique

Pays

Sous-catégorie sémantique

Remarques

ADMINISTRATIVE_AREA_1

Canada (CA)

CA_PROVINCE_OR_TERRITORY

Nouvelle-Zélande (NZ)

NZ_REGION

États-Unis (US)

US_STATE_OR_TERRITORY

ADMINISTRATIVE_AREA_2

États-Unis (US)

US_COUNTY

CITY

Canada (CA)

CA_CITY

Nouvelle-Zélande (NZ)

NZ_CITY

États-Unis (US)

US_CITY

POSTAL_CODE

Australie (AU)

AU_POSTAL_CODE

Canada (CA)

CA_POSTAL_CODE

Japon (JP)

JP_POSTAL_CODE

Nouvelle-Zélande (NZ)

NZ_POSTAL_CODE

Suisse (CH)

CH_POSTAL_CODE

Royaume-Uni (UK)

UK_POSTAL_CODE

Contient des informations du secteur public sous licence Open Government Licence v3.0.

États-Unis (US)

US_POSTAL_CODE

TAX_IDENTIFIER

États-Unis (US)

EMPLOYER_IDENTIFICATION_NUMBER

La sous-catégorie sémantique EMPLOYER_IDENTIFICATION_NUMBER est un quasi-identifiant, et non un identificateur, car c’est l’EIN d’une entreprise. La sous-catégorie US_TAX_IDENTIFIER de la catégorie TAX_IDENTIFIER représente l’ITIN d’un individu, et est un identificateur.

Informations sensibles

Les informations sensibles comprennent les éléments de données qui contiennent des détails confidentiels ou privés. Bien que les données n’identifient pas directement un individu, elles doivent être protégées en raison de leur nature sensible.

Informations sensibles globales

Catégorie sémantique

SALARY