Catégories sémantiques natives de la classification des données sensibles¶
Une catégorie sémantique est une étiquette qui décrit la signification ou le type d’informations dans une colonne de données, au-delà du type de données fondamental. Vous pouvez utiliser des catégories sémantiques pour ajouter un contexte métier et améliorer la gouvernance des données. Snowflake fournit les catégories sémantiques suivantes qui identifient les types courants d’attributs sensibles, tels que les noms et les adresses. Ces catégories sémantiques natives peuvent être regroupées dans les catégories de confidentialité suivantes :
Important
En application de diverses lois et réglementations, plusieurs catégories sémantiques peuvent être considérées comme des « données personnelles sensibles », des « catégories spéciales de données » ou des termes similaires. Ces catégories sémantiques peuvent nécessiter des protections ou des contrôles supplémentaires.
Pour catégoriser des attributs qui ne sont pas pris en charge de manière native, consultez Créer des catégories personnalisées pour les données sensibles.
À propos des sous-catégories sémantiques¶
Si Snowflake identifie que le type de données sensibles est spécifique à un pays, il enregistre une sous-catégorie sémantique dans les détails de la classification. Par exemple, un numéro de sécurité sociale (SSN) est un identificateur aux États-Unis (US), et sa sous-catégorie sémantique est NATIONAL_IDENTIFIER.
Vous pouvez trouver la sous-catégorie sémantique dans le champ Details de l’objet JSON renvoyé par le processus de classification. Pour plus d’informations sur l’affichage de cet objet de réponse, consultez Utiliser SQL pour voir les résultats.
Si le type de données sensibles n’est pas spécifique à un pays et est applicable à l’échelle globale, il n’a pas de sous-catégorie sémantique. Ce type de données sensibles est classé comme un identificateur global.
Identificateurs¶
Les catégories sémantiques d’identificateurs représentent des informations personnelles identifiables (PII) ou des éléments de données sensibles qui peuvent être utilisés pour identifier des personnes ou des entités.
Identificateurs globaux¶
Les catégories d’identificateurs globaux sont des catégories sémantiques qui ne sont pas spécifiques à un pays et qui sont applicables globalement.
Catégorie sémantique |
Remarques |
|---|---|
BANK_ACCOUNT |
Pour les pays en dehors du Canada, de la Nouvelle-Zélande et des États-Unis, la sous-catégorie sémantique est Numéro de compte bancaire internationale (IBAN). |
IMEI |
Un numéro d’identification international d’équipement mobile (IMEI) est un numéro unique qui identifie le modèle et le numéro de série d’un téléphone. |
IP_ADDRESS |
|
NAME |
|
PAYMENT_CARD |
|
URL |
Un identifiant uniforme de ressource (URL) est l’adresse unique d’une ressource (telle qu’un document ou un site Web) sur Internet. |
VIN |
Numéro d’identification d’un véhicule. |
Identificateurs spécifiques au pays¶
Catégorie sémantique |
Pays |
Sous-catégorie sémantique |
Remarques |
|---|---|---|---|
BANK_ACCOUNT |
Canada (CA) |
CA_BANK_ACCOUNT |
|
Nouvelle-Zélande (NZ) |
NZ_BANK_ACCOUNT |
||
États-Unis (US) |
US_BANK_ACCOUNT |
||
DRIVERS_LICENSE |
Autriche (AT) |
AT_DRIVERS_LICENSE |
|
Australie (AU) |
AU_DRIVERS_LICENSE |
||
Belgique (BE) |
BE_DRIVERS_LICENSE |
||
Bulgarie (BG) |
BG_DRIVERS_LICENSE |
||
Canada (CA) |
CA_DRIVERS_LICENSE |
||
Croatie (HR) |
HR_DRIVERS_LICENSE |
||
Chypre (CY) |
CY_DRIVERS_LICENSE |
||
Tchéquie (CZ) |
CZ_DRIVERS_LICENSE |
||
Danemark (DK) |
DK_DRIVERS_LICENSE |
||
Estonie (EE) |
EE_DRIVERS_LICENSE |
||
Finlande (FI) |
FI_DRIVERS_LICENSE |
||
France (FR) |
FR_DRIVERS_LICENSE |
||
Allemagne (DE) |
DE_DRIVERS_LICENSE |
||
Grèce (GR) |
GR_DRIVERS_LICENSE |
||
Hongrie (HU) |
HU_DRIVERS_LICENSE |
||
Inde (IN) |
IN_DRIVERS_LICENSE |
||
Irlande (IE) |
IE_DRIVERS_LICENSE |
||
Italie (IT) |
IT_DRIVERS_LICENSE |
||
Lettonie (LV) |
LV_DRIVERS_LICENSE |
||
Lituanie (LT) |
LT_DRIVERS_LICENSE |
||
Luxembourg (LU) |
LU_DRIVERS_LICENSE |
||
Malte (MT) |
MT_DRIVERS_LICENSE |
||
Pays-Bas (NL) |
NL_DRIVERS_LICENSE |
||
Nouvelle-Zélande (NZ) |
NZ_DRIVERS_LICENSE |
||
Pologne (PL) |
PL_DRIVERS_LICENSE |
||
Portugal (PT) |
PT_DRIVERS_LICENSE |
||
Roumanie (RO) |
RO_DRIVERS_LICENSE |
||
Slovaquie (SK) |
SK_DRIVERS_LICENSE |
||
Slovénie (SI) |
SI_DRIVERS_LICENSE |
||
Espagne (ES) |
ES_DRIVERS_LICENSE |
||
Suède (SE) |
SE_DRIVERS_LICENSE |
||
États-Unis (US) |
US_DRIVERS_LICENSE |
||
MEDICARE_NUMBER |
Australie (AU) |
AU_MEDICARE_NUMBER |
|
Nouvelle-Zélande (NZ) |
NZ_NHI_NUMBER |
||
NATIONAL_IDENTIFIER |
Autriche (AT) |
AT_IDENTITY_CARD
AT_SSN
|
|
Belgique (BE) |
BE_NATIONAL_NUMBER |
||
Bulgarie (BG) |
BG_UNIFORM_CIVIL_NUMBER |
||
Canada (CA) |
CA_SOCIAL_INSURANCE_NUMBER |
||
Croatie (HR) |
HR_PERSONAL_IDENTIFICATION_NUMBER |
||
Chypre (CY) |
CY_IDENTITY_CARD |
||
Tchéquie (CZ) |
CZ_PERSONAL_IDENTITY_NUMBER |
||
Danemark (DK) |
DK_PERSONAL_IDENTIFICATION_NUMBER |
||
Estonie (EE) |
EE_PERSONAL_IDENTIFICATION_CODE |
||
Finlande (FI) |
FI_NATIONAL_IDENTITY_CARD |
||
France (FR) |
FR_CNI
FR_SSN
|
Le FR_SSN est également connu sous le nom de numéro INSEE. |
|
Allemagne (DE) |
DE_IDENTITY_CARD |
||
Grèce (GR) |
GR_NATIONAL_IDENTITY_CARD
GR_SSN
|
Le GR_SSN est également connu sous le nom de numéro AMKA. |
|
Hongrie (HU) |
HU_PERSONAL_IDENTIFICATION_NUMBER
HU_SSN
|
Le HU_SSN est également connu sous le nom de numéro TAJ. |
|
Inde (IN) |
IN_PAN
IN_AADHAAR
IN_VOTER_ID
|
||
Irlande (IE) |
IE_PERSONAL_PUBLIC_SERVICE_NUMBER |
||
Lettonie (LV) |
LV_PERSONAL_CODE |
||
Lituanie (LT) |
LT_PERSONAL_CODE |
||
Luxembourg (LU) |
LU_NATIONAL_IDENTIFICATION_NUMBER_NATURAL_PERSONS
LU_NATIONAL_IDENTIFICATION_NUMBER_NON_NATURAL_PERSONS
|
||
Malte (MT) |
MT_IDENTITY_CARD |
||
Pays-Bas (NL) |
NL_CITIZEN_SERVICE_NUMBER |
||
Nouvelle-Zélande (NZ) |
NZ_STUDENT_NUMBER |
||
Pologne (PL) |
PL_NATIONAL_ID |
||
Portugal (PT) |
PT_CITIZEN_CARD_NUMBER |
||
Roumanie (RO) |
RO_PERSONAL_NUMERIC_CODE |
||
Singapour (SG) |
SG_NATIONAL_REGISTRATION_IDENTITY_CARD |
||
Slovaquie (SK) |
SK_PERSONAL_NUMBER |
||
Slovénie (SI) |
SI_UNIQUE_MASTER_CITIZEN_NUMBER |
||
Espagne (ES) |
ES_DNI
ES_SSN
|
||
Suède (SE) |
SE_NATIONAL_ID |
||
Royaume-Uni (UK) |
UK_NATIONAL_INSURANCE_NUMBER |
||
États-Unis (US) |
US_SSN |
||
ORGANIZATION_IDENTIFIER |
Australie (AU) |
AU_BUSINESS_NUMBER
AU_COMPANY_NUMBER
|
|
Nouvelle-Zélande (NZ) |
NZ_BUSINESS_NUMBER |
||
Singapour (SG) |
SG_UNIQUE_ENTITY_NUMBER |
||
PASSPORT |
Australie (AU) |
AU_PASSPORT |
|
Autriche (AT) |
AT_PASSPORT |
||
Belgique (BE) |
BE_PASSPORT |
||
Bulgarie (BG) |
BG_PASSPORT |
||
Canada (CA) |
CA_PASSPORT |
||
Croatie (HR) |
HR_PASSPORT |
||
Chypre (CY) |
CY_PASSPORT |
||
Tchéquie (CZ) |
CZ_PASSPORT |
||
Danemark (DK) |
DK_PASSPORT |
||
Estonie (EE) |
EE_PASSPORT |
||
Finlande (FI) |
FI_PASSPORT |
||
France (FR) |
FR_PASSPORT |
||
Allemagne (DE) |
DE_PASSPORT |
||
Grèce (GR) |
GR_PASSPORT |
||
Hongrie (HU) |
HU_PASSPORT |
||
Irlande (IE) |
IE_PASSPORT |
||
Italie (IT) |
IT_PASSPORT |
||
Lettonie (LV) |
LV_PASSPORT |
||
Lituanie (LT) |
LT_PASSPORT |
||
Luxembourg (LU) |
LU_PASSPORT |
||
Malte (MT) |
MT_PASSPORT |
||
Pays-Bas (NL) |
NL_PASSPORT |
||
Nouvelle-Zélande (NZ) |
NZ_PASSPORT |
||
Pologne (PL) |
PL_PASSPORT |
||
Portugal (PT) |
PT_PASSPORT |
||
Roumanie (RO) |
RO_PASSPORT |
||
Singapour (SG) |
SG_PASSPORT |
||
Slovaquie (SK) |
SK_PASSPORT |
||
Slovénie (SI) |
SI_PASSPORT |
||
Espagne (ES) |
ES_PASSPORT |
||
Suède (SE) |
SE_PASSPORT |
||
États-Unis (US) |
US_PASSPORT |
||
PHONE_NUMBER |
Australie (AU) |
AU_PHONE_NUMBER |
|
Canada (CA) |
CA_PHONE_NUMBER |
||
Japon (JP) |
JP_PHONE_NUMBER |
||
Royaume-Uni (UK) |
UK_PHONE_NUMBER |
||
États-Unis (US) |
US_PHONE_NUMBER |
||
STREET_ADDRESS |
Canada (CA) |
CA_STREET_ADDRESS |
|
Nouvelle-Zélande (NZ) |
NZ_STREET_ADDRESS |
||
États-Unis (US) |
US_STREET_ADDRESS |
||
TAX_IDENTIFIER |
Australie (AU) |
AU_TAX_NUMBER |
|
Autriche (AT) |
AT_TAX_ID_NUMBER |
||
Chypre (CY) |
CY_TAX_ID_NUMBER |
||
France (FR) |
FR_TAX_ID_NUMBER |
||
Allemagne (DE) |
DE_TAX_ID_NUMBER |
||
Grèce (GR) |
GR_TAX_ID_NUMBER |
||
Hongrie (HU) |
HU_TAX_ID_NUMBER |
||
Inde (IN) |
IN_GST_NUMBER |
||
Italie (IT) |
IT_FISCAL_CODE |
||
Malte (MT) |
MT_TAX_ID_NUMBER |
||
Pays-Bas (NL) |
NL_TAX_ID_NUMBER |
||
Nouvelle-Zélande (NZ) |
NZ_INLAND_REVENUE_NUMBER |
||
Pologne (PL) |
PL_TAX_ID_NUMBER |
||
Portugal (PT) |
PT_TAX_ID_NUMBER |
||
Slovénie (SI) |
SI_TAX_ID_NUMBER |
||
Espagne (ES) |
ES_TAX_ID_NUMBER |
||
Suède (SE) |
SE_TAX_ID_NUMBER |
||
États-Unis (US) |
US_TAX_IDENTIFIER |
La sous-catégorie sémantique US_TAX_IDENTIFIER est un identificateur, car c’est l’ITIN d’un individu. La sous-catégorie EMPLOYER_IDENTIFICATION_NUMBER de la catégorie TAX_IDENTIFIER est un quasi-identificateur, car c’est l’EIN d’une entreprise. |
Quasi-identificateurs¶
Les quasi-identificateurs sont des attributs qui, pris isolément, ne permettent pas d’identifier de manière unique un individu, mais qui, combinés à d’autres données, peuvent être utilisés pour réidentifier une personne. Parmi les exemples de quasi-identificateurs, citons les informations démographiques, les données géographiques et les régions administratives.
Quasi-identificateurs globaux¶
Les quasi-identificateurs globaux sont des catégories sémantiques de quasi-identificateurs qui ne sont pas spécifiques à un pays et qui sont applicables à l’échelle globale.
Sous-catégorie sémantique |
|---|
AGE |
COUNTRY |
DATE_OF_BIRTH |
ETHNICITY |
GENDER |
LATITUDE |
LAT_LONG |
LONGITUDE |
MARITAL_STATUS |
OCCUPATION |
YEAR_OF_BIRTH |
Quasi-identificateurs spécifiques au pays¶
Catégorie sémantique |
Pays |
Sous-catégorie sémantique |
Remarques |
|---|---|---|---|
ADMINISTRATIVE_AREA_1 |
Canada (CA) |
CA_PROVINCE_OR_TERRITORY |
|
Nouvelle-Zélande (NZ) |
NZ_REGION |
||
États-Unis (US) |
US_STATE_OR_TERRITORY |
||
ADMINISTRATIVE_AREA_2 |
États-Unis (US) |
US_COUNTY |
|
CITY |
Canada (CA) |
CA_CITY |
|
Nouvelle-Zélande (NZ) |
NZ_CITY |
||
États-Unis (US) |
US_CITY |
||
POSTAL_CODE |
Australie (AU) |
AU_POSTAL_CODE |
|
Canada (CA) |
CA_POSTAL_CODE |
||
Japon (JP) |
JP_POSTAL_CODE |
||
Nouvelle-Zélande (NZ) |
NZ_POSTAL_CODE |
||
Suisse (CH) |
CH_POSTAL_CODE |
||
Royaume-Uni (UK) |
UK_POSTAL_CODE |
Contient des informations du secteur public sous licence Open Government Licence v3.0. |
|
États-Unis (US) |
US_POSTAL_CODE |
||
TAX_IDENTIFIER |
États-Unis (US) |
EMPLOYER_IDENTIFICATION_NUMBER |
La sous-catégorie sémantique EMPLOYER_IDENTIFICATION_NUMBER est un quasi-identifiant, et non un identificateur, car c’est l’EIN d’une entreprise. La sous-catégorie US_TAX_IDENTIFIER de la catégorie TAX_IDENTIFIER représente l’ITIN d’un individu, et est un identificateur. |
Informations sensibles¶
Les informations sensibles comprennent les éléments de données qui contiennent des détails confidentiels ou privés. Bien que les données n’identifient pas directement un individu, elles doivent être protégées en raison de leur nature sensible.
Informations sensibles globales¶
Catégorie sémantique |
|---|
SALARY |