Afficher et suivre les résultats de la classification des données sensibles¶
Cette rubrique décrit les moyens par lesquels vous pouvez afficher et suivre les résultats de la classification des données sensibles et la manière dont vous pouvez suivre les balises de classification pour surveiller les données sensibles.
Utiliser le Centre de confiance pour afficher les résultats de la classification¶
Pour voir les résultats de la classification des données sensibles dans le Centre de confiance, procédez comme suit :
Connectez-vous à l”Snowsight en tant qu’utilisateur ayant les privilèges requis.
Dans le menu de navigation, sélectionnez Governance & security » Trust Center.
Sélectionnez l’onglet Data Security.
Effectuez au choix :
Si vous souhaitez obtenir des informations de haut niveau sur la sécurité de vos données sensibles, sélectionnez l’onglet Dashboard. Pour plus d’informations, voir Examiner la page Tableau de bord.
Si vous souhaitez dresser la liste de toutes les tables et vues qui ont été classées comme contenant des données sensibles, sélectionnez l’onglet Sensitive objects.
Lorsque la page s’ouvre, sélectionnez une table pour voir quelles colonnes contiennent des données sensibles, la catégorie sémantique de ces colonnes, et si des balises ont été appliquées aux colonnes.
Examiner la page Tableau de bord¶
La page Dashboard fournit des informations de haut niveau sur la sécurité de vos données sensibles, notamment le nombre de bases de données et de tables qui ont été classées. La page contient les vignettes suivantes :
Vignette |
Description |
|---|---|
Objects by compliance category |
Identifie le nombre d’objets contenant des données susceptibles d’être soumises à une réglementation ou à une autre norme de conformité, en fonction du type d’informations contenues dans l’objet.
|
Objects by semantic category |
Identifie les catégories sémantiques les plus courantes et le nombre d’objets contenant des données appartenant à ces catégories. |
Databases monitored by auto-classification |
Identifie les bases de données actuellement surveillées par la classification des données sensibles. Une base de données est partiellement surveillée si un utilisateur a utilisé SQL pour définir un profil de classification directement sur un schéma dans la base de données plutôt que de définir le profil au niveau de la base de données. |
Classification status |
Identifie si toutes les bases de données actuellement surveillées pour les données sensibles ont été classées. |
Sensitive data masking status |
Identifie si les données sensibles sont protégées par une politique de masquage. La politique de masquage peut être une politique basée sur des balises ou une politique qui a été appliquée manuellement à la colonne. Une table est entièrement masquée si chaque colonne contenant des données sensibles est associée à une politique de masquage. Une table est partiellement masquée si seules certaines colonnes contenant des données sensibles sont associées à une politique de masquage. |
Catégories de conformité et leurs catégories sémantiques¶
Note
Vous êtes uniquement responsable de la détermination des réglementations ou des lois qui s’appliquent à vos données et de la garantie de la conformité avec les réglementations ou les lois applicables. Les catégories de conformité au sein de la classification des données sensibles sont conçues pour vous fournir un ensemble d’outils prêts à l’emploi pour faciliter vos efforts, mais elles ne sont pas exhaustives. Seules les catégories sémantiques natives prises en charge par Snowflake sont mappées à une catégorie de conformité.
Avertissement
Les exigences HIPAA en matière de données imposent aux entités et aux partenaires commerciaux concernés de protéger la confidentialité, l’intégrité et la disponibilité des informations médicales protégées (PHI) au moyen de mesures de sécurité administratives, physiques et techniques strictes. La non-conformité à l’HIPAA peut entraîner des sanctions importantes. Les catégories sémantiques liées aux PHI sont incluses dans Informations sensibles.
Utilisez le tableau suivant pour comprendre la Objects by compliance category vignette sur la page Tableau de bord.
Catégorie de conformité |
Catégorie sémantique native |
Paramètre régional |
|---|---|---|
Loi sur la protection des données personnelles numériques (DPDPA) |
DATE_OF_BIRTH |
s/o |
DRIVERS_LICENSE |
Inde (IN) |
|
s/o |
||
NAME |
s/o |
|
NATIONAL_IDENTIFIER |
Inde (IN) |
|
PHONE_NUMBER |
s/o |
|
STREET_ADDRESS |
s/o |
|
TAX_IDENTIFIER |
Inde (IN) |
|
Règlement général sur la protection des données (GDPR) |
AGE |
s/o |
DRIVERS_LICENSE |
Allemagne (DE), Autriche (AT), Belgique (BE), Bulgarie (BG), Chypre (CY), Croatie (HR), Danemark (DK), Espagne (ES), Estonie (EE), Finlande (FI), France (FR), Grèce (GR), Hongrie (HU), Irlande (IE), Italie (IT), Lettonie (LV), Lituanie (LT), Luxembourg (LU), Malte (MT), Pays-Bas (NL), Pologne (PL), Portugal (PT), République tchèque (CZ), Roumanie (RO), Slovaquie (SK), Slovénie (SI), Suède (SE) |
|
s/o |
||
ETHNICITY |
s/o |
|
GENDER |
s/o |
|
IBAN |
s/o |
|
IMEI |
s/o |
|
IP_ADDRESS |
s/o |
|
NAME |
s/o |
|
NATIONAL_IDENTIFIER |
Allemagne (DE), Autriche (AT), Belgique (BE), Bulgarie (BG), Chypre (CY), Croatie (HR), Danemark (DK), Espagne (ES), Estonie (EE), Finlande (FI), France (FR), Grèce (GR), Hongrie (HU), Irlande (IE), Lettonie (LV), Lituanie (LT), Luxembourg (LU), Malte (MT), Pays-Bas (NL), Pologne (PL), Portugal (PT), République tchèque (CZ), Roumanie (RO), Royaume-Uni (UK), Slovaquie (SK), Slovénie (SI), Suède (SE) |
|
PASSPORT |
Allemagne (DE), Autriche (AT), Belgique (BE), Bulgarie (BG), Chypre (CY), Croatie (HR), Danemark (DK), Espagne (ES), Estonie (EE), Finlande (FI), France (FR), Grèce (GR), Hongrie (HU), Irlande (IE), Italie (IT), Lettonie (LV), Lituanie (LT), Luxembourg (LU), Malte (MT), Pays-Bas (NL), Pologne (PL), Portugal (PT), République tchèque (CZ), Roumanie (RO), Slovaquie (SK), Slovénie (SI), Suède (SE) |
|
PAYMENT_CARD |
s/o |
|
PHONE_NUMBER |
s/o |
|
SALARY |
s/o |
|
TAX_IDENTIFIER |
Allemagne (DE), Autriche (AT), Chypre (CY), Espagne (ES), France (FR), Grèce (GR), Hongrie (HU), Italie (IT), Malte (MT), Pays-Bas (NL), Pologne (PL), Portugal (PT), Slovaquie (SI), Suède (SE) |
|
VIN |
s/o |
|
Loi américaine sur la modernisation des services financiers (GLBA) |
BANK_ACCOUNT |
États-Unis (US) |
DRIVERS_LICENSE |
États-Unis (US) |
|
NAME |
États-Unis (US) |
|
NATIONAL_IDENTIFIER |
États-Unis (US) |
|
PASSPORT |
États-Unis (US) |
|
PAYMENT_CARD |
s/o |
|
STREET_ADDRESS |
États-Unis (US) |
|
TAX_IDENTIFIER |
États-Unis (US) |
|
Loi sur la transférabilité et la responsabilité en matière d’assurance maladie (HIPAA) |
ADMINISTRATIVE_AREA_1 |
États-Unis (US) |
ADMINISTRATIVE_AREA_2 |
États-Unis (US) |
|
AGE |
s/o |
|
CITY |
États-Unis (US) |
|
DATE_OF_BIRTH |
s/o |
|
s/o |
||
ETHNICITY |
s/o |
|
IMEI |
s/o |
|
IP_ADDRESS |
s/o |
|
MEDICAL_DATA |
s/o |
|
MEDICAL_SPECIALTY |
s/o |
|
NAME |
s/o |
|
NATIONAL_IDENTIFIER |
États-Unis (US) |
|
PHONE_NUMBER |
États-Unis (US) |
|
POSTAL_CODE |
États-Unis (US) |
|
STREET_ADDRESS |
États-Unis (US) |
|
URL |
s/o |
|
VIN |
s/o |
|
Secteur des cartes de paiement (PCI) |
PAYMENT_CARD |
s/o |
Informations personnelles identifiables (PII) |
DATE_OF_BIRTH |
s/o |
DRIVERS_LICENSE |
s/o |
|
s/o |
||
NAME |
s/o |
|
NATIONAL_IDENTIFIER |
s/o |
|
PHONE_NUMBER |
s/o |
|
STREET_ADDRESS |
s/o |
|
TAX_IDENTIFIER |
s/o |
Utiliser SQL pour afficher les résultats de la classification¶
Vous pouvez utiliser SQL pour afficher les résultats de la classification des données en appelant une fonction système ou en interrogeant une vue d’utilisation du compte.
Récupérer les résultats de la classification pour une table spécifique¶
Appelez la fonction SYSTEM$GET_CLASSIFICATION_RESULT pour afficher les résultats d’une table spécifique.
Les résultats ne sont pas disponibles tant que le processus de classification n’est pas terminé. Le processus de classification automatique ne démarre qu’une heure après la configuration du profil de classification sur la base de données.
Interroger les derniers résultats de la classification¶
Pour afficher les derniers résultats de la classification, interrogez la vue DATA_CLASSIFICATION_LATEST. Les résultats de la classification avant les derniers résultats ne sont pas affichés. Par exemple, vous pouvez utiliser un rôle auquel le rôle de base de données SNOWFLAKE.GOVERNANCE_VIEWER a été accordé. D’autres privilèges peuvent également fournir un accès, tels que l’utilisation de ACCOUNTADMIN ou la présence de IMPORTED PRIVILEGES sur la base de données SNOWFLAKE.
Les résultats peuvent ne pas apparaître avant trois heures après la fin de la classification. Pour afficher les résultats de la classification précédente, consultez Interroger l’historique de la classification.
Interroger l’historique de la classification¶
Pour afficher tous les événements de la classification au cours des 365 derniers jours, interrogez la vue DATA_CLASSIFICATION_HISTORY. Par exemple, vous pouvez utiliser un rôle auquel le rôle de base de données SNOWFLAKE.GOVERNANCE_VIEWER a été accordé. D’autres privilèges peuvent également fournir un accès, tels que l’utilisation de ACCOUNTADMIN ou la présence de IMPORTED PRIVILEGES sur la base de données SNOWFLAKE.
Utilisez les exemples suivants pour interroger l’historique de la classification :
Filtrer l’historique de la classification par nom de base de données, de schéma et de table¶
L’exemple suivant renvoie tous les événements de la classification d’une table spécifique en filtrant par nom de base de données, nom de schéma et nom de table, classés du plus récent au plus ancien :
La sortie affiche deux événements de classification pour la même table EMPLOYEES : une classification manuelle de février 2025 qui identifiait la colonne EMAIL et une classification automatique ultérieure de mars 2025 qui identifiait les colonnes EMAIL et SSN. Les résultats sont classés du plus récent au plus ancien, montrant comment les résultats de la classification peuvent évoluer dans le temps.
Filtrer par ID de table¶
L’exemple suivant filtre l’historique de la classification par ID de table pour renvoyer tous les événements de la classification d’une table spécifique, classés par le plus récent en premier :
Note
Le filtrage par ID peut être utile si la table a été renommée après la classification.
La sortie montre deux événements de la classification pour la même table (ID 1234), même si la table a été renommée EMPLOYEES_NEW à la place de EMPLOYEES entre les événements. Étant donné que la requête filtre par ID de table plutôt que par nom, les deux événements sont renvoyés quel que soit le changement de nom.
Compter les événements de la classification au cours des sept derniers jours¶
L’exemple suivant montre le nombre d’événements de la classification au cours des sept derniers jours :
Comparer les exécutions de la classification pour une même table¶
L’exemple suivant compare les deux exécutions de la classification les plus récentes pour une table et renvoie uniquement les colonnes dont la classification a changé entre les exécutions. Chaque ligne du résultat comprend une colonne change_type avec l’une des valeurs suivantes :
ADDED: La colonne n’a pas été classée lors de l’exécution précédente. Les colonnesPREV_*sont NULL.REMOVED: La colonne a été classée lors de l’exécution précédente, mais pas dans l’exécution actuelle. Les colonnesCURR_*sont NULL.CHANGED: La colonne existe dans les deux exécutions, mais sa sémantique ou sa catégorie de confidentialité diffère.
Les colonnes dont la classification était identique dans les deux exécutions sont exclues des résultats.
La sortie montre trois colonnes dont la classification a changé entre les deux exécutions les plus récentes : DATE_OF_BIRTH et SSN étaient nouvellement identifiées (ADDED) dans l’exécution en cours, tandis que PHONE a été classifiée dans l’exécution précédente mais n’apparaît plus dans l’exécution actuelle (REMOVED). Les colonnes dont la classification est restée la même dans l’ensemble des exécutions, telles que EMAIL, sont exclues des résultats.
Afficher les résultats de la classification pour les colonnes JSON¶
Snowflake peut classer les colonnes de type ARRAY, VARIANT ou OBJECT lorsque les données semi-structurées sont au format JSON. Le résultat de cette classification présente les caractéristiques suivantes :
L’objet des résultats contient un champ
object_path_results. Ce champ répertorie les objets, où chaque objet correspond à un champ dans les données semi-structurées qui a été classé dans une catégorie sémantique native.Si un champ dans les données semi-structurées contient des données sensibles, la catégorie sémantique de la colonne est
MULTIPLE. Pour obtenir la catégorie sémantique des champs dans les données semi-structurées, utilisez le champobject_path_resultsdans les résultats.
À titre d’exemple, supposons que Snowflake classe la table suivante :
Le résultat de la classification peut ressembler à ce qui suit :