Catégories :

Fonctions système (Informations système)

SYSTEM$GET_CLASSIFICATION_RESULT

Renvoie le résultat de la classification de l’objet spécifié.

Syntaxe

SELECT SYSTEM$GET_CLASSIFICATION_RESULT( '<object_name>' )
Copy

Arguments

object_name

Le nom de la table, de la table externe, de la vue ou de la vue matérialisée contenant les colonnes à classifier. Si une base de données et un schéma ne sont pas utilisés dans la session en cours, le nom doit être entièrement qualifié.

Le nom doit être spécifié exactement comme il est stocké dans la base de données. Si le nom contient des caractères spéciaux, des majuscules ou des espaces vides, il doit être placé d’abord entre guillemets doubles, puis entre guillemets simples.

Renvoie

Renvoie un objet JSON dans le format suivant. Par exemple :

{
  "classification_profile_config": {
    "classification_profile_name": "db1.sch.sensitive_data_detection_profile"
  },
  "classification_result": {
    "col1_name": {
      "alternates": [],
      "recommendation": {
        "confidence": "HIGH",
        "coverage": 1,
        "details": [],
        "privacy_category": "QUASI_IDENTIFIER",
        "semantic_category": "DATE_OF_BIRTH",
        "tags": [
          {
            "tag_applied": true,
            "tag_name": "snowflake.core.semantic_category",
            "tag_value": "DATE_OF_BIRTH"
          },
          {
            "tag_applied": true,
            "tag_name": "snowflake.core.privacy_category",
            "tag_value": "QUASI_IDENTIFIER"
          }
        ]
      },
      "valid_value_ratio": 1
    }
  }
}
Copy

Champs possibles :

classification_profile_config

Si la classification automatique est configurée, contient le nom complet du profil de configuration qui a été utilisé pour générer les résultats de la classification.

classification_result

Fournit des détails sur chaque colonne qui a été classée.

object_path_results

Lorsqu’une colonne contient des données semi-structurées avec des champs sensibles, la clé object_path_results répertorie les champs qui ont été classés dans une catégorie sémantique native ou personnalisée. Pour plus d’informations, voir Résultats pour les colonnes JSON.

alternates

Fournit des informations sur chaque balise et valeur à prendre en compte autre que la balise recommandée.

recommendation

Fournit des informations sur chaque balise et valeur en tant que premier choix basé sur le processus de classification.

Ces valeurs peuvent apparaître à la fois dans les alternatives et dans la recommandation :

classifier_name

Nom complet de l’instance de classification personnalisée utilisée pour baliser la colonne classifiée.

Ce champ n’apparaît que lorsqu’une instance de classification personnalisée est utilisée comme source de la balise à définir sur une colonne.

confidence

Fournit l’une des valeurs suivantes : HIGH, MEDIUM ou LOW. Cette valeur indique la confiance relative que Snowflake a sur la base du processus d’échantillonnage de la colonne et la façon dont les données de la colonne s’alignent sur la manière dont Snowflake classifie les données.

coverage

Fournit le pourcentage de valeurs de cellules échantillonnées qui correspondent aux règles d’une catégorie particulière.

details

Fournit des champs et des valeurs liés à la classification spécifique à la géographie. Le champ semantic_category contient la sous-catégorie sémantique pour un paramètre régional.

privacy_category

Fournit la catégorie de confidentialité.

Les valeurs possibles sont IDENTIFIER, QUASI-IDENTIFIER et SENSITIVE.

semantic_category

Fournit la catégorie sémantique. Pour une liste des catégories sémantiques natives, consultez Catégories sémantiques natives de la classification des données sensibles.

Si la valeur est MULTIPLE, des données sensibles ont été trouvées dans les données semi-structurées. Inspectez le champ object_path_results de l’objet de résultats pour une description détaillée des catégories sémantiques natives et personnalisées qui ont été trouvées lors de la classification. Pour plus d’informations, voir Résultats pour les colonnes JSON.

tags

Fournit des informations sur les balises qui ont été appliquées à la colonne à la suite du processus de classification.

valid_value_ratio

Fournit le ratio du nombre de valeurs de la taille de l’échantillon qui sont valides.

  • Pour les données structurées, les valeurs non valides incluent NULL et une chaîne comportant plus de 256 caractères.

  • Pour les données semi-structurées, les valeurs non valides incluent NULL et une chaîne vide.

Exemples

Renvoyer le résultat de la classification des données sensibles pour une table :

SELECT SYSTEM$GET_CLASSIFICATION_RESULT('hr.tables.empl_info');
Copy