Catégories :

Fonctions système (Informations système)

SYSTEM$GET_CLASSIFICATION_RESULT

Renvoie le résultat de la classification de l’objet spécifié.

Syntaxe

SELECT SYSTEM$GET_CLASSIFICATION_RESULT( '<object_name>' )
Copy

Arguments

object_name

Le nom de la table, de la table externe, de la vue ou de la vue matérialisée contenant les colonnes à classifier. Si une base de données et un schéma ne sont pas utilisés dans la session en cours, le nom doit être entièrement qualifié.

Le nom doit être spécifié exactement comme il est stocké dans la base de données. Si le nom contient des caractères spéciaux, des majuscules ou des espaces vides, il doit être placé d’abord entre guillemets doubles, puis entre guillemets simples.

Renvoie

Renvoie un objet JSON dans le format suivant. Par exemple :

{
  "classification_result": {
    "col1_name": {
      "alternates": [],
      "recommendation": {
        "confidence": "HIGH",
        "coverage": 1,
        "details": [
          {
            "coverage": 1,
            "semantic_category": "US_PASSPORT"
          }
        ],
        "privacy_category": "IDENTIFIER",
        "semantic_category": "PASSPORT"
      },
      "valid_value_ratio": 1
    },  
    "col2_name": { ... },
    ...
  }
}
Copy

Où :

alternates

Spécifie des informations sur chaque balise et valeur à prendre en compte autre que la balise recommandée.

recommendation

Spécifie des informations sur chaque balise et valeur en tant que premier choix basé sur le processus de classification.

Ces valeurs peuvent apparaître à la fois dans les alternatives et dans la recommandation :

classifier_name

Nom complet de l’instance de classification personnalisée utilisée pour baliser la colonne classifiée.

Ce champ n’apparaît que lorsqu’une instance de classification personnalisée est utilisée comme source de la balise à définir sur une colonne.

confidence

Cette colonne indique l’une des valeurs suivantes : HIGH, MEDIUM, ou LOW. Cette valeur indique la confiance relative que Snowflake a sur la base du processus d’échantillonnage de la colonne et la façon dont les données de la colonne s’alignent sur la manière dont Snowflake classifie les données.

coverage

Spécifie le pourcentage de valeurs de cellules échantillonnées qui correspondent aux règles d’une catégorie particulière.

details

Indique les champs et les valeurs qui font référence à une valeur de balise géographique pour la balise SEMANTIC_CATEGORY.

privacy_category

Spécifie la valeur de la balise de catégorie de confidentialité.

Les valeurs possibles sont IDENTIFIER, QUASI-IDENTIFIER et SENSITIVE.

semantic_category

Spécifie la valeur de la balise de la catégorie sémantique.

Pour connaître les valeurs possibles des balises, voir Balises système et catégories et Balises système et catégories.

valid_value_ratio

Spécifie le ratio des valeurs valides dans la taille de l’échantillon. Les valeurs non valides incluent NULL, une chaîne vide et une chaîne de plus de 256 caractères.

Notes sur l’utilisation

  • Utilisez une instruction ALTER TABLE … MODIFY COLUMN … SET TAG pour mettre à jour la valeur de la balise.

  • Pour supprimer une balise du système de classification d’une colonne, utilisez une instruction ALTER TABLE … MODIFY COLUMN … UNSET TAG.

Exemples

Renvoie le résultat de la classification des données pour une table :

SELECT SYSTEM$GET_CLASSIFICATION_RESULT('hr.tables.empl_info');
Copy