custom_classifier !ADD_REGEX

Voir aussi :

Using custom classifiers to implement custom semantic categories

Ajoute des catégories et une expression régulière au classificateur personnalisé, tout en spécifiant éventuellement une expression régulière pour le nom de la colonne et un commentaire.

Syntaxe

<custom_classifier>!ADD_REGEX(
  SEMANTIC_CATEGORY => '<custom_category>' ,
  PRIVACY_CATEGORY => { 'IDENTIFIER' | 'QUASI-IDENTIFIER' | 'SENSITIVE' } ,
  VALUE_REGEX => '<regular_expression>' ,
  [ COL_NAME_REGEX => <regular_expression> ] ,
  [ DESCRIPTION => <string> ] ,
  [ THRESHOLD => <number> ]
)
Copy

Arguments

Obligatoire :

SEMANTIC_CATEGORY => custom_category

Spécifie le nom de la catégorie personnalisée (c’est-à-dire le type d’informations).

PRIVACY_CATEGORY => { 'IDENTIFIER' | 'QUASI-IDENTIFIER' | 'SENSITIVE' }

Specifies the sensitivity of the data, and can be one of the following values: 'IDENTIFIER', 'QUASI_IDENTIFIER', or 'SENSITIVE'.

VALUE_REGEX => regular_expression

Spécifie l’expression régulière qui doit correspondre aux valeurs d’une colonne.

Vous pouvez tester la syntaxe de l’expression régulière en appelant la fonction REGEXP_LIKE.

Facultatif :

COL_NAME_REGEX => regular_expression

Spécifie l’expression régulière correspondant au nom de la colonne à classifier.

DESCRIPTION => string

Spécifie un commentaire décrivant la catégorie personnalisée ou le classificateur personnalisé qui la met en œuvre.

THRESHOLD => number

Specifies the threshold value for the scoring rule. For more information, see Threshold for custom categories.

La plage acceptable est supérieure à 0.0 et inférieure ou égale à 1.0.

Par défaut : 0.8.

Sortie

Renvoie un message de statut indiquant l’association de la catégorie avec le classificateur personnalisé dans ce format : classifier_name:category_name.

Exigences en matière de contrôle d’accès

Un rôle utilisé pour exécuter cette opération doit au minimum disposer des privilèges suivants :

Rôle de l’instance

Objet

Remarques

custom_classifier !PRIVACY_USER

L’instance de classification personnalisée.

Le rôle de compte qui appelle cette méthode doit se voir attribuer ce rôle d’instance sur le classificateur personnalisé.

Par défaut, le rôle de compte utilisé pour créer l’instance peut appeler cette méthode.

Pour effectuer une opération sur un objet dans un schéma, il est nécessaire de disposer d’au moins un privilège sur la base de données parente et d’au moins un privilège sur le schéma parent.

Pour obtenir des instructions sur la création d’un rôle personnalisé avec un ensemble spécifique de privilèges, voir Création de rôles personnalisés.

Pour des informations générales sur les rôles et les privilèges accordés pour effectuer des actions SQL sur des objets sécurisables, voir Aperçu du contrôle d’accès.

Notes sur l’utilisation

  • L’appel multiple de cette méthode donne un résultat additif pour le nombre d’expressions régulières associées à l’instance.

  • Appeler chaque méthode dans une instruction SQL distincte (pas de chaînage de méthodes).

  • Toutes les recherches d’expressions régulières à des fins de classification ne sont pas sensibles à la casse.

  • Testez l’expression régulière avant d’ajouter une expression régulière à l’instance de classification personnalisée. Par exemple, utilisez la fonction [ NOT ] REGEXP pour vous assurer que seules les valeurs correspondant à l’expression régulière sont renvoyées dans le résultat :

    SELECT <col_to_classify>
    FROM <table_with_col_to_classify>
    WHERE <col_to_classify> REGEXP('<regex>');
    
    Copy

    Pour plus de détails, voir Fonctions de chaîne (expressions régulières).

Exemples

Ajoutez des catégories et une expression régulière à l’instance medical_codes :

CALL medical_codes!ADD_REGEX(
  SEMANTIC_CATEGORY => 'ICD_10_CODES',
  PRIVACY_CATEGORY => 'IDENTIFIER',
  VALUE_REGEX => '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
  COL_NAME_REGEX => 'ICD.*',
  DESCRIPTION => 'Add a regex to identify ICD-10 medical codes in a column',
  THRESHOLD => 0.8
);
Copy

Renvoie :

+---------------+
|   ADD_REGEX   |
+---------------+
| ICD_10_CODES  |
+---------------+

Créez un classificateur personnalisé qui utilise le seuil par défaut et n’utilise pas d’expression régulière pour faire correspondre les noms de colonnes :

CALL medical_codes!ADD_REGEX(
  SEMANTIC_CATEGORY => 'ICD_10_CODES',
  PRIVACY_CATEGORY => 'IDENTIFIER',
  VALUE_REGEX => '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}'
);
Copy