custom_classifier !ADD_REGEX¶
- こちらもご参照ください。
カスタム分類子にカテゴリと正規表現を追加し、オプションで列名とコメントに正規表現を指定します。
構文¶
<custom_classifier>!ADD_REGEX(
SEMANTIC_CATEGORY => '<custom_category>' ,
PRIVACY_CATEGORY => { 'IDENTIFIER' | 'QUASI-IDENTIFIER' | 'SENSITIVE' } ,
VALUE_REGEX => '<regular_expression>' ,
[ COL_NAME_REGEX => <regular_expression> ] ,
[ DESCRIPTION => <string> ] ,
[ THRESHOLD => <number> ]
)
引数¶
必須:
SEMANTIC_CATEGORY => custom_categoryカスタムカテゴリの名前(つまり、情報のタイプ)を指定します。
PRIVACY_CATEGORY => { 'IDENTIFIER' | 'QUASI-IDENTIFIER' | 'SENSITIVE' }データの機密性を指定します。次の値のいずれかです。
'IDENTIFIER'、'QUASI_IDENTIFIER'、または'SENSITIVE'。VALUE_REGEX => regular_expression列の値に一致する正規表現を指定します。
REGEXP_LIKE 関数を呼び出すと、正規表現の構文をテストできます。
オプション:
COL_NAME_REGEX => regular_expression分類する列名に一致する正規表現を指定します。
DESCRIPTION => stringカスタムカテゴリまたはそれを実装するカスタム分類子を説明するコメントを指定します。
THRESHOLD => numberスコアリングルールのしきい値を指定します。詳細については、 カスタムカテゴリのしきい値 をご参照ください。
許容範囲は
0.0より大きく、1.0以下になります。デフォルト:
0.8。
出力¶
classifier_name:category_name の形式で、カスタム分類子とカテゴリの関連付けを示すステータスメッセージを返します。
アクセス制御の要件¶
この操作の実行に使用される ロール には、少なくとも次の 権限 が必要です。
インスタンスロール |
オブジェクト |
メモ |
|---|---|---|
|
カスタム分類インスタンス。 |
このメソッドを呼び出すアカウントロールには、カスタム分類子でこのインスタンスロールが付与されている必要があります。 デフォルトでは、インスタンスの作成に使用されたアカウントロールにより、このメソッドを呼び出すことができます。 |
スキーマ内のオブジェクトを操作するには、親データベースの少なくとも1つの権限と、親スキーマの少なくとも1つの権限が必要です。
指定された権限のセットを使用してカスタムロールを作成する手順については、 カスタムロールの作成 をご参照ください。
セキュリティ保護可能なオブジェクト に対して SQL アクションを実行するためのロールと権限付与に関する一般的な情報については、 アクセス制御の概要 をご参照ください。
使用上の注意¶
このメソッドを複数回呼び出すと、インスタンスに関連付けられた正規表現の数が加算されます。
各メソッドを別々の SQL ステートメントで呼び出します(メソッドは連結しません)。
分類目的の正規表現検索はいずれも、大文字と小文字を区別しません。
カスタム分類インスタンスに正規表現を追加する前に、正規表現をテストします。たとえば、正規表現に一致する値だけが結果に返されるようにするには、 [ NOT ] REGEXP 関数を使用します。
SELECT <col_to_classify> FROM <table_with_col_to_classify> WHERE <col_to_classify> REGEXP('<regex>');
詳細については、 文字列関数(正規表現) をご参照ください。
例¶
medical_codes インスタンスにカテゴリと正規表現を追加します。
CALL medical_codes!ADD_REGEX(
SEMANTIC_CATEGORY => 'ICD_10_CODES',
PRIVACY_CATEGORY => 'IDENTIFIER',
VALUE_REGEX => '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
COL_NAME_REGEX => 'ICD.*',
DESCRIPTION => 'Add a regex to identify ICD-10 medical codes in a column',
THRESHOLD => 0.8
);
戻り値:
+---------------+
| ADD_REGEX |
+---------------+
| ICD_10_CODES |
+---------------+
デフォルトのしきい値を使用し、列名を一致させるために正規表現を使用しないカスタム分類子を作成します。
CALL medical_codes!ADD_REGEX(
SEMANTIC_CATEGORY => 'ICD_10_CODES',
PRIVACY_CATEGORY => 'IDENTIFIER',
VALUE_REGEX => '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}'
);