custom_classifier !ADD_REGEX¶
- Consulte também:
Using custom classifiers to implement custom semantic categories
Adiciona categorias e uma expressão regular ao classificador personalizado, especificando opcionalmente uma expressão regular para o nome da coluna e um comentário.
Sintaxe¶
<custom_classifier>!ADD_REGEX(
SEMANTIC_CATEGORY => '<custom_category>' ,
PRIVACY_CATEGORY => { 'IDENTIFIER' | 'QUASI-IDENTIFIER' | 'SENSITIVE' } ,
VALUE_REGEX => '<regular_expression>' ,
[ COL_NAME_REGEX => <regular_expression> ] ,
[ DESCRIPTION => <string> ] ,
[ THRESHOLD => <number> ]
)
Argumentos¶
Obrigatório:
SEMANTIC_CATEGORY => custom_categoryEspecifica o nome da categoria personalizada (ou seja, o tipo de informação).
PRIVACY_CATEGORY => { 'IDENTIFIER' | 'QUASI-IDENTIFIER' | 'SENSITIVE' }Specifies the sensitivity of the data, and can be one of the following values:
'IDENTIFIER','QUASI_IDENTIFIER', or'SENSITIVE'.VALUE_REGEX => regular_expressionEspecifica a expressão regular para corresponder aos valores em uma coluna.
Você pode testar a sintaxe da expressão regular chamando a função REGEXP_LIKE.
Opcional:
COL_NAME_REGEX => regular_expressionEspecifica a expressão regular que corresponde ao nome da coluna que você deseja classificar.
DESCRIPTION => stringEspecifica um comentário que descreve a categoria personalizada ou o classificador personalizado que faz a implementação.
THRESHOLD => numberSpecifies the threshold value for the scoring rule. For more information, see Threshold for custom categories.
O intervalo aceitável é maior que
0.0e menor ou igual a1.0.Padrão:
0.8.
Saída¶
Retorna uma mensagem de status indicando a associação da categoria com o classificador personalizado neste formato: classifier_name:category_name.
Requisitos de controle de acesso¶
A função usada para executar essa operação deve ter, no mínimo, os seguintes privilégios:
Função de instância |
Objeto |
Notas |
|---|---|---|
|
A instância de classificação personalizada. |
A função de conta que chama esse método deve receber essa função de instância no classificador personalizado. Por padrão, a função de conta usada para criar a instância pode chamar esse método. |
A operação em um objeto de esquema requer pelo menos um privilégio no banco de dados pai e um privilégio no esquema pai.
Para instruções sobre como criar uma função personalizada com um conjunto específico de privilégios, consulte Criação de funções personalizadas.
Para informações gerais sobre concessões de funções e privilégios para executar ações de SQL em objetos protegíveis, consulte Visão geral do controle de acesso.
Notas de uso¶
Chamar esse método várias vezes fornece um resultado aditivo para o número de expressões regulares associadas à instância.
Chame cada método em uma instrução SQL separada (sem encadeamento de métodos).
Todas as pesquisas de expressão regular para fins de classificação não diferenciam maiúsculas de minúsculas.
Teste a expressão regular antes de adicioná-la à instância de classificação customizada. Por exemplo, use a função [ NOT ] REGEXP para garantir que apenas os valores que correspondam à regex sejam retornados no resultado:
SELECT <col_to_classify> FROM <table_with_col_to_classify> WHERE <col_to_classify> REGEXP('<regex>');
Para obter mais detalhes, consulte Funções de cadeia de caracteres (expressões regulares).
Exemplos¶
Adicione categorias e uma expressão regular à instância medical_codes:
CALL medical_codes!ADD_REGEX(
SEMANTIC_CATEGORY => 'ICD_10_CODES',
PRIVACY_CATEGORY => 'IDENTIFIER',
VALUE_REGEX => '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
COL_NAME_REGEX => 'ICD.*',
DESCRIPTION => 'Add a regex to identify ICD-10 medical codes in a column',
THRESHOLD => 0.8
);
Retorna:
+---------------+
| ADD_REGEX |
+---------------+
| ICD_10_CODES |
+---------------+
Criar um classificador personalizado que use o limite padrão e não use uma expressão regular para corresponder os nomes das colunas:
CALL medical_codes!ADD_REGEX(
SEMANTIC_CATEGORY => 'ICD_10_CODES',
PRIVACY_CATEGORY => 'IDENTIFIER',
VALUE_REGEX => '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}'
);