custom_classifier
!ADD_REGEX¶
Adiciona categorias e uma expressão regular ao classificador personalizado, especificando opcionalmente uma expressão regular para o nome da coluna e um comentário.
Sintaxe¶
<custom_classifier>!ADD_REGEX(
'<semantic_category>' ,
'<privacy_category>' ,
'<value_regex>' ,
[ <column_name_regex> ] ,
[ <description> ] ,
[ <threshold> ]
)
Argumentos¶
Obrigatório:
semantic_category
Especifica o identificador (nome) para a categoria semântica.
Para obter detalhes sobre categorias semânticas, consulte Tags de sistema e categorias.
privacy_category
Especifique um dos seguintes valores:
'IDENTIFIER'
,'QUASI_IDENTIFIER'
ou'SENSITIVE'
.Para obter detalhes sobre categorias de privacidade, consulte Tags de sistema e categorias.
value_regex
Especifica a expressão regular para corresponder aos valores em uma coluna.
Você pode testar a sintaxe da expressão regular chamando a função REGEXP_LIKE.
Opcional:
column_name_regex
Especifica a expressão regular que corresponde ao nome da coluna que você deseja classificar.
description
Especifica um comentário para os valores incluídos na instância.
threshold
Especifica o valor limite para a regra de pontuação.
O intervalo aceitável é maior que
0.0
e menor ou igual a1.0
.Padrão:
0.8
.
Saída¶
Retorna uma mensagem de status indicando a associação da categoria com o classificador personalizado neste formato: classifier_name:category_name
.
Requisitos de controle de acesso¶
A função usada para executar essa operação deve ter, no mínimo, os seguintes privilégios:
Função de instância |
Objeto |
Notas |
---|---|---|
|
A instância de classificação personalizada. |
A função de conta que chama esse método deve receber essa função de instância no classificador personalizado. Por padrão, a função de conta usada para criar a instância pode chamar esse método. |
O privilégio USAGE no banco de dados e no esquema pai é necessário para executar operações em qualquer objeto de um esquema.
Para instruções sobre como criar uma função personalizada com um conjunto específico de privilégios, consulte Criação de funções personalizadas.
Para informações gerais sobre concessões de funções e privilégios para executar ações de SQL em objetos protegíveis, consulte Visão geral do controle de acesso.
Notas de uso¶
Chamar esse método várias vezes fornece um resultado aditivo para o número de expressões regulares associadas à instância.
Chame cada método em uma instrução SQL separada (sem encadeamento de métodos).
Todas as pesquisas de expressão regular para fins de classificação não diferenciam maiúsculas de minúsculas.
Teste a expressão regular antes de adicioná-la à instância de classificação customizada. Por exemplo, use a função [ NOT ] REGEXP para garantir que apenas os valores que correspondam à regex sejam retornados no resultado:
SELECT <col_to_classify> FROM <table_with_col_to_classify> WHERE <col_to_classify> REGEXP('<regex>');
Para obter mais detalhes, consulte Funções de cadeia de caracteres (expressões regulares).
Exemplos¶
Adicione categorias e uma expressão regular à instância medical_codes
:
CALL medical_codes!ADD_REGEX(
'ICD_10_CODES',
'IDENTIFIER',
'[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
'ICD.*',
'Add a regex to identify ICD-10 medical codes in a column',
0.8,
);
Retorna:
+---------------+
| ADD_REGEX |
+---------------+
| ICD_10_CODES |
+---------------+