custom_classifier !ADD_REGEX¶
Adiciona categorias e uma expressão regular ao classificador personalizado, especificando opcionalmente uma expressão regular para o nome da coluna e um comentário.
Sintaxe¶
<custom_classifier>!ADD_REGEX(
'<semantic_category>' ,
'<privacy_category>' ,
'<value_regex>' ,
[ <column_name_regex> ] ,
[ <description> ] ,
[ <threshold> ]
)
Argumentos¶
Obrigatório:
semantic_categoryEspecifica o identificador (nome) para a categoria semântica.
Para obter detalhes sobre categorias semânticas, consulte Tags de sistema e categorias.
privacy_categoryEspecifique um dos seguintes valores:
'IDENTIFIER','QUASI_IDENTIFIER'ou'SENSITIVE'.Para obter detalhes sobre categorias de privacidade, consulte Tags de sistema e categorias.
value_regexEspecifica a expressão regular para corresponder aos valores em uma coluna.
Você pode testar a sintaxe da expressão regular chamando a função REGEXP_LIKE.
Opcional:
column_name_regexEspecifica a expressão regular que corresponde ao nome da coluna que você deseja classificar.
descriptionEspecifica um comentário para os valores incluídos na instância.
thresholdEspecifica o valor limite para a regra de pontuação.
O intervalo aceitável é maior que
0.0e menor ou igual a1.0.Padrão:
0.8.
Saída¶
Retorna uma mensagem de status indicando a associação da categoria com o classificador personalizado neste formato: classifier_name:category_name.
Requisitos de controle de acesso¶
A função usada para executar essa operação deve ter, no mínimo, os seguintes privilégios:
Função de instância |
Objeto |
Notas |
|---|---|---|
|
A instância de classificação personalizada. |
A função de conta que chama esse método deve receber essa função de instância no classificador personalizado. Por padrão, a função de conta usada para criar a instância pode chamar esse método. |
A operação em um objeto de esquema requer pelo menos um privilégio no banco de dados pai e um privilégio no esquema pai.
Para instruções sobre como criar uma função personalizada com um conjunto específico de privilégios, consulte Criação de funções personalizadas.
Para informações gerais sobre concessões de funções e privilégios para executar ações de SQL em objetos protegíveis, consulte Visão geral do controle de acesso.
Notas de uso¶
Chamar esse método várias vezes fornece um resultado aditivo para o número de expressões regulares associadas à instância.
Chame cada método em uma instrução SQL separada (sem encadeamento de métodos).
Todas as pesquisas de expressão regular para fins de classificação não diferenciam maiúsculas de minúsculas.
Teste a expressão regular antes de adicioná-la à instância de classificação customizada. Por exemplo, use a função [ NOT ] REGEXP para garantir que apenas os valores que correspondam à regex sejam retornados no resultado:
SELECT <col_to_classify> FROM <table_with_col_to_classify> WHERE <col_to_classify> REGEXP('<regex>');
Para obter mais detalhes, consulte Funções de cadeia de caracteres (expressões regulares).
Exemplos¶
Adicione categorias e uma expressão regular à instância medical_codes:
CALL medical_codes!ADD_REGEX(
'ICD_10_CODES',
'IDENTIFIER',
'[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
'ICD.*',
'Add a regex to identify ICD-10 medical codes in a column',
0.8
);
Retorna:
+---------------+
| ADD_REGEX |
+---------------+
| ICD_10_CODES |
+---------------+