custom_classifier !ADD_REGEX

Consulte também:

Using custom classifiers to implement custom semantic categories

Adiciona categorias e uma expressão regular ao classificador personalizado, especificando opcionalmente uma expressão regular para o nome da coluna e um comentário.

Sintaxe

<custom_classifier>!ADD_REGEX(
  SEMANTIC_CATEGORY => '<custom_category>' ,
  PRIVACY_CATEGORY => { 'IDENTIFIER' | 'QUASI-IDENTIFIER' | 'SENSITIVE' } ,
  VALUE_REGEX => '<regular_expression>' ,
  [ COL_NAME_REGEX => <regular_expression> ] ,
  [ DESCRIPTION => <string> ] ,
  [ THRESHOLD => <number> ]
)
Copy

Argumentos

Obrigatório:

SEMANTIC_CATEGORY => custom_category

Especifica o nome da categoria personalizada (ou seja, o tipo de informação).

PRIVACY_CATEGORY => { 'IDENTIFIER' | 'QUASI-IDENTIFIER' | 'SENSITIVE' }

Specifies the sensitivity of the data, and can be one of the following values: 'IDENTIFIER', 'QUASI_IDENTIFIER', or 'SENSITIVE'.

VALUE_REGEX => regular_expression

Especifica a expressão regular para corresponder aos valores em uma coluna.

Você pode testar a sintaxe da expressão regular chamando a função REGEXP_LIKE.

Opcional:

COL_NAME_REGEX => regular_expression

Especifica a expressão regular que corresponde ao nome da coluna que você deseja classificar.

DESCRIPTION => string

Especifica um comentário que descreve a categoria personalizada ou o classificador personalizado que faz a implementação.

THRESHOLD => number

Specifies the threshold value for the scoring rule. For more information, see Threshold for custom categories.

O intervalo aceitável é maior que 0.0 e menor ou igual a 1.0.

Padrão: 0.8.

Saída

Retorna uma mensagem de status indicando a associação da categoria com o classificador personalizado neste formato: classifier_name:category_name.

Requisitos de controle de acesso

A função usada para executar essa operação deve ter, no mínimo, os seguintes privilégios:

Função de instância

Objeto

Notas

custom_classifier !PRIVACY_USER

A instância de classificação personalizada.

A função de conta que chama esse método deve receber essa função de instância no classificador personalizado.

Por padrão, a função de conta usada para criar a instância pode chamar esse método.

A operação em um objeto de esquema requer pelo menos um privilégio no banco de dados pai e um privilégio no esquema pai.

Para instruções sobre como criar uma função personalizada com um conjunto específico de privilégios, consulte Criação de funções personalizadas.

Para informações gerais sobre concessões de funções e privilégios para executar ações de SQL em objetos protegíveis, consulte Visão geral do controle de acesso.

Notas de uso

  • Chamar esse método várias vezes fornece um resultado aditivo para o número de expressões regulares associadas à instância.

  • Chame cada método em uma instrução SQL separada (sem encadeamento de métodos).

  • Todas as pesquisas de expressão regular para fins de classificação não diferenciam maiúsculas de minúsculas.

  • Teste a expressão regular antes de adicioná-la à instância de classificação customizada. Por exemplo, use a função [ NOT ] REGEXP para garantir que apenas os valores que correspondam à regex sejam retornados no resultado:

    SELECT <col_to_classify>
    FROM <table_with_col_to_classify>
    WHERE <col_to_classify> REGEXP('<regex>');
    
    Copy

    Para obter mais detalhes, consulte Funções de cadeia de caracteres (expressões regulares).

Exemplos

Adicione categorias e uma expressão regular à instância medical_codes:

CALL medical_codes!ADD_REGEX(
  SEMANTIC_CATEGORY => 'ICD_10_CODES',
  PRIVACY_CATEGORY => 'IDENTIFIER',
  VALUE_REGEX => '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
  COL_NAME_REGEX => 'ICD.*',
  DESCRIPTION => 'Add a regex to identify ICD-10 medical codes in a column',
  THRESHOLD => 0.8
);
Copy

Retorna:

+---------------+
|   ADD_REGEX   |
+---------------+
| ICD_10_CODES  |
+---------------+

Criar um classificador personalizado que use o limite padrão e não use uma expressão regular para corresponder os nomes das colunas:

CALL medical_codes!ADD_REGEX(
  SEMANTIC_CATEGORY => 'ICD_10_CODES',
  PRIVACY_CATEGORY => 'IDENTIFIER',
  VALUE_REGEX => '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}'
);
Copy