Categorias:: Funções do monitor de modelos

MODEL_MONITOR_DRIFT_METRIC¶

Obtém métricas de desvio de um monitor de modelos. Cada monitor de modelo monitora um modelo de aprendizado de máquina.

Consulte também:: Consultar resultados de monitoramento para obter mais informações.

Sintaxe¶

MODEL_MONITOR_DRIFT_METRIC(
  <model_monitor_name>, <drift_metric_name>, <column_name>
  [ , <granularity> [ , <start_time>  [ , <end_time> [ , <extra_args> ] ] ] ]
)

Copy

Argumentos¶

Obrigatório:

model_monitor_name

Nome do monitor de modelo usado para calcular a métrica.

Valores válidos: uma cadeia de caracteres que é o nome do monitor de modelo. Pode ser um nome simples ou totalmente qualificado.

drift_metric_name

Nome da métrica.

Valores válidos:

'JENSEN_SHANNON'
'DIFFERENCE_OF_MEANS'
'WASSERSTEIN'
'POPULATION_STABILITY_INDEX'

column_name

Nome da coluna usada para calcular o desvio.

Valores válidos: qualquer cadeia de caracteres que exista como coluna de recurso, coluna de previsão ou coluna real no monitor de modelo.

Opcional:

granularity

Granularidade do intervalo de tempo que está sendo consultado. O valor padrão é 1 DAY.

Valores válidos:

'<num> DAY'
'<num> WEEK'
'<num> MONTH'
'<num> QUARTER'
'<num> YEAR'
'ALL'
NULL

start_time

Início do intervalo de tempo usado para calcular a métrica. O valor padrão é 60 dias antes da hora atual e é calculado sempre que você chama a função.

Valores válidos: uma expressão de carimbo de data/hora ou NULL.

end_time

Fim do intervalo de tempo usado para calcular a métrica. O valor padrão é a hora atual e é calculado sempre que você chama a função.

Valores válidos: uma expressão de carimbo de data/hora ou NULL.

extra_args

Argumentos adicionais para consultas específicas de segmento. Esse parâmetro é opcional; se não for fornecido, a consulta retornará métricas para todos os dados (consulta não segmentada).

Valores válidos: Uma cadeia de caracteres no formato JSON especificando pares de coluna e valor do segmento: '{"SEGMENTS": [{"column": "<segment_column_name>", "value": "<segment_value>"}]}'

Nota

Atualmente, as consultas de segmento aceitam apenas um par coluna:valor do segmento por consulta. Não é possível consultar vários segmentos simultaneamente em uma única chamada de função.

Para obter mais informações sobre segmentos, consulte ML Observability: monitoramento do comportamento do modelo ao longo do tempo.

Retornos¶

Coluna	Descrição	Exemplo de valores
`EVENT_TIMESTAMP`	Carimbo de data/hora no início do intervalo de tempo.	`2024-01-01 00:00:00.000`
`METRIC_VALUE`	Valor da métrica dentro do intervalo de tempo especificado.	`5`
`COL_COUNT_USED`	Número de registros usados para calcular a métrica.	`100`
`COL_COUNT_UNUSED`	Número de registros excluídos do cálculo da métrica.	`10`
`BASELINE_COL_COUNT_USED`	Número de registros usados para calcular a métrica.	`10`
`BASELINE_COL_COUNT_UNUSED`	Número de registros excluídos do cálculo da métrica.	`0`
`METRIC_NAME`	Nome da métrica de desvio que foi computada.	`DIFFERENCE_OF_MEANS`
`COLUMN_NAME`	Nome da coluna para a qual a métrica de desvio foi calculada.	`FEATURE_NAME`
`SEGMENT_COLUMN`	Nome da coluna do segmento para a qual a métrica é calculada (ou NULL para consultas sem segmento).	`CUSTOMER_TIER`
`SEGMENT_VALUE`	Valor do segmento para o qual a métrica é calculada (ou NULL para consultas sem segmento).	`PREMIUM`

Notas de uso¶

O monitor de modelo deve ter uma linha de base definida para que a métrica de desvio seja calculada.

Você poderá encontrar erros se:

Não definir uma linha de base para o monitor do modelo.
Solicitar uma métrica de desvio numérico para um recurso não numérico.
Usar uma métrica de desvio que não existe no monitor de modelo.

Se os valores que você especificou para column_name ou model_monitor_name diferenciam maiúsculas de minúsculas ou contêm caracteres especiais ou espaços, coloque-os entre aspas duplas. Você deve colocar as aspas duplas dentro de aspas simples, como '"<model_monitor_name>"'.

Sem as aspas duplas nesses dois campos, a diferenciação entre maiúsculas e minúsculas não será considerada em column_name ou model_monitor_name.

Para minimizar o impacto potencial das alterações no esquema, atualize suas consultas para selecionar explicitamente apenas as colunas necessárias em vez de usar um curinga (*).

Exemplos¶

O exemplo a seguir obtém as diferenças de métrica de desvio de médias para MY_MONITOR em um período de um dia:

SELECT * FROM TABLE(MODEL_MONITOR_DRIFT_METRIC(
'MY_MONITOR', 'DIFFERENCE_OF_MEANS', 'MODEL_PREDICTION', '1 DAY', TO_TIMESTAMP_TZ('2024-01-01'), TO_TIMESTAMP_TZ('2024-01-02'))
)

Copy

O exemplo a seguir obtém a métrica de desvio de Jensen-Shannon para MY_MONITOR nos últimos 30 dias:

SELECT * FROM TABLE(MODEL_MONITOR_DRIFT_METRIC(
'MY_MONITOR', 'JENSEN_SHANNON', 'MODEL_PREDICTION', '1 DAY', DATEADD('DAY', -30, CURRENT_DATE()), CURRENT_DATE())
)

Copy