- Categorias:
MODEL_MONITOR_DRIFT_METRIC¶
Obtém métricas de desvio de um monitor de modelos. Cada monitor de modelo monitora um modelo de aprendizado de máquina.
- Consulte também:
Consultar resultados de monitoramento para obter mais informações.
Sintaxe¶
MODEL_MONITOR_DRIFT_METRIC(
<model_monitor_name>, <drift_metric_name>, <column_name>
[ , <granularity> [ , <start_time> [ , <end_time> [ , <extra_args> ] ] ] ]
)
Argumentos¶
Obrigatório:
model_monitor_nameNome do monitor de modelo usado para calcular a métrica.
Valores válidos: uma cadeia de caracteres que é o nome do monitor de modelo. Pode ser um nome simples ou totalmente qualificado.
drift_metric_nameNome da métrica.
Valores válidos:
'JENSEN_SHANNON''DIFFERENCE_OF_MEANS''WASSERSTEIN''POPULATION_STABILITY_INDEX'
column_nameNome da coluna usada para calcular o desvio.
Valores válidos: qualquer cadeia de caracteres que exista como coluna de recurso, coluna de previsão ou coluna real no monitor de modelo.
Opcional:
granularityGranularidade do intervalo de tempo que está sendo consultado. O valor padrão é
1 DAY.Valores válidos:
'<num> DAY''<num> WEEK''<num> MONTH''<num> QUARTER''<num> YEAR''ALL'NULL
start_timeInício do intervalo de tempo usado para calcular a métrica. O valor padrão é 60 dias antes da hora atual e é calculado sempre que você chama a função.
Valores válidos: uma expressão de carimbo de data/hora ou
NULL.end_timeFim do intervalo de tempo usado para calcular a métrica. O valor padrão é a hora atual e é calculado sempre que você chama a função.
Valores válidos: uma expressão de carimbo de data/hora ou
NULL.extra_argsArgumentos adicionais para consultas específicas de segmento. Esse parâmetro é opcional; se não for fornecido, a consulta retornará métricas para todos os dados (consulta não segmentada).
Valores válidos: Uma cadeia de caracteres no formato JSON especificando pares de coluna e valor do segmento:
'{"SEGMENTS": [{"column": "<segment_column_name>", "value": "<segment_value>"}]}'Nota
Atualmente, as consultas de segmento aceitam apenas um par coluna:valor do segmento por consulta. Não é possível consultar vários segmentos simultaneamente em uma única chamada de função.
Para obter mais informações sobre segmentos, consulte ML Observability: monitoramento do comportamento do modelo ao longo do tempo.
Retornos¶
Coluna |
Descrição |
Exemplo de valores |
|---|---|---|
|
Carimbo de data/hora no início do intervalo de tempo. |
|
|
Valor da métrica dentro do intervalo de tempo especificado. |
|
|
Número de registros usados para calcular a métrica. |
|
|
Número de registros excluídos do cálculo da métrica. |
|
|
Número de registros usados para calcular a métrica. |
|
|
Número de registros excluídos do cálculo da métrica. |
|
|
Nome da métrica de desvio que foi computada. |
|
|
Nome da coluna para a qual a métrica de desvio foi calculada. |
|
|
Nome da coluna do segmento para a qual a métrica é calculada (ou NULL para consultas sem segmento). |
|
|
Valor do segmento para o qual a métrica é calculada (ou NULL para consultas sem segmento). |
|
Notas de uso¶
O monitor de modelo deve ter uma linha de base definida para que a métrica de desvio seja calculada.
Você poderá encontrar erros se:
Não definir uma linha de base para o monitor do modelo.
Solicitar uma métrica de desvio numérico para um recurso não numérico.
Usar uma métrica de desvio que não existe no monitor de modelo.
Se os valores que você especificou para column_name ou model_monitor_name diferenciam maiúsculas de minúsculas ou contêm caracteres especiais ou espaços, coloque-os entre aspas duplas. Você deve colocar as aspas duplas dentro de aspas simples, como '"<model_monitor_name>"'.
Sem as aspas duplas nesses dois campos, a diferenciação entre maiúsculas e minúsculas não será considerada em column_name ou model_monitor_name.
Para minimizar o impacto potencial das alterações no esquema, atualize suas consultas para selecionar explicitamente apenas as colunas necessárias em vez de usar um curinga (*).
Exemplos¶
O exemplo a seguir obtém as diferenças de métrica de desvio de médias para MY_MONITOR em um período de um dia:
SELECT * FROM TABLE(MODEL_MONITOR_DRIFT_METRIC(
'MY_MONITOR', 'DIFFERENCE_OF_MEANS', 'MODEL_PREDICTION', '1 DAY', TO_TIMESTAMP_TZ('2024-01-01'), TO_TIMESTAMP_TZ('2024-01-02'))
)
O exemplo a seguir obtém a métrica de desvio de Jensen-Shannon para MY_MONITOR nos últimos 30 dias:
SELECT * FROM TABLE(MODEL_MONITOR_DRIFT_METRIC(
'MY_MONITOR', 'JENSEN_SHANNON', 'MODEL_PREDICTION', '1 DAY', DATEADD('DAY', -30, CURRENT_DATE()), CURRENT_DATE())
)