Kategorien:: Funktionen von Modellmonitoren

MODEL_MONITOR_DRIFT_METRIC¶

Ruft Driftmetriken von einem Modellmonitor ab. Jeder Modellmonitor überwacht ein Machine-Learning-Modell.

Siehe auch:: Abfrage der Überwachungsergebnisse für weitere Informationen.

Syntax¶

MODEL_MONITOR_DRIFT_METRIC(
  <model_monitor_name>, <drift_metric_name>, <column_name>
  [ , <granularity> [ , <start_time>  [ , <end_time> [ , <extra_args> ] ] ] ]
)

Argumente¶

Benötigt:

model_monitor_name

Name des Modellmonitors, der für die Berechnung der Metrik verwendet wird.

Gültige Werte: Eine Zeichenfolge, die der Name des Modellmonitors ist. Dies kann ein einfacher oder voll qualifizierter Name sein.

drift_metric_name

Name der Kennzahl.

Gültige Werte:

'JENSEN_SHANNON'
'DIFFERENCE_OF_MEANS'
'WASSERSTEIN'
'POPULATION_STABILITY_INDEX'

column_name

Name der Spalte, die zur Berechnung der Abweichung verwendet wird.

Gültige Werte: Jede Zeichenfolge, die als Feature-Spalte, Vorhersagespalte oder tatsächliche Spalte im Modellmonitor vorhanden ist.

Optional:

granularity

Granularität des abgefragten Zeitbereichs. Der Standardwert ist 1 DAY.

Gültige Werte:

'<Zahl> DAY'
'<Zahl> WEEK'
'<Zahl> MONTH'
'<Zahl> QUARTER'
'<Zahl> YEAR'
'ALL'
NULL

start_time

Beginn des Zeitbereichs, der für die Berechnung der Metrik verwendet wird. Der Standardwert ist 60 Tage vor der aktuellen Zeit und wird jedes Mal berechnet, wenn Sie die Funktion aufrufen.

Gültige Werte: Ein Zeitstempel-Ausdruck oder NULL.

end_time

Ende des Zeitbereichs, der für die Berechnung der Metrik verwendet wird. Der Standardwert ist die aktuelle Zeit und wird jedes Mal berechnet, wenn Sie die Funktion aufrufen.

Gültige Werte: Ein Zeitstempel-Ausdruck oder NULL.

extra_args

Zusätzliche Argumente für segmentspezifische Abfragen. Dieser Parameter ist optional – wenn er nicht angegeben wird, gibt die Abfrage Metriken für alle Daten zurück (Nicht-Segment-Abfrage).

Gültige Werte: Eine Zeichenfolge im JSON-Format mit Angabe von Segmentspalte:Wert-Paaren: '{"SEGMENTS": [{"column": "<segment_column_name>", "value": "<segment_value>"}]}'

Bemerkung

Derzeit unterstützen Segmentabfragen nur 1 Segmentspalte:Wert-Paar pro Abfrage. Sie können nicht mehrere Segmente gleichzeitig in einem einzigen Funktionsaufruf abfragen.

Weitere Informationen zu Segmenten finden Sie unter ML Observability: Überwachen des Modellverhaltens im Laufe der Zeit.

Rückgabewerte¶


Spalte	Beschreibung	Beispielwerte
`EVENT_TIMESTAMP`	Zeitstempel zu Beginn des Zeitbereichs.	`2024-01-01 00:00:00.000`
`METRIC_VALUE`	Wert der Metrik innerhalb des angegebenen Zeitbereichs.	`5`
`COL_COUNT_USED`	Anzahl der Datensätze, die zur Berechnung der Metrik verwendet werden.	`100`
`COL_COUNT_UNUSED`	Anzahl der Datensätze, die von der Berechnung der Metrik ausgeschlossen werden.	`10`
`BASELINE_COL_COUNT_USED`	Anzahl der Datensätze, die zur Berechnung der Metrik verwendet werden.	`10`
`BASELINE_COL_COUNT_UNUSED`	Anzahl der Datensätze, die von der Berechnung der Metrik ausgeschlossen werden.	`0`
`METRIC_NAME`	Name der Abweichungsmetrik, die berechnet wurde.	`DIFFERENCE_OF_MEANS`
`COLUMN_NAME`	Name der Spalte, für die die Abweichungsmetrik berechnet wurde.	`FEATURE_NAME`
`SEGMENT_COLUMN`	Name der Segmentspalte, für die die Metrik berechnet wird (oder NULL für Nicht-Segment-Abfragen).	`CUSTOMER_TIER`
`SEGMENT_VALUE`	Segmentwert, für den die Metrik berechnet wird (oder NULL für Nicht-Segment-Abfragen).	`PREMIUM`

Nutzungshinweise¶

Der Modellmonitor muss eine Basis haben, damit die Abweichungsmetrik berechnet werden kann.

Sie könnten auf Fehler stoßen, wenn Sie:

keine Basis für den Modellmonitor festlegen.
eine numerische Abweichungsmetrik für ein nicht-numerisches Feature anfordern.
eine Abweichungsmetrik verwenden, die im Modellmonitor nicht vorhanden ist.

Wenn Werte, die Sie für column_name oder model_monitor_name angegeben haben, zwischen Groß- und Kleinschreibung unterscheiden oder Sonderzeichen oder Leerzeichen enthalten, setzen Sie sie in doppelte Anführungszeichen. Sie müssen die doppelten Anführungszeichen in einfache Anführungszeichen setzen, z. B. '"<model_monitor_name>"'.

Wenn in diesen beiden Feldern keine doppelten Anführungszeichen angegeben sind, wird davon ausgegangen, dass für column_name oder model_monitor_name nicht zwischen Groß- und Kleinschreibung unterschieden wird.

Um mögliche Auswirkungen von Schemaänderungen zu minimieren, aktualisieren Sie Ihre Abfragen, um explizit nur die erforderlichen Spalten auszuwählen, anstatt einen Platzhalter zu verwenden (*).

Beispiele¶

Das folgende Beispiel liefert die Differenzen der Mittelwert-Abweichungsmetrik für MY_MONITOR über einen Zeitraum von einem Tag:

SELECT * FROM TABLE(MODEL_MONITOR_DRIFT_METRIC(
'MY_MONITOR', 'DIFFERENCE_OF_MEANS', 'MODEL_PREDICTION', '1 DAY', TO_TIMESTAMP_TZ('2024-01-01'), TO_TIMESTAMP_TZ('2024-01-02'))
)

Das folgende Beispiel liefert die Jensen-Shannon-Abweichungsmetrik für MY_MONITOR über die letzten 30 Tage:

SELECT * FROM TABLE(MODEL_MONITOR_DRIFT_METRIC(
'MY_MONITOR', 'JENSEN_SHANNON', 'MODEL_PREDICTION', '1 DAY', DATEADD('DAY', -30, CURRENT_DATE()), CURRENT_DATE())
)