- Kategorien:
Tabellenfunktionen (Cortex Agents)
GET_AI_EVALUATION_DATA (SNOWFLAKE.LOCAL)¶
Ruft Bewertungsdaten für einen Cortex Agent-Bewertungslauf ab.
Rufen Sie diese Funktion auf, um alle aufgezeichneten Ablaufverfolgungen für einen Bewertungslauf zu prüfen. Weitere Informationen zu Cortex Agent-Bewertungen finden Sie unter Cortex Agent-Evaluierungen.
- Siehe auch:
EXECUTE_AI_EVALUATION, GET_AI_RECORD_TRACE (SNOWFLAKE.LOCAL), GET_AI_OBSERVABILITY_LOGS (SNOWFLAKE.LOCAL)
Syntax¶
Argumente¶
databaseName der Datenbank, die den Agenten enthält.
schemaName des Schemas, das den Agenten enthält.
agent_nameName des Agenten, für den ein Datensatz abgerufen werden soll.
agent_typeDie Zeichenfolgenkonstante
CORTEX AGENT. Dieser Wert unterscheidet nicht zwischen Groß- und Kleinschreibung.run_nameName der Ausführung, für die die vollständigen Bewertungsdaten abgerufen werden sollen.
Rückgabewerte¶
Eine Tabelle mit Informationen für die angegebene Bewertung mit den folgenden Spalten:
Spalte |
Datentyp |
Beschreibung |
|---|---|---|
RECORD_ID |
VARCHAR |
Der von Snowflake zugewiesene eindeutige Bezeichner für diesen Bewertungsdatensatz. |
INPUT_ID |
VARCHAR |
Der von Snowflake zugewiesene eindeutige Bezeichner für diese Bewertungseingabe. |
REQUEST_ID |
VARCHAR |
Der von Snowflake zugewiesene eindeutige Bezeichner für diese Anforderung. |
TIMESTAMP |
TIMESTAMP_TZ |
Die Uhrzeit (in UTC), zu der die Anforderung gestellt wurde. |
DURATION_MS |
INT |
Die Zeit in Millisekunden, die der Agent benötigte, um eine Antwort zurückzugeben. |
INPUT |
VARCHAR |
Die Abfragezeichenfolge, die als Eingabe für diesen Bewertungsdatensatz verwendet wurde. |
OUTPUT |
VARCHAR |
Die vom Cortex Agent für diesen Bewertungsdatensatz zurückgegebene Antwort. |
ERROR |
VARCHAR |
Informationen über Fehler, die während der Anforderung aufgetreten sind. |
GROUND_TRUTH |
VARCHAR |
Die Ground Truth-Informationen, die zur Bewertung der Cortex Agent-Ausgabe dieses Datensatzes verwendet wurden. |
METRIC_NAME |
VARCHAR |
Der Name der für diesen Datensatz bewerteten Kennzahl. |
EVAL_AGG_SCORE |
NUMBER |
Die für diesen Datensatz zugewiesene Bewertungskennzahl. |
METRIC_TYPE |
VARCHAR |
Der Typ der zu bewertenden Kennzahl. Für integrierte Kennzahlen ist der Wert |
METRIC_STATUS |
VARIANT |
Eine Zuordnung mit Informationen über die HTTP-Antwort des Agenten für diesen Datensatz mit den folgenden Schlüsseln:
|
METRIC_CALLS |
ARRAY |
Ein Array von VARIANT-Werten, die Informationen über die berechnete Kennzahl enthalten. Jeder Array-Eintrag enthält die Kriterien der Kennzahl, eine Erklärung der Kennzahl-Bewertung und Metadaten. Die Schlüssel der einzelnen Einträge sind:
|
TOTAL_INPUT_TOKENS |
INT |
Die Gesamtzahl der Token, die zur Verarbeitung der Eingabeabfrage verwendet wurden. |
TOTAL_OUTPUT_TOKENS |
INT |
Die Gesamtzahl der vom Cortex Agent erzeugten Ausgabe-Token. |
LLM_CALL_COUNT |
INT |
Zählt, wie oft LLM aufgerufen wurde, entweder vom Agenten oder einem Beurteilenden für die Bewertung. |
Anforderungen an die Zugriffssteuerung¶
Eine Rolle, die zur Ausführung dieser Operation verwendet wird, muss mindestens die folgenden Berechtigungen haben:
Berechtigung |
Objekt |
Anmerkungen |
|---|---|---|
CORTEX_USER |
Datenbankrolle |
|
USAGE |
Cortex Agent |
|
MONITOR |
Cortex Agent |
Für das Ausführen von Operationen für ein Objekt in einem Schema ist mindestens eine Berechtigung für die übergeordnete Datenbank und mindestens eine Berechtigung für das übergeordnete Schema erforderlich.
Eine Anleitung zum Erstellen einer kundenspezifischen Rolle mit einer bestimmten Gruppe von Berechtigungen finden Sie unter Erstellen von kundenspezifischen Rollen.
Allgemeine Informationen zu Rollen und Berechtigungen zur Durchführung von SQL-Aktionen auf sicherungsfähigen Objekten finden Sie unter Übersicht zur Zugriffssteuerung.
Informationen zu den Berechtigungen für die vollständige Zugriffssteuerung, die für die Bewertungen von Cortex Agent erforderlich sind, finden Sie unter Cortex Agent-Bewertungen – Anforderungen an die Zugriffssteuerung.
Beispiele¶
Das folgende Beispiel zeigt die vollständigen Bewertungsdetails für eine Ausführung namens run-1 an, wobei der Agent evaluated_agent heißt, der im Schema eval_db.eval_schema gespeichert ist: