13. März 2026: Cortex Agent-Bewertungen (Allgemeine Verfügbarkeit)¶
Snowflake bietet jetzt Cortex Agent-Bewertungen, mit denen Sie die Verhaltensweise und die Leistung Ihres Agenten überwachen können. Bewerten Sie Ihren Agenten sowohl anhand von Ground Truth-basierten als auch von referenzlosen Bewertungskennzahlen. Während der Bewertung wird die Aktivität Ihres Agenten verfolgt und überwacht, sodass Sie sicherstellen können, dass jeder Schritt des Prozesses Ihrem Endziel näher kommt.
Snowflake bietet die folgenden Kennzahlen, anhand derer Ihr Agent bewertet wird:
Antwortkorrektheit – Wie genau die Antwort eines Agenten auf Ihre vorbereitete Abfrage mit der erwarteten Antwort übereinstimmt. Diese Kennzahl ist am nützlichsten, wenn das Datenset, das Ihr Cortex Agent verwendet, statisch ist.
Logische Konsistenz – Misst die Konsistenz zwischen Agentenanweisungen, Planung und Tool-Aufrufen. Diese Kennzahl ist referenzlos, was bedeutet, dass Sie keine Informationen in Ihrem Datenset für die Bewertung vorbereiten müssen.
Kundenspezifische Kennzahlen – Snowflake ermöglicht es Ihnen auch, kundenspezifische Kennzahlen zu erstellen. Durch die Definition eines Eingabeaufforderungs- und Bewertungssystems können Sie die Vorteile des LLM-Beurteilungsprozesses nutzen, um zusätzliche Konsistenzprüfungen durchzuführen oder die Einhaltung von domänenspezifischen Anforderungen zu gewährleisten.
Informationen zum Erstellen und Ausführen einer Cortex Agent-Bewertung finden Sie unter Cortex Agent-Evaluierungen.