- Catégories :
Fonctions de table (Cortex Agents)
GET_AI_EVALUATION_DATA (SNOWFLAKE.LOCAL)¶
Récupère les données d’évaluation pour une exécution pour un Agent Cortex ou pour une application Agent Externe (consultez Commandes External Agent).
Appelez cette fonction pour inspecter toutes les traces enregistrées pour une exécution d’évaluation. Pour plus d’informations sur les évaluations des Agents Cortex, consultez Évaluations Cortex Agent. Pour les applications d’observabilité AI, consultez Données d’observabilité.
- Voir aussi :
EXECUTE_AI_EVALUATION , GET_AI_RECORD_TRACE (SNOWFLAKE.LOCAL) , GET_AI_OBSERVABILITY_LOGS (SNOWFLAKE.LOCAL) , GET_AI_OBSERVABILITY_EVENTS (SNOWFLAKE.LOCAL)
Syntaxe¶
Arguments¶
databaseNom de la base de données contenant l’agent.
schemaNom du schéma contenant l’agent.
agent_nameNom de l’agent pour lequel récupérer un enregistrement.
agent_typeLa chaîne du type d’agent. Utilisez
CORTEX AGENTpour un Agent Cortex ouEXTERNAL AGENTpour un objet Agent Externe. La valeur est insensible à la casse.run_nameNom de l’exécution pour laquelle récupérer les données d’évaluation complètes.
Renvoie¶
Table contenant des informations pour l’évaluation spécifiée, avec les colonnes suivantes :
Colonne |
Type de données |
Description |
|---|---|---|
RECORD_ID |
VARCHAR |
L’identificateur unique attribué par Snowflake pour cet enregistrement d’évaluation. |
INPUT_ID |
VARCHAR |
L’identificateur unique attribué par Snowflake pour cette entrée d’évaluation. |
REQUEST_ID |
VARCHAR |
L’identificateur unique attribué par Snowflake pour cette demande. |
TIMESTAMP |
TIMESTAMP_TZ |
L’heure (en UTC) à laquelle la requête a été effectuée. |
DURATION_MS |
INT |
Temps, en millisecondes, nécessaire à l’agent pour renvoyer une réponse. |
INPUT |
VARCHAR |
La chaîne de requête utilisée en entrée pour cet enregistrement d’évaluation. |
OUTPUT |
VARCHAR |
La réponse renvoyée par Cortex Agent pour cet enregistrement d’évaluation. |
ERROR |
VARCHAR |
Informations sur les erreurs éventuelles pouvant survenir lors de la requête. |
GROUND_TRUTH |
VARCHAR |
Les informations de réalité de terrain utilisées pour évaluer la sortie de Cortex Agent de cet enregistrement. Cette colonne contient le JSON de la colonne de réalité de terrain de votre ensemble de données, sérialisé sous forme de chaîne. Pour savoir comment |
METRIC_NAME |
VARCHAR |
Le nom de la métrique évaluée pour cet enregistrement. |
EVAL_AGG_SCORE |
NUMBER |
Score d’évaluation attribué à cet enregistrement. |
METRIC_TYPE |
VARCHAR |
Le type de métrique en cours d’évaluation. Pour les métriques intégrées, la valeur est |
METRIC_STATUS |
VARIANT |
Carte contenant des informations sur la réponse HTTP de l’agent pour cet enregistrement, avec les clés suivantes :
|
METRIC_CALLS |
ARRAY |
Un tableau de valeurs VARIANT qui contiennent des informations sur la métrique calculée. Chaque entrée de tableau contient les critères de la métrique, une explication du score de la métrique et des métadonnées. Les clés de chaque entrée sont les suivantes :
|
TOTAL_INPUT_TOKENS |
INT |
Le nombre total de jetons utilisés pour traiter la requête d’entrée. |
TOTAL_OUTPUT_TOKENS |
INT |
Le nombre total de jetons de sortie produits par Cortex Agent. |
LLM_CALL_COUNT |
INT |
Compte le nombre de fois où un LLM a été appelé, soit par l’agent, soit par un juge d’évaluation. |
Exigences en matière de contrôle d’accès¶
Un rôle utilisé pour exécuter cette opération doit au minimum disposer des privilèges suivants :
Privilège |
Objet |
Remarques |
|---|---|---|
CORTEX_USER |
Rôle de la base de données |
|
USAGE |
Agent Cortex ou Agent Externe |
Requis sur l’objet identifié par |
MONITOR |
Agent Cortex |
Requis sur l’Agent Cortex identifié par |
Pour effectuer une opération sur un objet dans un schéma, il est nécessaire de disposer d’au moins un privilège sur la base de données parente et d’au moins un privilège sur le schéma parent.
Pour obtenir des instructions sur la création d’un rôle personnalisé avec un ensemble spécifique de privilèges, voir Création de rôles personnalisés.
Pour des informations générales sur les rôles et les privilèges accordés pour effectuer des actions SQL sur des objets sécurisables, voir Aperçu du contrôle d’accès.
Lorsque agent_type est EXTERNAL AGENT, seul USAGE sur cet objet est nécessaire pour appeler cette fonction. OWNERSHIP sur l’Agent Externe est nécessaire pour modifier ou supprimer l’objet avec ALTER EXTERNAL AGENT ou DROP EXTERNAL AGENT.
Pour connaître les autorisations de contrôle d’accès complètes requises par les évaluations des Agents Cortex, consultez Évaluations des Agents Cortex — Exigences en matière de contrôle d’accès. Pour les objets Agents Externes, consultez Données d’observabilité.
Exemples¶
L’exemple suivant affiche les détails d’évaluation complets d’une exécution appelée run-1, où l’agent est nommé``evaluated_agent`` stocké sur le schéma``eval_db.eval_schema`` :