- Categorias:
Funções de tabela (Cortex Agents)
GET_AI_EVALUATION_DATA (SNOWFLAKE.LOCAL)¶
Retrieves evaluation data for a run for a Cortex Agent or for an External Agent application (see External Agent commands).
Call this function to inspect all recorded traces for an evaluation run. For more information on Cortex Agent evaluations, see Avaliações do Cortex Agent. For AI Observability applications, see Dados de observabilidade.
- Consulte também:
EXECUTE_AI_EVALUATION , GET_AI_RECORD_TRACE (SNOWFLAKE.LOCAL) , GET_AI_OBSERVABILITY_LOGS (SNOWFLAKE.LOCAL) , GET_AI_OBSERVABILITY_EVENTS (SNOWFLAKE.LOCAL)
Sintaxe¶
Argumentos¶
databaseNome do banco de dados que contém o agente.
schemaNome do esquema que contém o agente.
agent_nameNome do agente do qual recuperar um registro.
agent_typeThe agent type string. Use
CORTEX AGENTfor a Cortex Agent orEXTERNAL AGENTfor an External Agent object. This value is case-insensitive.run_nameNome da execução para a qual recuperar os dados de avaliação completos.
Retornos¶
Uma tabela contendo informações para a avaliação especificada, com as seguintes colunas:
Coluna |
Tipo de dados |
Descrição |
|---|---|---|
RECORD_ID |
VARCHAR |
O identificador exclusivo atribuído pelo Snowflake para este registro de avaliação. |
INPUT_ID |
VARCHAR |
O identificador exclusivo atribuído pelo Snowflake para esta entrada de avaliação. |
REQUEST_ID |
VARCHAR |
O identificador exclusivo atribuído pelo Snowflake para esta solicitação. |
TIMESTAMP |
TIMESTAMP_TZ |
A hora (em UTC) em que a solicitação foi feita. |
DURATION_MS |
INT |
O tempo, em milissegundos, que o agente levou para retornar uma resposta. |
INPUT |
VARCHAR |
A cadeia de caracteres de consulta usada como entrada para este registro de avaliação. |
OUTPUT |
VARCHAR |
A resposta retornada pelo Cortex Agent para este registro de avaliação. |
ERROR |
VARCHAR |
Informações sobre possíveis erros ocorridos durante a solicitação. |
GROUND_TRUTH |
VARCHAR |
The ground truth information used to evaluate this record’s Cortex Agent output. This column holds the JSON from your dataset’s ground truth column, serialized as a string. For how |
METRIC_NAME |
VARCHAR |
O nome da métrica avaliada para este registro. |
EVAL_AGG_SCORE |
NUMBER |
A pontuação de avaliação atribuída a este registro. |
METRIC_TYPE |
VARCHAR |
O tipo de métrica que está sendo avaliada. Para métricas internas, o valor é |
METRIC_STATUS |
VARIANT |
Um mapa com informações sobre a resposta HTTP do agente para este registro, com as seguintes chaves:
|
METRIC_CALLS |
ARRAY |
Uma matriz de valores VARIANT que contêm informações sobre a métrica computada. Cada entrada da matriz contém os critérios da métrica, uma explicação da pontuação da métrica e os metadados. As chaves de cada entrada são:
|
TOTAL_INPUT_TOKENS |
INT |
O número total de tokens usados para processar a consulta de entrada. |
TOTAL_OUTPUT_TOKENS |
INT |
O número total de tokens de saída produzidos pelo Cortex Agent. |
LLM_CALL_COUNT |
INT |
Conta quantas vezes um LLM foi chamado, seja pelo agente, seja por um juiz de avaliação. |
Requisitos de controle de acesso¶
A função usada para executar essa operação deve ter, no mínimo, os seguintes privilégios:
Privilégio |
Objeto |
Notas |
|---|---|---|
CORTEX_USER |
Função de banco de dados |
|
USAGE |
Cortex Agent or External Agent |
Required on the object identified by |
MONITOR |
Cortex Agent |
Required on the Cortex Agent identified by |
Operar em um objeto em um esquema requer pelo menos um privilégio no banco de dados pai e pelo menos um privilégio no esquema pai.
Para instruções sobre como criar uma função personalizada com um conjunto específico de privilégios, consulte Criação de funções personalizadas.
Para informações gerais sobre concessões de funções e privilégios para executar ações de SQL em objetos protegíveis, consulte Visão geral do controle de acesso.
When agent_type is EXTERNAL AGENT, only USAGE on that object is required to call this function. OWNERSHIP on the External Agent is required to modify or remove the object with ALTER EXTERNAL AGENT or DROP EXTERNAL AGENT.
For the full access control permissions required by Cortex Agent evaluations, see Cortex Agent evaluations – Access control requirements. For External Agent objects, see Dados de observabilidade.
Exemplos¶
O exemplo a seguir exibe os detalhes completos da avaliação para uma execução chamada run-1, em que o agente é chamado evaluated_agent e armazenado no esquema eval_db.eval_schema: