13 de março de 2026: avaliações do Cortex Agent (disponibilidade geral)

O Snowflake agora oferece avaliações do Cortex Agent que permitem monitorar o comportamento e o desempenho do seu agente. Avalie seu agente em relação a métricas de avaliação sem referências e com base em verdade fundamental. Durante a avaliação, a atividade do seu agente é rastreada e monitorada para que você possa garantir que cada etapa do processo avance rumo ao seu objetivo final.

O Snowflake oferece as seguintes métricas para avaliar seu agente:

  • Exatidão da resposta: até que ponto a resposta de um agente à sua consulta preparada corresponde a uma resposta esperada. Essa métrica é mais útil quando o conjunto de dados que alimenta o Cortex Agent é estático.

  • Consistência lógica: mede a consistência entre instruções do agente, planejamento e chamadas de ferramentas. Essa métrica é sem referência, o que significa que você não precisa preparar nenhuma informação em seu conjunto de dados para avaliação.

  • Métricas personalizadas: o Snowflake também permite que você crie métricas personalizadas. Ao definir um prompt e um sistema de pontuação, você pode aproveitar o processo de avaliação do LLM para executar verificações adicionais de consistência ou conformidade com os requisitos específicos do domínio.

Para obter informações sobre como criar e executar uma avaliação do Cortex Agent, consulte Avaliações do Cortex Agent.