EvaluateRagRetrieval 2025.5.31.15¶
Pacote¶
com.snowflake.openflow.runtime | runtime-rag-evaluation-processors-nar
Descrição¶
Calcula métricas de recuperação (Precision@N, Recall@N, FScore@N, MAP@N, MRR) para um sistema RAG usando um LLM como juiz. Para cada registro, ele usa os prompts Precision e Recall para avaliar a resposta e adiciona as métricas como atributos ao FlowFile.
Requisito de entrada¶
REQUIRED
Oferece suporte a propriedades dinâmicas confidenciais¶
falso
Propriedades¶
Propriedade |
Descrição |
---|---|
Caminho de registro do identificador de contexto |
O RecordPath para a matriz de IDs de contexto no registro. |
Caminho do registro de contexto |
O RecordPath para a matriz de contextos no registro. |
Caminho de registro dos resultados da avaliação |
Você deve escrever os resultados da avaliação para RecordPath. |
Caminho de registro da verdade fundamental |
O RecordPath para o campo de verdade fundamental no registro. |
Serviço do provedor de LLM |
O serviço de provedor para enviar prompts de avaliação ao LLM |
Caminho de registro da pergunta |
O RecordPath para o campo de pergunta no registro. |
Record Reader |
O Record Reader a ser usado para ler o FlowFile. |
Record Writer |
O Record Writer a ser usado para gravar os resultados. |
Relações¶
Nome |
Descrição |
---|---|
failure |
FlowFiles que não podem ser processados são encaminhados para essa relação |
success |
FlowFiles que são processados com sucesso são encaminhados para essa relação |
Grava atributos¶
Nome |
Descrição |
---|---|
n |
O número médio de documentos recuperados por consulta. |
precision.at.n |
A precisão média em N em todas as consultas. |
recall.at.n |
A recuperação média em N em todas as consultas. |
fscore.at.n |
O F-Score médio em N em todas as consultas. |
mrr |
O Mean Reciprocal Rank. |
retrieval.eval.failures |
Número de registros em que não foi possível calcular a avaliação. |
json.parse.failures |
Número de falhas de análise do JSON encontradas. |