model-based evaluation

Categoria: modelos e inferência

Abordagem de avaliação onde métricas de qualidade do agente (relevância, correção, aderência) são calculadas automaticamente usando outro modelo de IA como avaliador, escalando o processo de quality assurance.