model-based evaluation
Categoria: modelos e inferência
Abordagem de avaliação onde métricas de qualidade do agente (relevância, correção, aderência) são calculadas automaticamente usando outro modelo de IA como avaliador, escalando o processo de quality assurance.