LLM como juiz

Categoria: modelos e inferência

Técnica onde um modelo de IA avalia a qualidade das respostas do agente, funcionando como um "revisor automático" que pontua critérios como relevância, correção e aderência às instruções.