avaliação automática

Categoria: modelos e inferência

Processo de medir a qualidade do agente de forma automatizada, usando modelos de IA ou regras programáticas para analisar respostas sem depender exclusivamente de revisão humana.