LLM-as-a-judge

Categoria: modelos e inferência

Padrão onde um modelo de linguagem é usado para avaliar a qualidade das respostas de outro modelo ou agente, substituindo ou complementando avaliação humana com critérios definidos por prompt.