teste A/B
Categoria: avaliação e qualidade
Experimento em que duas versões do agente (com prompts, instruções ou configurações diferentes) são testadas com grupos diferentes de usuários para descobrir qual versão gera melhores resultados de forma objetiva.