online evaluation
Categoria: avaliação e qualidade
Avaliação realizada com o agente em produção, usando dados e interações reais de usuários. Captura o desempenho verdadeiro do agente no mundo real, mas exige cuidado para não degradar a experiência do usuário durante a medição.