execution accuracy

Categoria: avaliação e qualidade

Grau em que o agente executa corretamente cada etapa de um workflow ou pipeline analítico, incluindo escolha correta de ferramentas, sequência de operações e tratamento de erros. Mede a competência operacional do agente, não apenas a qualidade do resultado final.