offline evaluation

Categoria: avaliação e qualidade

Avaliação realizada em ambiente controlado, antes do deploy, usando datasets preparados. Permite testar mudanças sem risco para usuários reais, mas pode não capturar toda a variabilidade do uso em produção.