offline evaluation
Categoria: avaliação e qualidade
Avaliação realizada em ambiente controlado, antes do deploy, usando datasets preparados. Permite testar mudanças sem risco para usuários reais, mas pode não capturar toda a variabilidade do uso em produção.