resposta em streaming

Categoria: modelos e inferência

Modo de exibição onde a resposta do agente aparece palavra por palavra conforme é gerada, em vez de esperar a resposta completa. Dá sensação de maior rapidez ao usuário.