streaming response

Categoria: modelos e inferência

Resposta do modelo entregue token a token em tempo real via protocolo de streaming (como SSE ou WebSocket), permitindo que o agente exiba resultados progressivamente ao usuário.