token optimization

Categoria: avaliação e qualidade

Conjunto de técnicas para reduzir o número de tokens consumidos sem perder qualidade, como compactação de prompts, resumo de contexto, seleção mais precisa de chunks em RAG e remoção de instruções redundantes.