token optimization
Categoria: avaliação e qualidade
Conjunto de técnicas para reduzir o número de tokens consumidos sem perder qualidade, como compactação de prompts, resumo de contexto, seleção mais precisa de chunks em RAG e remoção de instruções redundantes.