routing by complexity

Categoria: modelos e inferência

Estratégia de direcionar cada requisição para o modelo mais adequado com base na complexidade estimada da tarefa, usando modelos menores para tarefas simples e modelos maiores para as complexas, otimizando custo e qualidade.