routing by complexity
Categoria: modelos e inferência
Estratégia de direcionar cada requisição para o modelo mais adequado com base na complexidade estimada da tarefa, usando modelos menores para tarefas simples e modelos maiores para as complexas, otimizando custo e qualidade.