Roteamento de Modelos
Seleção automática de modelo baseada em níveis roteia cada consulta para o modelo mais apropriado: Fast, Primary ou Smart.
Níveis
| Nível | Caso de Uso | Modelo Típico |
|---|---|---|
| Fast | Saudações simples, sim/não, consultas curtas | mistral-small-3.1-24b-instruct, mistral-nemo, gpt-5-nano |
| Primary | Conversas gerais, tarefas moderadas | gpt-5-mini, claude-sonnet-4.5, gemini-3-flash-preview |
| Smart | Raciocínio complexo, geração de código, análise | gemini-3-pro-preview, gpt-5.1, claude-opus-4.6 |
Regras de Classificação
Nível Smart (tarefas complexas)
Uma consulta é classificada como Smart se qualquer uma destas condições for verdadeira:
- Contém um bloco de código (
```) - Comprimento da mensagem > 500 caracteres
- Contém 3+ pontos de interrogação
- Contém palavras-chave: implement, refactor, debug, analyze, step by step, write code, architecture, optimize, algorithm, explain how, write a, build a, create a function, design, compare and contrast, walk me through, troubleshoot, review this, fix this, rewrite
Nível Fast (consultas simples)
Uma consulta é classificada como Fast se qualquer uma destas condições for verdadeira:
- Correspondência exata de saudações/confirmações: hi, hello, hey, thanks, ok, yes, no, sure, bye, goodbye, ty, cool, nice, great, awesome, lol, haha, wow (sem distinção de maiúsculas/minúsculas)
- Mensagem de uma única palavra
- Mensagem curta: <20 caracteres E ≤3 palavras
- Prefixo de consulta simples (what is, who is, define, when is, where is) + ≤6 palavras no total
Nível Primary (padrão)
Todo o resto é direcionado ao nível Primary.
Desativando o Roteamento Automático
- Se todos os três níveis de modelo forem iguais, o roteamento é automaticamente desativado
- Enviar
/model <nome>no Telegram desativa o roteamento (substituição manual) - Enviar
/autoreativa o roteamento automático