Roteamento de Modelos

Seleção automática de modelo baseada em níveis roteia cada consulta para o modelo mais apropriado: Fast, Primary ou Smart.

Níveis

Nível	Caso de Uso	Modelo Típico
Fast	Saudações simples, sim/não, consultas curtas	mistral-small-3.1-24b-instruct, mistral-nemo, gpt-5-nano
Primary	Conversas gerais, tarefas moderadas	gpt-5-mini, claude-sonnet-4.5, gemini-3-flash-preview
Smart	Raciocínio complexo, geração de código, análise	gemini-3-pro-preview, gpt-5.1, claude-opus-4.6

Uma consulta é classificada como Smart se qualquer uma destas condições for verdadeira:

Contém um bloco de código (```)
Comprimento da mensagem > 500 caracteres
Contém 3+ pontos de interrogação
Contém palavras-chave: implement, refactor, debug, analyze, step by step, write code, architecture, optimize, algorithm, explain how, write a, build a, create a function, design, compare and contrast, walk me through, troubleshoot, review this, fix this, rewrite

Uma consulta é classificada como Fast se qualquer uma destas condições for verdadeira:

Correspondência exata de saudações/confirmações: hi, hello, hey, thanks, ok, yes, no, sure, bye, goodbye, ty, cool, nice, great, awesome, lol, haha, wow (sem distinção de maiúsculas/minúsculas)
Mensagem de uma única palavra
Mensagem curta: <20 caracteres E ≤3 palavras
Prefixo de consulta simples (what is, who is, define, when is, where is) + ≤6 palavras no total

Todo o resto é direcionado ao nível Primary.

Se todos os três níveis de modelo forem iguais, o roteamento é automaticamente desativado
Enviar /model <nome> no Telegram desativa o roteamento (substituição manual)
Enviar /auto reativa o roteamento automático