Enrutamiento de Modelos

Seleccion automatica de modelo basada en niveles que enruta cada consulta al modelo mas apropiado: Fast, Primary o Smart.

Niveles

Nivel	Caso de Uso	Modelo Tipico
Fast	Saludos simples, si/no, consultas cortas	mistral-small-3.1-24b-instruct, mistral-nemo, gpt-5-nano
Primary	Conversacion general, tareas moderadas	gpt-5-mini, claude-sonnet-4.5, gemini-3-flash-preview
Smart	Razonamiento complejo, generacion de codigo, analisis	gemini-3-pro-preview, gpt-5.1, claude-opus-4.6

Una consulta se clasifica como Smart si alguna de estas condiciones es verdadera:

Contiene un bloque de codigo (```)
Longitud del mensaje > 500 caracteres
Contiene 3+ signos de interrogacion
Contiene palabras clave: implement, refactor, debug, analyze, step by step, write code, architecture, optimize, algorithm, explain how, write a, build a, create a function, design, compare and contrast, walk me through, troubleshoot, review this, fix this, rewrite

Una consulta se clasifica como Fast si alguna de estas condiciones es verdadera:

Coincidencia exacta de saludos/confirmaciones: hi, hello, hey, thanks, ok, yes, no, sure, bye, goodbye, ty, cool, nice, great, awesome, lol, haha, wow (sin distincion de mayusculas/minusculas)
Mensaje de una sola palabra
Mensaje corto: <20 caracteres Y ≤3 palabras
Prefijo de consulta simple (what is, who is, define, when is, where is) + ≤6 palabras totales

Todo lo demas se asigna al nivel Primary.

Si los tres niveles de modelo son iguales, el enrutamiento se desactiva automaticamente
Enviar /model <name> en Telegram desactiva el enrutamiento (anulacion manual)
Enviar /auto reactiva el enrutamiento automatico