Enrutamiento de Modelos
Seleccion automatica de modelo basada en niveles que enruta cada consulta al modelo mas apropiado: Fast, Primary o Smart.
Niveles
| Nivel | Caso de Uso | Modelo Tipico |
|---|---|---|
| Fast | Saludos simples, si/no, consultas cortas | mistral-small-3.1-24b-instruct, mistral-nemo, gpt-5-nano |
| Primary | Conversacion general, tareas moderadas | gpt-5-mini, claude-sonnet-4.5, gemini-3-flash-preview |
| Smart | Razonamiento complejo, generacion de codigo, analisis | gemini-3-pro-preview, gpt-5.1, claude-opus-4.6 |
Reglas de Clasificacion
Nivel Smart (tareas complejas)
Una consulta se clasifica como Smart si alguna de estas condiciones es verdadera:
- Contiene un bloque de codigo (
```) - Longitud del mensaje > 500 caracteres
- Contiene 3+ signos de interrogacion
- Contiene palabras clave: implement, refactor, debug, analyze, step by step, write code, architecture, optimize, algorithm, explain how, write a, build a, create a function, design, compare and contrast, walk me through, troubleshoot, review this, fix this, rewrite
Nivel Fast (consultas simples)
Una consulta se clasifica como Fast si alguna de estas condiciones es verdadera:
- Coincidencia exacta de saludos/confirmaciones: hi, hello, hey, thanks, ok, yes, no, sure, bye, goodbye, ty, cool, nice, great, awesome, lol, haha, wow (sin distincion de mayusculas/minusculas)
- Mensaje de una sola palabra
- Mensaje corto: <20 caracteres Y ≤3 palabras
- Prefijo de consulta simple (what is, who is, define, when is, where is) + ≤6 palabras totales
Nivel Primary (por defecto)
Todo lo demas se asigna al nivel Primary.
Desactivar Auto-Enrutamiento
- Si los tres niveles de modelo son iguales, el enrutamiento se desactiva automaticamente
- Enviar
/model <name>en Telegram desactiva el enrutamiento (anulacion manual) - Enviar
/autoreactiva el enrutamiento automatico