Utilisation des Tokens & Suivi des Coûts
Suivez la consommation de tokens par modèle et session. Définissez des budgets quotidiens pour contrôler les dépenses. Consultez les statistiques depuis Telegram avec /cost.
Comment Ça Fonctionne
- Chaque appel LLM enregistre les tokens d'entrée et de sortie dans la table SQLite
token_usage - Chaque enregistrement inclut : nom du modèle, ID de session, nombres de tokens et horodatage
- Optionnellement, définissez un budget quotidien de tokens qui bloque les appels LLM une fois dépassé
- Le budget se réinitialise automatiquement à minuit UTC
Configuration
| Key | Type | Default | Description |
|---|---|---|---|
daily_token_budget | integer | null | Nombre maximum total de tokens (entrée + sortie) par jour. Null = illimité. |
config.toml
[state]
daily_token_budget = 1000000 # 1M tokens per dayPortée du Budget
Le budget quotidien est global — il compte tous les tokens de toutes les sessions et tous les modèles. Lorsqu'il est dépassé, les appels LLM retournent une erreur jusqu'à minuit UTC.
Commande Telegram /cost
Envoyez /cost dans Telegram pour voir les statistiques d'utilisation :
text
Token usage (last 24h):
Input: 12,450 tokens
Output: 8,230 tokens
Token usage (last 7d):
Input: 87,320 tokens
Output: 52,180 tokens
Top models (7d):
gemini-3-flash-preview: 98,400 tokens
gemini-3-pro-preview: 41,100 tokensSchéma de la Base de Données
| Key | Type | Default | Description |
|---|---|---|---|
id | INTEGER PK | auto | Clé primaire auto-incrémentée |
session_id | TEXT | — | Quelle session utilisateur/chat a effectué l'appel |
model | TEXT | — | Quel modèle LLM a été utilisé |
input_tokens | INTEGER | — | Tokens envoyés au modèle |
output_tokens | INTEGER | — | Tokens générés par le modèle |
created_at | TEXT | now | Horodatage UTC de l'appel |
Ce Qui Est Suivi
- Tokens d'entrée (contexte + message utilisateur) par appel LLM
- Tokens de sortie (réponse du modèle) par appel LLM
- Nom du modèle pour les répartitions par modèle
- ID de session pour le suivi par utilisateur
- Horodatage pour les requêtes par fenêtre temporelle (24h, 7j)