Utilisation des Tokens & Suivi des Coûts

Suivez la consommation de tokens par modèle et session. Définissez des budgets quotidiens pour contrôler les dépenses. Consultez les statistiques depuis Telegram avec /cost.

Comment Ça Fonctionne

Chaque appel LLM enregistre les tokens d'entrée et de sortie dans la table SQLite token_usage
Chaque enregistrement inclut : nom du modèle, ID de session, nombres de tokens et horodatage
Optionnellement, définissez un budget quotidien de tokens qui bloque les appels LLM une fois dépassé
Le budget se réinitialise automatiquement à minuit UTC

Configuration

Key	Type	Default	Description
`daily_token_budget`	integer	`null`	Nombre maximum total de tokens (entrée + sortie) par jour. Null = illimité.

config.toml

[state]
daily_token_budget = 1000000  # 1M tokens per day

Portée du Budget

Le budget quotidien est global — il compte tous les tokens de toutes les sessions et tous les modèles. Lorsqu'il est dépassé, les appels LLM retournent une erreur jusqu'à minuit UTC.

Commande Telegram /cost

Envoyez /cost dans Telegram pour voir les statistiques d'utilisation :

text

Token usage (last 24h):
  Input:  12,450 tokens
  Output: 8,230 tokens

Token usage (last 7d):
  Input:  87,320 tokens
  Output: 52,180 tokens

Top models (7d):
  gemini-3-flash-preview: 98,400 tokens
  gemini-3-pro-preview: 41,100 tokens

Schéma de la Base de Données

Key	Type	Default	Description
`id`	INTEGER PK	`auto`	Clé primaire auto-incrémentée
`session_id`	TEXT	`—`	Quelle session utilisateur/chat a effectué l'appel
`model`	TEXT	`—`	Quel modèle LLM a été utilisé
`input_tokens`	INTEGER	`—`	Tokens envoyés au modèle
`output_tokens`	INTEGER	`—`	Tokens générés par le modèle
`created_at`	TEXT	`now`	Horodatage UTC de l'appel

Ce Qui Est Suivi

Tokens d'entrée (contexte + message utilisateur) par appel LLM
Tokens de sortie (réponse du modèle) par appel LLM
Nom du modèle pour les répartitions par modèle
ID de session pour le suivi par utilisateur
Horodatage pour les requêtes par fenêtre temporelle (24h, 7j)

PrécédentRoutage de Modèles SuivantBoucle Agent et Récupération d'Erreurs