Uso de Tokens & Rastreamento de Custos
Acompanhe o consumo de tokens por modelo e sessão. Defina orçamentos diários para controlar gastos. Verifique estatísticas pelo Telegram com /cost.
Como Funciona
- Cada chamada ao LLM registra tokens de entrada e saída na tabela SQLite
token_usage - Cada registro inclui: nome do modelo, ID da sessão, contagem de tokens e timestamp
- Opcionalmente, defina um orçamento diário de tokens que bloqueia chamadas ao LLM quando excedido
- O orçamento é resetado automaticamente à meia-noite UTC
Configuração
| Key | Type | Default | Description |
|---|---|---|---|
daily_token_budget | integer | null | Máximo total de tokens (entrada + saída) por dia. Null = ilimitado. |
config.toml
[state]
daily_token_budget = 1000000 # 1M tokens per dayEscopo do Orçamento
O orçamento diário é global — ele conta todos os tokens de todas as sessões e modelos. Quando excedido, chamadas ao LLM retornam um erro até a meia-noite UTC.
Comando /cost do Telegram
Envie /cost no Telegram para ver estatísticas de uso:
text
Token usage (last 24h):
Input: 12,450 tokens
Output: 8,230 tokens
Token usage (last 7d):
Input: 87,320 tokens
Output: 52,180 tokens
Top models (7d):
gemini-3-flash-preview: 98,400 tokens
gemini-3-pro-preview: 41,100 tokensEsquema do Banco de Dados
| Key | Type | Default | Description |
|---|---|---|---|
id | INTEGER PK | auto | Chave primária auto-incrementável |
session_id | TEXT | — | Qual sessão de usuário/chat fez a chamada |
model | TEXT | — | Qual modelo LLM foi usado |
input_tokens | INTEGER | — | Tokens enviados ao modelo |
output_tokens | INTEGER | — | Tokens gerados pelo modelo |
created_at | TEXT | now | Timestamp UTC da chamada |
O Que é Rastreado
- Tokens de entrada (contexto + mensagem do usuário) por chamada ao LLM
- Tokens de saída (resposta do modelo) por chamada ao LLM
- Nome do modelo para detalhamento por modelo
- ID da sessão para rastreamento por usuário
- Timestamp para consultas por janela de tempo (24h, 7d)