EN·ES·DE·PT·FR
⌘K

Uso de Tokens & Rastreamento de Custos

Acompanhe o consumo de tokens por modelo e sessão. Defina orçamentos diários para controlar gastos. Verifique estatísticas pelo Telegram com /cost.

Como Funciona

  1. Cada chamada ao LLM registra tokens de entrada e saída na tabela SQLite token_usage
  2. Cada registro inclui: nome do modelo, ID da sessão, contagem de tokens e timestamp
  3. Opcionalmente, defina um orçamento diário de tokens que bloqueia chamadas ao LLM quando excedido
  4. O orçamento é resetado automaticamente à meia-noite UTC

Configuração

KeyTypeDefaultDescription
daily_token_budgetintegernullMáximo total de tokens (entrada + saída) por dia. Null = ilimitado.
config.toml
[state]
daily_token_budget = 1000000  # 1M tokens per day
Escopo do Orçamento
O orçamento diário é global — ele conta todos os tokens de todas as sessões e modelos. Quando excedido, chamadas ao LLM retornam um erro até a meia-noite UTC.

Comando /cost do Telegram

Envie /cost no Telegram para ver estatísticas de uso:

text
Token usage (last 24h):
  Input:  12,450 tokens
  Output: 8,230 tokens

Token usage (last 7d):
  Input:  87,320 tokens
  Output: 52,180 tokens

Top models (7d):
  gemini-3-flash-preview: 98,400 tokens
  gemini-3-pro-preview: 41,100 tokens

Esquema do Banco de Dados

KeyTypeDefaultDescription
idINTEGER PKautoChave primária auto-incrementável
session_idTEXTQual sessão de usuário/chat fez a chamada
modelTEXTQual modelo LLM foi usado
input_tokensINTEGERTokens enviados ao modelo
output_tokensINTEGERTokens gerados pelo modelo
created_atTEXTnowTimestamp UTC da chamada

O Que é Rastreado

  • Tokens de entrada (contexto + mensagem do usuário) por chamada ao LLM
  • Tokens de saída (resposta do modelo) por chamada ao LLM
  • Nome do modelo para detalhamento por modelo
  • ID da sessão para rastreamento por usuário
  • Timestamp para consultas por janela de tempo (24h, 7d)