Herramienta de Navegador
Automatizacion de Chrome con sesiones de login persistentes. Inicia sesion una vez, y el agente puede navegar sitios autenticados en tu nombre.
config.toml a continuacion. El feature flag solo es necesario al compilar desde el codigo fuente.Inicio Rapido
Dos pasos para que el agente navegue con tus sesiones de login:
1. Inicia sesion en tus servicios
aidaemon browser loginChrome se abre con un perfil dedicado. Inicia sesion en los servicios a los que quieres que el agente acceda (Gmail, GitHub, AWS Console, Jira, etc.), luego cierra Chrome. Tus sesiones se guardan en ~/.aidaemon/chrome-profile/ y persisten entre reinicios.
2. Habilita la herramienta de navegador
[browser]
enabled = trueEso es todo. El agente ahora puede navegar sitios autenticados usando tus sesiones guardadas.
Configuracion
| Key | Type | Default | Description |
|---|---|---|---|
enabled | bool | false | Habilitar la herramienta de navegador |
headless | bool | true | Ejecutar Chrome sin ventana visible |
screenshot_width | int | 1280 | Ancho del viewport del navegador en pixeles |
screenshot_height | int | 720 | Alto del viewport del navegador en pixeles |
user_data_dir | string | ~/.aidaemon/chrome-profile | Directorio del perfil de Chrome para sesiones persistentes |
profile | string | Default | Nombre del perfil de Chrome dentro de user_data_dir |
remote_debugging_port | int | null | Conectar a una instancia de Chrome existente en este puerto (avanzado) |
Configuracion minima
[browser]
enabled = trueTodo lo demas tiene valores por defecto razonables. Las sesiones se guardan automaticamente en ~/.aidaemon/chrome-profile/.
Acciones
| Accion | Parametros | Descripcion |
|---|---|---|
navigate | url | Navegar a una URL, esperar 2s para la carga de la pagina |
screenshot | selector? | Captura PNG de la pagina completa o un elemento especifico |
click | selector | Hacer clic en un elemento por selector CSS |
fill | selector, value | Escribir texto en un campo de formulario |
get_text | selector? | Extraer contenido de texto de un elemento o de la pagina completa |
execute_js | script | Ejecutar JavaScript arbitrario y devolver el resultado |
wait | selector, timeout_secs? | Esperar a que aparezca un elemento (timeout por defecto 10s) |
close | β | Cerrar la sesion del navegador |
Persistencia de Sesiones
La herramienta de navegador utiliza un perfil de Chrome dedicado en ~/.aidaemon/chrome-profile/ que almacena cookies, almacenamiento local y sesiones de login. Esto significa:
- Inicia sesion una vez via
aidaemon browser login, las sesiones persisten indefinidamente - El agente lanza Chrome en modo headless con este perfil β ya autenticado
- Las sesiones sobreviven a reinicios de aidaemon y del sistema
- Ejecuta
aidaemon browser loginen cualquier momento para agregar nuevos servicios o renovar sesiones expiradas
Modos de Despliegue
Instancia aislada (recomendado)
Cuando ejecutas aidaemon en un servidor dedicado o VM, ningun otro Chrome esta ejecutandose. El agente lanza y controla Chrome directamente.
# SSH into your instance
ssh user@my-server
# One-time: log into services
aidaemon browser login
# Config
# [browser]
# enabled = true
# Done β agent handles Chrome automatically from herePara servidores headless, usa SSH con reenvio X (ssh -X) o VNC para el login inicial.
Computadora personal
Cuando ejecutas aidaemon junto a tu Chrome personal, el agente lanza una instancia de Chrome separada con su propio perfil. Ambos se ejecutan en paralelo sin conflictos.
# Same setup β separate Chrome instance, no conflict
aidaemon browser login
# Your personal Chrome (47 tabs, extensions, bookmarks) β untouched
# Aidaemon's Chrome (~/.aidaemon/chrome-profile/) β isolatedAvanzado: Conectar a Chrome existente
Para usuarios avanzados que quieren conectarse a una instancia de Chrome que ya esta ejecutandose con un puerto de depuracion remota:
[browser]
enabled = true
remote_debugging_port = 9222Inicia Chrome con --remote-debugging-port=9222 y el agente se conecta directamente. Esto comparte las sesiones de la instancia de Chrome pero requiere que Chrome se inicie con la bandera de depuracion.
Capturas de Pantalla
Las capturas de pantalla se toman como PNG y se envian al usuario a traves del canal activo (foto en Telegram, carga de archivo en Slack, etc.) con descripciones que indican la URL de la pagina.
Casos de Uso
- Monitoreo β Revisar dashboards (Grafana, Vercel, AWS Console), capturar estado de despliegues
- Extraccion de datos β Extraer datos de paginas renderizadas con JS, obtener reportes de paneles de administracion
- Automatizacion de flujos de trabajo β Llenar formularios, navegar flujos de multiples pasos en herramientas internas
- Pruebas β Navegar tu aplicacion desplegada, verificar la UI, comprobar layouts responsivos
- Navegacion autenticada β Interactuar con cualquier servicio en el que hayas iniciado sesion, sin necesidad de API keys
Compilacion desde el Codigo Fuente
La herramienta de navegador requiere el feature flag browser:
cargo build --release --features browserRequiere un navegador basado en Chromium instalado (Chrome, Chromium, Brave o Edge).