Aprende a operar y dominar Hermes Agent. Configura la plantilla de la sala de control de agentes, configura agentes especialistas y pasa de un solo agente a todo un departamento de marketing en un solo VPS.
La mayoría de las herramientas de IA responden preguntas. Hermes Agent ejecuta tus flujos de trabajo de principio a fin.
Navega por tu navegador, ejecuta comandos en la terminal, programa tareas de cron, monitorea tus bandejas de entrada, redacta el trabajo y publica el resultado donde sea que estés: Telegram, Discord, Slack, el hilo de correo en el que estás ahora mismo.
Creado por @NousResearch y es de código abierto con 150,000 estrellas en GitHub. Actualmente ocupa el puesto #1 en OpenRouter por uso global de tokens.
Es el framework sobre el que he construido toda mi operación de marketing durante las últimas semanas, y el artículo que estás a punto de leer es cómo lo configuraría si empezara hoy.

lo que obtendrás de este artículo
- qué es Hermes Agent y por qué los marketers (no solo desarrolladores) deberían preocuparse
- la versión del arquitectura apta para lectores: el cerebro, la personalidad, el conjunto de habilidades, y cómo viven todos en una sola carpeta
- los casos de uso que yo mismo ejecuto en Hermes, con las cuatro publicaciones que he compartido sobre ellos
- el modelo mental de cuatro partes (tú, sala de control, agentes, bus de tareas opcional) y los cuatro niveles de configuración, desde "un agente en tu portátil" hasta "un equipo de agentes completamente automatizado en un VPS que controlas desde tu teléfono"
- la metodología de prototipo → producción que uso para llevar un flujo de trabajo de marketing desde una idea desordenada hasta un despliegue autónomo
- los recursos que me hubiera gustado tener el primer día: documentación, el atlas de la comunidad, las personas a seguir, los encuentros que están sucediendo ahora mismo
- las desventajas honestas y dónde esto todavía falla
No te estoy vendiendo nada en este artículo. Hermes es de código abierto, Nous Portal tiene un nivel gratuito, y la mayor parte del ecosistema de la comunidad también es gratuito. Haz un fork, cámbialo, hazlo tuyo.
qué es Hermes Agent
versión corta: un agente autónomo que se vuelve más capaz cuanto más tiempo funciona.
versión larga: Hermes es un framework construido por Nous Research que convierte un modelo en un operador persistente. Tiene su propia memoria que sobrevive entre sesiones. Escribe sus propias habilidades mientras trabaja. Viene con 123 habilidades ya integradas (flujos de trabajo de GitHub, Obsidian, Google Workspace, Linear, Notion, Typefully, Perplexity, deep research, y más de 100 más). Vive donde lo pongas, en tu portátil, en un contenedor Docker, en un VPS, en un runtime serverless. Y puedes hablar con él a través de más de 20 superficies: Telegram, Discord, Slack, correo electrónico, modo de voz, o simplemente tu terminal.
Si has usado Claude Code o OpenClaw, Hermes tiene la misma forma con una filosofía diferente.
Hermes es como tener rieles. Valores predeterminados bien pensados, listo para usar, productivo desde el primer día con configuración mínima, el agente piensa más por ti.
OpenClaw es como Linux. Primitivas, garantías, control explícito, el agente hace exactamente lo que le dijiste y nada más.
Ambos son válidos. Yo uso Hermes porque los valores predeterminados integrados se acumulan. Cada proyecto que inicio con Hermes es uno donde el agente ya sabe cómo hacer más de 100 cosas antes de que yo escriba una línea de configuración. Esa ventaja inicial vale la pena para mí. También he notado que Hermes no tiene ni de lejos el mismo problema de desconexión de la puerta de enlace o fallos.
La prueba está en los números que Nous Research acaba de alcanzar:
- #1 en OpenRouter por uso global de tokens (entre todos los modelos y frameworks de la plataforma)
- 150,000 estrellas en GitHub en el repositorio de Hermes
- 123 habilidades incluidas antes de que el agente escriba una propia
- Más de 70 herramientas integradas en la puerta de enlace, además de más de 300 modelos a través de una suscripción
- 6 destinos de implementación: local, Docker, SSH, Daytona, Singularity, Modal
- Más de 20 superficies de mensajería: Telegram, Discord, Slack, correo electrónico, voz
Si eres un marketer de IA y aún no has empezado a usar Hermes, estás dejando sobre la mesa capacidad de crecimiento cada semana.
cómo funciona (la versión apta para lectores)
Cada agente de Hermes tiene tres cosas.
Un cerebro. La memoria vive en ~/.hermes/memories/. Dos archivos, MEMORY.md y USER.md, se inyectan al inicio de la sesión. Tu rúbrica de voz, tus notas de marca, el lenguaje de tus clientes, las correcciones de la semana pasada, todo se carga antes del primer mensaje. Las sesiones se almacenan en SQLite, la recuperación entre sesiones es de búsqueda de texto completo.
Una personalidad. Soul.md es donde vive la vibra. Conciso. Sarcástico. Directo. Formal. Rápido o reflexivo. Puedes crear seis agentes y darle a cada uno un alma diferente, con el mismo cerebro debajo. Uno es tu representante de ventas salientes con energía de cierre. Otro es tu investigador al que le gustan las oraciones largas. Otro es tu asistente que lo mantiene todo breve.

un conjunto de habilidades.
123 habilidades listas para usar: PRs de GitHub, Obsidian, Google Workspace, Linear, Notion, Typefully, Perplexity, deep research, control del navegador, web scraping, visión, voz, programación. Y el bucle de aprendizaje cerrado: mientras el agente trabaja, escribe nuevas habilidades sobre la marcha. Tu propia biblioteca de habilidades crece sobre las 123 sin que tengas que escribir ninguna.
Luego está con qué puede hablar el agente.
- La puerta de enlace de herramientas: una suscripción, más de 300 modelos, más web scraping y automatización del navegador integrados
- Integración MCP: cualquier servicio externo que hable el Protocolo de Contexto de Modelo se convierte en una herramienta que tu agente puede usar
- Más de 20 superficies de mensajería: Telegram, Discord, Slack, correo electrónico, voz, además de la propia CLI

y dónde puede vivir el agente.
- Tu portátil (local)
- Un contenedor Docker (aislado, portátil, como lo ejecuto yo)
- Una sesión SSH en un VPS (para que funcione incluso cuando tu portátil está cerrado)
- Daytona, Singularity, Modal (serverless si no quieres gestionar infraestructura)
El bucle de aprendizaje cerrado es lo que hace que esto sea diferente de un chatbot inteligente. El agente se observa a sí mismo trabajando, escribe nuevas habilidades a medida que aprende la forma de tu trabajo, refina su memoria periódicamente y recuerda el contexto pasado entre sesiones usando una combinación de búsqueda de texto completo y resumen LLM. No tienes que volver a enseñarle la semana que viene.
La regla que le digo a la gente nueva en Hermes es esta: no intentes escribir tus propias habilidades el primer día. Ejecuta trabajo real, deja que el agente observe y deja que el arnés escriba las habilidades. Construyes una biblioteca de habilidades personalizada más rápido trabajando que escribiendo mensajes.
lo que ejecuto en Hermes
Soy un marketer de IA, no un programador. La mayor parte de lo que ejecuto en Hermes es infraestructura de marketing con alguna herramienta interna ocasional. Aquí está la lista real:
- Un asistente personal que maneja lo laboral y lo privado, vive en Telegram, señala los cuatro correos electrónicos que vale la pena leer cada mañana, programa mis recordatorios, resume las reuniones que me perdí
- Un banco de pruebas de prototipos de flujos de trabajo de marketing donde pruebo nuevos flujos (imán de leads, revisión de creatividades publicitarias, sprint de contenido) contra trabajo real durante 2-3 ejecuciones antes de promocionarlos
- Agentes de marketing especializados: SEO, ventas salientes / desarrollo de negocio, revisión de diseño, redacción de contenido, cada uno con su propia alma y su propio alcance
- Un cerebro de empresa que monitorea Slack, chats, correos electrónicos, transcripciones, notas de voz, y hace que todo sea consultable. Cuando pregunto "¿qué le dijimos a ese cliente sobre el precio el mes pasado?" obtengo la respuesta en 3 segundos en lugar de 30 minutos de búsqueda
- Un agente SEO que ejecuta el pipeline completo desde la semilla de palabras clave hasta el artículo publicado en un solo contenedor Docker, 21 pasos, sin intervención humana hasta la revisión final
- Un agente de distribución de contenido que toma una pieza de formato largo (este artículo, por ejemplo) y la atomiza en LinkedIn, X, Threads, con ganchos específicos para cada plataforma
- Un agente orquestador que no produce trabajo en sí mismo, solo enruta las solicitudes al especialista adecuado según lo que estoy pidiendo
El plano que publiqué que lo resume:
El agente SEO en particular merece un análisis más detallado, porque es el que he lanzado públicamente y el que mejor se ajusta a la arquitectura del resto de este artículo. Cinco capas, todas dentro de un contenedor Docker, 21 pasos desde la semilla de palabras clave hasta el artículo publicado.
Los 21 pasos se ven así en la terminal:
Las capas sobre este pipeline:
- Cerebro de la empresa en la parte superior: visión, marca, audiencia, productos. Cada agente lee de aquí.
- Agente orquestador Hermes: toma el tema o la semilla de palabras clave y lo enruta al agente SEO.
- Cerebro SEO: manual de posicionamiento, reglas de voz, formatos de contenido, guía de estilo visual, criterios de éxito por formato. Todo el contexto específico de SEO vive aquí.
- Tres subagentes dentro del agente SEO, cada uno manejando una fase:
- Investigación e ideación: semilla de palabras clave, instantánea de SERP, extracción de competidores, análisis de intención y formato, brecha de contenido y visual, validación interna y externa.
- Producción: briefing de ángulo y posicionamiento, briefing de estrategia visual, esquema, borrador, generación de imágenes, generación de diagramas de flujo, QA visual y de artículo.
- Distribución: preparación para publicación, schema, enlazado interno, sindicación, analítica, monitoreo.
- Un contenedor Docker contiene los tres subagentes. Comparten entorno, memoria y herramientas. Los subperfiles cambian de contexto por fase. Un proceso, un sistema de archivos, un conjunto de credenciales.
Por qué un contenedor en lugar de tres: el trabajo SEO es secuencial. La investigación alimenta el briefing, el briefing alimenta la producción, la producción alimenta la distribución. Cada paso necesita memoria de lo que se decidió aguas arriba. Dividir en tres contenedores significa transportar el estado a través de los límites, lo cual se vuelve costoso y rompe la cadena.
Cada otro agente especializado en la empresa se ejecuta en la misma plantilla. Clona la plantilla del agente SEO, cambia el cerebro (cerebro SEO → cerebro de ventas salientes, o → cerebro de diseño, o → cerebro de soporte), y tienes un nuevo agente para cualquier función con la misma forma de cinco capas.
Las capas no son decoración. Son la razón por la que el agente no pierde el contexto a medida que el trabajo se especializa. El cerebro de la empresa se mantiene estable mientras el trabajador itera. Las capas del cerebro hacen que el trabajador sea desechable.
También organicé recientemente un evento de Nous Research en nuestra sede de @EspressioAI en Lisboa para una velada de Hermes Agent. @yeahfortommy de Nous dirigió una sesión de preguntas y respuestas, Simao de noticed .so mostró un arnés de agente con investigación automatizada, y yo expliqué cómo estamos usando Hermes para el crecimiento en Espressio.
Si estás en Lisboa y quieres venir al próximo, publicaré cuándo esté programado.
de un agente a una flota completa
Antes de los niveles, el modelo mental.
La configuración tiene cuatro partes:
- Tú eres el operador. Tienes acceso directo a cada parte del sistema.
- La sala de control de agentes es el plano de control lateral. No es un agente con el que chatees. Es una carpeta en /root/vps-agents que documenta y gobierna toda la flota. La abres, la editas, la inspeccionas, o le pides a Claude, Codex o Hermes que la usen cuando estás gestionando el sistema.
- Los agentes Hermes son los trabajadores. Algunos son especialistas (SEO, desarrollo, CMO, operaciones). Uno de ellos puede ser opcionalmente un orquestador.
- El bus de tareas de agentes es un escritorio de transferencia opcional que se sitúa entre el orquestador y los especialistas. Solo lo necesitas una vez que tienes un orquestador en juego.
Todo se ve así:
La división del almacenamiento importa más de lo que la gente piensa:
La sala de control contiene las respuestas a preguntas como qué agentes existen, qué hacen, qué puertos usan, a qué credenciales hacen referencia, qué puede y no puede hacer cada agente, y cómo reiniciar, depurar o reconstruir cualquiera de ellos. El runtime en vivo contiene el funcionamiento real.
La sala de control es el cerebro que define el sistema. El runtime en vivo es el cuerpo que lo ejecuta. Puedes reconstruir el cuerpo a partir del cerebro. No puedes reconstruir el cerebro a partir del cuerpo.
Dentro de la sala de control:
Y dentro del runtime de cada agente en /srv/<nombre-del-agente>/data/:
tres formas de interactuar
- La ruta de control es la capa meta. Se usa al añadir agentes, revisar documentos, verificar puertos, rotar claves, depurar la configuración.
- La ruta directa es la más rápida. Se usa cuando ya sabes qué agente hace el trabajo.
- La ruta orquestada es el sintetizador. Se usa cuando quieres una única puerta de entrada que enrute y combine el trabajo entre múltiples especialistas.
nivel 1: un agente
Tienes un agente Hermes. Eso es todo. La sala de control aún puede existir (recomendado) pero solo documenta ese agente.
Mejor para: configuración inicial, tu Hermes personal, documentación de instalación raíz, migración simple a Docker.
Un agente, vivido, con una personalidad que has ajustado y una memoria que ha comenzado a construirse. Rellena SOUL.md con la voz que quieras, MEMORY.md con los hechos estables sobre tu negocio y USER.md con los hechos estables sobre ti. Conéctalo a Telegram o Discord para que viva donde tú estás. Empieza a usarlo en tareas reales. Deja que toque tus herramientas. Deja que escriba sus propias habilidades sobre la marcha.
MEMORY.md contiene los hechos estables (qué es tu negocio, quiénes son tus clientes, qué hacen tus productos). USER.md contiene los hechos estables sobre ti (zona horaria, horas de trabajo, proyectos recurrentes, formatos de salida preferidos). Ambos se refinan cada semana a medida que corriges al agente en conversaciones reales.
nivel 2: agentes especialistas directos
Tienes múltiples agentes especializados, pero aún hablas con cada uno directamente. Sin orquestador todavía.
La sala de control los documenta a todos.
Mejor para: separación clara de roles, probar qué agentes son útiles, evitar la orquestación prematura, mantener las credenciales limitadas por agente.
La trampa a evitar aquí es buscar un orquestador antes de haber demostrado que tus especialistas son útiles. Crea dos o tres, ejecútalos directamente, y solo añade un orquestador cuando te encuentres queriendo una única puerta de entrada.
Cuándo crear un nuevo agente frente a quedarte con lo que tienes:
Mal patrón: un mega-agente con cada credencial y cada capa de memoria mezclada. Pierdes el aislamiento, pierdes la capacidad de revocar el acceso de forma limpia, y el agente se confunde sobre qué voz usar.
nivel 3: orquestador + especialistas
Añades Hermes-Orchestrator como puerta de entrada. Aún puedes hablar directamente con los especialistas, pero el orquestador puede enrutar el trabajo y sintetizar los resultados.

El orquestador lee la sala de control para saber qué agentes existen, qué hace cada uno, dónde viven las colas de tareas, qué requiere aprobación, qué acciones están prohibidas y dónde están los documentos y manuales. No necesita preguntarte nada de eso, lo lee.
Mejor para: trabajo multifuncional, delegación, resumen y síntesis, una interfaz principal para flujos de trabajo multiagente.
El orquestador es el momento en que tu configuración deja de ser una colección de agentes y comienza a ser un equipo. También es el momento en que la sala de control demuestra su valor, porque el orquestador es tan bueno como los documentos que lee.
Cómo se ve una verificación rápida de la flota desde mi portátil o teléfono:
nivel 4: equipo de agentes automatizado
Misma forma que el nivel 3, pero con flujos de trabajo recurrentes y automatización más sólida. Los informes SEO semanales se ejecutan con cron. Las comprobaciones de estado del servidor se realizan a diario. La verificación de copias de seguridad se ejecuta sin que lo pidas. Los flujos de trabajo empresariales entre agentes se activan según un horario.
Mejor para: informes SEO semanales, operaciones de contenido, comprobaciones de estado del servidor, verificación de copias de seguridad, flujos de trabajo empresariales entre agentes.
El nivel 4 es cómo se ve un departamento de marketing en tu terminal. No necesita que inicies el día. Se presenta a trabajar por sí solo, presenta informes, se verifica a sí mismo, y solo te notifica para las decisiones que requieren criterio.

la jerarquía de control
Un principio para tener en mente a medida que asciendes de nivel.
La sala de control es para configuración, documentos, manuales y gobierno. Documenta qué agentes existen, qué hacen, dónde se ejecutan, a qué credenciales hacen referencia, qué puede y no puede hacer cada agente. Es el panel de administración de la flota, incluido el orquestador. No es a donde vas para hacer trabajo.
Para trabajar, hablas directamente con los agentes. Ya sea un especialista (cuando sabes qué agente es el responsable del trabajo) o el orquestador (cuando quieres una única puerta de entrada para enrutar entre especialistas).
la guía de configuración: apunta tu agente al repositorio
Ahora entiendes la arquitectura. Aquí te explicamos cómo construirla.
He publicado una plantilla pública que contiene la estructura exacta descrita anteriormente, más las habilidades que tu agente necesita para configurarla por ti.
Vive en github.com/shannhk/hermes-agent-control-room.

Puedes clonarla manualmente, pero la idea es que no tienes que hacerlo. Si tienes Claude Code o Codex en tu portátil, los agentes hacen la mayor parte del trabajo después de que les entregues una clave de API de Hetzner.
El flujo automatizado:
En diez o quince minutos tienes:
- Un VPS Hetzner nuevo con las herramientas adecuadas instaladas
- La sala de control clonada en /root/agent-control-room en el VPS
- Las habilidades incluidas enlazadas en ~/.claude/skills en el VPS
- Un agente Hermes registrado, manual rellenado, mapa de entorno escrito
- Un alias SSH en tu portátil para que ssh hermes se conecte al instante
la metodología de prototipo → producción
La mayoría de los flujos de trabajo no comienzan como flujos de producción. Comienzan desordenados. Un flujo que ejecuta investigación SEO, redacta un artículo, lo programa en Typefully y lo publica en LinkedIn no existe completamente formado en tu cabeza. Lo descubres ejecutándolo.
Hermes es el entorno de prototipado para esto. Aquí está el camino de cuatro pasos que uso para llevar cualquier nuevo flujo de trabajo de marketing desde la idea hasta el despliegue autónomo:
- Prototipa en Hermes. Abre tu agente Hermes principal, describe lo que quieres que suceda y déjalo intentar. Fallará en la mayor parte en el primer intento. Está bien.
- Ejecútalo 2-3 veces contra trabajo real, corrigiendo la desviación cada vez. El arnés observa cada corrección y comienza a escribir la habilidad a medida que aprende la forma. En la tercera ejecución, el agente está haciendo la mayor parte de lo que quieres sin entrenamiento.
- Ajusta en un espacio de trabajo dedicado. Lleva el flujo de trabajo a un espacio de trabajo separado de Claude Code (o un agente Hermes nuevo si prefieres), ajusta los mensajes, bloquea el enrutamiento, añade manejo de errores, decide qué debe ejecutarse con cron y qué debe activarse.
- Despliega en un VPS con una programación. Una vez que sobrevive una semana de ejecuciones reales sin que lo supervise, publícalo en su propio contenedor Docker en tu VPS, configura el cron y aléjate.
Aprendí este patrón después de pasar algunos fines de semana quemados tratando de escribir agentes de producción desde cero. No puedes escribir un agente de producción desde cero. Tienes que hacer que crezca uno. Hermes hace que la parte del crecimiento sea rápida.

- Prototipa en Hermes
- Ajusta en un espacio de trabajo dedicado
- Despliega autónomo en un VPS
los modelos que ejecuto en Hermes
Hermes te da el framework. El modelo subyacente es tu elección. A través de la puerta de enlace de herramientas puedes enrutar a más de 300 modelos desde una suscripción, cambiando por agente o por tarea.
Lo que ejecuto personalmente hoy:
- Claude Opus 4.7 para el trabajo creativo: redacción, voz, generación de ganchos, borrador de contenido, cualquier cosa donde el gusto y la calidad de escritura importen
- Codex (GPT 5.5) para el trabajo estructurado: codificación, planificación, flujos de trabajo de varios pasos, automatización del navegador, scraping, cualquier cosa donde los pasos deban ser precisos y la salida predecible
Ejecuto ambos. Opus escribe. Codex construye y planea. Hermes hace que el enrutamiento sea fácil, apuntas cada agente al modelo que se ajusta al trabajo que hace.
Si solo puedes ejecutar uno, la respuesta depende del tipo de trabajo que esté haciendo tu flota. ¿Mucho contenido y redacción? Empieza con Claude Opus 4.7. ¿Mucha infraestructura, automatización y flujos de trabajo de ingeniería? Empieza con Codex. Siempre puedes añadir el segundo modelo más tarde a través de la misma puerta de enlace de herramientas.
desventajas honestas
No voy a fingir que Hermes es perfecto. Tres desventajas reales.
- Los valores predeterminados incluidos también son opiniones. Hermes viene con valores predeterminados sólidos sobre cómo funciona la memoria, cómo se escriben las habilidades, cómo el agente usa las herramientas. Ese es todo el argumento de venta. Pero también significa que si quieres primitivas con control explícito sobre cada paso, Hermes te parecerá pesado. OpenClaw es la mejor opción para ese gusto. Elige la herramienta que coincida con tu filosofía.
- Los niveles 3 y 4 tienen una curva de aprendizaje real. Docker, VPS, SSH, la estructura de carpetas de la sala de control, las habilidades del orquestador, nada de esto es "instalar y listo". No deberías saltar al nivel 3 si aún no estás ejecutando Hermes en el nivel 1 a diario.
- El modelo sigue siendo importante. Hermes es un framework que hace que un buen modelo sea excelente. No convierte un modelo pequeño en un estratega. Usa los modelos más potentes que puedas permitirte para el trabajo que importa (tu orquestador, tu agente de estrategia, tu cerebro). Recurre a modelos más baratos para el trabajo que no lo requiere (scraping de investigación, generación de borradores, procesamiento por lotes).
Nada de esto es magia. Es un framework que da resultados porque la memoria persiste, las habilidades se acumulan y los agentes se mantienen enfocados. Aplícalo al modelo de tamaño incorrecto y obtienes un equipo confundido. Aplícalo al correcto y obtienes un equipo.
recursos
Si empiezas hoy, esto es lo que leería en orden.
- La documentación oficial: hermes-agent.nousresearch.com/docs. Empieza con la guía de instalación, luego lee la página de habilidades para entender qué viene incluido de serie.
- La plantilla de la sala de control (mi repositorio): github.com/shannhk/hermes-agent-control-room. La estructura exacta que describí anteriormente, lista para clonar. Plantilla de tipo sala-de-control-primero para gestionar agentes Hermes desde un agente en un VPS hasta equipos de especialistas y flujos de trabajo orquestados. Haz un fork y hazlo tuyo.
- hermesatlas.com: El mapa curado por la comunidad de más de 100 herramientas de código abierto, plugins, espacios de trabajo e integraciones construidas sobre Hermes. Categorizado por dominio (proveedores de memoria, espacios de trabajo, registros de habilidades, implementación, orquestación). También incluye el Manual de Hermes, un tutorial para principiantes. Actualizaciones semanales, boletín gratuito.
- @Teknium en X: Fundador de Nous Research. Publica actualizaciones de Hermes casi a diario. La integración del runtime de Codex, el nivel gratuito de DeepSeek V4 Flash en Nous Portal, las habilidades de pretexto, todo llegó a través de su feed primero.
- @NousResearch en X: La cuenta oficial, anuncios oficiales de funciones.
- Los encuentros: Ahora hay encuentros de Hermes en persona (Lisboa, Ventura, más ciudades). Vale la pena asistir si hay uno cerca de ti. Aprendes más en 90 minutos de conversaciones paralelas que en una semana de lectura.

Espero que hayas encontrado valor en esto, gracias por leerlo completo.
-- Shann





