aprende a operar y dominar Hermes Agent. configura la plantilla de la sala de control de agentes, personaliza agentes especializados y pasa de un solo agente a todo un equipo de marketing en un solo VPS.
la mayoría de las herramientas de IA responden preguntas. Hermes Agent ejecuta tus flujos de trabajo de principio a fin.
navega por tu navegador, ejecuta comandos en la terminal, programa tareas cron, monitorea tus bandejas de entrada, redacta el trabajo y publica el resultado donde sea que estés: Telegram, Discord, Slack, el hilo de correo en el que estás ahora mismo.
creado por @NousResearch y es código abierto con 150,000 estrellas en GitHub. Actualmente ocupa el #1 en OpenRouter en uso global de tokens.
es el framework sobre el que he construido toda mi operación de marketing durante las últimas semanas, y el artículo que estás a punto de leer es cómo lo configuraría si empezara hoy.

lo que obtendrás de este artículo
- qué es Hermes Agent y por qué los marketeros (no solo los desarrolladores) deberían prestarle atención
- la versión amigable de la arquitectura: el cerebro, la personalidad, las habilidades y cómo conviven en una sola carpeta
- los casos de uso que estoy ejecutando personalmente en Hermes, con las cuatro publicaciones que he hecho al respecto
- el modelo mental de cuatro partes (tú, sala de control, agentes, bus de tareas opcional) y los cuatro niveles de configuración, desde "un agente en tu laptop" hasta "un equipo de agentes totalmente automatizado en un VPS que controlas desde tu teléfono"
- la metodología de prototipo a producción que uso para llevar un flujo de trabajo de marketing desde una idea desordenada hasta un despliegue autónomo
- los recursos que me habría gustado tener desde el día uno: documentación, el atlas comunitario, las personas a seguir, los encuentros que están ocurriendo ahora mismo
- las desventajas honestas y dónde esto todavía falla
No te estoy vendiendo nada en este artículo. Hermes es código abierto, Nous Portal tiene un nivel gratuito, y la mayor parte del ecosistema comunitario también es gratuito. haz un fork, modifícalo, hazlo tuyo.
qué es Hermes Agent
versión corta: un agente autónomo que se vuelve más capaz cuanto más tiempo lleva funcionando.
versión larga: Hermes es un framework construido por Nous Research que convierte un modelo en un operador persistente. tiene su propia memoria que sobrevive entre sesiones. escribe sus propias habilidades mientras trabaja. viene con 123 habilidades ya integradas (flujos de trabajo de GitHub, Obsidian, Google Workspace, Linear, Notion, Typefully, Perplexity, Deep Research, y más de 100 más). vive donde sea que lo pongas: en tu laptop, en un contenedor Docker, en un VPS, en un runtime serverless. y puedes hablar con él a través de más de 20 superficies: Telegram, Discord, Slack, correo electrónico, modo de voz o simplemente tu terminal.
si has usado Claude Code o OpenClaw, Hermes tiene la misma forma pero con una filosofía diferente.
Hermes es como un tren con rieles. configuraciones predeterminadas con opinión, baterías incluidas, productivo desde el día uno con configuración mínima, el agente piensa más por ti.
OpenClaw es como Linux. primitivas, garantías, control explícito, el agente hace exactamente lo que le dijiste y nada más.
ambos son válidos. Yo uso Hermes porque los valores predeterminados incluidos se acumulan. cada proyecto que empiezo con Hermes es uno en el que el agente ya sabe hacer más de 100 cosas antes de que yo escriba una línea de configuración. esa ventaja inicial vale la pena para mí. También he notado que Hermes no tiene ni de lejos el mismo problema de desconexión de la puerta de enlace o de bugs.
la prueba está en los números que Nous Research acaba de alcanzar:
- #1 en OpenRouter en uso global de tokens (de entre todos los modelos y frameworks en la plataforma)
- 150,000 estrellas en GitHub en el repositorio de Hermes
- 123 habilidades incluidas antes de que el agente escriba una propia
- más de 70 herramientas integradas en la puerta de enlace, más de 300 modelos a través de una sola suscripción
- 6 objetivos de despliegue: local, Docker, SSH, Daytona, Singularity, Modal
- más de 20 superficies de mensajería: Telegram, Discord, Slack, correo electrónico, voz
si eres un marketero de IA y aún no has empezado a usar Hermes, estás dejando sobre la mesa capacidad de acumulación cada semana.
cómo funciona (la versión amigable)
cada agente de Hermes tiene tres cosas.
un cerebro. la memoria vive en ~/.hermes/memories/. dos archivos, MEMORY.md y USER.md, se inyectan al inicio de la sesión. tu rúbrica de voz, tus notas de marca, el lenguaje de tus clientes, las correcciones de la semana pasada, todo eso se carga antes del primer prompt. las sesiones se almacenan en SQLite, la recuperación entre sesiones es posible mediante búsqueda de texto completo.
una personalidad. soul.md es donde reside la vibra. conciso. sarcástico. directo. formal. rápido o reflexivo. puedes crear seis agentes y darle a cada uno un alma diferente, el mismo cerebro debajo. uno es tu representante de ventas salientes con energía de cierre. otro es tu investigador al que le gustan las oraciones largas. otro es tu asistente que mantiene todo breve.

un conjunto de habilidades.
123 habilidades listas para usar: PRs de GitHub, Obsidian, Google Workspace, Linear, Notion, Typefully, Perplexity, Deep Research, control del navegador, web scraping, visión, voz, programación. y el ciclo de aprendizaje cerrado: mientras el agente trabaja, escribe nuevas habilidades en el proceso. tu propia biblioteca de habilidades crece sobre las 123 sin que tengas que escribir ninguna.
luego está con lo que el agente puede hablar.
- la puerta de enlace de herramientas: una suscripción, más de 300 modelos, además de web scraping y automatización del navegador integrados
- integración MCP: cualquier servicio externo que hable el Protocolo de Contexto de Modelo se convierte en una herramienta que tu agente puede usar
- más de 20 superficies de mensajería: Telegram, Discord, Slack, correo electrónico, además del propio CLI

y dónde puede vivir el agente.
- tu laptop (local)
- un contenedor Docker (aislado, portátil, así es como ejecuto el mío)
- una sesión SSH en un VPS (para que funcione incluso cuando tu laptop está cerrada)
- Daytona, Singularity, Modal (serverless si no quieres gestionar infraestructura)
el ciclo de aprendizaje cerrado es lo que hace que esto sea diferente de un chatbot inteligente. el agente se observa a sí mismo trabajar, escribe nuevas habilidades a medida que aprende la forma de tu trabajo, refina su memoria periódicamente y recuerda el contexto pasado entre sesiones usando una combinación de búsqueda de texto completo y resumen con LLM. no tienes que volver a enseñarle la semana que viene.
la regla que les digo a las personas nuevas en Hermes es esta: no intentes escribir tus propias habilidades el primer día. ejecuta trabajo real, deja que el agente observe y deja que el arnés escriba las habilidades. construyes una biblioteca de habilidades personalizada más rápido trabajando que escribiendo prompts.
lo que estoy ejecutando en Hermes
soy un marketero de IA, no un programador. la mayor parte de lo que ejecuto en Hermes es infraestructura de marketing con alguna que otra herramienta interna. aquí está la lista real:
- un asistente personal que maneja lo laboral y lo privado, vive en Telegram, señala los cuatro correos electrónicos que vale la pena leer cada mañana, programa mis recordatorios, resume reuniones que me perdí
- un banco de pruebas de prototipado de flujos de trabajo de marketing donde pruebo nuevos flujos (imán de leads, revisión de anuncios creativos, sprint de contenido) con trabajo real durante 2-3 ejecuciones antes de promoverlos
- agentes de marketing especializados: SEO, outreach/BD, revisión de diseño, redacción de contenido, cada uno con su propia alma y su propio alcance
- un cerebro de empresa que monitorea Slack, chats, correos, transcripciones, notas de voz, y hace que todo sea consultable. cuando pregunto "¿qué le dijimos a ese cliente sobre los precios el mes pasado?" obtengo la respuesta en 3 segundos en lugar de 30 minutos de búsqueda
- un agente SEO que ejecuta el pipeline completo desde la semilla de palabras clave hasta el artículo publicado en un solo contenedor Docker, 21 pasos, sin intervención humana hasta la revisión final
- un agente de distribución de contenido que toma un contenido de formato largo (este artículo, por ejemplo) y lo atomiza en LinkedIn, X, Threads, con ganchos específicos para cada plataforma
- un agente orquestador que no produce trabajo por sí mismo, solo enruta solicitudes al especialista adecuado según lo que estoy pidiendo
el modelo que publiqué y que lo resume:
el agente SEO en particular merece un acercamiento, porque es el que he lanzado públicamente y el que mejor se ajusta a la arquitectura del resto de este artículo. cinco capas, todo dentro de un solo contenedor Docker, 21 pasos desde la semilla de palabras clave hasta el artículo publicado.
los 21 pasos se ven así en la terminal:
las capas sobre este pipeline:
- cerebro de la empresa en la parte superior: visión, marca, audiencia, productos. cada agente lee de esto
- agente orquestador de Hermes: toma el tema o la semilla de palabras clave y lo enruta al agente SEO
- cerebro SEO: manual de posicionamiento, reglas de voz, formatos de contenido, guía de estilo visual, criterios de éxito por formato. todo el contexto específico de SEO vive aquí
- tres subagentes dentro del agente SEO, cada uno manejando una fase:
- investigación e ideación: semilla de palabras clave, instantánea de SERP, extracción de competidores, análisis de intención y formato, brecha de contenido y visual, validación interna y externa
- producción: briefing de ángulo y posicionamiento, briefing de estrategia visual, esquema, borrador, generación de imágenes, generación de diagramas de flujo, control de calidad visual y de artículo
- distribución: preparación para publicación, esquema, enlazado interno, sindicación, análisis, monitoreo
- un contenedor Docker contiene los tres subagentes. comparten entorno, memoria y herramientas. los subperfiles cambian de contexto por fase. un proceso, un sistema de archivos, un conjunto de credenciales.
por qué un solo contenedor en lugar de tres: el trabajo de SEO es secuencial. la investigación alimenta el briefing, el briefing alimenta la producción, la producción alimenta la distribución. cada paso necesita memoria de lo que se decidió antes. dividir en tres contenedores significa transportar el estado entre límites, lo que se vuelve costoso y rompe la cadena.
cada otro agente especializado en la empresa se ejecuta sobre la misma plantilla. clona la plantilla del agente SEO, cambia el cerebro (cerebro SEO → cerebro de outreach, o → cerebro de diseño, o → cerebro de soporte), y tienes un nuevo agente para cualquier función con la misma forma de cinco capas.
las capas no son decoración. son la razón por la que el agente no pierde el contexto a medida que el trabajo se especializa. el cerebro de la empresa se mantiene estable mientras el trabajador itera. las capas del cerebro hacen que el trabajador sea desechable.
También recibí a Nous Research en nuestra sede de @EspressioAI en Lisboa para una velada de Hermes Agent recientemente. @yeahfortommy de Nous dirigió una sesión de preguntas y respuestas, Simao de noticed .so mostró un arnés de agente con investigación automática, y yo expliqué cómo estamos usando Hermes para el crecimiento en Espressio.
si estás en Lisboa y quieres venir a la próxima, publicaré cuando esté programada.
de un agente a una flota completa
antes de los niveles, el modelo mental.
la configuración tiene cuatro partes:
- tú eres el operador. tienes acceso directo a cada parte del sistema.
- la sala de control del agente es el plano de control lateral. no es un agente con el que chateas. es una carpeta en /root/vps-agents que documenta y gobierna toda la flota. la abres, la editas, la inspeccionas, o le pides a Claude, Codex o Hermes que la usen cuando estás gestionando el sistema.
- los agentes de Hermes son los trabajadores. algunos son especialistas (SEO, dev, CMO, ops). uno de ellos puede ser opcionalmente un orquestador.
- el bus de tareas del agente es un escritorio de transferencia opcional que se sitúa entre el orquestador y los especialistas. solo lo necesitas una vez que tienes un orquestador en juego.
todo se ve así:
la división del almacenamiento importa más de lo que la gente cree:
la sala de control contiene las respuestas a preguntas como qué agentes existen, qué hacen, qué puertos usan, a qué credenciales hacen referencia, qué puede y no puede hacer cada agente, y cómo reiniciar, depurar o reconstruir cualquiera de ellos. el runtime en vivo contiene el funcionamiento real.
la sala de control es el cerebro que define el sistema. el runtime en vivo es el cuerpo que lo ejecuta. puedes reconstruir el cuerpo a partir del cerebro. no puedes reconstruir el cerebro a partir del cuerpo.
dentro de la sala de control:
y dentro del runtime de cada agente en /srv/<nombre-del-agente>/data/:
tres formas de interactuar
- la ruta de control es la capa meta. se usa al agregar agentes, revisar documentos, verificar puertos, rotar claves, depurar la configuración.
- la ruta directa es la más rápida. se usa cuando ya sabes qué agente hace el trabajo.
- la ruta orquestada es la sintetizadora. se usa cuando quieres una única puerta de entrada que enrute y combine el trabajo entre varios especialistas.
nivel 1: un agente
tienes un agente de Hermes. eso es todo. la sala de control aún puede existir (recomendado) pero solo documenta ese agente.
mejor para: configuración inicial, tu Hermes personal, documentación de instalación raíz, migración simple a Docker.
un agente, vivido, con una personalidad que has ajustado y una memoria que ha comenzado a construir. completa SOUL.md con la voz que quieras, MEMORY.md con los hechos estables sobre tu negocio, y USER.md con los hechos estables sobre ti. conéctalo a Telegram o Discord para que viva donde tú estés. empieza a usarlo en tareas reales. deja que toque tus herramientas. deja que escriba sus propias habilidades en el proceso.
MEMORY.md contiene los hechos estables (qué es tu negocio, quiénes son tus clientes, qué hacen tus productos). USER.md contiene los hechos estables sobre ti (zona horaria, horario laboral, proyectos recurrentes, formatos de salida preferidos). ambos se refinan cada semana a medida que corriges al agente en conversaciones reales.
nivel 2: agentes especialistas directos
tienes múltiples agentes especializados, pero aún hablas con cada uno directamente. todavía no hay orquestador.
la sala de control los documenta a todos.
mejor para: separación clara de roles, probar qué agentes son útiles, evitar orquestación prematura, mantener credenciales delimitadas por agente.
la trampa que debes evitar aquí es buscar un orquestador antes de haber demostrado que tus especialistas son útiles. crea dos o tres, ejecútalos directamente, y solo agrega un orquestador cuando te encuentres deseando tener una única puerta de entrada.
cuándo crear un nuevo agente versus quedarte con lo que tienes:
mal patrón: un megaagente con cada credencial y cada capa de memoria mezclada. pierdes aislamiento, pierdes la capacidad de revocar el acceso limpiamente, y el agente se confunde sobre qué voz usar.
nivel 3: orquestador + especialistas
agregas hermes-orchestrator como puerta de entrada. aún puedes hablar directamente con los especialistas, pero el orquestador puede enrutar el trabajo y sintetizar resultados.

el orquestador lee la sala de control para saber qué agentes existen, qué hace cada uno, dónde viven las colas de tareas, qué requiere aprobación, qué acciones están prohibidas, y dónde están los documentos y manuales. no necesita preguntarte nada de eso, lo lee.
mejor para: trabajo interfuncional, delegación, resumen y síntesis, una interfaz principal para flujos de trabajo multiagente.
el orquestador es el momento en que tu configuración deja de ser una colección de agentes y comienza a ser un equipo. también es el momento en que la sala de control demuestra su valor, porque el orquestador solo es tan bueno como los documentos que lee.
cómo se ve una verificación rápida de la flota desde mi laptop o teléfono:
nivel 4: equipo de agentes automatizado
la misma forma que el nivel 3, pero con flujos de trabajo recurrentes y automatización más sólida. informes SEO semanales se ejecutan con cron. verificaciones de salud del servidor se activan a diario. la verificación de respaldo se ejecuta sin que tú lo pidas. los flujos de trabajo de negocio entre agentes se inician según el cronograma.
mejor para: informes SEO semanales, operaciones de contenido, verificaciones de salud del servidor, verificación de respaldos, flujos de trabajo de negocio entre agentes.
el nivel 4 es cómo se ve un departamento de marketing en tu terminal. no necesita que tú inicies el día. se presenta al trabajo por sí solo, presenta informes, se verifica a sí mismo, y solo te avisa para las decisiones que requieren criterio.

la jerarquía de control
un principio para tener en mente mientras subes de nivel.
la sala de control es para configuración, documentación, manuales y gobierno. documenta qué agentes existen, qué hacen, dónde se ejecutan, a qué credenciales hacen referencia, qué puede y no puede hacer cada agente. es el panel de administración de la flota, incluido el orquestador. no es a donde vas para trabajar.
para trabajar, hablas directamente con los agentes. ya sea un especialista (cuando sabes qué agente es responsable del trabajo) o el orquestador (cuando quieres una única puerta de entrada para enrutar entre especialistas).
la guía de configuración: apunta tu agente al repositorio
ahora entiendes la arquitectura. aquí te explicamos cómo construirla.
publiqué una plantilla pública que contiene la estructura exacta descrita anteriormente, más las habilidades que tu agente necesita para configurarla por ti.
está en github.com/shannhk/hermes-agent-control-room.

puedes clonarla manualmente, pero la idea es que no tienes que hacerlo. si tienes Claude Code o Codex en tu laptop, los agentes hacen la mayor parte del trabajo después de que les entregues una clave API de Hetzner.
el flujo automatizado:
en diez o quince minutos tienes:
- un VPS de Hetzner nuevo con las herramientas adecuadas instaladas
- la sala de control clonada en /root/agent-control-room en el VPS
- las habilidades incluidas vinculadas en ~/.claude/skills en el VPS
- un agente de Hermes registrado, manual completado, mapa de variables de entorno escrito
- un alias SSH en tu laptop para que ssh hermes se conecte al instante
la metodología de prototipo a producción
la mayoría de los flujos de trabajo no comienzan como flujos de producción. comienzan desordenados. un flujo que ejecuta investigación SEO, redacta un artículo, lo programa en Typefully y lo publica en LinkedIn no existe completamente formado en tu cabeza. lo descubres ejecutándolo.
Hermes es el entorno de prototipado para esto. aquí está el camino de cuatro pasos que uso para llevar cualquier nuevo flujo de trabajo de marketing desde la idea hasta el despliegue autónomo:
- prototipa en Hermes. abre tu agente principal de Hermes, describe lo que quieres que suceda y deja que lo intente. se equivocará en la mayor parte en la primera ejecución. está bien.
- ejecútalo 2-3 veces contra trabajo real, corrigiendo la desviación cada vez. el arnés observa cada corrección y comienza a escribir la habilidad a medida que aprende la forma. para la tercera ejecución, el agente ya está haciendo la mayor parte de lo que quieres sin necesidad de guía.
- ajusta en un espacio de trabajo dedicado. lleva el flujo de trabajo a un espacio de trabajo separado de Claude Code (o a un agente nuevo de Hermes si prefieres), ajusta los prompts, fija el enrutamiento, agrega manejo de errores, decide qué debe ejecutarse con cron y qué debe activarse.
- despliega en un VPS con una programación. una vez que sobrevive una semana de ejecuciones reales sin que tú lo supervisores, muévelo a su propio contenedor Docker en tu VPS, configura el cron y aléjate.
aprendí este patrón después de quemar algunos fines de semana intentando escribir agentes listos para producción desde cero. no puedes escribir un agente de producción desde cero. tienes que hacerlo crecer. Hermes hace que la parte de crecimiento sea rápida.

- prototipa en Hermes
- ajusta en un espacio de trabajo dedicado
- despliega autónomo en un VPS
los modelos que ejecuto en Hermes
Hermes te da el framework. el modelo subyacente es tu elección. a través de la puerta de enlace de herramientas puedes dirigirte a más de 300 modelos desde una sola suscripción, cambiando por agente o por tarea.
lo que ejecuto personalmente hoy:
- Claude Opus 4.7 para el trabajo creativo: redacción, voz, generación de ganchos, redacción de contenido, cualquier cosa donde el gusto y la calidad de escritura importen
- Codex (GPT 5.5) para el trabajo estructurado: codificación, planificación, flujos de trabajo de varios pasos, automatización del navegador, scraping, cualquier cosa donde los pasos deban ser exactos y el resultado predecible
ejecuto ambos. Opus escribe. Codex construye y planifica. Hermes hace que el enrutamiento sea fácil, apuntas cada agente al modelo que se ajusta al trabajo que hace.
si solo puedes ejecutar uno, la respuesta depende del tipo de trabajo que haga tu flota. mucho contenido y redacción? empieza con Claude Opus 4.7. mucho trabajo de infraestructura, automatización e ingeniería? empieza con Codex. siempre puedes agregar el segundo modelo más tarde a través de la misma puerta de enlace de herramientas.
desventajas honestas
no voy a fingir que Hermes es perfecto. tres desventajas reales.
- los valores predeterminados incluidos también son opiniones. Hermes viene con valores predeterminados sólidos sobre cómo funciona la memoria, cómo se escriben las habilidades, cómo el agente usa las herramientas. esa es toda la propuesta. pero también significa que si quieres primitivas con control explícito sobre cada paso, Hermes se sentirá pesado. OpenClaw es la mejor opción para ese gusto. elige la herramienta que coincida con tu filosofía.
- el nivel 3 y 4 tienen una curva de aprendizaje real. Docker, VPS, SSH, la estructura de carpetas de la sala de control, las habilidades del orquestador, nada de esto es "instalar y listo". no deberías saltar al nivel 3 si aún no estás ejecutando Hermes en el nivel 1 a diario.
- el modelo sigue siendo importante. Hermes es un framework que hace que un buen modelo sea excelente. no convierte un modelo pequeño en un estratega. usa los modelos más potentes que puedas permitirte para el trabajo que importa (tu orquestador, tu agente de estrategia, tu cerebro). baja a modelos más baratos para el trabajo que no importa tanto (scraping de investigación, generación de borradores, procesamiento por lotes).
nada de esto es magia. es un framework que rinde frutos porque la memoria persiste, las habilidades se acumulan y los agentes se mantienen enfocados. aplícalo al modelo de tamaño incorrecto y obtienes un equipo confundido. aplícalo al modelo correcto y obtienes un equipo.
recursos
si empiezas hoy, esto es lo que leería en orden.
- la documentación oficial: hermes-agent.nousresearch.com/docs. empieza con la guía de instalación, luego lee la página de habilidades para entender qué viene incluido de fábrica
- la plantilla de la sala de control (mi repositorio): github.com/shannhk/hermes-agent-control-room. la estructura exacta que describí anteriormente, lista para clonar. plantilla primero la sala de control para gestionar agentes de Hermes desde un agente en un VPS hasta equipos de especialistas y flujos de trabajo orquestados. haz un fork y hazla tuya
- hermesatlas.com: el mapa curado por la comunidad de más de 100 herramientas, plugins, espacios de trabajo e integraciones de código abierto construidos sobre Hermes. categorizados por dominio (proveedores de memoria, espacios de trabajo, registros de habilidades, despliegue, orquestación). también incluye el Manual de Hermes, un tutorial para principiantes. actualizaciones semanales, boletín gratuito
- @Teknium en X: fundador de Nous Research. publica actualizaciones de Hermes casi a diario. la integración del runtime de Codex, el nivel gratuito de DeepSeek V4 Flash en Nous Portal, las habilidades de pretexto, todo llegó primero a través de su feed
- @NousResearch en X: la cuenta oficial, anuncios oficiales de funciones
- los encuentros: ahora hay encuentros de Hermes en persona (Lisboa, Ventura, más ciudades). vale la pena asistir si hay uno cerca de ti. aprendes más en 90 minutos de conversaciones paralelas que en una semana de lectura

Espero que hayas encontrado valor en esto, gracias por leer todo el artículo.
-- Shann





