Cách trở thành một Hermes Agent Operator

@shannholmberg
TIẾNG ANH2 tháng trước · 15 thg 5, 2026
830K
1.7K
164
27
5.5K

TL;DR

Hướng dẫn này trình bày chi tiết về kiến trúc và cách thiết lập Hermes Agent của Nous Research, giải thích cách triển khai các AI agent tự hành với bộ nhớ bền vững để tự động hóa tiếp thị từ đầu đến cuối.

Học cách vận hành và làm chủ Hermes Agent. Thiết lập mẫu agent control room, cấu hình các agent chuyên biệt, và phát triển từ một agent thành cả một công ty marketing trên một VPS.

Hầu hết các công cụ AI chỉ trả lời câu hỏi. Hermes Agent chạy toàn bộ quy trình làm việc của bạn từ đầu đến cuối.

Nó điều hướng trình duyệt của bạn, thực thi lệnh terminal, lên lịch cron job, theo dõi hộp thư đến của bạn, soạn thảo công việc, và đăng kết quả đến bất cứ nơi nào bạn sống: Telegram, Discord, Slack, chuỗi email bạn đang ở ngay bây giờ.

Được xây dựng bởi @NousResearch và là mã nguồn mở với 150.000 sao GitHub. Hiện đang xếp hạng #1 trên OpenRouter về tổng lượng token sử dụng toàn cầu.

Đây là framework mà tôi đã xây dựng toàn bộ hoạt động marketing của mình trong vài tuần qua, và bài viết bạn sắp đọc là cách tôi sẽ thiết lập nó nếu tôi bắt đầu ngày hôm nay.

Shann³ - inline image

Những gì bạn sẽ nhận được từ bài viết này

  • Hermes Agent là gì và tại sao các marketer (không chỉ developer) nên quan tâm
  • Phiên bản dễ hiểu về kiến trúc: bộ não, tính cách, bộ kỹ năng, và cách chúng sống trong một thư mục
  • Các trường hợp sử dụng mà cá nhân tôi đang chạy trên Hermes, kèm bốn bài viết tôi đã xuất bản về chúng
  • Mô hình tư duy bốn phần (bạn, control room, agent, task bus tùy chọn) và bốn cấp độ thiết lập, từ "một agent trên laptop của bạn" đến "một đội agent tự động hóa hoàn toàn trên VPS mà bạn điều khiển từ điện thoại"
  • Phương pháp prototype → production mà tôi sử dụng để đưa quy trình marketing từ ý tưởng lộn xộn đến triển khai tự động
  • Các tài nguyên mà tôi ước mình có ngay từ ngày đầu: tài liệu, bản đồ cộng đồng, những người nên theo dõi, các buổi gặp mặt đang diễn ra
  • Những đánh đổi trung thực và nơi điều này vẫn còn hỏng hóc

Tôi không bán cho bạn bất cứ thứ gì trong bài viết này. Hermes là mã nguồn mở, Nous Portal có gói miễn phí, và hầu hết hệ sinh thái cộng đồng cũng miễn phí. Fork nó, thay đổi nó, biến nó thành của bạn.

Hermes Agent là gì

Phiên bản ngắn: một agent tự động ngày càng có năng lực hơn khi nó chạy lâu hơn.

Phiên bản dài hơn: Hermes là một framework được xây dựng bởi Nous Research, biến một mô hình thành một người vận hành bền bỉ. Nó có bộ nhớ riêng tồn tại giữa các phiên làm việc. Nó tự viết các kỹ năng của mình khi nó làm việc. Nó được tích hợp sẵn 123 kỹ năng (GitHub workflows, Obsidian, Google Workspace, Linear, Notion, Typefully, Perplexity, Deep Research, cộng thêm hơn 100 kỹ năng khác). Nó sống ở bất cứ nơi nào bạn đặt nó, trên laptop của bạn, trong một Docker container, trên một VPS, trong một runtime serverless. Và bạn có thể nói chuyện với nó qua hơn 20 bề mặt: Telegram, Discord, Slack, email, chế độ giọng nói, hoặc chỉ terminal của bạn.

Nếu bạn đã sử dụng Claude Code hoặc OpenClaw, Hermes có hình dạng tương tự với một triết lý khác.

Hermes là đường ray. Các mặc định có chủ kiến, đầy đủ pin, hiệu quả ngay từ ngày đầu với thiết lập tối thiểu, agent suy nghĩ nhiều hơn cho bạn.

OpenClaw là Linux. Các nguyên thủy, sự đảm bảo, kiểm soát rõ ràng, agent làm chính xác những gì bạn yêu cầu và không hơn.

Cả hai đều hợp lệ. Tôi chạy Hermes vì các mặc định đi kèm cộng dồn. Mọi dự án tôi bắt đầu với Hermes đều là dự án mà agent đã biết cách làm hơn 100 việc trước khi tôi viết một dòng cấu hình. Lợi thế khởi đầu đó đáng giá với tôi. Tôi cũng nhận thấy Hermes không gặp vấn đề lớn về gateway mất kết nối hay bị lỗi như vậy.

Bằng chứng nằm ở những con số Nous Research vừa đạt được:

  • #1 trên OpenRouter về tổng lượng token sử dụng toàn cầu (trong số tất cả các mô hình và framework trên nền tảng)
  • 150.000 sao GitHub trên repo Hermes
  • 123 kỹ năng được tích hợp sẵn trước khi agent tự viết một kỹ năng nào
  • 70+ công cụ tích hợp trong gateway, cộng thêm 300+ mô hình thông qua một gói đăng ký
  • 6 mục tiêu triển khai: local, docker, ssh, daytona, singularity, modal
  • 20+ bề mặt nhắn tin: Telegram, Discord, Slack, email, giọng nói

Nếu bạn là một marketer AI và bạn chưa bắt đầu chạy Hermes, bạn đang bỏ lại khả năng cộng dồn trên bàn mỗi tuần.

Cách nó hoạt động (phiên bản dễ hiểu)

Mỗi agent Hermes có ba thứ.

Một bộ não. Bộ nhớ sống tại ~/.hermes/memories/. Hai tệp, MEMORY.md và USER.md, được chèn vào khi bắt đầu phiên. Tiêu chí giọng nói của bạn, ghi chú thương hiệu của bạn, ngôn ngữ khách hàng của bạn, những sửa chữa tuần trước, tất cả đều được tải trước prompt đầu tiên. Các phiên được lưu trữ trong SQLite, khả năng truy xuất giữa các phiên có thể tìm kiếm toàn văn bản.

Một tính cách. Soul.md là nơi mà vibe sống. Ngắn gọn. Mỉa mai. Thẳng thắn. Trang trọng. Nhanh hoặc chu đáo. Bạn có thể tạo sáu agent và cho mỗi agent một soul khác nhau, cùng một bộ não bên dưới. Một là đại diện bán hàng của bạn với năng lượng chốt đơn. Một khác là nhà nghiên cứu của bạn thích những câu dài. Một khác là trợ lý của bạn giữ mọi thứ ngắn gọn.

Shann³ - inline image

Một bộ kỹ năng.

123 kỹ năng có sẵn: GitHub PRs, Obsidian, Google Workspace, Linear, Notion, Typefully, Perplexity, Deep Research, điều khiển trình duyệt, quét web, thị giác, giọng nói, lập lịch. Và vòng lặp học tập khép kín: khi agent làm việc, nó tự viết các kỹ năng mới trên đường đi. Thư viện kỹ năng riêng của bạn phát triển trên nền 123 kỹ năng mà bạn không cần phải viết bất kỳ kỹ năng nào.

Sau đó là những gì agent có thể nói chuyện cùng.

  • Tool gateway: một gói đăng ký, 300+ mô hình, cộng với quét web và tự động hóa trình duyệt được tích hợp sẵn
  • Tích hợp MCP: bất kỳ dịch vụ bên ngoài nào nói Model Context Protocol đều trở thành công cụ agent của bạn có thể sử dụng
  • 20+ bề mặt nhắn tin: Telegram, Discord, Slack, email, giọng nói, cộng với CLI
Shann³ - inline image

Và nơi agent có thể sống.

  • Laptop của bạn (local)
  • Một Docker container (cô lập, di động, cách tôi chạy nó)
  • Một phiên SSH trên VPS (để nó chạy ngay cả khi laptop của bạn tắt)
  • Daytona, Singularity, Modal (serverless nếu bạn không muốn quản lý cơ sở hạ tầng)

Vòng lặp học tập khép kín là điều làm nó khác biệt so với một chatbot thông minh. Agent tự xem mình làm việc, viết các kỹ năng mới khi nó học được hình dạng công việc của bạn, tinh chỉnh bộ nhớ của nó định kỳ, và nhớ lại ngữ cảnh quá khứ giữa các phiên sử dụng kết hợp tìm kiếm toàn văn bản và tóm tắt LLM. Bạn không phải dạy lại nó vào tuần sau.

Quy tắc tôi nói với những người mới dùng Hermes là thế này: đừng cố viết kỹ năng của riêng bạn vào ngày đầu tiên. Chạy công việc thực tế, để agent quan sát, và để harness viết các kỹ năng. Bạn xây dựng một thư viện kỹ năng tùy chỉnh nhanh hơn bằng cách làm việc hơn là bằng cách viết prompt.

Những gì tôi đang chạy trên Hermes

Tôi là một marketer AI, không phải lập trình viên. Hầu hết những gì tôi chạy trên Hermes là cơ sở hạ tầng marketing với thỉnh thoảng là công cụ nội bộ. Đây là danh sách thực tế:

  • Một trợ lý cá nhân xử lý cả công việc và riêng tư, sống trong Telegram, gắn cờ bốn email đáng đọc mỗi sáng, lên lịch nhắc nhở của tôi, tóm tắt các cuộc họp tôi đã bỏ lỡ
  • Một băng ghế tạo mẫu quy trình marketing nơi tôi thử các luồng mới (lead magnet, đánh giá sáng tạo quảng cáo, sprint nội dung) với công việc thực tế trong 2-3 lần chạy trước khi thăng cấp chúng
  • Các agent marketing chuyên biệt: SEO, outbound / BD, đánh giá thiết kế, viết nội dung, mỗi agent có soul riêng và phạm vi riêng
  • Một bộ não công ty giám sát Slack, chat, email, bản ghi, ghi chú giọng nói, và làm cho tất cả đều có thể truy vấn được. Khi tôi hỏi "chúng ta đã nói gì với khách hàng đó về giá tháng trước" tôi nhận được câu trả lời trong 3 giây thay vì 30 phút đào bới
  • Một agent SEO chạy toàn bộ pipeline từ hạt giống từ khóa đến bài viết đã xuất bản trong một Docker container, 21 bước, không có con người ở giữa cho đến khi đánh giá cuối cùng
  • Một agent phân phối nội dung lấy một tác phẩm dài (ví dụ bài viết này) và nguyên tử hóa nó trên LinkedIn, X, Threads, với các hook dành riêng cho từng nền tảng
  • Một agent điều phối không tự sản xuất công việc, chỉ định tuyến yêu cầu đến đúng chuyên gia dựa trên những gì tôi đang yêu cầu

Bản thiết kế tôi đã đăng tóm tắt nó:

Đặc biệt, agent SEO đáng để phóng to xem xét, vì nó là cái tôi đã phát hành công khai và là cái ánh xạ rõ ràng nhất đến kiến trúc trong phần còn lại của bài viết này. Năm lớp, tất cả bên trong một Docker container, 21 bước từ hạt giống từ khóa đến bài viết đã xuất bản.

21 bước trông như thế này trong terminal:

Các lớp phía trên pipeline này:

  1. Bộ não công ty ở trên cùng: tầm nhìn, thương hiệu, đối tượng, sản phẩm. Mọi agent đều đọc từ đây
  2. Agent điều phối Hermes: lấy chủ đề hoặc hạt giống từ khóa và định tuyến nó đến agent SEO
  3. Bộ não SEO: sổ tay xếp hạng, quy tắc giọng nói, định dạng nội dung, hướng dẫn phong cách hình ảnh, tiêu chí thành công cho mỗi định dạng. Tất cả ngữ cảnh dành riêng cho SEO sống ở đây
  4. Ba sub-agent bên trong agent SEO, mỗi cái xử lý một giai đoạn:
  5. Nghiên cứu + Ý tưởng: hạt giống từ khóa, ảnh chụp nhanh SERP, trích xuất đối thủ cạnh tranh, phân tích ý định và định dạng, khoảng trống nội dung và hình ảnh, xác thực nội bộ và bên ngoài
  6. Sản xuất: brief góc nhìn và định vị, brief chiến lược hình ảnh, dàn bài, bản nháp, tạo hình ảnh, tạo flowchart, QA hình ảnh và bài viết
  7. Phân phối: chuẩn bị xuất bản, schema, liên kết nội bộ, syndication, phân tích, giám sát
  8. Một Docker container chứa tất cả ba sub-agent. Chúng chia sẻ env, bộ nhớ và công cụ. Sub-profile chuyển đổi ngữ cảnh theo từng giai đoạn. Một tiến trình, một hệ thống tệp, một bộ thông tin xác thực.

Tại sao một container thay vì ba: công việc SEO là tuần tự. Nghiên cứu cung cấp brief, brief cung cấp sản xuất, sản xuất cung cấp phân phối. Mọi bước đều cần bộ nhớ về những gì đã được quyết định ở thượng nguồn. Chia thành ba container có nghĩa là phải vận chuyển trạng thái qua các ranh giới, điều này trở nên đắt đỏ và phá vỡ chuỗi.

Mọi agent chuyên biệt khác trong công ty đều chạy trên cùng một mẫu. Clone mẫu agent SEO, thay thế bộ não (bộ não SEO → bộ não outbound, hoặc → bộ não thiết kế, hoặc → bộ não hỗ trợ), và bạn có một agent mới cho bất kỳ chức năng nào với cùng hình dạng năm lớp.

Các lớp không phải là trang trí. Chúng là lý do tại sao agent không mất ngữ cảnh khi công việc trở nên chuyên biệt. Bộ não công ty vẫn ổn định trong khi worker lặp lại. Các lớp não làm cho worker có thể thay thế được.

Tôi cũng đã tổ chức cho Nous Research tại trụ sở @EspressioAI ở Lisbon cho một buổi tối Hermes Agent gần đây. @yeahfortommy từ Nous đã tổ chức một phiên Hỏi & Đáp, Simao từ noticed .so đã trình diễn một agent harness với tự động nghiên cứu, và tôi đã trình bày cách chúng tôi sử dụng Hermes để tăng trưởng tại Espressio.

Nếu bạn ở Lisbon và muốn tham dự buổi tiếp theo, tôi sẽ đăng khi nó được lên lịch.

Từ một agent đến cả một đội

Trước các cấp độ, mô hình tư duy.

Thiết lập có bốn phần:

  • Bạn là người vận hành. Bạn có quyền truy cập trực tiếp vào mọi phần của hệ thống.
  • Agent control room là mặt phẳng điều khiển phụ. Nó không phải là agent bạn trò chuyện qua. Nó là một thư mục tại /root/vps-agents ghi chép và quản trị toàn bộ đội. Bạn mở nó, chỉnh sửa nó, kiểm tra nó, hoặc yêu cầu Claude, Codex, hoặc Hermes sử dụng nó khi bạn quản lý hệ thống.
  • Các agent Hermes là những worker. Một số là chuyên gia (SEO, dev, CMO, ops). Một trong số chúng có thể tùy chọn là một người điều phối.
  • Agent task bus là một bàn giao tùy chọn nằm giữa người điều phối và các chuyên gia. Bạn chỉ cần nó khi bạn đã có một người điều phối hoạt động.

Toàn bộ trông như thế này:

Sự phân chia lưu trữ quan trọng hơn mọi người nghĩ:

Control room chứa câu trả lời cho các câu hỏi như agent nào tồn tại, chúng làm gì, chúng sử dụng cổng nào, chúng tham chiếu thông tin xác thực nào, mỗi agent có thể và không thể làm gì, và cách khởi động lại, gỡ lỗi, hoặc xây dựng lại bất kỳ agent nào. Runtime trực tiếp chứa các hoạt động thực tế.

Control room là bộ não định nghĩa hệ thống. Runtime trực tiếp là cơ thể chạy nó. Bạn có thể xây dựng lại cơ thể từ bộ não. Bạn không thể xây dựng lại bộ não từ cơ thể.

Bên trong control room:

Và bên trong runtime của mỗi agent tại /srv/<tên-agent>/data/:

Ba cách bạn tương tác

  • Control path là lớp siêu dữ liệu. Được sử dụng khi thêm agent, xem xét tài liệu, kiểm tra cổng, xoay vòng khóa, gỡ lỗi thiết lập.
  • Direct path là nhanh nhất. Được sử dụng khi bạn đã biết agent nào thực hiện công việc.
  • Orchestrated path là bộ tổng hợp. Được sử dụng khi bạn muốn một cửa trước định tuyến và kết hợp công việc qua nhiều chuyên gia.

Cấp độ 1: một agent

Bạn có một agent Hermes. Đó là tất cả. Control room vẫn có thể tồn tại (khuyến nghị) nhưng nó chỉ ghi chép về một agent đó.

Tốt nhất cho: thiết lập ban đầu, Hermes cá nhân của bạn, tài liệu cài đặt gốc, di chuyển Docker đơn giản.

Một agent, sống động, với tính cách bạn đã điều chỉnh và bộ nhớ đã bắt đầu xây dựng. Điền SOUL.md với giọng nói bạn muốn, MEMORY.md với các sự kiện ổn định về doanh nghiệp của bạn, và USER.md với các sự kiện ổn định về bạn. Kết nối nó với Telegram hoặc Discord để nó sống ở nơi bạn sống. Bắt đầu sử dụng nó cho các nhiệm vụ thực tế. Để nó chạm vào các công cụ của bạn. Để nó tự viết các kỹ năng của mình trên đường đi.

MEMORY.md chứa các sự kiện ổn định (doanh nghiệp của bạn là gì, khách hàng của bạn là ai, sản phẩm của bạn làm gì). USER.md chứa các sự kiện ổn định về bạn (múi giờ, giờ làm việc, dự án định kỳ, định dạng đầu ra ưa thích). Cả hai đều được tinh chỉnh mỗi tuần khi bạn sửa lỗi agent trong các cuộc trò chuyện thực tế.

Cấp độ 2: agent chuyên biệt trực tiếp

Bạn có nhiều agent chuyên biệt, nhưng bạn vẫn nói chuyện trực tiếp với từng agent. Chưa có người điều phối.

Control room ghi chép tất cả chúng.

Tốt nhất cho: phân chia vai trò rõ ràng, kiểm tra agent nào hữu ích, tránh điều phối sớm, giữ thông tin xác thực trong phạm vi mỗi agent.

Cái bẫy cần tránh ở đây là tiếp cận một người điều phối trước khi bạn chứng minh được các chuyên gia của mình hữu ích. Tạo hai hoặc ba agent, chạy chúng trực tiếp, và chỉ thêm người điều phối khi bạn thấy mình muốn một cửa trước.

Khi nào nên tạo một agent mới so với giữ những gì bạn có:

Mô hình xấu: một siêu agent với mọi thông tin xác thực và mọi lớp bộ nhớ trộn lẫn với nhau. Bạn mất sự cô lập, bạn mất khả năng thu hồi quyền truy cập một cách sạch sẽ, và agent bị nhầm lẫn về giọng nói nào nên sử dụng.

Cấp độ 3: người điều phối + chuyên gia

Bạn thêm hermes-orchestrator như một cửa trước. Bạn vẫn có thể nói chuyện trực tiếp với các chuyên gia, nhưng người điều phối có thể định tuyến công việc và tổng hợp kết quả.

Shann³ - inline image

Người điều phối đọc control room để biết agent nào tồn tại, mỗi agent làm gì, hàng đợi nhiệm vụ sống ở đâu, việc gì cần phê duyệt, hành động nào bị cấm, và tài liệu và sổ tay hướng dẫn ở đâu. Nó không cần hỏi bạn bất kỳ điều gì trong số đó, nó đọc chúng.

Tốt nhất cho: công việc đa chức năng, ủy quyền, tóm tắt và tổng hợp, một giao diện chính cho quy trình làm việc đa agent.

Người điều phối là khoảnh khắc thiết lập của bạn không còn là một tập hợp các agent và bắt đầu là một đội. Nó cũng là khoảnh khắc control room phát huy giá trị của nó, bởi vì người điều phối chỉ tốt bằng các tài liệu nó đọc.

Một lần kiểm tra nhanh đội trông như thế nào từ laptop hoặc điện thoại của tôi:

Cấp độ 4: đội agent tự động hóa

Cùng hình dạng như cấp độ 3, nhưng với quy trình làm việc định kỳ và tự động hóa mạnh mẽ hơn. Báo cáo SEO hàng tuần chạy trên cron. Kiểm tra sức khỏe máy chủ diễn ra hàng ngày. Xác minh sao lưu chạy mà không cần bạn yêu cầu. Quy trình làm việc kinh doanh đa agent khởi chạy theo lịch trình.

Tốt nhất cho: báo cáo SEO hàng tuần, vận hành nội dung, kiểm tra sức khỏe máy chủ, xác minh sao lưu, quy trình làm việc kinh doanh đa agent.

Cấp độ 4 là những gì một bộ phận marketing trong terminal của bạn trông giống như vậy. Nó không cần bạn bắt đầu ngày mới. Nó tự đến nơi làm việc, nộp báo cáo, tự kiểm tra, và chỉ nhắn tin cho bạn về những quyết định cần gu thẩm mỹ.

Shann³ - inline image

Hệ thống phân cấp điều khiển

Một nguyên tắc để giữ trong đầu bạn khi bạn leo lên các cấp độ.

Control room dành cho cấu hình, tài liệu, sổ tay hướng dẫn và quản trị. Nó ghi chép agent nào tồn tại, chúng làm gì, chúng chạy ở đâu, chúng tham chiếu thông tin xác thực nào, mỗi agent có thể và không thể làm gì. Nó là bảng quản trị cho đội, bao gồm cả người điều phối. Nó không phải là nơi bạn đến để làm việc.

Để làm việc, bạn nói chuyện trực tiếp với các agent. Hoặc là một chuyên gia (khi bạn biết agent nào sở hữu công việc) hoặc người điều phối (khi bạn muốn một cửa trước để định tuyến qua các chuyên gia).

Hướng dẫn thiết lập: trỏ agent của bạn vào repo

Bây giờ bạn đã hiểu kiến trúc. Đây là cách bạn xây dựng nó.

Tôi đã phát hành một mẫu công khai chứa chính xác cấu trúc được mô tả ở trên, cộng với các kỹ năng agent của bạn cần để thiết lập nó cho bạn.

Nó sống tại github.com/shannhk/hermes-agent-control-room.

Shann³ - inline image

Bạn có thể clone nó thủ công, nhưng vấn đề là bạn không cần phải làm vậy. Nếu bạn có Claude Code hoặc Codex trên laptop của mình, các agent thực hiện hầu hết công việc sau khi bạn đưa ra một khóa API Hetzner.

Luồng tự động:

Trong vòng mười đến mười lăm phút, bạn có:

  • Một VPS Hetzner mới với các công cụ thích hợp đã được cài đặt
  • Control room được clone tại /root/agent-control-room trên VPS
  • Các kỹ năng đi kèm được liên kết vào ~/.claude/skills trên VPS
  • Một agent Hermes được đăng ký, sổ tay hướng dẫn đã được điền, env-map đã được viết
  • Một bí danh SSH trên laptop của bạn để ssh hermes kết nối ngay lập tức

Phương pháp prototype → production

Hầu hết các quy trình làm việc không bắt đầu như production. Chúng bắt đầu lộn xộn. Một luồng chạy nghiên cứu SEO, soạn thảo bài viết, lên lịch trong Typefully, và đăng nó lên LinkedIn không tồn tại trong đầu bạn một cách hoàn chỉnh. Bạn khám phá nó bằng cách chạy nó.

Hermes là môi trường tạo mẫu cho việc này. Đây là con đường bốn bước tôi sử dụng để đưa bất kỳ quy trình marketing mới nào từ ý tưởng đến triển khai tự động:

  1. Tạo mẫu trong Hermes. Mở agent Hermes chính của bạn, mô tả những gì bạn muốn xảy ra, và để nó thử. Nó sẽ làm sai hầu hết mọi thứ trong lần chạy đầu tiên. Điều đó ổn.
  2. Chạy nó 2-3 lần với công việc thực tế, sửa lỗi trôi mỗi lần. Harness theo dõi mọi sửa lỗi và bắt đầu viết kỹ năng khi nó học được hình dạng. Đến lần chạy thứ ba, agent đang làm hầu hết những gì bạn muốn mà không cần hướng dẫn.
  3. Tinh chỉnh trong một không gian làm việc chuyên dụng. Kéo quy trình làm việc vào một không gian làm việc Claude Code riêng (hoặc một agent Hermes mới nếu bạn thích), thắt chặt các prompt, khóa định tuyến, thêm xử lý lỗi, quyết định những gì nên chạy trên cron và những gì nên được kích hoạt.
  4. Triển khai lên VPS theo lịch trình. Khi nó sống sót qua một tuần chạy thực tế mà không có bạn giám sát, đẩy nó vào Docker container riêng trên VPS của bạn, đặt cron, và rời đi.

Tôi đã học được mẫu này sau khi đốt vài ngày cuối tuần cố gắng viết các agent production từ đầu. Bạn không thể viết một agent production từ đầu. Bạn phải nuôi dưỡng một agent. Hermes làm cho phần nuôi dưỡng trở nên nhanh chóng.

Shann³ - inline image
  1. Tạo mẫu trong Hermes
  2. Tinh chỉnh trong một không gian làm việc chuyên dụng
  3. Triển khai tự động trên VPS

Các mô hình tôi chạy trên Hermes

Hermes cung cấp cho bạn framework. Mô hình bên dưới là sự lựa chọn của bạn. Thông qua tool gateway, bạn có thể định tuyến đến 300+ mô hình từ một gói đăng ký, chuyển đổi theo từng agent hoặc từng nhiệm vụ.

Những gì cá nhân tôi chạy ngày nay:

  • Claude Opus 4.7 cho công việc sáng tạo: copywriting, giọng nói, tạo hook, soạn thảo nội dung, bất cứ thứ gì mà gu thẩm mỹ và chất lượng viết là quan trọng
  • Codex (GPT 5.5) cho công việc có cấu trúc: mã hóa, lập kế hoạch, quy trình làm việc đa bước, tự động hóa trình duyệt, quét web, bất cứ thứ gì mà các bước cần chặt chẽ và đầu ra có thể dự đoán

Tôi chạy cả hai. Opus viết. Codex xây dựng và lập kế hoạch. Hermes làm cho việc định tuyến dễ dàng, bạn trỏ mỗi agent vào mô hình phù hợp với công việc nó làm.

Nếu bạn chỉ có thể chạy một, câu trả lời phụ thuộc vào loại công việc đội của bạn đang làm. Nặng về nội dung và copy? Bắt đầu với Claude Opus 4.7. Nặng về cơ sở hạ tầng, tự động hóa và quy trình làm việc kỹ thuật? Bắt đầu với Codex. Bạn luôn có thể thêm mô hình thứ hai sau thông qua cùng một tool gateway.

Những đánh đổi trung thực

Tôi sẽ không giả vờ Hermes là hoàn hảo. Ba đánh đổi thực tế.

  1. Các mặc định đi kèm cũng là ý kiến. Hermes có các mặc định mạnh mẽ về cách bộ nhớ hoạt động, cách kỹ năng được viết, cách agent sử dụng công cụ. Đó là toàn bộ lời chào hàng. Nhưng nó cũng có nghĩa là nếu bạn muốn các nguyên thủy với kiểm soát rõ ràng trên mọi bước, Hermes sẽ cảm thấy nặng nề. OpenClaw là lựa chọn tốt hơn cho gu đó. Chọn công cụ phù hợp với triết lý của bạn.
  1. Cấp độ 3 và 4 có một đường cong học tập thực sự. Docker, VPS, SSH, cấu trúc thư mục control room, kỹ năng điều phối, không có gì trong số này là "cài đặt và chạy." Bạn không nên nhảy đến cấp độ 3 nếu bạn chưa chạy Hermes ở cấp độ 1 hàng ngày.
  1. Mô hình vẫn quan trọng. Hermes là một framework làm cho một mô hình tốt trở nên tuyệt vời. Nó không biến một mô hình nhỏ thành một chiến lược gia. Sử dụng các mô hình mạnh nhất bạn có thể chi trả cho công việc quan trọng (người điều phối của bạn, agent chiến lược của bạn, bộ não của bạn). Hạ xuống các mô hình rẻ hơn cho công việc không quan trọng (quét nghiên cứu, tạo bản nháp, xử lý hàng loạt).

Không có gì trong số này là phép thuật. Nó là một framework mang lại lợi ích vì bộ nhớ tồn tại, các kỹ năng tích lũy, và các agent luôn trong phạm vi. Áp dụng nó cho mô hình có kích thước sai, bạn có một đội bối rối. Áp dụng nó cho mô hình đúng, bạn có một đội.

Tài nguyên

Nếu bạn bắt đầu ngày hôm nay, đây là những gì tôi sẽ đọc theo thứ tự.

  • Tài liệu chính thức: hermes-agent.nousresearch.com/docs. Bắt đầu với hướng dẫn cài đặt, sau đó đọc trang kỹ năng để bạn hiểu những gì có sẵn ngay lập tức
  • Mẫu control room (repo của tôi): github.com/shannhk/hermes-agent-control-room. Cấu trúc chính xác tôi đã mô tả ở trên, sẵn sàng để clone. Mẫu control-room-first để quản lý các agent Hermes từ một agent VPS đến các đội chuyên gia và quy trình làm việc được điều phối. Fork nó và biến nó thành của bạn
  • hermesatlas.com: Bản đồ do cộng đồng quản lý gồm hơn 100 công cụ mã nguồn mở, plugin, không gian làm việc và tích hợp được xây dựng trên Hermes. Được phân loại theo miền (nhà cung cấp bộ nhớ, không gian làm việc, sổ đăng ký kỹ năng, triển khai, điều phối). Cũng bao gồm Sổ tay Hermes, một hướng dẫn thân thiện cho người mới bắt đầu. Cập nhật hàng tuần, bản tin miễn phí
  • @Teknium trên X: Người sáng lập Nous Research. Đăng tải cập nhật Hermes gần như hàng ngày. Tích hợp runtime Codex, gói miễn phí DeepSeek V4 Flash trên Nous Portal, các kỹ năng pretext, tất cả đều đến qua feed của anh ấy trước tiên
  • @NousResearch trên X: Tài khoản chính thức, thông báo tính năng chính thức
  • Các buổi gặp mặt: Hiện có các buổi gặp mặt Hermes trực tiếp (Lisbon, Ventura, nhiều thành phố khác). Đáng để tham dự nếu có một buổi gần bạn. Bạn học được nhiều hơn trong 90 phút trò chuyện bên lề hơn là một tuần đọc tài liệu
Shann³ - inline image

Hy vọng bạn nhận được một số giá trị từ bài viết này, cảm ơn bạn đã đọc toàn bộ.

-- Shann

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind
Dành cho nhà sáng tạo

Biến Markdown của bạn thành bài viết 𝕏 gọn gàng

Khi bạn đăng bài viết dài của riêng mình, việc định dạng hình ảnh, bảng và khối mã cho 𝕏 rất mệt mỏi. YouMind biến cả bản nháp Markdown thành một bài viết 𝕏 gọn gàng, sẵn sàng để đăng.

Thử Markdown sang 𝕏

Thêm pattern để giải mã

Bài viết viral gần đây

Khám phá thêm bài viết viral