เรียนรู้วิธีใช้งานและควบคุม Hermes Agent อย่างเชี่ยวชาญ ตั้งค่าเทมเพลตห้องควบคุมเอเจนต์ กำหนดค่าเอเจนต์ผู้เชี่ยวชาญ และพัฒนา从一个เอเจนต์ไปจนถึงบริษัทการตลาดทั้งระบบบน VPS เครื่องเดียว
เครื่องมือ AI ส่วนใหญ่แค่ตอบคำถาม แต่ Hermes Agent รันเวิร์กโฟลว์ของคุณแบบครบวงจรตั้งแต่ต้นจนจบ
มันนำทางเบราว์เซอร์ของคุณ รันคำสั่งบนเทอร์มินัล ตั้งค่า cron jobs ตรวจสอบอินบ็อกซ์ของคุณ ร่างงาน และโพสต์ผลลัพธ์ไปยังที่ที่คุณต้องการ ไม่ว่าจะเป็น Telegram, Discord, Slack, อีเมลที่คุณกำลังอ่านอยู่ตอนนี้
สร้างโดย @NousResearch และเป็นโอเพนซอร์สที่มี 150,000 ดาวบน GitHub ปัจจุบันครองอันดับ 1 บน OpenRouter ในด้านการใช้งานโทเค็นทั่วโลก
มันคือเฟรมเวิร์กที่ฉันใช้สร้างระบบปฏิบัติการด้านการตลาดทั้งหมดในช่วงไม่กี่สัปดาห์ที่ผ่านมา และบทความที่คุณกำลังจะอ่านนี้คือวิธีที่ฉันจะตั้งค่ามันหากเริ่มต้นวันนี้

สิ่งที่คุณจะได้จากบทความนี้
- Hermes Agent คืออะไร และทำไมนักการตลาด (ไม่ใช่แค่นักพัฒนา) ควรสนใจ
- เวอร์ชันที่อ่านง่ายของสถาปัตยกรรม: สมอง บุคลิกภาพ ทักษะ และทั้งหมดนี้ทำงานร่วมกันในโฟลเดอร์เดียวได้อย่างไร
- กรณีการใช้งานที่ฉันกำลังรันบน Hermes อยู่จริง พร้อมโพสต์สี่ชิ้นที่ฉันเคยเผยแพร่เกี่ยวกับเรื่องนี้
- โมเดลทางความคิดสี่ส่วน (คุณ, ห้องควบคุม, เอเจนต์, ตัวส่งงานเสริม) และสี่ระดับของการตั้งค่า ตั้งแต่ "เอเจนต์เดียวบนแล็ปท็อปของคุณ" ไปจนถึง "ทีมเอเจนต์อัตโนมัติบน VPS ที่คุณควบคุมจากโทรศัพท์"
- ระเบียบวิธีจากต้นแบบสู่ระบบผลิตจริงที่ฉันใช้เพื่อเปลี่ยนเวิร์กโฟลว์การตลาดจากไอเดียที่ยุ่งเหยิงไปสู่การทำงานอัตโนมัติ
- แหล่งข้อมูลที่ฉันอยากมีตั้งแต่วันแรก: เอกสาร, Atlas ชุมชน, ผู้คนที่ควรติดตาม, การพบปะที่กำลังเกิดขึ้น
- ข้อแลกเปลี่ยนที่ตรงไปตรงมา และจุดที่มันยังมีปัญหา
ฉันไม่ได้ขายอะไรคุณในบทความนี้ Hermes เป็นโอเพนซอร์ส, Nous Portal มีฟรีเทียร์, และระบบนิเวศของชุมชนส่วนใหญ่ก็ฟรีเช่นกัน fork, ปรับเปลี่ยน, ทำให้เป็นของคุณเอง
Hermes Agent คืออะไร
เวอร์ชันสั้น: เอเจนต์อัตโนมัติที่ยิ่งรันนานยิ่งมีความสามารถมากขึ้น
เวอร์ชันยาว: Hermes เป็นเฟรมเวิร์กที่สร้างโดย Nous Research ที่เปลี่ยนโมเดลให้เป็นตัวดำเนินการที่ทำงานต่อเนื่อง มันมีหน่วยความจำของตัวเองที่คงอยู่ระหว่างเซสชัน มันเขียนทักษะของตัวเองขณะทำงาน มันมาพร้อมกับ 123 ทักษะที่ติดตั้งมาให้แล้ว (GitHub workflows, Obsidian, Google Workspace, Linear, Notion, Typefully, Perplexity, Deep Research, อีก 100+ รายการ) มันอยู่ที่ไหนก็ได้ที่คุณวางมันไว้: บนแล็ปท็อป, ใน Docker container, บน VPS, หรือในรันไทม์แบบ serverless และคุณสามารถพูดคุยกับมันผ่าน 20+ ช่องทาง: Telegram, Discord, Slack, อีเมล, โหมดเสียง, หรือแค่เทอร์มินัลของคุณ
ถ้าคุณเคยใช้ Claude Code หรือ OpenClaw, Hermes มีรูปแบบเดียวกันแต่มีปรัชญาที่ต่างออกไป
Hermes คือระบบราง ค่าเริ่มต้นที่ถูกกำหนดไว้ล่วงหน้า พร้อมใช้งานทันที มีประสิทธิผลตั้งแต่วันแรกด้วยการตั้งค่าน้อยที่สุด เอเจนต์จะคิดแทนคุณมากขึ้น
OpenClaw คือ Linux องค์ประกอบพื้นฐาน การรับประกัน การควบคุมที่ชัดเจน เอเจนต์จะทำตามที่คุณบอกเท่านั้นและไม่มากกว่านั้น
ทั้งสองแนวทางใช้ได้ ฉันใช้ Hermes เพราะค่าเริ่มต้นที่รวมมานั้นทวีคูณประสิทธิภาพ ทุกโปรเจกต์ที่ฉันเริ่มต้นด้วย Hermes คือโปรเจกต์ที่เอเจนต์รู้วิธีทำ 100+ สิ่งแล้วก่อนที่ฉันจะเขียนการกำหนดค่าบรรทัดเดียว การเริ่มต้นที่เร็วนั้นคุ้มค่าสำหรับฉัน และฉันยังสังเกตเห็นว่า Hermes ไม่ค่อยมีปัญหาเรื่องเกตเวย์ขาดการเชื่อมต่อหรือบั๊กเท่าไหร่
หลักฐานอยู่ในตัวเลขที่ Nous Research เพิ่งทำได้:
- อันดับ 1 บน OpenRouter ในด้านการใช้งานโทเค็นทั่วโลก (จากทุกโมเดลและเฟรมเวิร์กบนแพลตฟอร์ม)
- 150,000 ดาวบน GitHub ในคลังของ Hermes
- 123 ทักษะในตัว ก่อนที่เอเจนต์จะเริ่มเขียนทักษะของตัวเอง
- เครื่องมือในตัว 70+ รายการในเกตเวย์ พร้อมโมเดลมากกว่า 300 รุ่นผ่านการสมัครสมาชิกเดียว
- เป้าหมายการปรับใช้ 6 รูปแบบ: local, docker, ssh, daytona, singularity, modal
- ช่องทางการส่งข้อความ 20+ ช่องทาง: Telegram, Discord, Slack, อีเมล, เสียง
ถ้าคุณเป็นนักการตลาด AI และยังไม่ได้เริ่มใช้ Hermes คุณกำลังปล่อยให้ความสามารถที่ทวีคูณหลุดมือไปทุกสัปดาห์
วิธีการทำงาน (เวอร์ชันที่อ่านง่าย)
Hermes Agent ทุกตัวมีสามสิ่ง
สมอง: หน่วยความจำอาศัยอยู่ที่ ~/.hermes/memories/ สองไฟล์, MEMORY.md และ USER.md, จะถูกแทรกเมื่อเริ่มเซสชัน หลักเกณฑ์ด้านโทนเสียงของคุณ, บันทึกเกี่ยวกับแบรนด์, ภาษาของลูกค้า, การแก้ไขจากสัปดาห์ที่แล้ว, ทั้งหมดจะถูกโหลดก่อนพรอมพ์แรก เซสชันถูกจัดเก็บใน SQLite, การเรียกคืนระหว่างเซสชันสามารถค้นหาแบบ full-text ได้
บุคลิกภาพ: soul.md คือที่ที่ความรู้สึกและสไตล์อาศัยอยู่ กระชับ เหน็บแนม ตรงไปตรงมา เป็นทางการ เร็วหรือรอบคอบ คุณสามารถสร้างเอเจนต์หกตัวและให้靈魂 (soul) ที่แตกต่างกันแก่แต่ละตัว โดยมีสมองเดียวกันข้างใต้ ตัวหนึ่งเป็นพนักงานขาย Outbound ที่มีพลังของคนปิดการขาย อีกตัวเป็นนักวิจัยที่ชอบประโยคยาวๆ อีกตัวเป็นผู้ช่วยที่ทำให้ทุกอย่างสั้น

ชุดทักษะ
123 ทักษะที่พร้อมใช้งานทันที: GitHub PRs, Obsidian, Google Workspace, Linear, Notion, Typefully, Perplexity, Deep Research, การควบคุมเบราว์เซอร์, การขูดเว็บ, วิทัศน์, เสียง, การจัดตารางเวลา และวงจรการเรียนรู้แบบปิด: ขณะที่เอเจนต์ทำงาน มันจะเขียนทักษะใหม่ๆ ไปด้วย คลังทักษะของคุณเองจะเติบโตขึ้นบนฐานของ 123 ทักษะ โดยที่คุณไม่ต้องเขียนมันเลย
จากนั้นก็มีสิ่งที่เอเจนต์สามารถสื่อสารด้วย:
- Tool Gateway: สมัครสมาชิกเดียว, โมเดล 300+ รุ่น, พร้อมการขูดเว็บและระบบอัตโนมัติของเบราว์เซอร์ในตัว
- การบูรณาการ MCP: บริการภายนอกใดๆ ที่พูดภาษา Model Context Protocol จะกลายเป็นเครื่องมือที่เอเจนต์ของคุณใช้ได้
- ช่องทางการส่งข้อความ 20+ ช่องทาง: Telegram, Discord, Slack, อีเมล, เสียง, และ CLI เอง

และสถานที่ที่เอเจนต์สามารถอาศัยอยู่:
- แล็ปท็อปของคุณ (local)
- Docker container (แยกส่วน, พกพาได้, วิธีที่ฉันใช้)
- เซสชัน SSH บน VPS (เพื่อให้มันทำงานได้แม้ปิดแล็ปท็อป)
- Daytona, Singularity, Modal (serverless ถ้าคุณไม่ต้องการจัดการโครงสร้างพื้นฐาน)
วงจรการเรียนรู้แบบปิดคือสิ่งที่ทำให้สิ่งนี้แตกต่างจากแชทบอทอัจฉริยะ เอเจนต์เฝ้าดูตัวเองทำงาน เขียนทักษะใหม่เมื่อมันเรียนรู้รูปร่างของงานของคุณ ปรับแต่งหน่วยความจำเป็นระยะ และเรียกคืนบริบทในอดีตระหว่างเซสชันโดยใช้การค้นหาแบบเต็มข้อความและการสรุปโดย LLM ผสมผสานกัน คุณไม่ต้องสอนมันใหม่ในสัปดาห์หน้า
กฎที่ฉันบอกคนที่ใหม่กับ Hermes คือ: อย่าพยายามเขียนทักษะของคุณเองในวันแรก รันงานจริง ปล่อยให้เอเจนต์เฝ้าดู และปล่อยให้เฟรมเวิร์กเขียนทักษะ คุณจะสร้างคลังทักษะที่กำหนดเองได้เร็วกว่าด้วยการทำงานมากกว่าการเขียนพรอมพ์
สิ่งที่ฉันรันบน Hermes
ฉันเป็นนักการตลาด AI ไม่ใช่นักโค้ด สิ่งที่ฉันรันบน Hermes ส่วนใหญ่คือโครงสร้างพื้นฐานทางการตลาด บวกกับเครื่องมือภายในเป็นครั้งคราว นี่คือรายการจริง:
- ผู้ช่วยส่วนตัวที่จัดการทั้งเรื่องธุรกิจและเรื่องส่วนตัว อาศัยอยู่ใน Telegram, คัดกรองอีเมลสี่ฉบับที่ควรอ่านทุกเช้า, เตือนความจำ, สรุปการประชุมที่ฉันพลาด
- โต๊ะทดลองการสร้างเวิร์กโฟลว์การตลาด ที่ฉันทดสอบโฟลว์ใหม่ๆ (Lead Magnet, การตรวจสอบครีเอทีฟโฆษณา, Content Sprint) กับงานจริง 2-3 รอบก่อนนำไปใช้จริง
- เอเจนต์การตลาดเฉพาะทาง: SEO, Outbound / BD, ตรวจสอบการออกแบบ, การเขียนเนื้อหา แต่ละตัวมี靈魂 (soul) และขอบเขตของตัวเอง
- สมองของบริษัทที่ตรวจสอบ Slack, แชท, อีเมล, บทถอดความ, บันทึกเสียง และทำให้ทุกอย่างสามารถค้นหาได้ เมื่อฉันถามว่า "เราพูดอะไรกับลูกค้าคนนั้นเรื่องราคาเมื่อเดือนที่แล้ว" ฉันจะได้คำตอบภายใน 3 วินาที แทนที่จะต้องขุดค้น 30 นาที
- เอเจนต์ SEO ที่รันไปป์ไลน์เต็มรูปแบบตั้งแต่การป้อนคีย์เวิร์ดไปจนถึงบทความที่เผยแพร่ใน Docker container เดียว 21 ขั้นตอน ไม่มีมนุษย์เข้ามายุ่งจนถึงการตรวจสอบครั้งสุดท้าย
- เอเจนต์กระจายเนื้อหาที่นำคอนเทนต์แบบยาว (เช่นบทความนี้) และกระจายไปยัง LinkedIn, X, Threads พร้อมจุดขายเฉพาะแพลตฟอร์ม
- เอเจนต์ตัวประสานงานที่ไม่ผลิตงานเอง แต่ทำหน้าที่ส่งคำขอไปยังเอเจนต์ผู้เชี่ยวชาญที่เหมาะสมตามสิ่งที่ฉันถาม
บลูพริ้นท์ที่ฉันโพสต์ซึ่งสรุปมัน:
เอเจนต์ SEO โดยเฉพาะเป็นสิ่งที่ควรเจาะลึก เพราะมันคือตัวที่ฉันปล่อยสู่สาธารณะแล้ว และเป็นตัวที่เข้ากับสถาปัตยกรรมในส่วนที่เหลือของบทความนี้ได้ดีที่สุด ห้าชั้น ทุกอย่างอยู่ใน Docker container เดียว 21 ขั้นตอนจากคีย์เวิร์ดไปยังบทความที่เผยแพร่
21 ขั้นตอนมีลักษณะดังนี้ในเทอร์มินัล:
ชั้นต่างๆ ที่อยู่เหนือไปป์ไลน์นี้:
- สมองของบริษัทอยู่ด้านบนสุด: วิสัยทัศน์, แบรนด์, ผู้ชม, ผลิตภัณฑ์ เอเจนต์ทุกตัวอ่านจากสิ่งนี้
- Hermes Agent ตัวประสานงาน: รับหัวข้อหรือคีย์เวิร์ดเริ่มต้นและส่งต่อไปยังเอเจนต์ SEO
- สมอง SEO: หลักปฏิบัติด้านการจัดอันดับ, กฎของโทนเสียง, รูปแบบเนื้อหา, คู่มือสไตล์ภาพ, เกณฑ์ความสำเร็จตามรูปแบบ บริบทเฉพาะด้าน SEO ทั้งหมดอยู่ที่นี่
- เอเจนต์ย่อยสามตัวภายในเอเจนต์ SEO แต่ละตัวจัดการหนึ่งเฟส:
- ค้นคว้า + ตั้งแนวคิด: คีย์เวิร์ดเริ่มต้น, ภาพรวม SERP, การดึงข้อมูลคู่แข่ง, การวิเคราะห์เจตนาและรูปแบบ, ช่องว่างด้านเนื้อหาและภาพ, การตรวจสอบภายในและภายนอก
- การผลิต: บรีฟเกี่ยวกับมุมมองและตำแหน่ง, บรีฟเกี่ยวกับกลยุทธ์ภาพ, โครงเรื่อง, ร่าง, การสร้างภาพ, การสร้างผังงาน, การตรวจสอบคุณภาพของภาพและบทความ
- การกระจาย: การเตรียมพร้อมสำหรับการเผยแพร่, Schema, การเชื่อมโยงภายใน, การแจกจ่ายเนื้อหา, การวิเคราะห์, การติดตาม
- Docker container หนึ่งตัวเก็บเอเจนต์ย่อยทั้งสามตัวไว้ พวกมันแชร์ env, หน่วยความจำ, และเครื่องมือ โปรไฟล์ย่อยจะสลับบริบทตามเฟส หนึ่งกระบวนการ, หนึ่งระบบไฟล์, ชุดข้อมูลรับรองหนึ่งชุด
ทำไมต้องคอนเทนเนอร์เดียวแทนที่จะเป็นสาม: งาน SEO เป็นลำดับขั้นตอน การค้นคว้าป้อนบรีฟ, บรีฟป้อนการผลิต, การผลิตป้อนการกระจาย ทุกขั้นตอนต้องการหน่วยความจำเกี่ยวกับสิ่งที่ตัดสินใจไว้ก่อนหน้านี้ การแยกเป็นสามคอนเทนเนอร์หมายถึงการขนถ่ายสถานะข้ามขอบเขต ซึ่งมีค่าใช้จ่ายสูงและทำให้ห่วงโซ่ขาด
เอเจนต์เฉพาะทางอื่นๆ ทุกตัวในบริษัทรันบนเทมเพลตเดียวกัน โคลนเทมเพลตเอเจนต์ SEO, สลับสมอง (สมอง SEO → สมอง Outbound, หรือ → สมองออกแบบ, หรือ → สมองสนับสนุน) แล้วคุณก็จะมีเอเจนต์ใหม่สำหรับทุกฟังก์ชันที่มีรูปร่างห้าชั้นเดียวกัน
ชั้นต่างๆ ไม่ใช่ของตกแต่ง พวกมันคือเหตุผลที่เอเจนต์ไม่สูญเสียบริบทเมื่องานมีความเชี่ยวชาญมากขึ้น สมองของบริษัทยังคงที่ในขณะที่ผู้ปฏิบัติงานดำเนินการซ้ำ ชั้นของสมองทำให้ผู้ปฏิบัติงานสามารถเปลี่ยนแทนได้
ฉันยังเป็นเจ้าภาพจัดงาน Nous Research ที่ @EspressioAI HQ ในลิสบอนสำหรับค่ำคืนของ Hermes Agent เมื่อเร็วๆ นี้ @yeahfortommy จาก Nous จัดเซสชัน Q&A, Simao จาก noticed .so สาธิตเอเจนต์ฮาร์เนสพร้อมการวิจัยอัตโนมัติ และฉันได้อธิบายว่าเรากำลังใช้ Hermes เพื่อการเติบโตที่ Espressio อย่างไร
ถ้าคุณอยู่ในลิสบอนและต้องการมางานครั้งต่อไป ฉันจะโพสต์เมื่อมีการกำหนดวัน
จากเอเจนต์เดียวสู่กองเรือเต็มรูปแบบ
ก่อนจะถึงระดับต่างๆ เรามาทำความเข้าใจโมเดลทางความคิดกันก่อน
การตั้งค่ามีสี่ส่วน:
- คุณคือผู้ดำเนินการ คุณมีสิทธิ์เข้าถึงโดยตรงทุกส่วนของระบบ
- ห้องควบคุมเอเจนต์ (Agent Control Room) คือระนาบควบคุมด้านข้าง มันไม่ใช่เอเจนต์ที่คุณใช้แชทด้วย มันคือโฟลเดอร์ที่ /root/vps-agents ซึ่งจัดทำเอกสารและกำกับดูแลกองเรือทั้งหมด คุณเปิดมัน, แก้ไขมัน, ตรวจสอบมัน, หรือขอให้ Claude, Codex, หรือ Hermes ใช้มันเมื่อคุณกำลังจัดการระบบ
- Hermes Agents คือผู้ปฏิบัติงาน บางตัวเป็นผู้เชี่ยวชาญ (SEO, Dev, CMO, Ops) หนึ่งในนั้นสามารถทำหน้าที่เป็นตัวประสานงานได้ตามต้องการ
- Agent Task Bus คือโต๊ะส่งต่องานเสริมที่อยู่ระหว่างตัวประสานงานและผู้เชี่ยวชาญ คุณจำเป็นต้องใช้มันก็ต่อเมื่อคุณมีตัวประสานงานทำงานอยู่แล้วเท่านั้น
ทั้งหมดมีลักษณะดังนี้:
การแยกส่วนจัดเก็บข้อมูลมีความสำคัญมากกว่าที่คนส่วนใหญ่คิด:
ห้องควบคุมประกอบด้วยคำตอบสำหรับคำถามเช่น: มี่เอเจนต์ใดบ้าง, พวกมันทำอะไร, พวกมันใช้พอร์ตอะไร, พวกมันอ้างถึงข้อมูลรับรองอะไร, แต่ละเอเจนต์ทำอะไรได้และไม่ได้, และวิธีรีสตาร์ท, ดีบัก, หรือสร้างใหม่เอเจนต์ใดๆ รันไทม์สดประกอบด้วยการทำงานจริง
ห้องควบคุมคือสมองที่กำหนดระบบ รันไทม์สดคือร่างกายที่รันระบบ คุณสามารถสร้างร่างกายขึ้นมาใหม่จากสมองได้ แต่คุณไม่สามารถสร้างสมองขึ้นมาใหม่จากร่างกายได้
ภายในห้องควบคุม:
และภายในรันไทม์ของแต่ละเอเจนต์ที่ /srv/<ชื่อ-เอเจนต์>/data/:
สามวิธีที่คุณโต้ตอบ
- Control Path คือชั้นเมตา ใช้เมื่อเพิ่มเอเจนต์, ทบทวนเอกสาร, ตรวจสอบพอร์ต, หมุนคีย์, แก้ไขปัญหาการตั้งค่า
- Direct Path คือวิธีที่เร็วที่สุด ใช้เมื่อคุณรู้อยู่แล้วว่าเอเจนต์ใดทำงานที่ต้องการ
- Orchestrated Path คือตัวสังเคราะห์ ใช้เมื่อคุณต้องการประตูหน้าเดียวที่ส่งต่องานและรวมผลลัพธ์จากผู้เชี่ยวชาญหลายคน
ระดับที่ 1: หนึ่งเอเจนต์
คุณมี Hermes Agent หนึ่งตัว เท่านั้นแหละ ห้องควบคุมยังคงมีอยู่ได้ (แนะนำ) แต่มันแค่จัดทำเอกสารสำหรับเอเจนต์ตัวนั้นเท่านั้น
เหมาะสำหรับ: การตั้งค่าเริ่มต้น, Hermes ส่วนตัวของคุณ, เอกสารประกอบการติดตั้งรากฐาน, การย้าย Docker อย่างง่าย
หนึ่งเอเจนต์, ถูกใช้งานอย่างสม่ำเสมอ, มีบุคลิกภาพที่คุณปรับแต่งแล้ว และหน่วยความจำที่เริ่มสร้างแล้ว กรอก SOUL.md ด้วยโทนเสียงที่คุณต้องการ, MEMORY.md ด้วยข้อเท็จจริงที่มั่นคงเกี่ยวกับธุรกิจของคุณ, และ USER.md ด้วยข้อเท็จจริงที่มั่นคงเกี่ยวกับคุณ เชื่อมต่อกับ Telegram หรือ Discord เพื่อให้มันอาศัยอยู่ในที่ที่คุณอยู่ เริ่มใช้มันกับงานจริง ปล่อยให้มันสัมผัสเครื่องมือของคุณ ปล่อยให้มันเขียนทักษะของตัวเองไปพร้อมกัน
MEMORY.md เก็บข้อเท็จจริงที่มั่นคง (ธุรกิจของคุณคืออะไร, ลูกค้าของคุณคือใคร, ผลิตภัณฑ์ของคุณทำอะไร) USER.md เก็บข้อเท็จจริงที่มั่นคงเกี่ยวกับคุณ (เขตเวลา, เวลาทำงาน, โปรเจกต์ประจำ, รูปแบบผลลัพธ์ที่ต้องการ) ทั้งสองจะถูกปรับปรุงทุกสัปดาห์เมื่อคุณแก้ไขเอเจนต์ในการสนทนาจริง
ระดับที่ 2: เอเจนต์ผู้เชี่ยวชาญโดยตรง
คุณมีเอเจนต์เฉพาะทางหลายตัว แต่คุณยังคงพูดคุยกับแต่ละตัวโดยตรง ยังไม่มีตัวประสานงาน
ห้องควบคุมจัดทำเอกสารทั้งหมด
เหมาะสำหรับ: การแยกบทบาทที่ชัดเจน, การทดสอบว่าเอเจนต์ใดมีประโยชน์, การหลีกเลี่ยงการมีตัวประสานงานก่อนเวลาอันควร, การเก็บข้อมูลรับรองให้อยู่ในขอบเขตต่อเอเจนต์
กับดักที่ควรหลีกเลี่ยงคือการหาตัวประสานงานก่อนที่คุณจะพิสูจน์แล้วว่าเอเจนต์ผู้เชี่ยวชาญของคุณมีประโยชน์ สร้างสองสามตัว รันโดยตรง และเพิ่มตัวประสานงานต่อเมื่อคุณพบว่าตัวเองต้องการประตูหน้าเพียงบานเดียว
เมื่อใดควรสร้างเอเจนต์ใหม่เทียบกับการใช้สิ่งที่มีอยู่:
รูปแบบที่ไม่ดี: เอเจนต์มหึมาหนึ่งตัวที่มีทุกข้อมูลรับรองและทุกชั้นหน่วยความจำรวมกัน คุณสูญเสียการแยกส่วน คุณสูญเสียความสามารถในการเพิกถอนการเข้าถึงอย่างสะอาด และเอเจนต์สับสนว่าโทนเสียงไหนควรใช้
ระดับที่ 3: ตัวประสานงาน + ผู้เชี่ยวชาญ
คุณเพิ่ม hermes-orchestrator เป็นประตูหน้า คุณยังคงสามารถพูดคุยกับผู้เชี่ยวชาญได้โดยตรง แต่ตัวประสานงานสามารถส่งต่องานและสังเคราะห์ผลลัพธ์

ตัวประสานงานอ่านห้องควบคุมเพื่อรู้ว่าเอเจนต์ใดมีอยู่, แต่ละตัวทำอะไร, คิวงานอยู่ที่ไหน, สิ่งใดต้องได้รับการอนุมัติ, การกระทำใดถูกห้าม, และเอกสารและคู่มือปฏิบัติงานอยู่ที่ไหน มันไม่จำเป็นต้องถามคุณทั้งหมดนั้น มันอ่านมันเอง
เหมาะสำหรับ: งานข้ามสายงาน, การมอบหมายงาน, การสรุปและการสังเคราะห์, อินเทอร์เฟซหลักเดียวสำหรับเวิร์กโฟลว์หลายเอเจนต์
ตัวประสานงานคือช่วงเวลาที่การตั้งค่าของคุณเลิกเป็นเพียงกลุ่มของเอเจนต์และเริ่มเป็นทีม มันยังเป็นช่วงเวลาที่ห้องควบคุมพิสูจน์คุณค่าของมัน เพราะตัวประสานงานจะดีได้เท่าที่เอกสารที่มันอ่านเท่านั้น
หน้าตาการเช็คอินกองเรืออย่างรวดเร็วจากแล็ปท็อปหรือโทรศัพท์ของฉัน:
ระดับที่ 4: ทีมเอเจนต์อัตโนมัติ
รูปร่างเดียวกับระดับที่ 3 แต่มีเวิร์กโฟลว์ที่เกิดขึ้นเป็นประจำและระบบอัตโนมัติที่แข็งแกร่งกว่า รายงาน SEO รายสัปดาห์รันบน Cron การตรวจสอบสุขภาพเซิร์ฟเวอร์ทำงานทุกวัน การตรวจสอบการสำรองข้อมูลรันโดยที่คุณไม่ต้องถาม เวิร์กโฟลว์ธุรกิจข้ามเอเจนต์เริ่มทำงานตามตารางเวลา
เหมาะสำหรับ: รายงาน SEO รายสัปดาห์, การดำเนินการด้านเนื้อหา, การตรวจสอบสุขภาพเซิร์ฟเวอร์, การตรวจสอบการสำรองข้อมูล, เวิร์กโฟลว์ธุรกิจข้ามเอเจนต์
ระดับที่ 4 คือสิ่งที่แผนกการตลาดในเทอร์มินัลของคุณมีลักษณะเป็นแบบนั้น มันไม่ต้องการให้คุณเริ่มต้นวัน มันมาทำงานเอง, ส่งรายงาน, ตรวจสอบตัวเอง, และแค่ส่งข้อความถึงคุณเฉพาะการตัดสินใจที่ต้องใช้รสนิยม

ลำดับชั้นการควบคุม
หลักการหนึ่งที่ควรจดจำไว้ในใจขณะที่คุณไต่ระดับขึ้นไป
ห้องควบคุมมีไว้สำหรับการกำหนดค่า, เอกสาร, คู่มือปฏิบัติงาน, และการกำกับดูแล มันจัดทำเอกสารว่าเอเจนต์ใดบ้างที่มีอยู่, พวกมันทำอะไร, พวกมันรันที่ไหน, พวกมันอ้างถึงข้อมูลรับรองอะไร, แต่ละเอเจนต์ทำอะไรได้และไม่ได้ มันคือแผงผู้ดูแลระบบสำหรับกองเรือ รวมถึงตัวประสานงานด้วย มันไม่ใช่ที่ที่คุณไปเพื่อทำงาน
สำหรับการทำงาน คุณพูดคุยกับเอเจนต์โดยตรง ไม่ว่าจะเป็นผู้เชี่ยวชาญ (เมื่อคุณรู้ว่าเอเจนต์ใดเป็นเจ้าของงาน) หรือตัวประสานงาน (เมื่อคุณต้องการประตูหน้าเดียวเพื่อส่งต่องานไปยังผู้เชี่ยวชาญต่างๆ)
คู่มือการตั้งค่า: ชี้เอเจนต์ของคุณไปที่คลัง
ตอนนี้คุณเข้าใจสถาปัตยกรรมแล้ว นี่คือวิธีสร้างมัน
ฉันได้ปล่อยเทมเพลตสาธารณะที่มีโครงสร้างที่อธิบายไว้ข้างต้น พร้อมด้วยทักษะที่เอเจนต์ของคุณต้องการเพื่อตั้งค่าให้คุณ
มันอยู่ที่ github.com/shannhk/hermes-agent-control-room

คุณสามารถโคลนมันด้วยตนเอง แต่ประเด็นคือคุณไม่จำเป็นต้องทำ ถ้าคุณมี Claude Code หรือ Codex บนแล็ปท็อป เอเจนต์จะทำงานส่วนใหญ่หลังจากที่คุณส่งคีย์ API ของ Hetzner ให้มัน
โฟลว์อัตโนมัติ:
ภายในสิบถึงสิบห้านาทีคุณจะได้รับ:
- VPS Hetzner ใหม่พร้อมเครื่องมือที่เหมาะสมที่ติดตั้งไว้
- ห้องควบคุมที่โคลนไว้ที่ /root/agent-control-room บน VPS
- ทักษะที่รวมมาถูกลิงก์ไปยัง ~/.claude/skills บน VPS
- Hermes Agent หนึ่งตัวที่ลงทะเบียน, คู่มือปฏิบัติงานถูกกรอก, env-map ถูกเขียน
- นามแฝง SSH บนแล็ปท็อปของคุณ ดังนั้น ssh hermes เชื่อมต่อได้ทันที
ระเบียบวิธีจากต้นแบบสู่ระบบผลิตจริง
เวิร์กโฟลว์ส่วนใหญ่ไม่ได้เริ่มต้นเป็นงานผลิต พวกมันเริ่มต้นอย่างยุ่งเหยิง โฟลว์ที่รันการค้นคว้า SEO, ร่างบทความ, กำหนดเวลาใน Typefully, และโพสต์ไปยัง LinkedIn ไม่ได้มีอยู่ในหัวคุณอย่างสมบูรณ์ คุณค้นพบมันโดยการรันมัน
Hermes คือสภาพแวดล้อมการสร้างต้นแบบสำหรับสิ่งนี้ นี่คือเส้นทางสี่ขั้นตอนที่ฉันใช้เพื่อนำเวิร์กโฟลว์การตลาดใหม่จากไอเดียไปสู่การปรับใช้อัตโนมัติ:
- สร้างต้นแบบใน Hermes เปิด Hermes Agent หลักของคุณ, อธิบายสิ่งที่คุณต้องการให้เกิดขึ้น, และปล่อยให้มันลอง มันจะทำผิดพลาดส่วนใหญ่ในรอบแรก ไม่เป็นไร
- รันมัน 2-3 ครั้งกับงานจริง, แก้ไขส่วนที่ผิดเพี้ยนในแต่ละครั้ง เฟรมเวิร์กเฝ้าดูทุกการแก้ไขและเริ่มเขียนทักษะเมื่อมันเรียนรู้รูปร่าง ภายในรอบที่สาม เอเจนต์จะทำสิ่งที่คุณต้องการเป็นส่วนใหญ่โดยไม่ต้องแนะนำ
- ปรับแต่งในพื้นที่ทำงานเฉพาะ ดึงเวิร์กโฟลว์ไปยังพื้นที่ทำงาน Claude Code แยกต่างหาก (หรือ Hermes Agent ใหม่ถ้าคุณชอบ), ปรับพรอมพ์ให้แน่นขึ้น, ล็อกการกำหนดเส้นทาง, เพิ่มการจัดการข้อผิดพลาด, ตัดสินใจว่าอะไรควรรันบน Cron และอะไรควรถูกเรียกใช้งาน
- ปรับใช้บน VPS ตามตารางเวลา เมื่อมันรอดจากการรันจริงเป็นเวลาหนึ่งสัปดาห์โดยที่คุณไม่ต้องดูแลผลักมันไปยัง Docker container ของตัวเองบน VPS ของคุณ, ตั้งค่า Cron, และเดินจากไป
ฉันเรียนรู้รูปแบบนี้หลังจากหมดสุดสัปดาห์สองสามครั้งพยายามเขียนเอเจนต์ระดับผลิตจากศูนย์ คุณไม่สามารถเขียนเอเจนต์ระดับผลิตจากศูนย์ได้ คุณต้องเติบโตมัน Hermes ทำให้ส่วนการเติบโตรวดเร็ว

- สร้างต้นแบบใน Hermes
- ปรับแต่งในพื้นที่ทำงานเฉพาะ
- ปรับใช้อัตโนมัติบน VPS
โมเดลที่ฉันรันบน Hermes
Hermes ให้เฟรมเวิร์กแก่คุณ โมเดลที่อยู่ข้างใต้นั้นเป็นทางเลือกของคุณ ผ่าน Tool Gateway คุณสามารถกำหนดเส้นทางไปยังโมเดล 300+ รุ่นจากการสมัครสมาชิกเดียว โดยสลับต่อเอเจนต์หรือต่องาน
สิ่งที่ฉันรันส่วนตัวในวันนี้:
- Claude Opus 4.7 สำหรับงานสร้างสรรค์: การเขียนคำโฆษณา, เสียง, การสร้าง Hook, การร่างเนื้อหา, อะไรก็ตามที่รสนิยมและคุณภาพการเขียนมีความสำคัญ
- Codex (GPT 5.5) สำหรับงานที่มีโครงสร้าง: การเขียนโค้ด, การวางแผน, เวิร์กโฟลว์หลายขั้นตอน, ระบบอัตโนมัติของเบราว์เซอร์, การขูดเว็บ, อะไรก็ตามที่ขั้นตอนต้องรัดกุมและผลลัพธ์ต้องคาดเดาได้
ฉันใช้ทั้งสองตัว Opus เขียน Codex สร้างและวางแผน Hermes ทำให้การกำหนดเส้นทางง่าย คุณเพียงแค่ชี้แต่ละเอเจนต์ไปยังโมเดลที่เหมาะกับงานที่มันทำ
ถ้าคุณสามารถรันได้เพียงตัวเดียว คำตอบขึ้นอยู่กับว่างานของกองเรือของคุณเป็นประเภทไหน หนักไปทางเนื้อหาและงานเขียน? เริ่มต้นด้วย Claude Opus 4.7 หนักไปทางโครงสร้างพื้นฐาน, ระบบอัตโนมัติ, และเวิร์กโฟลว์วิศวกรรม? เริ่มต้นด้วย Codex คุณสามารถเพิ่มโมเดลที่สองได้เสมอผ่าน Tool Gateway เดียวกัน
ข้อแลกเปลี่ยนที่ตรงไปตรงมา
ฉันจะไม่แสร้งทำเป็นว่า Hermes สมบูรณ์แบบ ข้อแลกเปลี่ยนจริงสามข้อ:
- ค่าเริ่มต้นที่รวมมาคือความคิดเห็นด้วย Hermes มาพร้อมกับค่าเริ่มต้นที่ชัดเจนสำหรับวิธีการทำงานของหน่วยความจำ, วิธีการเขียนทักษะ, วิธีการใช้เครื่องมือของเอเจนต์ นั่นคือจุดขายทั้งหมด แต่มันก็หมายความว่าถ้าคุณต้องการองค์ประกอบพื้นฐานที่มีการควบคุมที่ชัดเจนในทุกขั้นตอน, Hermes จะรู้สึกหนัก OpenClaw เหมาะกับรสนิยมนั้นมากกว่า เลือกเครื่องมือที่ตรงกับปรัชญาของคุณ
- ระดับที่ 3 และ 4 มีเส้นโค้งการเรียนรู้ที่แท้จริง Docker, VPS, SSH, โครงสร้างโฟลเดอร์ห้องควบคุม, ทักษะของตัวประสานงาน, ไม่มีอะไรที่เป็น "ติดตั้งแล้วใช้ได้ทันที" คุณไม่ควรกระโดดไปที่ระดับที่ 3 ถ้าคุณยังไม่ได้รัน Hermes ในระดับที่ 1 เป็นประจำทุกวัน
- โมเดลยังคงมีความสำคัญ Hermes เป็นเฟรมเวิร์กที่ทำให้โมเดลที่ดีกลายเป็นสิ่งที่ยอดเยี่ยม มันไม่ได้ทำให้โมเดลเล็กกลายเป็นนักวางกลยุทธ์ ใช้โมเดลที่แข็งแกร่งที่สุดที่คุณสามารถจ่ายได้สำหรับงานที่สำคัญ (ตัวประสานงานของคุณ, เอเจนต์กลยุทธ์ของคุณ, สมองของคุณ) ลดระดับลงมาใช้โมเดลที่ถูกกว่าสำหรับงานที่ไม่สำคัญ (การขูดเว็บเพื่อการค้นคว้า, การสร้างร่าง, การประมวลผลแบบแบตช์)
ไม่มีอะไรในนี้เป็นเวทมนตร์ มันเป็นเฟรมเวิร์กที่ให้ผลตอบแทนเพราะหน่วยความจำคงอยู่, ทักษะสะสม, และเอเจนต์ยังคงอยู่ในขอบเขตที่กำหนด ใช้มันกับโมเดลที่มีขนาดผิดแล้วคุณจะได้ทีมที่สับสน ใช้มันกับโมเดลที่ถูกต้องแล้วคุณจะได้ทีม
แหล่งข้อมูล
ถ้าคุณเริ่มต้นวันนี้ นี่คือสิ่งที่ฉันจะอ่านตามลำดับ
- เอกสารทางการ: hermes-agent.nousresearch.com/docs เริ่มต้นด้วยคู่มือการติดตั้ง, จากนั้นอ่านหน้าทักษะเพื่อให้เข้าใจว่ามีอะไรมาพร้อมกับระบบ
- เทมเพลตห้องควบคุม (คลังของฉัน): github.com/shannhk/hermes-agent-control-room โครงสร้างที่แน่นอนที่อธิบายไว้ข้างต้น พร้อมให้โคลน เทมเพลตแบบควบคุมห้องเป็นอันดับแรกสำหรับการจัดการ Hermes Agent จากเอเจนต์ VPS ตัวเดียวไปจนถึงทีมผู้เชี่ยวชาญและเวิร์กโฟลว์ที่ประสานงานกัน Fork แล้วทำให้เป็นของคุณเอง
- hermesatlas.com: แผนที่ที่ดูแลโดยชุมชนของเครื่องมือโอเพนซอร์ส 100+ รายการ, ปลั๊กอิน, พื้นที่ทำงาน, และการบูรณาการที่สร้างบน Hermes จัดหมวดหมู่ตามโดเมน (ผู้ให้บริการหน่วยความจำ, พื้นที่ทำงาน, ทะเบียนทักษะ, การปรับใช้, การประสานงาน) รวมถึง Hermes Handbook, คำแนะนำที่เป็นมิตรกับผู้เริ่มต้น อัปเดตรายสัปดาห์, จดหมายข่าวฟรี
- @Teknium บน X: ผู้ก่อตั้ง Nous Research อัปเดต Hermes เกือบทุกวัน การบูรณาการรันไทม์ Codex, ฟรีเทียร์ DeepSeek V4 Flash บน Nous Portal, ทักษะ Pretext, ทั้งหมดมาผ่านฟีดของเขาก่อน
- @NousResearch บน X: บัญชีทางการ, ประกาศคุณสมบัติทางการ
- การพบปะ: มีการพบปะของ Hermes ที่เกิดขึ้นด้วยตนเองตอนนี้ (ลิสบอน, Ventura, เมืองอื่นๆ อีก) คุ้มค่าที่จะไปถ้ามีใกล้คุณ คุณเรียนรู้มากขึ้นใน 90 นาทีของการสนทนาข้างเคียงมากกว่าการอ่านเป็นเวลาหนึ่งสัปดาห์

หวังว่าคุณจะได้รับประโยชน์จากสิ่งนี้ ขอบคุณที่อ่านจนจบ
-- Shann





