หนึ่งคำสั่งติดตั้ง หนึ่งครั้งที่ล็อกอินก็พร้อมใช้งาน ภายในสัปดาห์ที่สอง มันจะสร้างเวิร์กโฟลว์ที่คุณไม่เคยสอนมัน
ฟรีแลนซ์ที่ปรึกษาด้านระบบอัตโนมัติวัย 29 ปี ในลิสบอน ใช้เวลาช่วงเย็นไปกับงานประจำ 3 อย่างให้ลูกค้า: ดึงบทถอดความ, ร่างโพสต์, และจัดเรียงกล่องข้อความ ในเดือนมีนาคม เขาย้ายงานทั้งหมดไปไว้บนเอเจนต์ตัวเดียวที่ทำงานบน VPS ราคา $5 เขาคุยกับมันผ่าน Telegram บนโทรศัพท์ มันยังคงทำงานต่อไปแม้แล็ปท็อปของเขาจะปิดอยู่
เอเจนต์ตัวนั้นคือ Hermes สร้างโดย Nous Research มันคือเอเจนต์ตัวเดียวที่มีลูปการเรียนรู้ในตัว หลังจากทำงานใดๆ ที่ต้องใช้ 5 ขั้นตอนขึ้นไป มันจะเขียนวิธีการนั้นลงในไฟล์สกิลและนำกลับมาใช้ใหม่ในครั้งถัดไป เสียงของเขา รูปแบบของเขา การตรวจสอบของเขา ถูกบันทึกไว้ครั้งเดียวและปรับปรุงทุกครั้งที่มันเริ่มคลาดเคลื่อน เขาไม่ได้ปรับจูนโมเดล (fine-tune) เขาแค่ให้โฟลเดอร์หนึ่งแก่เอเจนต์
1. Hermes คืออะไร ในหนึ่งบรรทัด
เอเจนต์ที่พัฒนาตนเองได้ ซึ่งสร้างสกิลจากประสบการณ์ ค้นหาเซสชันในอดีตของตัวเอง และสร้างโมเดลว่าคุณทำงานอย่างไรในหลายๆ การสนทนา เรียกใช้ได้บน VPS ราคา $5, กล่อง GPU, หรือแบบ serverless ที่แทบไม่มีค่าใช้จ่ายเมื่อไม่ได้ใช้งาน ชี้ไปที่โมเดลใดก็ได้: Nous Portal, OpenRouter, OpenAI, หรือ endpoint ของคุณเอง สลับด้วย hermes model โดยไม่ต้องแก้ไขโค้ด
2. ติดตั้งด้วยคำสั่งเดียว
บน Mac หรือ Linux:
curl -fsSL
Windows มีตัวติดตั้ง PowerShell; โทรศัพท์ใช้เส้นทาง Termux รัน hermes doctor ทันทีหลังจากติดตั้ง มันจะแจ้งเตือนการกำหนดค่า provider ที่ขาดหายไป, ตัวแปร env ที่เสีย, และพาธที่ผิด ก่อนที่คุณจะเสียเวลาหนึ่งชั่วโมงไปกับการพิมพ์ผิด
3. พร้อมใช้งานด้วยการล็อกอินครั้งเดียว
รัน hermes setup --portal OAuth ครั้งเดียวครอบคลุมหนึ่งโมเดลบวกเครื่องมือ 4 อย่าง: ค้นหาเว็บ, สร้างภาพ, แปลงข้อความเป็นเสียง, และเบราว์เซอร์บนคลาวด์ ไม่ต้องสะสมคีย์ API แยก 5 อัน อยากได้คีย์ของตัวเองต่อเครื่องมือ? รัน hermes setup สำหรับคำแนะนำแบบเต็ม, หรือ Blank Slate เพื่อเริ่มต้นด้วยเครื่องมือเทอร์มินัลและไฟล์เท่านั้น แล้วเปิดใช้ส่วนอื่นด้วยตัวเอง
4. ให้มันมีโมเดลที่มีพื้นที่ให้คิด
Hermes ปฏิเสธโมเดลใดๆ ที่มีบริบทน้อยกว่า 64,000 โทเค็นในตอนเริ่มต้น หน้าต่างที่เล็กกว่าไม่สามารถรองรับงานเรียกใช้เครื่องมือแบบหลายขั้นตอนได้ Claude, GPT, Gemini, Qwen, และ DeepSeek ผ่านเกณฑ์ทั้งหมด กำลังรันโมเดลในเครื่อง? ตั้งค่าบริบทของมันอย่างน้อย 64K
5. เรียกใช้ได้สองวิธี
เทอร์มินัล: hermes หรือ hermes --tui สำหรับอินเทอร์เฟซที่ทันสมัย Gateway: hermes gateway ทำให้มันอยู่บน Telegram, Discord, Slack, WhatsApp, Signal, หรือ Email ทั้งสองใช้ฐานข้อมูลเซสชันเดียวกัน เริ่มงานที่โต๊ะทำงาน เสร็จจากโทรศัพท์บนรถไฟ ความทรงจำและสกิลเดียวกัน
6. สอนงานของคุณให้มันเป็นสกิล
สกิลคือไฟล์ความรู้ธรรมดา วางหนึ่งไฟล์ใน ~/.hermes/skills/ และมันจะทำงานทันทีโดยไม่ต้องลงทะเบียน มันจะโหลดเฉพาะเมื่อเอเจนต์เรียกใช้เท่านั้น ดังนั้นมันใช้ 0 โทเค็นจนกว่าจะถูกใช้งาน เรียกดูรายการด้วย hermes skills list ดึงเพิ่มจาก Hub ด้วย hermes skills install หลังจากงานยาก Hermes จะเสนอให้บันทึกวิธีการนั้นเป็นสกิลโดยอัตโนมัติ อยากตรวจสอบลูปนั้นไหม? ตั้งค่า write_approval: true และอนุมัติทุกสกิลที่มันเขียน
7. ปล่อยให้มันแบ่งงาน

เครื่องมือ delegate_task จะสร้างเอเจนต์ย่อยพร้อมชุดเครื่องมือของตัวเองและบริบทที่สะอาด ตัวหนึ่งค้นคว้า ตัวหนึ่งร่าง ตัวหนึ่งตรวจสอบ ทั้งหมดพร้อมกัน แต่ละตัวเริ่มต้นใหม่ ดังนั้นคุณต้องส่งทุกอย่างที่มันต้องการตั้งแต่แรก สำหรับลูกค้าประจำ ให้รันโปรไฟล์: การกำหนดค่า, คีย์, ความทรงจำ, และบอท Telegram แยกกันต่อเอเจนต์บนเครื่อง 1 เครื่อง
8. กำหนดตารางเวลาให้มัน
cron ในตัวจะเรียกใช้งานตามช่วงเวลาและส่งผลลัพธ์ไปยังแพลตฟอร์มใดก็ได้ ไฟล์ใหม่ในโฟลเดอร์, สรุปข่าวเช้าตอน 7 โมง, รายงานประจำสัปดาห์ ไม่มีอะไรที่คุณต้องกดปุ่ม จับคู่เครื่องมือเทอร์มินัลกับ Docker backend แล้วมันจะทำตัวเหมือนแซนด์บ็อกซ์แบบถาวร: ติดตั้งแพ็กเกจครั้งเดียว มันจะอยู่ตลอดเซสชัน
9. จะให้มันทำอะไรดี
- เนื้อหา: ดึงบทถอดความด้วย yt-dlp, เขียนโพสต์ภายในสกิลของคุณ, ส่งร่างไปยัง Telegram เพื่อขออนุมัติก่อนโพสต์
- กล่องข้อความและปฏิทิน: อ่าน, จัดเรียง, ร่างคำตอบ, จองเวลาผ่านอีเมลหรือข้อความ
- งานวิจัย: กระจายเอเจนต์ย่อยไปยังแหล่งต่างๆ, รวบรวมสรุปเป็นรายงานเดียว
- โค้ด: ตรวจสอบ, ปรับโครงสร้าง, และรันใน repo ผ่านสกิล
github-pr-workflow - เอกสาร: อ่าน PDF 50 ไฟล์, ดึงตัวเลข, ส่งกลับเป็นสรุปแบบมีโครงสร้าง
10. คนทำเงินกับมันยังไง

ขายผลลัพธ์ ไม่ใช่การตั้งค่า 3 เส้นทางที่มีหลักฐานชัดเจน:
- ระบบอัตโนมัติแบบทำเสร็จส่งมอบ สร้าง workflow จากกล่องข้อความถึง CRM หรือระบบจองของลูกค้าครั้งเดียว คิดค่าตั้งค่าและค่ารักษารายเดือน เอเจนซี่ตั้งราคางานเหล่านี้ตั้งแต่ไม่กี่ร้อยถึงไม่กี่พัน (ตามที่รายงานเอง)
- การผลิตเนื้อหา รันช่องแบบไม่มีหน้า (faceless channel) หรือ pipeline การโพสต์ของลูกค้าแบบ end to end มีวิดีโอเข้า ได้โพสต์ออก
- สกิลแบบผลิตภัณฑ์ แพ็คเกจเวิร์กโฟลว์เป็นสกิลและแชร์ผ่าน Skills Hub ให้คนอื่นติดตั้ง
คณิตศาสตร์ที่ทำให้มันคุ้มค่า: เอเจนต์ทำงานบนเครื่องราคา $5 และโค้ดที่ประสานงานเอเจนต์ย่อยนั้นคิดค่าใช้จ่าย 0 โทเค็น มีแค่การเรียกใช้โมเดลเท่านั้นที่เสียเงิน ต้นทุนของคุณต่ำในขณะที่งานทวีคูณ
มันไม่เหนื่อย และมันไม่มีวันลืมสิ่งที่เรียนรู้เมื่อวาน
ขอบคุณที่อ่าน
ถ้าสิ่งนี้ช่วยประหยัดเวลาหนึ่งสุดสัปดาห์ที่คุณต้องลองผิดลองถูก นั่นคือจุดประสงค์ทั้งหมด ติดตามเพื่อดู build logs และสกิลที่ผมจะปล่อยต่อไป และบุ๊กมาร์กหน้านี้ไว้สำหรับวันที่คุณรัน `hermes setup` ด้วยตัวเอง สร้างบางอย่างกับมัน แล้วกลับมาบอกผมว่ามันเรียนรู้อะไร





