
Meta-Meta-Prompting: เคล็ดลับการทำให้ AI Agents ทำงานได้อย่างมีประสิทธิภาพ
AI features
- Views
- 1.4M
- Likes
- 3.5K
- Reposts
- 486
- Comments
- 129
- Bookmarks
- 11.0K
TL;DR
Garry Tan อธิบายสถาปัตยกรรม Fat Skills, Thin Harness สำหรับ AI Agents พร้อมรายละเอียดการใช้เครื่องมือโอเพนซอร์สอย่าง GBrain เพื่อสร้างฐานความรู้ส่วนบุคคลที่เติบโตขึ้นเรื่อยๆ และเวิร์กโฟลว์แบบอัตโนมัติ
Reading the ไทย translation
ผู้คนถามผมอยู่เรื่อยว่าทำไมผมถึงใช้เวลากลางคืนเขียนโค้ดจนถึงตีสอง ผมมีงานประจำ และเป็นงานใหญ่ด้วย — ในฐานะซีอีโอของ Y Combinator เราช่วยผู้สร้างนับพันคนต่อปีให้สร้างความฝันในการสร้างสตาร์ทอัพจริงที่มีรายได้จริงและเติบโตเร็ว
ในช่วง 5 เดือนที่ผ่านมา AI ทำให้ผมกลับมาเป็นผู้สร้างอีกครั้ง ช่วงปลายปีที่แล้ว เครื่องมือต่างๆ ดีพอที่ผมจะกลับมาสร้างของจริง ไม่ใช่โปรเจกต์เล่นๆ แต่เป็นระบบจริงที่ทบต้น ผมอยากให้คุณเห็นด้วยตัวอย่างที่ชัดเจนว่า Personal AI จริงๆ แล้วหน้าตาเป็นยังไง เมื่อคุณเลิกมองมันเป็นแค่หน้าต่างแชท และเริ่มมองมันเป็นระบบปฏิบัติการ และผมแจกมันเป็นโอเพนซอร์สและในบทความแบบนี้ เพราะผมอยากให้คุณก้าวไปพร้อมกับผม
นี่เป็นส่วนหนึ่งของซีรีส์: Fat Skills, Fat Code, Thin Harness แนะนำสถาปัตยกรรมหลัก Resolvers ครอบคลุมตารางเส้นทางสำหรับความฉลาด The LOC Controversy ว่าด้วยเรื่องที่คนสายเทคนิคทุกคนเพิ่มขีดความสามารถตัวเอง 100 ถึง 1,000 เท่า Naked models are stupider โต้แย้งว่าโมเดลคือเครื่องยนต์ ไม่ใช่รถยนต์ และ the skillify manifesto อธิบายว่าทำไม LangChain ระดมทุนได้ 160 ล้านดอลลาร์ แล้วให้คุณแค่ราวแขวนกับดัมเบลโดยไม่มีแผนออกกำลังกาย แล้วก็ให้แผนที่คุณต้องการในที่สุด
หนังสือที่อ่านฉันกลับ
เดือนที่แล้วผมกำลังอ่าน When Things Fall Apart ของ Pema Chödrön หนังสือ 162 หน้า 22 บทเกี่ยวกับแนวทางพุทธในการจัดการกับความทุกข์ ความไร้พื้นฐาน และการปล่อยวาง เพื่อนคนหนึ่งแนะนำในช่วงเวลาที่ยากลำบาก
ผมขอให้ AI ของผมทำ Book Mirror
ความหมายที่เป็นรูปธรรม: ระบบแยกเนื้อหาทั้ง 22 บทของหนังสือออกมา แล้วสำหรับแต่ละบท ก็รันซับเอเจนต์ที่ทำสองอย่างพร้อมกัน: สรุปแนวคิดของผู้เขียน และจากนั้นจับคู่ทุกแนวคิดกับชีวิตจริงของผม ไม่ใช่คำพูดคลุมเครือแบบ "สิ่งนี้ใช้ได้กับผู้นำ" แต่เป็นการจับคู่เฉพาะเจาะจง มันรู้ประวัติครอบครัวของผม (พ่อแม่เป็นผู้อพยพ พ่อมาจากฮ่องกงและสิงคโปร์ แม่มาจากพม่า) มันรู้บริบทการทำงานของผม (บริหาร YC, สร้างเครื่องมือโอเพนซอร์ส, ให้คำปรึกษาผู้ก่อตั้งนับพัน) มันรู้ว่าผมอ่านอะไร คิดอะไรตอนตีสอง และกำลังทำงานอะไรกับนักบำบัดของผม
ผลลัพธ์คือ Brain Page ขนาด 30,000 คำ แต่ละบทแสดงเป็นสองคอลัมน์: สิ่งที่ Pema พูด และมันเชื่อมโยงกับสิ่งที่ผมกำลังเผชิญอยู่จริงๆ บทเกี่ยวกับความไร้พื้นฐานเชื่อมโยงกับการสนทนากับผู้ก่อตั้งคนหนึ่งที่ผมมีเมื่อสัปดาห์ก่อน บทเกี่ยวกับความกลัวจับคู่กับรูปแบบที่นักบำบัดของผมระบุไว้ บทเกี่ยวกับการปล่อยวางอ้างอิงถึงเซสชันดึกที่ผมเขียนเกี่ยวกับอิสรภาพในการสร้างสรรค์ที่ผมค้นพบในปีนี้
ทั้งหมดใช้เวลาประมาณ 40 นาที นักบำบัดที่คิดชั่วโมงละ 300 ดอลลาร์ที่อ่านหนังสือเล่มนี้และประยุกต์ใช้กับชีวิตผม ไม่สามารถทำได้ใน 40 ชั่วโมง เพราะพวกเขาไม่มีกราฟเต็มรูปแบบของบริบทการทำงาน ประวัติการอ่าน บันทึกการประชุม และความสัมพันธ์กับผู้ก่อตั้งที่ถูกโหลดและเชื่อมโยงกันได้
ผมทำแบบนี้กับหนังสือมากกว่า 20 เล่มแล้ว: Amplified (Dion Lim), Autobiography of Bertrand Russell, Designing Your Life, Drama of the Gifted Child, Finite and Infinite Games, Gift from the Sea (Lindbergh), Siddhartha (Hesse), Steppenwolf (Hesse), The Art of Doing Science and Engineering (Hamming), The Dream Machine, The Book on the Taboo Against Knowing Who You Are (Alan Watts), What Do You Care What Other People Think (Feynman), When Things Fall Apart (Pema Chodron), A Brief History of Everything (Ken Wilber), และอื่นๆ แต่ละเล่มยิ่งมีคุณค่ามากขึ้นเพราะสมองยิ่งสมบูรณ์ขึ้น กระจกเงาบานที่สองรู้เรื่องบานแรก บานที่ยี่สิบรู้เรื่องทั้งหมดสิบเก้าบาน
วิธีที่ Book-Mirror ดีขึ้นผ่านการทำซ้ำ
Book Mirror ครั้งแรกที่ผมทำนั้นแย่มาก เวอร์ชัน 1 มีข้อผิดพลาดเชิงข้อเท็จจริงสามข้อเกี่ยวกับครอบครัวของผม มันบอกว่าพ่อแม่หย่ากันทั้งที่ไม่ได้หย่า บอกว่าผมโตในฮ่องกงทั้งที่เกิดในแคนาดา เรื่องพื้นฐานที่อาจทำลายความไว้วางใจถ้าผมแชร์ออกไป
ผมเลยเพิ่มขั้นตอนตรวจสอบข้อเท็จจริงที่จำเป็น ทุก Mirror ทุกวันนี้จะรัน Cross-Modal Evaluation กับข้อเท็จจริงที่รู้ใน Brain ก่อนที่จะส่งออก Opus 4.7 1M จับข้อผิดพลาดด้านความแม่นยำ GPT-5.5 จับบริบทที่ขาดหาย DeepSeek V4-Pro จับเวลาที่อะไรบางอย่างอ่านดูเป็นเรื่องทั่วไป
จากนั้นผมก็อัปเกรดเป็น Deep Retrieval ด้วยการใช้เครื่องมือ GBrain เวอร์ชันดั้งเดิมเก่งเรื่องการสังเคราะห์แต่อ่อนเรื่องความเฉพาะเจาะจง เวอร์ชัน 3 ทำการค้นหา Brain แยกตามส่วน ทุกรายการในคอลัมน์ขวาอ้างอิง Brain Page จริง เมื่อหนังสือพูดถึงการจัดการกับการสนทนาที่ยาก มันไม่ได้แค่สังเคราะห์หลักการทั่วไป มันดึงจากบันทึกการประชุมจริงของผมกับผู้ก่อตั้งเฉพาะที่กำลังมีการสนทนาที่ยากกับผู้ร่วมก่อตั้ง หรือไอเดียที่ผมมีตอนไปเที่ยวกับเจมส์น้องชายในวันพฤหัส หรือแชท IM ที่ผมมีกับเพื่อนร่วมห้องสมัยมหา'ลัยตอนอายุ 19 มันช่างน่าขนลุก
นี่คือสิ่งที่ Skillification (ใช้ /skillify ใน GBrain) หมายถึงในทางปฏิบัติ ผมเอาความพยายามด้วยมือครั้งแรก สกัดรูปแบบที่ทำซ้ำได้ เขียนไฟล์ Skill ที่ผ่านการทดสอบพร้อมทริกเกอร์และกรณีขอบ และทุกการแก้ไขจะทบต้นใน Book Mirror ในอนาคตทั้งหมด
ทักษะที่สร้างทักษะ
ตรงนี้คือจุดที่มันเกิดการวนซ้ำ และเป็นจุดที่ผมคิดว่าเป็นข้อมูลเชิงลึกที่ใหญ่ที่สุด
ระบบที่ขับเคลื่อนชีวิตผมไม่ได้มีอยู่เป็นก้อนเดียว มันถูกประกอบขึ้นจากทักษะ และทักษะเหล่านั้นก็ถูกสร้างขึ้นโดยทักษะอีกที
Skillify คือ Meta-Skill ที่สร้างทักษะใหม่ เมื่อผมเจอเวิร์กโฟลว์ที่ต้องทำซ้ำ ผมพูดว่า "skillify this" แล้วมันจะตรวจสอบสิ่งที่เพิ่งเกิดขึ้น สกัดรูปแบบที่ทำซ้ำได้ เขียนไฟล์ Skill ที่ผ่านการทดสอบพร้อมทริกเกอร์และกรณีขอบ และลงทะเบียนใน Resolver ไพพ์ไลน์ Book-Mirror ถูก Skillify ตั้งแต่ครั้งแรกที่ผมทำด้วยมือ เวิร์กโฟลว์เตรียมประชุมถูก Skillify หลังจากผมสังเกตว่าผมทำขั้นตอนเดิมก่อนทุกการโทร
ทักษะประกอบกันได้ Book-Mirror เรียก Brain-Ops เพื่อจัดเก็บ, Enrich เพื่อบริบท, Cross-Modal-Eval เพื่อคุณภาพ, และ PDF-Generation เพื่อผลลัพธ์ แต่ละทักษะโฟกัสที่สิ่งเดียว พวกมันต่อกันเป็นลูกโซ่เพื่อสร้างเวิร์กโฟลว์ที่ซับซ้อน เมื่อผมปรับปรุงทักษะหนึ่ง ทุกเวิร์กโฟลว์ที่ใช้มันจะดีขึ้นโดยอัตโนมัติ ไม่ต้อง "ลืมพูดถึงกรณีขอบนี้ใน Prompt" อีกต่อไป ทักษะจำได้
การประชุมที่เตรียมตัวเอง
Demis Hassabis มาที่ YC เพื่อ Fireside Chat ชีวประวัติของเขาโดย Sebastian Mallaby เพิ่งออกมา
ผมขอให้ระบบเตรียมตัวผม
ในเวลาไม่ถึงสองนาที มันดึง: Brain Page เต็มของ Demis (ที่สะสมมาหลายเดือนจากบทความ, บทถอดเสียงพอดแคสต์, และบันทึกของผมเอง), ความเชื่อที่เขาตีพิมพ์เกี่ยวกับไทม์ไลน์ AGI ("50% scaling, 50% innovation", คิดว่า AGI อยู่ห่าง 5-10 ปี), ไฮไลท์จากชีวประวัติของ Mallaby, ลำดับความสำคัญในการวิจัยที่เขาระบุ (Continual Learning, World Models, Long-Term Memory), การอ้างอิงโยงกับสิ่งที่ผมพูดต่อสาธารณะเกี่ยวกับ AI, สคริปต์สาธิตสามแบบสำหรับแสดงความสามารถในการใช้เหตุผลแบบหลายขั้นตอนของ Brain ระหว่างการสนทนา, และชุดตะขอสำหรับการสนทนาตามจุดที่โลกทัศน์ของเราทับซ้อนและแตกต่าง
นี่ไม่ใช่แค่การค้นหา Google ที่ดีกว่า นี่คือการเตรียมตัวที่ใช้บริบทสะสมของผมเกี่ยวกับ Demis, จุดยืนของผมเอง, และเป้าหมายเชิงกลยุทธ์สำหรับการสนทนา ระบบเตรียมไม่เพียงแค่ข้อเท็จจริง แต่รวมถึงมุมมองด้วย
หน้าตาของ Brain 100,000 หน้า
ผมดูแลฐานความรู้ที่มีโครงสร้างประมาณ 100,000 หน้า ทุกคนที่ผมพบจะได้หน้าเพจที่มีไทม์ไลน์, ส่วนสถานะ (สิ่งที่เป็นจริงในปัจจุบัน), หัวข้อที่ยังค้าง, และคะแนน ทุกการประชุมจะได้บันทึกการถอดเสียง, สรุปที่มีโครงสร้าง, และสิ่งที่ผมเรียกว่า Entity Propagation: หลังทุกการประชุม ระบบจะเดินผ่านทุกคนและทุกบริษัทที่ถูกกล่าวถึง และอัปเดต Brain Page ของพวกเขาด้วยสิ่งที่ถูกพูดถึง ทุกหนังสือที่ผมอ่านจะได้ Mirror แยกตามบท ทุกบทความ, พอดแคสต์, และวิดีโอที่ผมมีส่วนร่วมจะถูกนำเข้า, ติดแท็ก, และอ้างอิงโยง
โครงร่างนั้นง่าย แต่ละหน้ามี: Compiled Truth ที่ด้านบน (ความเข้าใจที่ดีที่สุดในปัจจุบัน), ไทม์ไลน์แบบ Append-Only ด้านล่าง (เหตุการณ์ตามลำดับเวลา), และ Raw Data Sidecars สำหรับแหล่งข้อมูลต้นฉบับ คิดว่ามันเป็น Wikipedia ส่วนตัวที่ทุกหน้าถูกอัปเดตอย่างต่อเนื่องโดย AI ที่อยู่ในการประชุม, อ่านอีเมล, ดูการบรรยาย, และนำเข้า PDF
นี่คือตัวอย่างว่าสิ่งนี้ทบต้นอย่างไร ผมพบผู้ก่อตั้งที่ Office Hours ระบบสร้างหรืออัปเดตหน้า Person, หน้า Company, อ้างอิงโยงบันทึกการประชุม, ตรวจสอบว่าผมเคยพบพวกเขามาก่อนหรือไม่ (และแสดงสิ่งที่เราคุยกันครั้งล่าสุด), ตรวจสอบข้อมูลสมัคร, ดึงเมตริกล่าสุด, และระบุว่ามีพอร์ตโฟลิโอหรือผู้ติดต่อของผมที่เกี่ยวข้องกับปัญหาของพวกเขาหรือไม่ เมื่อผมเดินเข้าประชุมครั้งต่อไปกับพวกเขา ระบบมีชุดบริบทเต็มพร้อมแล้ว
นี่คือความแตกต่างระหว่างการมีตู้เก็บเอกสารกับการมีระบบประสาท ตู้เก็บเอกสารเก็บสิ่งต่างๆ ระบบประสาทเชื่อมโยง它们, แจ้งสิ่งที่เปลี่ยนแปลง, และแสดงสิ่งที่เกี่ยวข้องกับตอนนี้
สถาปัตยกรรม
นี่คือวิธีการทำงาน ผมคิดว่านี่คือวิธีที่ถูกต้องในการสร้าง Personal AI และผมเปิดซอร์สทั้งหมดเพื่อให้คุณสร้างเองได้
Harness นั้นบาง OpenClaw คือ Runtime มันรับข้อความของผม, หาว่า Skill ไหนที่เกี่ยวข้อง, และส่งต่อ ตรรกะการจัดเส้นทางไม่กี่พันบรรทัด มันไม่รู้อะไรเกี่ยวกับหนังสือหรือการประชุมหรือผู้ก่อตั้ง มันแค่จัดเส้นทาง
Skills นั้นอ้วน ตอนนี้มีมากกว่า 100 อัน แต่ละอันเป็นไฟล์ Markdown ที่มีคำแนะนำโดยละเอียดสำหรับงานเฉพาะหนึ่งงาน คุณเห็น Book-Mirror และ Meeting-Prep ข้างต้นแล้ว นี่คืออีกสองสามอันที่มาพร้อมกับ GBrain:
- meeting-ingestion: หลังทุกการประชุม มันดึงบันทึกการถอดเสียง, สรุปที่มีโครงสร้าง, จากนั้นเดินผ่านทุกคนและทุกบริษัทที่ถูกกล่าวถึง และอัปเดต Brain Page ของพวกเขาด้วยสิ่งที่ถูกพูดถึง หน้า Meeting ไม่ใช่ผลิตภัณฑ์สุดท้าย Entity Propagation กลับไปยังทุกหน้า Person และ Company คือคุณค่าที่แท้จริง
- enrich: ให้ชื่อคน มันดึงจากห้าแหล่งที่แตกต่างกัน, รวมทุกอย่างเป็น Brain Page เดียวที่มีเส้นทางอาชีพ, ข้อมูลติดต่อ, ประวัติการประชุม, และบริบทความสัมพันธ์ อ้างอิงแหล่งที่มาสำหรับทุกข้ออ้าง
- media-ingest: จัดการวิดีโอ, เสียง, PDF, ภาพหน้าจอ, GitHub Repos ถอดเสียง, สกัด Entities, เก็บไปยังตำแหน่ง Brain ที่ถูกต้อง ผมใช้สิ่งนี้ตลอดสำหรับวิดีโอ YouTube, พอดแคสต์, และ Voice Memos
- perplexity-research: การวิจัยเว็บที่เสริมด้วย Brain ค้นหาเว็บผ่าน Perplexity แต่ก่อนสังเคราะห์, ตรวจสอบว่า Brain รู้อะไรอยู่แล้ว เพื่อที่จะบอกคุณว่าอะไรใหม่จริงๆ เทียบกับสิ่งที่คุณบันทึกไว้แล้ว
ผมมีอีกหลายสิบอันที่สร้างขึ้นสำหรับงานของตัวเองที่อาจจะเปิดซอร์ส: email-triage, investor-update-ingest ที่ตรวจจับการอัปเดตพอร์ตโฟลิโอในอีเมลและสกัดเมตริกลงในหน้า Company, calendar-check สำหรับการตรวจจับความขัดแย้งและความเป็นไปไม่ได้ในการเดินทาง, และชุดการวิจัยนักข่าวทั้งหมดที่ใช้สำหรับงานพลเมือง แต่ละ Skill เข้ารหัสความรู้ในการปฏิบัติงานที่ผู้ช่วยมนุษย์ใหม่ต้องใช้เวลาหลายเดือนในการเรียนรู้ เมื่อมีคนถามว่าผม "Prompt" AI ของผมยังไง คำตอบคือ: ผมไม่ Prompt Skills คือ Prompts
ข้อมูลอ้วน 100,000 หน้าของความรู้ที่มีโครงสร้างใน Brain Repo ทุกคน, ทุกบริษัท, ทุกการประชุม, ทุกหนังสือ, ทุกบทความ, และทุกไอเดียที่ผมมีส่วนร่วม, เชื่อมโยงทั้งหมด, ค้นหาได้ทั้งหมด, และเติบโตทุกวัน
โค้ดอ้วน โค้ดที่ป้อนมัน (สคริปต์สำหรับการถอดเสียง, OCR, การเก็บถาวรโซเชียลมีเดีย, การซิงค์ปฏิทิน, การรวม API) ก็สำคัญเช่นกัน แต่ข้อมูลคือที่ที่คุณค่าทบต้นอยู่ ผมรัน Cron มากกว่า 100 ครั้งต่อวันที่ตรวจสอบทุกอย่าง: โซเชียลมีเดีย, Slack, อีเมล, อะไรก็ตามที่ผมสนใจ, OpenClaw/Hermes Agents ของผมก็ดูให้ผมด้วย
โมเดลสามารถเปลี่ยนได้ ผมใช้ Opus 4.7 1M เพื่อความแม่นยำ GPT-5.5 เพื่อการเรียกคืนและการสกัดที่ละเอียด DeepSeek V4-Pro สำหรับงานสร้างสรรค์และมุมมองที่สาม Groq กับ Llamma เพื่อความเร็ว Skill เป็นตัวตัดสินใจว่าจะเรียกโมเดลไหนสำหรับงานไหน Harness ไม่สนใจ เมื่อมีคนถามว่า "AI model ไหนดีที่สุด" คำตอบคือ: คำถามผิด โมเดลเป็นแค่เครื่องยนต์ ทุกอย่างอื่นคือรถยนต์
ผู้สร้างตอนตีสองและระบบที่ทบต้น
คนถามผมเกี่ยวกับประสิทธิภาพการทำงาน ผมไม่ได้คิดแบบนั้น สิ่งที่ผมคิดคือการทบต้น
ทุกการประชุมที่ผมเข้าร่วมเพิ่มเข้าไปใน Brain ทุกหนังสือที่ผมอ่านทำให้บริบทสำหรับหนังสือเล่มถัดไปสมบูรณ์ขึ้น ทุก Skill ที่ผมสร้างทำให้เวิร์กโฟลว์ถัดไปเร็วขึ้น ทุกหน้า Person ที่ผมอัปเดตทำให้การเตรียมประชุมครั้งถัดไปคมชัดขึ้น ระบบวันนี้ดีกว่าเมื่อสองเดือนก่อน 10 เท่า และอีกสองเดือนจากนี้มันจะดีขึ้นอีก 10 เท่า
เมื่อผมยังตื่นตอนตีสองเขียนโค้ด (และผมก็ทำเป็นประจำ เพราะ AI ทำให้ผมมีความสุขในการสร้างอีกครั้ง) ผมไม่ได้แค่เขียนซอฟต์แวร์ ผมกำลังเพิ่มเข้าไปในระบบที่ดีขึ้นทุกชั่วโมง 100 Cronjobs ตลอด 24 ชั่วโมง การนำเข้าประชุมทำงานอัตโนมัติ การจัดลำดับความสำคัญอีเมลทำงานทุก 10 นาที กราฟความรู้เสริมสร้างตัวเองจากการสนทนาทุกครั้ง ระบบประมวลผลบันทึกการถอดเสียงรายวันและสกัดรูปแบบที่ผมพลาดในเวลาจริง
นี่ไม่ใช่เครื่องมือเขียน มันไม่ใช่เครื่องมือค้นหา มันไม่ใช่แชทบอท มันคือสมองที่สองที่ใช้งานได้จริง ไม่ใช่ในเชิงอุปมา แต่เป็นระบบที่ทำงานจริงที่มี 100,000 หน้า, 100+ Skills, 15 Cron Jobs, และบริบทสะสมของทุกความสัมพันธ์ทางอาชีพ, การประชุม, หนังสือ, และไอเดียที่ผมมีส่วนร่วมในปีที่ผ่านมา
ผมเปิดซอร์สทั้ง Stack GStack คือกรอบงาน Coding Skill (87,000+ ดาว) ที่ผมใช้สร้างมัน ผมยังใช้มันเป็น Skill ภายใน OpenClaw/Hermes Agent เมื่อ Agent ต้องการเขียนโค้ด มีเบราว์เซอร์ที่ตั้งโปรแกรมได้ดี (ทั้งแบบมีหัวและไม่มีหัว) อยู่ในนั้น GBrain คือโครงสร้างพื้นฐานความรู้ OpenClaw และ Hermes Agent คือ Harnesses คุณควรเลือกแต่ผมมักใช้ทั้งสอง ที่เก็บข้อมูลอยู่บน GitHub
วิทยานิพนธ์นั้นง่าย: อนาคตเป็นของบุคคลที่สร้างระบบ AI ที่ทบต้น ไม่ใช่ของบุคคลที่ใช้เครื่องมือ AI แบบรวมศูนย์ที่บริษัทเป็นเจ้าของ ความแตกต่างคือความแตกต่างระหว่างการเขียนบันทึกส่วนตัวกับการมีระบบประสาท
วิธีเริ่มต้น
ถ้าคุณต้องการสร้างสิ่งนี้:
- เลือก Harness OpenClaw, Hermes Agent, หรือสร้างเองจากศูนย์ด้วย Pi ทำให้มันบาง Harness เป็นแค่เราเตอร์ โฮสต์บนคอมพิวเตอร์สำรองที่บ้านด้วย Tailscale หรือใช้ Render หรือ Railway บนคลาวด์
- เริ่ม Brain ด้วย GBrain ผมได้ แรงบันดาลใจจาก LLM Wiki ของ Karpathy, นำไปใช้ใน OpenClaw, และขยายเป็น GBrain มันคือ ระบบ retrieval ที่ดีที่สุดที่ผม benchmark (97.6% recall บน LongMemEval, ชนะ MemPalace โดยไม่มี LLM ในลูป retrieval) และมาพร้อมกับ 39 Skills ที่ติดตั้งได้ รวมถึงทุกอย่างที่อธิบายในบทความนี้ คำสั่งเดียวในการติดตั้ง Git Repo ที่ทุกคน, ทุกการประชุม, ทุกบทความ, และทุกไอเดียมีหน้าเพจ
- ทำสิ่งที่น่าสนใจ อย่าเริ่มด้วยการวางแผนสถาปัตยกรรม Skill เริ่มด้วยการทำสิ่งหนึ่ง เขียนรายงาน ค้นคว้าบุคคล ดาวน์โหลดฤดูกาลคะแนน NBA และสร้างโมเดลทำนายสำหรับการเดิมพันกีฬา วิเคราะห์พอร์ตโฟลิโอ อะไรก็ตามที่คุณสนใจจริงๆ ทำกับ Agent ของคุณ ทำซ้ำจนกว่าจะดี แล้วรัน Skillify (Meta-Skill จากก่อนหน้านี้) เพื่อสกัดรูปแบบเป็น Skill ที่ใช้ซ้ำได้ จากนั้นรัน check_resolvable เพื่อยืนยันว่า Skill ใหม่เชื่อมต่อกับ Resolver แล้ว ลูปนั้นเปลี่ยนงานครั้งเดียวให้เป็นโครงสร้างพื้นฐานที่ทบต้น
- ใช้มันต่อไปและดูผลลัพธ์ Skill จะธรรมดาในตอนแรก นั่นคือประเด็น ใช้มัน, อ่านสิ่งที่มันสร้าง, และเมื่อมีอะไรผิดพลาด, รัน Cross-Modal Eval: ส่งผลลัพธ์ผ่านหลายโมเดลและให้พวกเขาให้คะแนนกันในมิติที่คุณสนใจ นั่นคือวิธีที่ผมจับข้อผิดพลาดเชิงข้อเท็จจริงใน Book-Mirror การแก้ไขถูกฝังลงใน Skill และทุก Mirror ตั้งแต่นั้นมาก็สะอาด ในหกเดือนคุณจะมีสิ่งที่ไม่มีแชทบอทใดทำซ้ำได้ เพราะคุณค่าไม่ได้อยู่ในโมเดล แต่อยู่ในสิ่งที่คุณสอนระบบเกี่ยวกับชีวิต, งาน, และการตัดสินใจเฉพาะของคุณ
สิ่งแรกที่ผมสร้างด้วยระบบนี้แย่มาก สิ่งที่ร้อยคือสิ่งที่ผมจะไว้ใจด้วยปฏิทิน, กล่องจดหมาย, การเตรียมประชุม, และรายการอ่านของผม ระบบเรียนรู้ ผมเรียนรู้ เส้นโค้งทบต้นเป็นจริง
Fat Skills. Fat Code. Thin Harness. LLM เพียงอย่างเดียวเป็นแค่เครื่องยนต์ คุณสามารถสร้างรถของคุณเองได้
ทุกอย่างที่ผมอธิบายที่นี่, Skills ทั้งหมด, ไพพ์ไลน์ Book Mirror, กรอบงาน Cross-Modal Eval, ลูป Skillify, สถาปัตยกรรม Resolver, บวก Skillpack ที่ติดตั้งได้อีก 30+ ชุด, เป็นโอเพนซอร์สและฟรีบน GitHub: github.com/garrytan/gbrain ไปสร้างเลย


