วิธีลดค่าใช้จ่าย Token ของ Fable 5 ลง 50%+
Claude Fable 5 คือโมเดล AI ที่ดีที่สุดที่ฉันเคยใช้มา จบ.
ปัญหาคือมันแพงมาก
ในไม่กี่ชั่วโมงแรกที่ทดสอบ ฉันเกือบใช้โควต้าหมดทั้งที่ยังไม่ได้ทำอะไรหนักๆ เลย
Fable มีราคาแพงกว่า Opus 4.8 เท่าตัว และเพราะมันฉลาดมาก มันเลยคิดมากเกินไป วนลูปและเผา Token ในแบบที่ Claude รุ่นก่อนๆ ไม่เคยทำ
การเรียนรู้วิธีใช้โมเดลใหม่นี้อย่างถูกต้องสำคัญกว่าที่เคย
ในคู่มือนี้ ฉันจะอธิบายระบบ 10-80-10 ที่ฉันพัฒนาขึ้นเพื่อลดค่าใช้จ่าย Token ของ Fable อย่างมาก และคำแนะนำนี้มาจากวิศวกรของ Anthropic โดยตรง
ท้ายบทความ ฉันได้สร้างเอกสารที่คุณสามารถวางลงใน Fable ได้โดยตรง ซึ่งสรุปกรอบแนวคิดทั้งหมดของฉัน
เอกสารนี้จะช่วยลดการใช้ Token ของคุณทันที
อ่านต่อจนจบ แล้วฉันจะแชร์ให้คุณโดยตรง

เอกสารกรอบแนวคิด \ของฉัน\
I: อธิบายระบบ 10-80-10
ระบบ 10-80-10 เป็นกรอบแนวคิดง่ายๆ สำหรับใช้ Fable อย่างมีประสิทธิภาพเฉพาะในจุดที่จำเป็นจริงๆ
นี่คือกรอบแนวคิดที่วิศวกรของ Anthropic ใช้กันเอง
นี่คือรายละเอียด:
10% แรก: การวางแผน
ก่อนที่คุณจะเริ่มโปรเจกต์ AI ใดๆ คุณควรใช้ Fable เพื่อกำหนดโครงสร้าง แนวทาง เกณฑ์ความสำเร็จ และข้อจำกัด
ลองนึกถึงการสร้างบ้าน ส่วนสำคัญที่สุดคือการออกแบบและวางแผนให้ถูกต้อง มิฉะนั้นช่างก่อสร้างก็จะทำงานตามแผนที่แย่
Fable 5 เป็นสถาปนิกที่ยอดเยี่ยม ใช้มันในบทบาทนั้น
80% ตรงกลาง: การดำเนินการ
Token ส่วนใหญ่ถูกเผาไปกับการโต้ตอบไปมา การปรับปรุงซ้ำ การแก้ไขเล็กน้อย และงานหนักของการทำงานให้เสร็จ
สำหรับชั้นการดำเนินการของโปรเจกต์ AI คุณควรใช้โมเดลที่ถูกกว่า เช่น Opus 4.8 สำหรับงานทั่วไป หรือ Haiku สำหรับงานเบา
คุณจะได้ประโยชน์จากสถาปัตยกรรมของ Fable โดยไม่ต้องจ่ายราคา Fable สำหรับทุก Token ของการดำเนินการ (ซึ่งเกินความจำเป็นอยู่ดี)
10% สุดท้าย: การตรวจสอบ
เมื่อดำเนินการเสร็จ ให้เรียก Fable กลับมา ให้มันตรวจสอบผลลัพธ์เทียบกับสถาปัตยกรรมดั้งเดิม
ผลลัพธ์ตรงกับแผนหรือไม่? มีช่องว่างอะไรไหม? มีอะไรต้องแก้ไขก่อนเผยแพร่หรือไม่?
รอบสุดท้ายนี้คือจุดที่ความฉลาดของ Fable จับสิ่งที่โมเดลราคาถูกมองข้าม และเพราะมันตรวจสอบผลลัพธ์ที่เสร็จแล้วแทนที่จะสร้างจากศูนย์ มันจึงใช้ Token น้อยกว่าการทำงานทั้งหมดด้วยตัวเองมาก

ระบบ 10-80-10
นี่คือกรอบแนวคิด 10-80-10 ทั้งหมดที่ช่วยให้คุณได้รับประโยชน์ทั้งหมดของ Fable โดยไม่มีข้อเสียเรื่องค่าใช้จ่าย Token
โมเดลอย่าง Opus 4.8 ก็มีความสามารถพอๆ กันในการจัดการชั้นการดำเนินการ และระบบนี้ช่วยหลีกเลี่ยงความต้องการของ Fable ที่จะทำให้ทุกอย่าง "สมบูรณ์แบบ" ด้วยการวนลูปหลายรอบ ค้นคว้าเชิงลึก ฯลฯ
II: อธิบาย Loops
ฉันจะเขียนบทความเจาะลึกเกี่ยวกับเรื่องนี้ แต่ฉันอยากจะพูดถึง /loop สั้นๆ เพราะมันเป็นวิธีที่ทรงพลังที่สุดในการใช้ Fable 5 ในตอนนี้
Lance Martin ( @RLanceMartin ) วิศวกรของ Anthropic เผยแพร่คู่มือการออกแบบ Loops สำหรับโมเดลระดับ Mythos
ฉันแนะนำให้อ่านบทความนี้ แต่ฉันจะสรุปให้ด้านล่าง
https://x.com/RLanceMartin/status/2064397389189071163
วิธีการ Prompt แบบเก่า vs ใหม่
วิธีการ Prompt แบบเก่าเป็นแบบนี้:
คุณ Prompt → Claude ตอบกลับ → คุณตรวจสอบ → คุณ Prompt ซ้ำ → ทำซ้ำ
ในรูปแบบนั้น คุณคือ Loop
คุณตรวจสอบทุกขั้นตอนการยืนยัน ทุกการแก้ไข และทุกการติดตามผลด้วยตัวเอง
Loops จะทำให้กระบวนการทั้งหมดเป็นอัตโนมัติและกำจัดคุณซึ่งเป็นคอขวด
ด้วยวิศวกรรม Loop คุณกำหนดเป้าหมายให้ Fable ล่วงหน้า จากนั้นมันจะสร้าง Subagents ขึ้นมาเพื่อทำงานไปสู่เป้าหมายนั้น
ออกแบบ Loop → Fable สร้าง Subagents ที่ตรวจสอบ → Agents Prompt ตัวเองเพื่อทำงานให้สำเร็จ

วิศวกรรม Prompt เทียบกับวิศวกรรม Loop
อธิบาย /goal และ /loop
สองคำสั่งนี้คือการนำวิศวกรรม Loop ไปใช้จริงภายใน Claude Code
/goal คือจุดเริ่มต้น
โครงสร้าง Prompt
/goal [งาน] until [สถานะสิ้นสุดที่วัดได้] without [ข้อจำกัด]
/loop ก้าวไปอีกขั้น
แทนที่จะรันครั้งเดียว /loop จะรัน Prompt ซ้ำตามช่วงเวลาที่กำหนด
/loop [Prompt ของคุณ] --interval 30m --expires 8h

/goal เทียบกับ /loop
การรวมกันนี้ทรงพลังมาก
ใช้ /goal เพื่อกำหนดงานเพียงครั้งเดียว และใช้ /loop เพื่อให้มันทำงานอัตโนมัติตามตารางเวลาที่เหมาะสมกับงาน
การใช้วิศวกรรม Loop ในทางปฏิบัติเพื่อลดค่าใช้จ่าย Token
นี่คือจุดที่ระบบ 10-80-10 ทำงานได้อย่างมหัศจรรย์
ด้วยกรอบแนวคิด 10-80-10 Fable จัดการการวางแผน 10% แรกโดยการออกแบบ Loop โมเดลราคาถูกจัดการการดำเนินการ 80% และ Fable จะกลับมาเฉพาะเมื่อ Loop ปิดหรือเมื่อจำเป็น
คุณยังสามารถใช้ GPT-5.5 ในชั้นการดำเนินการ ซึ่งสามารถลดค่าใช้จ่าย Token ได้ 50% หรือมากกว่า
III: เคล็ดลับการประหยัด Token ทั่วไป
ระบบ 10-80-10 และ Loops จัดการประสิทธิภาพในภาพรวม ส่วนนี้คือการปรับแต่งเล็กน้อยที่ช่วยได้เช่นกัน
- การเลือกระดับความพยายาม
เริ่มที่ระดับความพยายามปานกลาง ไม่ใช่สูงสุด
Fable ระดับปานกลางดีกว่า Opus ระดับสูงมาก ให้เพิ่มระดับเมื่อคุณพบปัญหาด้านคุณภาพจริงๆ การตั้งค่าสูงสุดทุกอย่างเป็นวิธีที่เร็วที่สุดวิธีหนึ่งในการเผาโควต้าของคุณ
บางคนรายงานว่าใช้ Fable ระดับความพยายามต่ำและได้ผลลัพธ์ที่ยอดเยี่ยม
- ลบ Skills และคำแนะนำเก่า
Prompt ที่สร้างสำหรับโมเดลรุ่นก่อนๆ มักทำงานได้แย่กว่าใน Fable
คำแนะนำที่สั้นกว่าและสะอาดกว่าทำงานได้ดีกว่าและมีค่าใช้จ่ายน้อยกว่าใน Fable (Fable จะหาทางจัดการเองอยู่แล้ว)
- บอก Fable ถึง "เหตุผล" ของทุกอย่าง
Fable จะทำสิ่งที่ถูกต้องตั้งแต่ครั้งแรกบ่อยขึ้นเมื่อมันเข้าใจเจตนาเบื้องหลังคำขอ
การแก้ไขและการวนซ้ำน้อยลงหมายถึงการเผา Token น้อยลงมาก
โปรดทราบว่าโมเดลนี้ถูกสร้างขึ้นสำหรับการทำงานอัตโนมัติเต็มรูปแบบ และถ้าคุณไม่บอก "เหตุผล" เบื้องหลังสิ่งต่างๆ มันจะต้องคิดหนักขึ้นเพื่อหาขั้นตอนถัดไป
- /usage
ตรวจสอบการใช้งานของคุณอย่างสม่ำเสมอ รัน /usage ใน Claude Code เป็นประจำ เมื่อ Fable เปลี่ยนเป็นจ่ายต่อ Token ในวันที่ 7 กรกฎาคม สิ่งนี้จะกลายเป็นสิ่งจำเป็น
ฉันเขียนคู่มือการ Prompt Fable 5 ทั้งหมดที่นี่ - เคล็ดลับหลายข้อที่กล่าวถึงจะช่วยลดการใช้ Token ของคุณด้วย
https://x.com/aiedge_/status/2065064961999847849
IV: ข้อผิดพลาดราคาแพงของ Fable
นี่คือข้อผิดพลาดสองข้อที่ควรกล่าวถึงเป็นพิเศษเพราะสังเกตได้ยากและอาจมีค่าใช้จ่ายสูงหากไม่แก้ไข
ข้อผิดพลาด 1: เผลอใช้ Fable โดยไม่ตั้งใจ
เมื่อคุณเปิด Claude Code หรือแอป Claude ตอนนี้มันจะตั้งค่าเริ่มต้นเป็น Fable
Anthropic กำลังสนับสนุนให้ผู้คนทดสอบโมเดลนี้ในตอนนี้
คำแนะนำง่ายๆ: ตรวจสอบตัวเลือกโมเดลก่อนทุกเซสชัน ฉันเคยจับได้ว่าตัวเองใช้ Fable โดยไม่ตั้งใจในการแชทปกติ
ข้อผิดพลาด 2: ไม่มีวงเงินใช้จ่าย
ในวันที่ 7 กรกฎาคม Fable จะออกจากระบบสมัครสมาชิกมาตรฐาน
ถ้าคุณต้องการใช้มันต่อเกินขีดจำกัดของแผน คุณต้องเพิ่มบัตรเครดิตและจ่ายต่อ Token
กับดักคือการไม่มีวงเงินสูงสุดในบัตรเครดิตของคุณ
Fable เผา Token อย่างรวดเร็วในการทำงานอัตโนมัติและเซสชันยาวๆ หากไม่มีขีดจำกัด คุณอาจมีค่าใช้จ่ายจำนวนมากก่อนที่จะรู้ตัว
คุณสามารถตั้งค่าใช้จ่ายรายเดือนได้ที่ การตั้งค่า → การใช้งาน → ปรับขีดจำกัด

ตั้งค่าใช้จ่ายรายเดือน
ปิดท้าย
เอาล่ะ นี่คือทั้งหมด
กรอบแนวคิดทั้งหมดของฉันสำหรับการลดค่าใช้จ่าย Token ของ Fable อย่างมาก
ฉันหวังว่าคุณจะพบว่าบทความนี้มีประโยชน์
ถ้าใช่ อย่าลืมติดตามฉัน @milesdeutscher และ @aiedge_ - ทุกสัปดาห์ฉันจะโพสต์คู่มือ AI ที่ใช้งานได้จริงเพื่อให้คุณก้าวนำในโลกที่บ้าคลั่งนี้
ตามที่สัญญาไว้ ฉันสร้างเอกสารที่คุณสามารถส่งไปยัง Fable โดยตรงเพื่อลดการใช้ Token โดยเร็วที่สุด

เอกสารระบบ 10-80-10 \ตัวอย่างเล็กน้อย\
เพื่อเข้าถึงเอกสารฉบับเต็ม:
- สมัครรับจดหมายข่าว AI Edge ฟรี
- เข้าร่วมชุมชน Instagram ฟรีของฉันเพื่อให้ฉันส่งให้คุณ
เริ่มต้นได้ที่นี่👇

ขอบคุณที่อ่านจนถึงตรงนี้💙





