วิธีใช้งาน Claude Fable 5 ให้คุ้มค่าโดยไม่กระเป๋าฉีก

@milesdeutscher
อังกฤษ2 วันที่ผ่านมา · 02 ก.ค. 2569
120K
178
29
18
319

TL;DR

Miles Deutscher แนะนำเฟรมเวิร์ก 10-80-10 เพื่อเพิ่มประสิทธิภาพการใช้งาน Claude Fable 5 โดยใช้สำหรับการวางแผนและตรวจสอบ พร้อมมอบหมายงานส่วนการดำเนินการให้กับโมเดลที่มีราคาถูกกว่า

วิธีลดค่าใช้จ่าย Token ของ Fable 5 ลง 50%+

Claude Fable 5 คือโมเดล AI ที่ดีที่สุดที่ฉันเคยใช้มา จบ.

ปัญหาคือมันแพงมาก

ในไม่กี่ชั่วโมงแรกที่ทดสอบ ฉันเกือบใช้โควต้าหมดทั้งที่ยังไม่ได้ทำอะไรหนักๆ เลย

Fable มีราคาแพงกว่า Opus 4.8 เท่าตัว และเพราะมันฉลาดมาก มันเลยคิดมากเกินไป วนลูปและเผา Token ในแบบที่ Claude รุ่นก่อนๆ ไม่เคยทำ

การเรียนรู้วิธีใช้โมเดลใหม่นี้อย่างถูกต้องสำคัญกว่าที่เคย

ในคู่มือนี้ ฉันจะอธิบายระบบ 10-80-10 ที่ฉันพัฒนาขึ้นเพื่อลดค่าใช้จ่าย Token ของ Fable อย่างมาก และคำแนะนำนี้มาจากวิศวกรของ Anthropic โดยตรง

ท้ายบทความ ฉันได้สร้างเอกสารที่คุณสามารถวางลงใน Fable ได้โดยตรง ซึ่งสรุปกรอบแนวคิดทั้งหมดของฉัน

เอกสารนี้จะช่วยลดการใช้ Token ของคุณทันที

อ่านต่อจนจบ แล้วฉันจะแชร์ให้คุณโดยตรง

Miles Deutscher - inline image

เอกสารกรอบแนวคิด \ของฉัน\

I: อธิบายระบบ 10-80-10

ระบบ 10-80-10 เป็นกรอบแนวคิดง่ายๆ สำหรับใช้ Fable อย่างมีประสิทธิภาพเฉพาะในจุดที่จำเป็นจริงๆ

นี่คือกรอบแนวคิดที่วิศวกรของ Anthropic ใช้กันเอง

นี่คือรายละเอียด:

10% แรก: การวางแผน

ก่อนที่คุณจะเริ่มโปรเจกต์ AI ใดๆ คุณควรใช้ Fable เพื่อกำหนดโครงสร้าง แนวทาง เกณฑ์ความสำเร็จ และข้อจำกัด

ลองนึกถึงการสร้างบ้าน ส่วนสำคัญที่สุดคือการออกแบบและวางแผนให้ถูกต้อง มิฉะนั้นช่างก่อสร้างก็จะทำงานตามแผนที่แย่

Fable 5 เป็นสถาปนิกที่ยอดเยี่ยม ใช้มันในบทบาทนั้น

80% ตรงกลาง: การดำเนินการ

Token ส่วนใหญ่ถูกเผาไปกับการโต้ตอบไปมา การปรับปรุงซ้ำ การแก้ไขเล็กน้อย และงานหนักของการทำงานให้เสร็จ

สำหรับชั้นการดำเนินการของโปรเจกต์ AI คุณควรใช้โมเดลที่ถูกกว่า เช่น Opus 4.8 สำหรับงานทั่วไป หรือ Haiku สำหรับงานเบา

คุณจะได้ประโยชน์จากสถาปัตยกรรมของ Fable โดยไม่ต้องจ่ายราคา Fable สำหรับทุก Token ของการดำเนินการ (ซึ่งเกินความจำเป็นอยู่ดี)

10% สุดท้าย: การตรวจสอบ

เมื่อดำเนินการเสร็จ ให้เรียก Fable กลับมา ให้มันตรวจสอบผลลัพธ์เทียบกับสถาปัตยกรรมดั้งเดิม

ผลลัพธ์ตรงกับแผนหรือไม่? มีช่องว่างอะไรไหม? มีอะไรต้องแก้ไขก่อนเผยแพร่หรือไม่?

รอบสุดท้ายนี้คือจุดที่ความฉลาดของ Fable จับสิ่งที่โมเดลราคาถูกมองข้าม และเพราะมันตรวจสอบผลลัพธ์ที่เสร็จแล้วแทนที่จะสร้างจากศูนย์ มันจึงใช้ Token น้อยกว่าการทำงานทั้งหมดด้วยตัวเองมาก

Miles Deutscher - inline image

ระบบ 10-80-10

นี่คือกรอบแนวคิด 10-80-10 ทั้งหมดที่ช่วยให้คุณได้รับประโยชน์ทั้งหมดของ Fable โดยไม่มีข้อเสียเรื่องค่าใช้จ่าย Token

โมเดลอย่าง Opus 4.8 ก็มีความสามารถพอๆ กันในการจัดการชั้นการดำเนินการ และระบบนี้ช่วยหลีกเลี่ยงความต้องการของ Fable ที่จะทำให้ทุกอย่าง "สมบูรณ์แบบ" ด้วยการวนลูปหลายรอบ ค้นคว้าเชิงลึก ฯลฯ

II: อธิบาย Loops

ฉันจะเขียนบทความเจาะลึกเกี่ยวกับเรื่องนี้ แต่ฉันอยากจะพูดถึง /loop สั้นๆ เพราะมันเป็นวิธีที่ทรงพลังที่สุดในการใช้ Fable 5 ในตอนนี้

Lance Martin ( @RLanceMartin ) วิศวกรของ Anthropic เผยแพร่คู่มือการออกแบบ Loops สำหรับโมเดลระดับ Mythos

ฉันแนะนำให้อ่านบทความนี้ แต่ฉันจะสรุปให้ด้านล่าง

https://x.com/RLanceMartin/status/2064397389189071163

วิธีการ Prompt แบบเก่า vs ใหม่

วิธีการ Prompt แบบเก่าเป็นแบบนี้:

คุณ Prompt → Claude ตอบกลับ → คุณตรวจสอบ → คุณ Prompt ซ้ำ → ทำซ้ำ

ในรูปแบบนั้น คุณคือ Loop

คุณตรวจสอบทุกขั้นตอนการยืนยัน ทุกการแก้ไข และทุกการติดตามผลด้วยตัวเอง

Loops จะทำให้กระบวนการทั้งหมดเป็นอัตโนมัติและกำจัดคุณซึ่งเป็นคอขวด

ด้วยวิศวกรรม Loop คุณกำหนดเป้าหมายให้ Fable ล่วงหน้า จากนั้นมันจะสร้าง Subagents ขึ้นมาเพื่อทำงานไปสู่เป้าหมายนั้น

ออกแบบ Loop → Fable สร้าง Subagents ที่ตรวจสอบ → Agents Prompt ตัวเองเพื่อทำงานให้สำเร็จ

Miles Deutscher - inline image

วิศวกรรม Prompt เทียบกับวิศวกรรม Loop

อธิบาย /goal และ /loop

สองคำสั่งนี้คือการนำวิศวกรรม Loop ไปใช้จริงภายใน Claude Code

/goal คือจุดเริ่มต้น

โครงสร้าง Prompt

/goal [งาน] until [สถานะสิ้นสุดที่วัดได้] without [ข้อจำกัด]

/loop ก้าวไปอีกขั้น

แทนที่จะรันครั้งเดียว /loop จะรัน Prompt ซ้ำตามช่วงเวลาที่กำหนด

/loop [Prompt ของคุณ] --interval 30m --expires 8h

Miles Deutscher - inline image

/goal เทียบกับ /loop

การรวมกันนี้ทรงพลังมาก

ใช้ /goal เพื่อกำหนดงานเพียงครั้งเดียว และใช้ /loop เพื่อให้มันทำงานอัตโนมัติตามตารางเวลาที่เหมาะสมกับงาน

การใช้วิศวกรรม Loop ในทางปฏิบัติเพื่อลดค่าใช้จ่าย Token

นี่คือจุดที่ระบบ 10-80-10 ทำงานได้อย่างมหัศจรรย์

ด้วยกรอบแนวคิด 10-80-10 Fable จัดการการวางแผน 10% แรกโดยการออกแบบ Loop โมเดลราคาถูกจัดการการดำเนินการ 80% และ Fable จะกลับมาเฉพาะเมื่อ Loop ปิดหรือเมื่อจำเป็น

คุณยังสามารถใช้ GPT-5.5 ในชั้นการดำเนินการ ซึ่งสามารถลดค่าใช้จ่าย Token ได้ 50% หรือมากกว่า

III: เคล็ดลับการประหยัด Token ทั่วไป

ระบบ 10-80-10 และ Loops จัดการประสิทธิภาพในภาพรวม ส่วนนี้คือการปรับแต่งเล็กน้อยที่ช่วยได้เช่นกัน

  1. การเลือกระดับความพยายาม

เริ่มที่ระดับความพยายามปานกลาง ไม่ใช่สูงสุด

Fable ระดับปานกลางดีกว่า Opus ระดับสูงมาก ให้เพิ่มระดับเมื่อคุณพบปัญหาด้านคุณภาพจริงๆ การตั้งค่าสูงสุดทุกอย่างเป็นวิธีที่เร็วที่สุดวิธีหนึ่งในการเผาโควต้าของคุณ

บางคนรายงานว่าใช้ Fable ระดับความพยายามต่ำและได้ผลลัพธ์ที่ยอดเยี่ยม

  1. ลบ Skills และคำแนะนำเก่า

Prompt ที่สร้างสำหรับโมเดลรุ่นก่อนๆ มักทำงานได้แย่กว่าใน Fable

คำแนะนำที่สั้นกว่าและสะอาดกว่าทำงานได้ดีกว่าและมีค่าใช้จ่ายน้อยกว่าใน Fable (Fable จะหาทางจัดการเองอยู่แล้ว)

  1. บอก Fable ถึง "เหตุผล" ของทุกอย่าง

Fable จะทำสิ่งที่ถูกต้องตั้งแต่ครั้งแรกบ่อยขึ้นเมื่อมันเข้าใจเจตนาเบื้องหลังคำขอ

การแก้ไขและการวนซ้ำน้อยลงหมายถึงการเผา Token น้อยลงมาก

โปรดทราบว่าโมเดลนี้ถูกสร้างขึ้นสำหรับการทำงานอัตโนมัติเต็มรูปแบบ และถ้าคุณไม่บอก "เหตุผล" เบื้องหลังสิ่งต่างๆ มันจะต้องคิดหนักขึ้นเพื่อหาขั้นตอนถัดไป

  1. /usage

ตรวจสอบการใช้งานของคุณอย่างสม่ำเสมอ รัน /usage ใน Claude Code เป็นประจำ เมื่อ Fable เปลี่ยนเป็นจ่ายต่อ Token ในวันที่ 7 กรกฎาคม สิ่งนี้จะกลายเป็นสิ่งจำเป็น

ฉันเขียนคู่มือการ Prompt Fable 5 ทั้งหมดที่นี่ - เคล็ดลับหลายข้อที่กล่าวถึงจะช่วยลดการใช้ Token ของคุณด้วย

https://x.com/aiedge_/status/2065064961999847849

IV: ข้อผิดพลาดราคาแพงของ Fable

นี่คือข้อผิดพลาดสองข้อที่ควรกล่าวถึงเป็นพิเศษเพราะสังเกตได้ยากและอาจมีค่าใช้จ่ายสูงหากไม่แก้ไข

ข้อผิดพลาด 1: เผลอใช้ Fable โดยไม่ตั้งใจ

เมื่อคุณเปิด Claude Code หรือแอป Claude ตอนนี้มันจะตั้งค่าเริ่มต้นเป็น Fable

Anthropic กำลังสนับสนุนให้ผู้คนทดสอบโมเดลนี้ในตอนนี้

คำแนะนำง่ายๆ: ตรวจสอบตัวเลือกโมเดลก่อนทุกเซสชัน ฉันเคยจับได้ว่าตัวเองใช้ Fable โดยไม่ตั้งใจในการแชทปกติ

ข้อผิดพลาด 2: ไม่มีวงเงินใช้จ่าย

ในวันที่ 7 กรกฎาคม Fable จะออกจากระบบสมัครสมาชิกมาตรฐาน

ถ้าคุณต้องการใช้มันต่อเกินขีดจำกัดของแผน คุณต้องเพิ่มบัตรเครดิตและจ่ายต่อ Token

กับดักคือการไม่มีวงเงินสูงสุดในบัตรเครดิตของคุณ

Fable เผา Token อย่างรวดเร็วในการทำงานอัตโนมัติและเซสชันยาวๆ หากไม่มีขีดจำกัด คุณอาจมีค่าใช้จ่ายจำนวนมากก่อนที่จะรู้ตัว

คุณสามารถตั้งค่าใช้จ่ายรายเดือนได้ที่ การตั้งค่า → การใช้งาน → ปรับขีดจำกัด

Miles Deutscher - inline image

ตั้งค่าใช้จ่ายรายเดือน

ปิดท้าย

เอาล่ะ นี่คือทั้งหมด

กรอบแนวคิดทั้งหมดของฉันสำหรับการลดค่าใช้จ่าย Token ของ Fable อย่างมาก

ฉันหวังว่าคุณจะพบว่าบทความนี้มีประโยชน์

ถ้าใช่ อย่าลืมติดตามฉัน @milesdeutscher และ @aiedge_ - ทุกสัปดาห์ฉันจะโพสต์คู่มือ AI ที่ใช้งานได้จริงเพื่อให้คุณก้าวนำในโลกที่บ้าคลั่งนี้

ตามที่สัญญาไว้ ฉันสร้างเอกสารที่คุณสามารถส่งไปยัง Fable โดยตรงเพื่อลดการใช้ Token โดยเร็วที่สุด

Miles Deutscher - inline image

เอกสารระบบ 10-80-10 \ตัวอย่างเล็กน้อย\

เพื่อเข้าถึงเอกสารฉบับเต็ม:

  1. สมัครรับจดหมายข่าว AI Edge ฟรี
  2. เข้าร่วมชุมชน Instagram ฟรีของฉันเพื่อให้ฉันส่งให้คุณ

เริ่มต้นได้ที่นี่👇

https://www.aiedgehq.co/

Miles Deutscher - inline image

https://www.aiedgehq.co/

ขอบคุณที่อ่านจนถึงตรงนี้💙

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
สำหรับครีเอเตอร์

เปลี่ยน Markdown ของคุณให้เป็นบทความ 𝕏 ที่สะอาดตา

เวลาคุณเผยแพร่งานเขียนยาวของตัวเอง การจัดรูปแบบรูปภาพ ตาราง และบล็อกโค้ดให้เข้ากับ 𝕏 นั้นน่าปวดหัว YouMind เปลี่ยนร่าง Markdown ทั้งฉบับให้เป็นบทความ 𝕏 ที่สะอาดตาและพร้อมโพสต์ทันที

ลอง Markdown เป็น 𝕏

แพตเทิร์นให้ถอดรหัสเพิ่มเติม

บทความไวรัลล่าสุด

สำรวจบทความไวรัลเพิ่มเติม