Cách giảm chi phí token Fable 5 của bạn hơn 50%
Claude Fable 5 là mô hình AI tốt nhất mà tôi từng sử dụng. Không bàn cãi.
Vấn đề là, nó cực kỳ đắt đỏ.
Trong vài giờ đầu thử nghiệm, tôi suýt đốt hết toàn bộ giới hạn sử dụng - và tôi thậm chí còn chưa làm gì quá đáng cả.
Fable đắt gấp đôi Opus 4.8, và vì quá thông minh, nó thực sự suy nghĩ quá mức, chạy vòng lặp và đốt token theo những cách mà chưa mô hình Claude nào trước đây từng làm.
Học cách sử dụng mô hình mới này đúng cách quan trọng hơn bao giờ hết.
Trong hướng dẫn này, tôi sẽ trình bày chính xác hệ thống 10-80-10 mà tôi đã phát triển để giảm đáng kể chi phí token Fable, và lời khuyên này đến trực tiếp từ các kỹ sư của Anthropic.
Ở cuối bài viết, tôi đã tạo một tài liệu mà bạn có thể thả trực tiếp vào Fable, tóm tắt toàn bộ khung làm việc của tôi.
Tài liệu này sẽ ngay lập tức giảm chi tiêu token của bạn.
Hãy ở lại đến cuối, và tôi sẽ chia sẻ nó trực tiếp với bạn.

Tài liệu khung làm việc của tôi
I: Giải thích Hệ thống 10-80-10
Hệ thống 10-80-10 là một khung làm việc đơn giản để sử dụng Fable hiệu quả chỉ khi thực sự cần thiết.
Đây chính xác là khung làm việc mà các kỹ sư Anthropic tự sử dụng.
Đây là cách nó hoạt động:
10% đầu tiên: Lập kế hoạch
Trước khi bạn bắt đầu bất kỳ dự án AI nào, bạn muốn sử dụng Fable để xác định cấu trúc, cách tiếp cận, tiêu chí thành công và các ràng buộc.
Hãy nghĩ như thể bạn đang xây một ngôi nhà. Phần quan trọng nhất thực sự là có được kiến trúc và kế hoạch đúng đắn. Nếu không, những người thợ xây sẽ chỉ thực thi một kế hoạch tồi.
Fable 5 là một kiến trúc sư xuất sắc; hãy sử dụng nó như vậy.
80% ở giữa: Thực thi
Hầu hết token bị đốt trong quá trình qua lại, lặp đi lặp lại, sửa lỗi nhỏ, công việc nặng nhọc của việc thực sự hoàn thành nhiệm vụ.
Đối với lớp thực thi của các dự án AI, bạn nên sử dụng một mô hình rẻ hơn, chẳng hạn như Opus 4.8 cho công việc tiêu chuẩn hoặc Haiku cho các tác vụ nhẹ.
Bạn nhận được lợi ích từ kiến trúc của Fable mà không phải trả giá Fable cho mọi token thực thi (vốn là quá mức cần thiết).
10% cuối cùng: Đánh giá
Khi quá trình thực thi hoàn tất, hãy đưa Fable trở lại. Yêu cầu nó đánh giá đầu ra so với kiến trúc ban đầu.
Kết quả có khớp với kế hoạch không? Có khoảng trống nào không? Có gì cần sửa trước khi xuất bản không?
Bước đánh giá cuối cùng này là lúc trí thông minh của Fable phát hiện ra những gì các mô hình rẻ hơn bỏ sót, và vì nó đang đánh giá một đầu ra đã hoàn thành thay vì tạo ra từ đầu, nó sử dụng ít token hơn nhiều so với khi nó tự làm toàn bộ nhiệm vụ.

Hệ thống 10-80-10
Đây là toàn bộ khung làm việc 10-80-10 cho phép bạn nhận được tất cả lợi ích của Fable mà không phải chịu chi phí token.
Các mô hình như Opus 4.8 cũng có khả năng xử lý lớp thực thi tương tự, và hệ thống này tránh được xu hướng của Fable muốn làm mọi thứ "hoàn hảo" với nhiều vòng lặp, nghiên cứu sâu, v.v.
II: Giải thích về Vòng lặp
Tôi sẽ làm một bài viết chuyên sâu về điều này, nhưng tôi muốn đề cập ngắn gọn về /loop, vì đây là cách mạnh mẽ nhất để sử dụng Fable 5 hiện tại.
Lance Martin ( @RLanceMartin ), một kỹ sư tại Anthropic, đã xuất bản một hướng dẫn về thiết kế vòng lặp cho các mô hình lớp Mythos.
Tôi thực sự khuyên bạn nên đọc bài viết này, nhưng tôi sẽ tóm tắt nó bên dưới.
https://x.com/RLanceMartin/status/2064397389189071163
Cách cũ vs Cách mới của Prompting
Cách cũ của prompting trông như thế này:
Bạn prompt → Claude trả lời → Bạn xem xét → Bạn prompt lại → Lặp lại
Trong mô hình đó, bạn là vòng lặp.
Bạn tự xác minh thủ công mọi bước xác minh, mọi chỉnh sửa và mọi bước theo dõi.
Vòng lặp tự động hóa toàn bộ quá trình này và loại bỏ bạn khỏi vai trò nút thắt cổ chai.
Với kỹ thuật vòng lặp, bạn đưa cho Fable một mục tiêu ngay từ đầu, và nó sẽ khởi tạo các tác nhân phụ để làm việc hướng tới mục tiêu đó.
Thiết kế vòng lặp → Fable khởi tạo các tác nhân phụ xác minh → Các tác nhân tự prompt để hoàn thành mục tiêu

Kỹ thuật prompt so với kỹ thuật vòng lặp
Giải thích về /goal và /loop
Hai lệnh này là cách triển khai thực tế của kỹ thuật vòng lặp trong Claude Code.
/goal là điểm khởi đầu.
CẤU TRÚC PROMPT
/goal [nhiệm vụ] cho đến khi [trạng thái kết thúc có thể đo lường] mà không có [ràng buộc]
/loop đưa điều này tiến xa hơn một bước.
Thay vì một lần chạy duy nhất, /loop chạy lại prompt ở một khoảng thời gian định trước.
/loop [prompt của bạn ở đây] --interval 30m --expires 8h

/goal so với /loop
Sự kết hợp này cực kỳ mạnh mẽ.
Sử dụng /goal để xác định nhiệm vụ một lần, và sử dụng /loop để nó tự động chạy theo bất kỳ lịch trình nào phù hợp với công việc.
Sử dụng thực tế kỹ thuật vòng lặp để giảm chi tiêu token rẻ hơn
Đây là lúc hệ thống 10-80-10 phát huy tác dụng kỳ diệu.
Với khung làm việc 10-80-10, Fable xử lý 10% lập kế hoạch ban đầu bằng cách thiết kế vòng lặp; mô hình rẻ hơn xử lý 80% thực thi; và Fable chỉ quay lại khi vòng lặp kết thúc hoặc khi cần thiết.
Bạn thậm chí có thể sử dụng GPT-5.5 ở lớp thực thi, điều này có thể giảm chi tiêu token hơn 50%.
III: Mẹo tiết kiệm Token chung
Hệ thống 10-80-10 và vòng lặp xử lý hiệu quả tổng thể - đây là những điều chỉnh nhỏ hơn cũng có thể tạo ra sự khác biệt.
- Chọn mức độ nỗ lực
Bắt đầu ở mức trung bình, không phải tối đa.
Fable ở mức trung bình đánh bại Opus ở mức cực cao. Chỉ tăng lên nếu bạn thực sự gặp vấn đề về chất lượng. Mặc định ở mức tối đa cho mọi thứ là một trong những cách nhanh nhất để đốt giới hạn của bạn.
Một số người thậm chí còn báo cáo sử dụng Fable ở mức nỗ lực Thấp và nhận được đầu ra tuyệt vời.
- Xóa các kỹ năng và hướng dẫn cũ
Các prompt được xây dựng cho các mô hình trước đó thường hoạt động kém hơn trong Fable.
Các hướng dẫn ngắn hơn, sạch hơn hoạt động tốt hơn và tốn ít chi phí hơn trong Fable (Fable sẽ tự tìm ra mọi thứ).
- Cung cấp cho Fable lý do của mọi thứ
Fable làm đúng ngay lần đầu tiên thường xuyên hơn khi nó hiểu được ý định đằng sau yêu cầu.
Ít lần chỉnh sửa và lặp lại hơn cũng đồng nghĩa với việc đốt ít token hơn nhiều.
Lưu ý rằng mô hình này được xây dựng cho công việc hoàn toàn tự động, và nếu bạn không đưa ra "lý do" đằng sau mọi thứ, nó phải suy nghĩ nhiều hơn để đưa ra các bước tiếp theo.
- /usage
Theo dõi mức sử dụng của bạn một cách chủ động. Chạy /usage trong Claude Code thường xuyên. Một khi Fable chuyển sang trả tiền theo token vào ngày 7 tháng 7, điều này sẽ trở nên thiết yếu.
Tôi đã viết toàn bộ hướng dẫn prompting Fable 5 tại đây - nhiều mẹo được đề cập ở đây cũng sẽ cắt giảm chi tiêu token của bạn
https://x.com/aiedge_/status/2065064961999847849
IV: Những Sai lầm Tốn kém với Fable
Đây là hai sai lầm đáng được đề cập cụ thể vì chúng dễ bị bỏ qua và có thể tốn kém nếu bạn không giải quyết chúng.
Sai lầm 1: Vô tình chạy Fable khi không có chủ đích.
Khi bạn mở Claude Code hoặc ứng dụng Claude, nó hiện mặc định là Fable.
Anthropic đang tích cực khuyến khích mọi người thử nghiệm mô hình này ngay bây giờ.
Lời khuyên đơn giản: Kiểm tra bộ chọn mô hình trước mỗi phiên. Tôi đã từng tự bắt gặp mình vô tình chạy Fable trong các cuộc trò chuyện thông thường.
Sai lầm 2: Không có giới hạn chi tiêu
Vào ngày 7 tháng 7, Fable sẽ chuyển khỏi các gói đăng ký tiêu chuẩn.
Nếu bạn muốn tiếp tục sử dụng nó vượt quá giới hạn gói của mình, bạn sẽ cần thêm thẻ tín dụng và trả tiền theo token.
Cái bẫy là không có giới hạn cứng trên thẻ tín dụng của bạn.
Fable đốt token nhanh chóng trong các lần chạy tự động và các phiên dài. Nếu không có giới hạn, bạn có thể tích lũy một hóa đơn đáng kể trước khi bạn kịp nhận ra điều gì đã xảy ra.
Bạn có thể đặt chi tiêu hàng tháng của mình trong Cài đặt → Sử dụng → Điều chỉnh Giới hạn

Đặt chi tiêu hàng tháng
Kết luận
Vậy là bạn đã có nó.
Toàn bộ khung làm việc của tôi để giảm đáng kể chi phí token Fable.
Tôi hy vọng bạn thấy bài viết này hữu ích.
Nếu vậy, hãy nhớ theo dõi tôi @milesdeutscher và @aiedge_ - mỗi tuần tôi đều đăng các hướng dẫn AI thực tế để giúp bạn đi trước trong lĩnh vực điên rồ này.
Như đã hứa, tôi đã tạo một tài liệu mà bạn có thể gửi trực tiếp cho Fable để giảm chi tiêu token ngay lập tức.

Tài liệu hệ thống 10-80-10 xem trước
Để truy cập tài liệu đầy đủ:
- Đăng ký bản tin AI Edge miễn phí
- Tham gia cộng đồng Instagram miễn phí của tôi để tôi có thể gửi nó cho bạn
Bắt đầu tại đây.👇

Cảm ơn bạn đã đọc nếu bạn đã đi đến tận đây.💙





