Tối ưu hóa chi phí Claude Fable 5: Hướng dẫn điều hướng 10-80-10

Fable 5 là mô hình AI tốt nhất mà tôi từng sử dụng.

Nhưng nó cũng cực kỳ đắt đỏ.

Trong vài giờ đầu tiên thử nghiệm, tôi suýt đốt hết toàn bộ hạn mức sử dụng.

Và tôi thậm chí còn chưa làm gì quá đặc biệt.

Fable đắt gấp đôi Opus 4.8.

Và vì nó quá thông minh, nó thực sự suy nghĩ quá mức — chạy vòng lặp và đốt token theo những cách mà chưa có mô hình Claude nào trước đây làm được.

Hầu hết mọi người đang sử dụng nó hoàn toàn sai cách.

Đây chính xác là hệ thống tôi đã xây dựng để cắt giảm chi phí token Fable của mình hơn 50%.

Không cần công cụ mới. Không giảm sản lượng. Chỉ định tuyến thông minh hơn.

Sai lầm mà ai cũng mắc phải ngay từ ngày đầu

Bạn mở Claude Code.

Fable hiện là mô hình mặc định.

Bạn bắt đầu trò chuyện.

Bạn yêu cầu nó sửa một lỗi chính tả. Bạn yêu cầu nó định dạng một đoạn JSON. Bạn yêu cầu nó đổi tên một biến.

Fable suy nghĩ trong 12 giây, đốt 8.000 token lý luận, trả về câu trả lời.

Chi phí: $0.60 cho một tác vụ mà Haiku có thể làm tốt với $0.02.

Bạn đang trả giá bác sĩ phẫu thuật cho những cuộc tán gẫu.

Fable là một kiến trúc sư.

Không phải bạn cùng phòng.

Khoảnh khắc bạn thấm nhuần điều đó, mọi thứ thay đổi.

Hệ thống 10-80-10 (Khung chính xác mà các kỹ sư Anthropic tự sử dụng)

Mọi dự án Fable đều có ba giai đoạn.

Hầu hết mọi người chạy cả ba giai đoạn trên Fable.

Cách thông minh là chỉ chạy hai trong số chúng trên Fable.

10% đầu tiên — Lập kế hoạch

Đây là lúc Fable xứng đáng với mức giá của nó.

Trước khi bắt đầu bất kỳ dự án nào, hãy sử dụng Fable để xác định:

→ Cấu trúc và cách tiếp cận → Tiêu chí thành công → Các ràng buộc và trường hợp ngoại lệ → Điều gì có thể sai

Hãy nghĩ về việc xây một ngôi nhà.

Sai lầm đắt giá nhất là đưa cho thợ xây một bản thiết kế tồi.

Hãy có được kiến trúc đúng ngay từ đầu.

Fable cực kỳ xuất sắc trong việc này.

80% ở giữa — Thực thi

Đây là nơi hầu hết token bị đốt.

Sự qua lại. Sự lặp đi lặp lại. Các vòng lặp triển khai. Công việc nặng nhọc của việc thực sự hoàn thành các tác vụ.

Fable không cần phải ở đây.

Chuyển sang Opus 4.8 cho công việc tiêu chuẩn. Sử dụng Haiku cho các tác vụ nhẹ. Sử dụng Codex hoặc GPT-5.5 cho việc thực thi cơ học.

Bạn có được kiến trúc chất lượng Fable mà không phải trả giá Fable cho mọi token thực thi.

10% cuối cùng — Đánh giá

Đưa Fable trở lại.

Yêu cầu nó xem xét đầu ra so với kế hoạch ban đầu:

→ Kết quả có khớp với kiến trúc không?

→ Có thiếu sót hoặc trường hợp ngoại lệ nào bị bỏ lỡ không?

→ Có cần sửa chữa gì trước khi phát hành không?

Bởi vì Fable xem xét một đầu ra đã hoàn thành thay vì tạo ra từ đầu, nó sử dụng một phần nhỏ token so với khi nó tự làm toàn bộ tác vụ.

[INSERT IMAGE 2 — PROMPT BELOW]

Bảng định tuyến CLAUDE.md (Một tệp điều khiển mọi thứ)

Đây là sự khai phá lớn nhất.

Giữ một bảng định tuyến duy nhất trong CLAUDE.md của bạn.

Để Fable hoạt động như người điều phối đọc nó và tự động phân công công việc cho đúng mô hình.

Đây chính xác là bảng định tuyến tôi sử dụng:

markdown

1## Bảng Định Tuyến Mô Hình
2
3### Fable 5 (chỉ người điều phối)
4Sử dụng cho: lập kế hoạch, kiến trúc, xem xét đầu ra cuối cùng
5Không bao giờ sử dụng cho: tác vụ cơ học, tạo hàng loạt, mã soạn sẵn
6Mức nỗ lực: cao (không bao giờ xhigh — nó là một lò đốt với đầu ra tệ hơn)
7
8### Opus 4.8 (người thực thi suy luận sâu)
9Sử dụng cho: gỡ lỗi phức tạp, suy luận nhiều bước, bất cứ thứ gì
10         cần suy nghĩ thực sự nhưng không phải là kiến trúc
11Bậc chi phí: tiêu chuẩn
12
13### Sonnet 5 (người thực thi công việc cơ học)
14Sử dụng cho: tạo mã, tái cấu trúc, công việc tính năng tiêu chuẩn
15Bậc chi phí: rẻ
16
17### Codex / GPT-5.5 (người thực thi ngang hàng)
18Sử dụng cho: tác vụ triển khai, xác minh UI/UX,
19         công việc thực thi có đặc tả rõ ràng
20Lưu ý: Fable có thể học cách điều khiển Codex — dạy nó một lần
21Bậc chi phí: thường miễn phí trên gói Codex
22
23### Haiku (người thực thi hàng loạt)
24Sử dụng cho: định dạng, lint, chỉnh sửa đơn giản, mã soạn sẵn,
25         tái cấu trúc đổi tên, khung kiểm thử
26Không bao giờ tạo thêm tác tử phụ từ Haiku
27Bậc chi phí: rẻ nhất
28
29### Kimi / GLM-5.2 (người thực thi ngữ cảnh dài)
30Sử dụng cho: đọc các tệp lớn, phân tích kho lưu trữ dài hạn
31         để Fable không bao giờ tốn token cho việc đó
32Bậc chi phí: rất rẻ
33
34### DeepSeek / Qwen (công việc chân tay siêu rẻ)
35Sử dụng cho: mã soạn sẵn, viết kiểm thử, làm sạch dữ liệu,
36         dịch thuật, tài liệu bản thảo đầu tiên, tạo hàng loạt
37Bậc chi phí: gần như miễn phí

Fable không bao giờ động đến công việc rẻ tiền một cách trực tiếp.

Nó lập kế hoạch, ủy quyền cho đúng bậc, sau đó kiểm tra kết quả so với kế hoạch.

Bộ não đắt tiền chỉ tốn token để quyết định.

Một tệp đó là lý do tại sao hóa đơn của tôi GIẢM trong khi sản lượng của tôi TĂNG.

Thiết lập CLAUDE.md chính xác đã tiết kiệm 70% token của tôi

Đây là toàn bộ phần điều phối mà tôi đã thêm vào CLAUDE.md của mình:

markdown

1## Quy Trình Điều Phối
2
3Bạn (Fable) là người điều phối. Lập kế hoạch, phân rã, tổng hợp.
4KHÔNG tự mình thực hiện các tác vụ cơ học.
5
6### Quy tắc ủy quyền:
7- Các giai đoạn nặng về suy luận → deep-reasoner (Opus 4.8)
8- Công việc cơ học → fast-worker (Sonnet/Haiku)
9- Phân tích cơ sở mã / tệp lớn → Kimi (ngữ cảnh dài)
10- Mã soạn sẵn / hàng loạt → DeepSeek hoặc Qwen
11- Đánh giá ngang hàng từ góc nhìn khác → Codex
12
13### Codex là người ngang hàng, không phải người đánh giá:
14Đối xử với Codex như một kỹ sư cao cấp xuất sắc từ một
15góc nhìn khác. Đối với các quyết định quan trọng: giao nhiệm vụ cho Opus + Codex
16trên cùng một vấn đề song song, tổng hợp những gì tốt nhất của
17cả hai mà không cho bên nào thấy câu trả lời của bên kia.
18
19### Kỷ luật ngữ cảnh:
20Giữ ngữ cảnh của riêng bạn gọn nhẹ.
21Không bao giờ đọc lại các tệp bạn đã xử lý.
22Tóm tắt đầu ra công cụ trước khi đưa trở lại ngữ cảnh.
23Yêu cầu các mô hình trả về kết luận ngắn gọn mà bạn có thể hành động.
24
25### Mức nỗ lực:
26- Lập kế hoạch và kiến trúc: nỗ lực cao
27- Các lượt đánh giá: nỗ lực trung bình
28- Không bao giờ sử dụng xhigh/max theo mặc định — tốn nhiều hơn, thường tệ hơn

Bây giờ hãy nhắc Fable như một trưởng nhóm kỹ thuật:

markdown

1Mục tiêu: [bạn muốn gì]
2Bối cảnh: [các tệp, ràng buộc, điều bạn sợ]
3
4Bạn là trưởng nhóm.
5Ủy quyền suy luận cho deep-reasoner (Opus).
6Ủy quyền công việc chân tay cho fast-worker (Sonnet/Haiku).
7Sử dụng Codex cho các vấn đề cần góc nhìn mới.
8
9Cho tôi thấy kế hoạch của bạn trước, sau đó thực thi.

Chỉ vậy thôi.

Fable lập kế hoạch. Mọi thứ khác thực thi. Hóa đơn vẫn ổn định.

Cài đặt plugin Codex — bước nhân lên sức mạnh

Đây là thiết lập mà hầu hết mọi người bỏ qua.

Codex + Fable cùng nhau tốt hơn 10 lần so với chỉ dùng Fable.

Fable làm kiến trúc. Codex thực thi với chất lượng GPT-5.5. Bạn hầu như không chạm đến giới hạn Claude của mình.

Thiết lập trong vòng chưa đầy 5 phút:

Bước 1: Cài đặt Codex CLI trên máy của bạn

bash

1npm install -g @openai/codex

Bước 2: Thêm plugin bên trong Claude Code

text

1/plugin marketplace add openai/codex-plugin-cc
2/plugin install codex@openai-codex
3/codex:setup

Bước 3: Tạo hai tác tử phụ trong Claude Code

text

1/agents
2
3→ deep-reasoner
4  Mô hình: Opus 4.8
5  Hướng dẫn: "Sử dụng cho các giai đoạn nặng về suy luận, kiến trúc,
6  gỡ lỗi các vấn đề phức tạp. Suy nghĩ thấu đáo, trả về một kết luận
7  ngắn gọn mà người điều phối có thể hành động."
8
9→ fast-worker
10  Mô hình: Sonnet 5
11  Hướng dẫn: "Sử dụng cho các tác vụ cơ học, mã soạn sẵn, kiểm thử,
12  định dạng, chỉnh sửa đơn giản. Thực thi hiệu quả."

Bước 4: Yêu cầu Fable viết một SKILL.md cho Codex

text

1Viết một SKILL.md dạy Codex chính xác cách:
2- Đọc và thực thi các kế hoạch triển khai
3- Chạy kiểm thử và báo cáo kết quả lại cho bạn
4- Xử lý cấu trúc tệp cụ thể trong dự án này

Làm cho Codex không cần sự hướng dẫn nào cho công việc cơ học.

Fable viết kỹ năng một lần.

Codex đọc nó trong mọi lần chạy sau đó.

Đầu ra Codex của bạn ngay lập tức tốt hơn 10 lần.

Lệnh /loop (Cách mạnh mẽ nhất để sử dụng Fable ngay bây giờ)

Hầu hết mọi người vẫn nhắc theo cách cũ.

Bạn nhắc → Fable trả lời → bạn xem xét → bạn nhắc lại → lặp lại.

Trong mô hình đó, bạn là vòng lặp.

Bạn tự xác minh từng bước, từng sửa chữa, từng bước tiếp theo.

Loops loại bỏ bạn khỏi vai trò nút thắt cổ chai.

Cách nó hoạt động:

Bạn đưa cho Fable một mục tiêu ngay từ đầu.

Nó khởi tạo các tác tử phụ để làm việc hướng tới mục tiêu đó.

Các tác tử tự nhắc nhở và báo cáo lại khi hoàn thành.

Hai lệnh:

text

1/goal — xác định tác vụ và trạng thái kết thúc
2
3Cấu trúc:
4/goal [tác vụ] until [trạng thái kết thúc có thể đo lường] without [ràng buộc]
5
6Ví dụ:
7/goal tái cấu trúc module auth until tất cả 47 bài kiểm tra đều pass
8without chạm vào dịch vụ thanh toán hoặc lược đồ cơ sở dữ liệu

text

1/loop — chạy một lời nhắc theo lịch trình tự động
2
3Cấu trúc:
4/loop [lời nhắc của bạn] --interval 30m --expires 8h
5
6Ví dụ:
7/loop chạy kiểm tra bảo mật trên tất cả các API endpoint
8--interval 24h --expires 7d

Sự kết hợp:

text

1/goal xây dựng lại component dashboard until Lighthouse
2score exceeds 90 on mobile without phá vỡ các bài kiểm tra hiện có
3
4/loop chạy /goal ở trên --interval 6h --expires 48h

Fable thiết kế vòng lặp. Các mô hình rẻ hơn chạy 80% thực thi bên trong vòng lặp. Fable chỉ quay lại khi vòng lặp kết thúc hoặc gặp vật cản.

Bạn thức dậy với một tác vụ đã hoàn thành.

[INSERT IMAGE 5 — PROMPT BELOW]

7 lời nhắc để chạy trên Fable ngay bây giờ

Đây là những việc có đòn bẩy cao nhất để làm với Fable trước khi sử dụng nó cho bất cứ điều gì khác.

Không phải vibe coding.

Không phải phát hành tính năng.

Mài giũa mọi hệ thống bạn đã có.

1. Tìm ra thứ gì thực sự đáng chạy trên Fable

text

1Bạn là Fable 5, mô hình có năng lực nhất hiện có.
2
3Nhìn qua các dự án, tài liệu và bộ nhớ của tôi.
4
5Liệt kê 5 tác vụ hàng đầu thực sự đáng chạy trên bạn.
6
7Xếp hạng chúng với một dòng lý do cho mỗi tác vụ.
8
9Chưa cần làm việc.

2. Thiết kế lại cách bạn xây dựng trước khi xây dựng bất cứ thứ gì

text

1Tôi muốn bạn kiểm toán hoàn toàn và thiết kế lại quy trình viết mã của tôi.
2
3Đây là cách tôi hiện đang làm việc: [mô tả quy trình của bạn]
4
5Mục tiêu của tôi là: [bạn đang cố gắng phát hành cái gì]
6
7Xem xét, kiểm toán, mài giũa và cải thiện hệ thống của tôi.
8
9Đừng viết mã. Hãy thiết kế lại nhà máy trước khi chúng ta vận hành nó.

3. Lên kế hoạch cho dự án lớn — chưa xây dựng nó

text

1Tôi muốn lên kế hoạch: [mô tả dự án]
2
3Chưa xây dựng.
4
5Trình bày kế hoạch đầy đủ: các giai đoạn, quyết định chính, rủi ro,
6và các câu hỏi mở.
7
8Đánh dấu bất cứ điều gì có thể làm hỏng nó.
9
10Làm cho kế hoạch đủ rõ ràng để Sonnet hoặc Codex có thể
11thực thi nó từng bước mà không cần hỏi tôi câu hỏi.

4. Tìm mọi thứ sai trước khi phát hành

text

1Tôi sắp phát hành dự án này.
2
3Hãy tìm mọi thứ sai với nó trước.
4
5Đọc toàn bộ cơ sở mã.
6
7Săn lùng các lỗi thực sự, các trường hợp ngoại lệ bị hỏng, và bất cứ thứ gì
8sẽ bị hỏng trước mặt người dùng.
9
10Liệt kê từng vấn đề với: cách tái tạo nó và cách sửa.
11
12Giữ một tiêu chuẩn cao. Hãy khắt khe.

5. Xây dựng lại CLAUDE.md của bạn từ đầu

text

1Đọc CLAUDE.md hiện tại của tôi.
2
3Nó được viết cho các mô hình cũ hơn và bị phình to.
4
5Các hướng dẫn ngắn hơn, sạch hơn hoạt động tốt hơn và tốn ít chi phí hơn
6trong Fable.
7
8Viết lại nó:
9- Loại bỏ các hướng dẫn Fable không còn cần
10- Thắt chặt mọi quy trình làm việc
11- Thêm bảng định tuyến mô hình từ cuộc trò chuyện của chúng ta
12- Giữ mỗi phần dưới 5 dòng nếu có thể
13
14Fable sẽ tự tìm ra phần còn lại.

6. Nhận lời khuyên kinh doanh từ mọi thứ nó biết về bạn

text

1Bạn là cố vấn kinh doanh của tôi.
2
3Đọc tài liệu kế hoạch, các công cụ đã kết nối và bộ nhớ của tôi.
4
5Viết một trang đánh giá về doanh nghiệp của tôi và:
6- 3 điều hàng đầu cần tập trung trong 3 tháng tới
7- Nên bỏ gì và tại sao
8- Một điều tôi có thể đang mù quáng

7. Quét bảo mật tự động

text

1/loop chạy kiểm tra bảo mật trên tất cả các API endpoint của tôi.
2
3Tìm kiếm: khóa bị lộ, thiếu xác thực, lỗ hổng giới hạn tốc độ,
4vector injection, và bất cứ thứ gì người dùng độc hại có thể lợi dụng.
5
6Chỉ báo cáo các vấn đề thực sự với xếp hạng mức độ nghiêm trọng.
7
8--interval 24h --expires 7d

Mức nỗ lực — cài đặt bị hiểu lầm nhất

Hầu hết mọi người đặt mặc định là max hoặc xhigh.

Điều này là sai.

Đây là những gì thực sự xảy ra ở mỗi cấp độ:

→ Thấp: Nhanh, rẻ, có khả năng đáng ngạc nhiên cho các tác vụ đơn giản. Nhiều người báo cáo đầu ra tuyệt vời ở đây.

→ Trung bình: Điểm ngọt ngào. Fable ở mức trung bình đánh bại Opus ở mức extra high. Mặc định ở mức này.

→ Cao: Sử dụng cho: gỡ lỗi khó, tái cấu trúc nhiều tệp, quyết định kiến trúc. Sức mạnh suy luận thực sự.

→ xhigh / max: Lò đốt token. Thường tạo ra đầu ra TỆ HƠN so với mức Cao. Dành riêng cho những vấn đề khó nhất bạn từng gặp.

Quy tắc: bắt đầu ở mức Trung bình. Chuyển lên Cao chỉ khi chất lượng thực sự không đạt yêu cầu. Không bao giờ đặt mặc định là max.

Một cài đặt nữa giết chết ngân sách:

Extended Thinking — tắt nó theo mặc định.

Chỉ bật nó cho các vấn đề thực sự cần nó. Để nó bật vĩnh viễn giống như để động cơ xe chạy không tải trong gara.

Thủ thuật /handoff — khắc phục tình trạng phình to cửa sổ ngữ cảnh

Các phiên dài là một kẻ giết người thầm lặng.

Mỗi lượt gửi lại toàn bộ lịch sử hội thoại.

Một phiên 200k token trở thành thứ đắt nhất trên hóa đơn của bạn.

Giải pháp: thường xuyên mở các cuộc trò chuyện mới.

Nhưng bạn không muốn mất ngữ cảnh khi làm điều đó.

Sử dụng kỹ năng /handoff:

text

1Đưa cho tôi một lời nhắc tôi có thể sử dụng để khởi động lại phiên này trong
2một cuộc trò chuyện mới mà không làm mất bất kỳ ngữ cảnh nào của chúng ta.
3
4Bao gồm:
5- Những gì chúng ta đã quyết định
6- Những gì chúng ta đã xây dựng
7- Các bước tiếp theo là gì
8- Bất kỳ ràng buộc quan trọng nào tôi phải nhớ
9
10Làm cho nó dưới 500 token để phiên mới bắt đầu gọn nhẹ.

Sao chép đầu ra đó.

Mở cuộc trò chuyện mới.

Dán nó vào.

Tiếp tục chính xác nơi bạn đã dừng lại với một phần nhỏ chi phí ngữ cảnh.

Phiên mới mỗi 30–60 phút = tiết kiệm token khổng lồ.

4 sai lầm đắt giá cần tránh

Sai lầm 1: Fable bây giờ là mặc định.

Khi bạn mở Claude Code, nó tự động sử dụng Fable.

Kiểm tra bộ chọn mô hình trước mỗi phiên.

Thói quen đơn giản này đã nhiều lần khiến tôi vô tình chạy Fable trên các cuộc trò chuyện bình thường nhiều hơn tôi muốn thừa nhận.

Sai lầm 2: Không có giới hạn chi tiêu.

Vào ngày 7 tháng 7, Fable chuyển khỏi các gói đăng ký tiêu chuẩn.

Thêm thẻ tín dụng và đặt giới hạn hàng tháng cứng ngay lập tức.

Cài đặt → Sử dụng → Điều chỉnh giới hạn.

Fable đốt token nhanh chóng trong các lần chạy tự động và các phiên dài.

Nếu không có giới hạn cứng, một lần chạy tác tử qua đêm có thể tích lũy một hóa đơn trước khi bạn thức dậy.

Ai đó đã bị tính phí $960 cho một lời nhắc duy nhất.

Đặt giới hạn tối nay.

Sai lầm 3: Yêu cầu nó giải thích lý do của nó.

Một yêu cầu đó có thể làm vấp bộ phân loại và công việc của bạn sẽ âm thầm được xử lý bởi một mô hình yếu hơn trong khi bạn nghĩ mình vẫn đang dùng Fable.

Bỏ qua các yêu cầu "tại sao". Đánh giá chất lượng đầu ra, không phải quy trình.

Sai lầm 4: Nhỏ giọt cho nó những lời nhắc nhỏ.

Fable giữ hàng giờ ngữ cảnh trong đầu nó.

Đưa cho nó toàn bộ thứ lộn xộn cùng một lúc.

Đầy đủ ngữ cảnh. Các ràng buộc. Điều bạn thực sự sợ.

Tôi đã đưa cho Fable một bản tái cấu trúc mà tôi đã lo sợ trong nhiều tuần trong một bản tóm tắt duy nhất. Nó quay lại và đã hoàn thành.

Nhỏ giọt cho nó lãng phí thứ duy nhất nó giỏi nhất.

So sánh chi phí mô hình — biết bạn thực sự đang trả bao nhiêu

Trước khi bạn định tuyến bất cứ thứ gì, hãy biết giá của từng mô hình:

Mô hình Đầu vào ($/M) Đầu ra ($/M) Tốt nhất cho

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Fable 5 ~$15 ~$75 Lập kế hoạch, đánh giá

Opus 4.8 ~$5 ~$25 Suy luận sâu

Sonnet 5 ~$3 ~$15 Thực thi tiêu chuẩn

Kimi K2.7 ~$0.95 ~$4.00 Viết mã hàng loạt, ngữ cảnh dài

GLM-5.2 ~$1.40 ~$4.40 Công việc quy mô kho lưu trữ

DeepSeek v4 ~$0.28 ~$1.10 Công việc chân tay siêu rẻ

Haiku 4.5 ~$1 ~$5 Dọn dẹp, định dạng

Local (Qwen/Llama) $0 $0 Tự động hoàn thành, mã soạn sẵn

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Khoảng cách giữa Fable và DeepSeek: 53x trên đầu vào. 68x trên đầu ra.

Cùng một tác tử tái cấu trúc 30 bước: → Tất cả Fable: ~$25 mỗi lần chạy → Kế hoạch Fable + thực thi Kimi: ~$1.40 mỗi lần chạy → Cùng mã được phát hành. Cùng các bài kiểm tra pass.

Định tuyến không phải là để rẻ.

Mà là để chính xác.

Hệ thống đầy đủ — nó trông như thế nào khi chạy

Trước hệ thống này:

→ Mọi thứ đều định tuyến đến Fable

→ Hóa đơn tăng vọt mỗi lần bạn phát hành

→ Giới hạn sử dụng bị chạm giữa phiên

→ Bạn phân bổ lời nhắc như một du khách tiết kiệm

Sau hệ thống này:

→ Fable xử lý 10% thực sự cần nó

→ Các mô hình rẻ xử lý 80% thực thi

→ /loop chạy qua đêm mà không chạm đến giới hạn của bạn

→ Bạn phát hành nhiều hơn, chi tiêu ít hơn, không bao giờ chạm giới hạn tốc độ

Bản tóm tắt ba dòng:

Fable lập kế hoạch. Các mô hình khác thực thi. Fable đánh giá.

Một quy tắc duy nhất đó giảm hóa đơn của bạn hơn 50% trước khi bạn thay đổi bất cứ điều gì khác.

Phần còn lại là tối ưu hóa.

Chạy cái này tối nay

Thả cái này vào Fable ngay bây giờ:

Đọc CLAUDE.md hiện tại của tôi và tất cả các dự án đang hoạt động của tôi.

Công việc của bạn: thiết lập hệ thống định tuyến 10-80-10 cho quy trình làm việc của tôi.

Tạo:

CLAUDE.md đã cập nhật với bảng định tuyến mô hình đầy đủ
Danh sách các tác vụ đang hoạt động hiện tại của tôi được xếp hạng theo mô hình nào nên xử lý từng tác vụ
Ba lời nhắc /goal tôi có thể chạy tối nay trên các mô hình rẻ hơn dựa trên những gì bạn thấy trong các dự án của tôi

Không thực thi bất cứ điều gì. Chỉ lập kế hoạch và định tuyến.

Fable làm việc lập kế hoạch.

Bạn thức dậy với một hệ thống định tuyến hoàn chỉnh.

Và một hóa đơn không làm bạn đau tim.

Nếu điều này giúp bạn tiết kiệm tiền:

→ Đăng lại để những người xây dựng khác ngừng đốt ngân sách của họ

→ Theo dõi @sairahul1 để biết thêm các hệ thống như thế này

→ Đánh dấu trang này — cấu hình CLAUDE.md hoạt động, hãy dán chúng tối nay

Đăng ký theaibuilders.co để biết thêm nhiều bài viết thú vị như vậy

Tôi viết về AI, xây dựng sản phẩm và các hệ thống hoạt động trong khi bạn ngủ.

Tài nguyên:

→ Bộ định tuyến token Entelligence: entelligence.ai/blogs/entelligence-token-router

→ Quy trình làm việc ba mô hình đã cắt giảm hóa đơn 80%: entelligence.ai/blogs/our-three-model-coding-workflow-that-cut-our-ai-bill-80

→ Claude Code: claude.ai/code

→ Codex CLI: npmjs.com/package/@openai/codex

Cách sử dụng Claude Fable 5 mà không lo cạn kiệt ngân sách

Hệ thống 10-80-10 (Khung chính xác mà các kỹ sư Anthropic tự sử dụng)

Bảng định tuyến CLAUDE.md (Một tệp điều khiển mọi thứ)

Thiết lập CLAUDE.md chính xác đã tiết kiệm 70% token của tôi

Cài đặt plugin Codex — bước nhân lên sức mạnh

Lệnh /loop (Cách mạnh mẽ nhất để sử dụng Fable ngay bây giờ)

7 lời nhắc để chạy trên Fable ngay bây giờ

Mức nỗ lực — cài đặt bị hiểu lầm nhất

Thủ thuật /handoff — khắc phục tình trạng phình to cửa sổ ngữ cảnh

4 sai lầm đắt giá cần tránh

So sánh chi phí mô hình — biết bạn thực sự đang trả bao nhiêu

Hệ thống đầy đủ — nó trông như thế nào khi chạy

Chạy cái này tối nay

Nếu điều này giúp bạn tiết kiệm tiền:

Tài nguyên:

Turn one viral article into a full content workflow

Bài viết viral gần đây

Nói "Cứ hỏi tôi bất cứ lúc nào" không phải là cố vấn thực thụ: Hướng dẫn về sự đồng hành chuyên nghiệp đích thực

Fable 5: Hướng dẫn cơ bản về kỹ thuật vòng lặp (Loop Engineering)

Hướng dẫn toàn diện về mô hình AI tốt nhất: Giải thích đơn giản về Claude Fable 5

Vốn tư nhân đang đánh giá thấp AI

Thật tàn nhẫn: Một cựu nhân viên nội bộ phơi bày mặt tối của ngành bảo hiểm

Cách kiếm tiền với Claude Fable 5 (Hướng dẫn đầy đủ)

Cách sử dụng Claude Fable 5 mà không lo cạn kiệt ngân sách

Hệ thống 10-80-10 (Khung chính xác mà các kỹ sư Anthropic tự sử dụng)

Bảng định tuyến CLAUDE.md (Một tệp điều khiển mọi thứ)

Thiết lập CLAUDE.md chính xác đã tiết kiệm 70% token của tôi

Cài đặt plugin Codex — bước nhân lên sức mạnh

Lệnh /loop (Cách mạnh mẽ nhất để sử dụng Fable ngay bây giờ)

7 lời nhắc để chạy trên Fable ngay bây giờ

Mức nỗ lực — cài đặt bị hiểu lầm nhất

Thủ thuật /handoff — khắc phục tình trạng phình to cửa sổ ngữ cảnh

4 sai lầm đắt giá cần tránh

So sánh chi phí mô hình — biết bạn thực sự đang trả bao nhiêu

Hệ thống đầy đủ — nó trông như thế nào khi chạy

Chạy cái này tối nay

Nếu điều này giúp bạn tiết kiệm tiền:

Tài nguyên:

Turn one viral article into a full content workflow

Biến Markdown của bạn thành bài viết 𝕏 gọn gàng

Bài viết viral gần đây

Nói "Cứ hỏi tôi bất cứ lúc nào" không phải là cố vấn thực thụ: Hướng dẫn về sự đồng hành chuyên nghiệp đích thực

Fable 5: Hướng dẫn cơ bản về kỹ thuật vòng lặp (Loop Engineering)

Hướng dẫn toàn diện về mô hình AI tốt nhất: Giải thích đơn giản về Claude Fable 5

Vốn tư nhân đang đánh giá thấp AI

Thật tàn nhẫn: Một cựu nhân viên nội bộ phơi bày mặt tối của ngành bảo hiểm

Cách kiếm tiền với Claude Fable 5 (Hướng dẫn đầy đủ)