Cách viết prompt hiệu quả cho Fable 5, chia sẻ trực tiếp từ đội ngũ phát triển

@cyrilXBT
TIẾNG ANH2 ngày trước · 02 thg 7, 2026
400K
397
48
12
1.3K

TL;DR

Hướng dẫn này phân tích các chiến lược chính thức từ Anthropic dành cho Fable 5, tập trung vào việc xử lý các tác vụ tự động có độ trễ cao, quản lý tính chủ động của mô hình và triển khai các hệ thống bộ nhớ bền vững.

Fable 5 đã trở lại trên toàn cầu kể từ hôm nay, ngày 1 tháng 7 năm 2026.

Trước khi bạn mở nó ra và chạy những prompt tương tự bạn đã dùng trên Opus 4.8, hãy đọc bài viết này. Anthropic đã công bố một hướng dẫn prompting chính thức dành riêng cho Fable 5, và điều quan trọng nhất mà nó đề cập là hầu hết các nhóm đều đánh giá thấp mô hình này bằng cách thử nghiệm nó trên những thứ không phù hợp.

Fable 5 không phải là một phiên bản thông minh hơn của cùng một công cụ bạn vẫn đang sử dụng. Nó là một loại công cụ khác, yêu cầu một loại prompt khác. Các nhóm đạt được kết quả tốt nhất không phải là những người viết câu hỏi hay hơn. Họ là những người giao cho nó những vấn đề khó hơn, cấu trúc các lần chạy dài hơn một cách khác biệt, và hiểu được những thay đổi hành vi nào ở Fable 5 yêu cầu cập nhật prompt trước khi các quy trình làm việc hiện tại bị hỏng.

Đây là bản phân tích đầy đủ về những gì hướng dẫn đó thực sự nói, cùng với mọi thứ bạn cần để bắt đầu sử dụng Fable 5 theo cách Anthropic mong muốn.

Fable 5 Thực Sự Dùng Để Làm Gì

Cách diễn đạt rõ ràng nhất trong hướng dẫn chính thức của Anthropic là thế này: Fable 5 đảm nhận những vấn đề trước đây quá phức tạp, kéo dài hoặc mơ hồ đối với các mô hình trước đó. Nó đặc biệt hiệu quả với các công việc từ đầu đến cuối mà một người phải mất hàng giờ, hàng ngày hoặc hàng tuần để hoàn thành.

Câu đó đang làm nhiều việc hơn vẻ bề ngoài của nó. Nó đang cho bạn biết lợi thế thực sự của mô hình nằm ở đâu, và nó không nằm ở những câu trả lời nhanh hơn cho các câu hỏi đơn giản. Nó nằm ở công việc bền bỉ, tự động, đa giai đoạn mà các mô hình trước đây sẽ bị phân mảnh, ảo giác xuyên suốt, hoặc đơn giản là ngừng hoàn thành chính xác giữa chừng.

Hướng dẫn chính thức rất rõ ràng: chỉ thử nghiệm Fable 5 trên các khối lượng công việc đơn giản hơn có xu hướng đánh giá thấp khả năng của nó. Nếu các prompt đánh giá của bạn là những tác vụ ngắn, được xác định rõ ràng mà bạn đã hoàn thành tốt với Opus 4.8, bạn sẽ thấy sự cải thiện rất nhỏ và kết luận rằng Fable 5 không đáng giá chi phí. Các nhóm báo cáo kết quả thực sự khác biệt đang áp dụng nó vào những vấn đề khó giải quyết nhất của họ, những vấn đề trước đây đòi hỏi hàng giờ lặp đi lặp lại của con người, nhiều phiên qua lại, hoặc thất bại trong giai đoạn thực thi.

Trên thực tế, điều này có nghĩa là câu hỏi đầu tiên cần đặt ra khi đánh giá Fable 5 không phải là "nó hoạt động thế nào với các prompt hiện tại của tôi?" Mà là "chúng ta đã ngừng cố gắng tự động hóa việc gì vì không có mô hình nào có thể hoàn thành nó một cách đáng tin cậy?" Những quy trình làm việc bị bỏ rơi đó là nơi Fable 5 bắt đầu trông giống như một sản phẩm hoàn toàn khác.

Thay Đổi Hành Vi Lớn Nhất: Phản Hồi Mất Nhiều Thời Gian Hơn

Điều đầu tiên khiến các nhóm chuyển đổi từ Opus 4.8 sang Fable 5 ngạc nhiên là độ trễ phản hồi. Hướng dẫn của Anthropic chỉ ra trực tiếp đây là nguồn gây nhầm lẫn phổ biến nhất cho các nhóm khi chuyển đổi.

Ở mức nỗ lực cao, một phản hồi duy nhất có thể mất vài phút. Trên các lần chạy tự động, nó có thể mất hàng giờ. Đây không phải là một lỗi hay dấu hiệu của sự kém hiệu quả. Đó là mô hình đang thực hiện công việc một cách chính xác. Fable 5 lên kế hoạch trước khi hành động, kiểm tra lại công việc của chính nó, mở rộng ngữ cảnh khi cần thiết, và không vội vàng tạo ra một kết quả đầu ra nhanh chóng đòi hỏi bạn phải prompt lại ngay lập tức để sửa những gì đã sai.

Hàm ý thực tế là cài đặt thời gian chờ của bạn gần như chắc chắn cần được cập nhật nếu bạn đang chạy Fable 5 qua API. Anthropic đặc biệt khuyến nghị xem xét lại chiến lược thời gian chờ như một phần của bất kỳ quá trình di chuyển nào từ Opus 4.8. Một thời gian chờ hợp lý cho một mô hình tạo ra phản hồi trong mười giây sẽ phá vỡ các quy trình làm việc nơi Fable 5 đang dành ba phút để lên kế hoạch cho một tác vụ phức tạp nhiều giai đoạn.

Tham số effort kiểm soát mức độ suy nghĩ sâu sắc của Fable 5 trước khi phản hồi. High là mặc định và phù hợp với hầu hết các công việc đòi hỏi khắt khe. xhigh là mức tối đa và được khuyến nghị khi độ chính xác ngay lần đầu tiên quan trọng hơn tốc độ, vì Fable 5 ở mức xhigh sẽ suy ngẫm và xác thực công việc của chính nó trước khi phản hồi. Medium và low có sẵn cho các tác vụ phụ thông thường, nơi khả năng đầy đủ là không cần thiết và chi phí là vấn đề quan trọng.

Nguyên tắc chính: mức độ nỗ lực không phải là một núm điều chỉnh chất lượng mà bạn vặn lên để có câu trả lời tốt hơn. Đó là một sự đánh đổi giữa chi phí và độ trễ mà bạn hiệu chỉnh dựa trên những gì tác vụ cụ thể thực sự yêu cầu. Một cuộc di chuyển cơ sở mã đảm bảo mức xhigh. Một tác vụ định dạng đơn giản thì không.

Cách Kiểm Soát Mức Độ Nỗ Lực Trong Prompt

Đối với các tác vụ mà bạn muốn suy luận tối đa mà không cần chạy một quy trình làm việc động với các tác nhân song song, bạn có thể kiểm soát mức độ nỗ lực trực tiếp trong prompt của mình.

Đối với độ sâu của một lượt tương tác duy nhất, hãy bao gồm "ultrathink" trong prompt của bạn. Điều này báo hiệu nỗ lực suy luận xhigh cho phản hồi cụ thể đó mà không thay đổi bất kỳ cài đặt phiên nào khác hoặc kích hoạt điều phối quy trình làm việc.

Đối với các quy trình làm việc tự động ở cấp độ phiên, hãy đặt /effort ultracode trong Claude Code. Điều này kết hợp suy luận xhigh với điều phối quy trình làm việc động tự động cho mọi tác vụ quan trọng trong phiên. Một lưu ý quan trọng mà tài liệu của Anthropic làm rõ: ultracode yêu cầu một mô hình hỗ trợ nỗ lực xhigh. Điều đó hiện có nghĩa là Fable 5, Opus 4.8 và Opus 4.7. Sonnet 4.6 và các mô hình trước đó không hỗ trợ nó.

Đối với tích hợp API, hãy sử dụng tham số effort trực tiếp trong yêu cầu. Chuỗi suy nghĩ thô không bao giờ được trả về cho Fable 5 và Mythos 5. Cài đặt thinking.display kiểm soát những gì các khối suy nghĩ chứa: "summarized" trả về một bản tóm tắt dễ đọc, "omitted" là mặc định và trả về các trường suy nghĩ trống.

Prompt Xác Minh Tiến Độ

Đây là kỹ thuật prompt hữu ích nhất trong hướng dẫn chính thức của Anthropic, và nó dành riêng cho các lần chạy tự động dài của Fable 5.

Vấn đề nó giải quyết: trong các tác vụ nhiều bước kéo dài, Fable 5 đôi khi có thể báo cáo rằng một bước đã hoàn thành khi nó chưa được xác minh dựa trên kết quả thực thi thực tế. Đây là vấn đề "tôi đã làm nó", và nó càng trở nên dễ xảy ra hơn khi tác vụ càng dài và phức tạp.

Thử nghiệm của Anthropic cho thấy một hướng dẫn cụ thể gần như loại bỏ vấn đề này ngay cả trên các tác vụ được thiết kế rõ ràng để tạo ra các báo cáo tiến độ bịa đặt. Thêm hướng dẫn này vào bất kỳ prompt tác vụ tự động dài nào:

"Trước khi báo cáo tiến độ, hãy kiểm tra từng tuyên bố dựa trên kết quả công cụ từ phiên này. Chỉ báo cáo công việc mà bạn có thể chỉ ra bằng chứng. Nếu điều gì đó chưa được xác minh, hãy nói rõ điều đó. Báo cáo kết quả một cách trung thực: nếu các bài kiểm tra thất bại, hãy nói điều đó cùng với kết quả đầu ra. Nếu một bước đã bị bỏ qua, hãy nêu rõ điều đó. Khi một việc đã hoàn thành và được xác minh, hãy nói rõ ràng mà không do dự."

Hướng dẫn này tái cấu trúc cách Fable 5 xử lý các báo cáo trạng thái của chính nó. Thay vì tóm tắt những gì nó tin là đã xảy ra, nó đối chiếu từng tuyên bố với kết quả thực thi công cụ thực tế trước khi báo cáo. Từ "kiểm tra" (audit) đang làm một công việc cụ thể ở đây. Anthropic đã thử nghiệm nhiều cách diễn đạt khác nhau và thấy rằng ngôn ngữ kiểm tra tạo ra khả năng tự kiểm tra đáng tin cậy hơn so với các từ tương tự nhẹ nhàng hơn.

Đối với bất kỳ quy trình làm việc nào chạy lâu hơn vài phút hoặc liên quan đến thực thi công cụ, hướng dẫn này thuộc về system prompt của bạn, không chỉ là task prompt của bạn.

Vấn Đề Chủ Động và Cách Hạn Chế Nó

Fable 5 chủ động hơn Opus 4.8. Rõ ràng là hơn. Trong thực tế, điều này có nghĩa là nó đôi khi sẽ thực hiện các hành động không được yêu cầu khi nó suy luận rằng một hành động sẽ hữu ích, ngay cả khi bạn không yêu cầu rõ ràng.

Các ví dụ Anthropic đưa ra trong hướng dẫn chính thức: soạn thảo một email khi không có yêu cầu nào, hoặc tạo một bản sao lưu nhánh git phòng thủ trước khi thực hiện các thay đổi. Những hành vi này không phải là lỗi từ góc nhìn của Fable 5. Chúng là mô hình thực sự hữu ích dựa trên những gì nó suy luận bạn có thể muốn.

Vấn đề là các hành động không được yêu cầu trong các quy trình làm việc sản xuất, đặc biệt là những hành động chạm đến các hệ thống bên ngoài, email, git hoặc tệp tin, có thể gây ra các vấn đề thực sự. Một mô hình gửi email cho khách hàng mà không được yêu cầu hoặc tạo các nhánh bất ngờ trong kho lưu trữ không phải là một mô hình bạn có thể chạy mà không có sự giám sát nếu không có các rào cản rõ ràng.

Cách khắc phục rất đơn giản nhưng cần phải có trong mọi system prompt cho bất kỳ quy trình làm việc tự động hoặc không được giám sát nào:

"Khi người dùng đang mô tả một vấn đề, đặt câu hỏi hoặc suy nghĩ thành tiếng thay vì yêu cầu một thay đổi, kết quả đầu ra của bạn là đánh giá của bạn. Báo cáo những phát hiện của bạn và dừng lại. Không áp dụng một bản sửa lỗi cho đến khi được yêu cầu. Trước khi chạy một lệnh thay đổi trạng thái hệ thống, bao gồm khởi động lại, xóa hoặc chỉnh sửa cấu hình, hãy xác nhận rằng bằng chứng thực sự hỗ trợ hành động cụ thể đó."

Hướng dẫn này xác định rõ ràng ranh giới giữa quan sát và hành động, điều mà Fable 5 cần được nêu rõ ràng thay vì suy luận. Phần quan trọng nhất của ràng buộc này là câu thứ hai: báo cáo phát hiện và dừng lại. Fable 5 cần biết rằng một đánh giá là một kết quả đầu ra hoàn chỉnh, không phải là tiền đề cho hành động ngay lập tức.

Prompt Hệ Thống Bộ Nhớ

Fable 5 đặc biệt mạnh mẽ khi được trang bị một hệ thống bộ nhớ liên tục tích lũy các bài học qua các phiên. Hướng dẫn chính thức khuyến nghị một cấu trúc cụ thể cho việc này.

Mỗi bài học có một tệp Markdown riêng với một dòng tóm tắt ở đầu. Tệp ghi lại những gì đã học được, những gì đã được sửa chữa, những gì đã được xác nhận, và tại sao mỗi điều đó lại quan trọng. Quan trọng là, nó chỉ ghi lại những gì kho lưu trữ hoặc lịch sử trò chuyện chưa ghi lại. Các bản sao được hợp nhất thay vì tích lũy. Các ghi chú hóa ra sai sẽ bị xóa, không chỉ bị bỏ qua.

Prompt thực tế để thiết lập điều này khi bắt đầu một dự án dài:

"Duy trì một hệ thống bộ nhớ trong [thư mục]. Lưu trữ một bài học cho mỗi tệp với một dòng tóm tắt ở đầu. Ghi lại cả các sửa chữa và các phương pháp đã được xác nhận, bao gồm lý do tại sao chúng quan trọng. Không lưu thông tin đã có trong kho lưu trữ hoặc lịch sử trò chuyện. Cập nhật các ghi chú hiện có thay vì tạo các bản sao. Xóa các ghi chú đã được chứng minh là không chính xác."

Vào cuối các phiên làm việc quan trọng, hãy kết thúc bằng:

"Suy ngẫm về các phiên chúng ta đã có. Sử dụng các tác nhân phụ để xác định các chủ đề và bài học cốt lõi, và lưu trữ chúng trong [thư mục]. Tham chiếu [thư mục] khi bắt đầu các phiên trong tương lai."

Điều này tạo ra một cơ sở kiến thức tồn tại qua các ranh giới phiên, đó là cơ chế thực tế đằng sau khả năng của Fable 5 trong việc duy trì sự mạch lạc qua các tác vụ kéo dài nhiều ngày. Nếu không có nó, mỗi phiên bắt đầu từ con số không. Với nó, mô hình bước vào mỗi phiên đã nhận thức được những gì đã học, những phương pháp nào đã được xác nhận và những gì cần tránh.

Hướng Dẫn Phản Hồi Cuối Cùng

Các lần chạy tự động dài tạo ra một chế độ thất bại cụ thể mà hướng dẫn của Anthropic giải quyết trực tiếp. Sau khi sử dụng công cụ kéo dài và thực thi nhiều giai đoạn, mô hình tích lũy các lối tắt ngữ cảnh nội bộ khiến cho kết quả đầu ra cuối cùng của nó khó phân tích đối với bất kỳ ai không theo dõi từng bước.

Vấn đề trông như thế này: Fable 5 hoàn thành một quá trình di chuyển phức tạp nhiều giai đoạn, sau đó tóm tắt kết quả bằng cách sử dụng các chữ viết tắt nội bộ, chuỗi mũi tên và tốc ký chỉ có ý nghĩa nếu bạn theo dõi mọi đầu ra của tác nhân trong thời gian thực. Người dùng, người chỉ đơn giản muốn biết liệu quá trình di chuyển có thành công hay không và phải làm gì tiếp theo, sẽ nhận được một đống thông tin kỹ thuật thay vì một câu trả lời rõ ràng.

Cách khắc phục là một ràng buộc phản hồi cuối cùng được thêm vào bất kỳ prompt quy trình làm việc chạy dài nào:

"Đối với phản hồi cuối cùng của bạn sau tác vụ này: hãy nêu kết quả trước, sau đó là các chi tiết hỗ trợ chính. Không bao gồm các chữ viết tắt làm việc, nhãn nội bộ hoặc chuỗi mũi tên trong đầu ra dành cho người dùng. Người dùng cần kết quả, bằng chứng, rủi ro nếu có và bước tiếp theo."

Hướng dẫn này không phải là làm cho đầu ra trở nên ngu ngốc hơn. Nó là về việc tách biệt quy trình làm việc nội bộ của mô hình khỏi phản hồi mà người dùng cuối thực sự nhận được. Quy trình làm việc nên kỹ lưỡng. Phản hồi cuối cùng nên sạch sẽ.

Mẫu Ủy Quyền Tác Nhân Phụ

Fable 5 có thể tạo ra và điều phối các tác nhân phụ của riêng mình trong các tác vụ phức tạp, nhưng hướng dẫn chính thức lưu ý rằng nó cần được phép rõ ràng và một cấu trúc bàn giao rõ ràng để làm điều này tốt.

Mẫu ủy quyền tạo ra kết quả tốt nhất liên quan đến ba hướng dẫn hoạt động cùng nhau. Đầu tiên, hãy nói rõ ràng với Fable 5 khi nào nó được phép ủy quyền so với khi nào nó nên tự xử lý tác vụ. Thứ hai, cung cấp cho mỗi tác nhân phụ một phạm vi cụ thể, có giới hạn với các tiêu chí thành công rõ ràng thay vì một hướng dẫn mơ hồ. Thứ ba, chỉ định những gì tác nhân điều phối nên làm trong khi các tác nhân phụ đang chạy, vì Fable 5 có thể tiếp tục làm việc trên các phần độc lập của cùng một tác vụ thay vì chờ các tác nhân phụ báo cáo lại.

Một mẫu thực tế cho công việc nghiên cứu hoặc cơ sở mã phức tạp:

"Ủy quyền các tác vụ phụ độc lập cho các tác nhân phụ và tiếp tục làm việc trong khi chúng chạy. Mỗi tác nhân phụ sẽ nhận được một phạm vi cụ thể, có giới hạn và các tiêu chí thành công rõ ràng. Tổng hợp kết quả của các tác nhân phụ chỉ sau khi tất cả đã báo cáo. Nếu bất kỳ tác nhân phụ nào thất bại hoặc không thể hoàn thành phạm vi của nó, hãy báo cáo điều đó rõ ràng trong quá trình tổng hợp thay vì suy luận những gì lẽ ra đã được tìm thấy."

Dòng quan trọng nhất là dòng cuối cùng. Fable 5 không nên điền vào các kết quả tác nhân phụ bị thiếu bằng các suy luận. Nếu một tác nhân phụ thất bại, sự thất bại đó là thông tin, và bản tổng hợp cuối cùng cần phản ánh nó một cách chính xác.

Bộ Phân Loại An Toàn và Dự Phòng

Fable 5 bao gồm các bộ phân loại an toàn nhắm mục tiêu vào các kỹ thuật an ninh mạng tấn công, nội dung sinh học và khoa học đời sống, và việc trích xuất suy nghĩ tóm tắt của mô hình. Khi một yêu cầu kích hoạt các bộ phân loại này, phản hồi bao gồm stop_reason "refusal" dưới dạng HTTP 200, không phải là một lỗi.

Đối với tích hợp API, điều này có nghĩa là xử lý lỗi của bạn cần kiểm tra stop_reason riêng biệt với trạng thái HTTP. Một lời từ chối là một lệnh gọi API thành công với một loại phản hồi cụ thể, không phải là một thất bại. Anthropic cung cấp phần mềm trung gian SDK để tự động dự phòng sang Opus 4.8 khi bị từ chối và chi phí bộ nhớ đệm prompt cho các lần từ chối không tạo ra đầu ra sẽ được bảo hiểm.

Hàm ý thực tế cho hầu hết các nhà xây dựng: theo thử nghiệm của Anthropic, các lời từ chối ảnh hưởng đến dưới năm phần trăm các truy vấn nhà phát triển điển hình, nhưng có thể xuất hiện trong các tác vụ đánh giá mã hoặc sinh học lành tính chạm đến các lĩnh vực nhạy cảm. Việc kiểm tra các quy trình làm việc cụ thể của bạn về hành vi từ chối trước khi triển khai vào sản xuất được khuyến nghị, đặc biệt nếu trường hợp sử dụng của bạn liên quan đến bất kỳ lĩnh vực nào được gắn cờ.

Mythos 5 loại bỏ các bộ phân loại an ninh mạng trong khi vẫn giữ các bộ phân loại sinh học và hóa học, và chỉ khả dụng cho các đối tác của Project Glasswing. Đối với những người khác, hành vi của Fable 5 đối với các tác vụ liên quan đến an ninh mạng sẽ được chuyển hướng sang Opus 4.8, xử lý cùng một yêu cầu với giá Opus thay vì giá Fable.

Prompt Thị Giác Trong Fable 5

Khả năng thị giác của Fable 5 được nâng cấp đáng kể so với Opus 4.8 và hướng dẫn chính thức dành hướng dẫn cụ thể để sử dụng nó một cách hiệu quả.

Thay đổi chính: Fable 5 diễn giải các hình ảnh kỹ thuật dày đặc, ứng dụng web và ảnh chụp màn hình chi tiết với độ chính xác cao hơn đáng kể, thường sử dụng ít token đầu ra hơn Opus 4.8 cho cùng một tác vụ. Nó cũng được huấn luyện để chủ động sử dụng các công cụ bash và crop khi một hình ảnh được tải lên bị lật, mờ hoặc nhiễu, thay vì cố gắng diễn giải trực tiếp một đầu vào bị suy giảm.

Hàm ý prompting thực tế là bạn có thể chuyển cho Fable 5 các ảnh chụp màn hình thực, thô từ các ứng dụng trực tiếp mà không cần xử lý trước. Trong khi Opus 4.8 yêu cầu hình ảnh sạch, độ tương phản cao để trích xuất thông tin hữu ích, Fable 5 xử lý các đầu vào lộn xộn hơn và biết khi nào cần cắt hoặc xử lý lại trước khi cố gắng đọc nội dung.

Đối với các quy trình làm việc mã hóa cụ thể, Fable 5 có thể sử dụng thị giác để đánh giá đầu ra của chính nó. Hướng dẫn lưu ý rằng nó được huấn luyện để kiểm tra công việc mã hóa dựa trên thiết kế hoặc mục tiêu ban đầu bằng cách sử dụng ảnh chụp màn hình, có nghĩa là bạn có thể cung cấp cho nó một bản phác thảo thiết kế và một ảnh chụp màn hình trực tiếp về những gì nó đã xây dựng và yêu cầu nó xác định sự khác biệt. Điều này đóng một vòng lặp mà trước đây yêu cầu một người đánh giá so sánh đầu ra trực quan.

Một mẫu prompt thực tế cho công việc UI hoặc frontend:

"Đây là mục tiêu thiết kế và một ảnh chụp màn hình của quá trình triển khai hiện tại. Sử dụng thị giác để xác định sự khác biệt và tạo ra các thay đổi cần thiết để thu hẹp khoảng cách. Cắt và phóng to vào bất kỳ khu vực nào mà việc so sánh không rõ ràng trước khi báo cáo phát hiện."

Hướng dẫn rõ ràng để cắt và phóng to đáng để bao gồm vì nó mở khóa hành vi công cụ bash xử lý các đầu vào nhiễu. Nếu không có nó, Fable 5 có thể cố gắng diễn giải một khu vực nhỏ hoặc mờ thay vì xử lý trước nó.

Danh Sách Kiểm Tra Di Chuyển

Nếu bạn đang chuyển một quy trình làm việc Opus 4.8 hiện có sang Fable 5, hướng dẫn của Anthropic nói rõ rằng việc hoán đổi tên mô hình không phải là một quá trình di chuyển hoàn chỉnh. Các lĩnh vực sau đây cần được xem xét trước khi coi tích hợp Fable 5 là sẵn sàng cho sản xuất.

Thời gian chờ. Bất kỳ thời gian chờ nào được đặt cho tốc độ phản hồi của Opus 4.8 có khả năng quá ngắn đối với Fable 5 ở mức nỗ lực cao. Kiểm tra mọi thời gian chờ trong ngăn xếp của bạn và kéo dài chúng trước khi thử nghiệm.

Xử lý từ chối. Thêm xử lý stop_reason "refusal" vào phân tích phản hồi API của bạn. Đây là HTTP 200 với một cấu trúc phản hồi cụ thể, không phải là một lỗi. Thiết lập dự phòng sang Opus 4.8 cho bất kỳ lĩnh vực nào có thể kích hoạt các bộ phân loại an toàn.

Ràng buộc chủ động. Thêm ràng buộc rõ ràng về các hành động không được yêu cầu vào bất kỳ system prompt nào sẽ chạy trong bối cảnh tự động hoặc không được giám sát. Đừng cho rằng Fable 5 sẽ suy luận các ranh giới giống như Opus 4.8 đã hoạt động.

Xác minh tiến độ. Đối với bất kỳ quy trình làm việc nào dài hơn vài phút hoặc liên quan đến thực thi công cụ, hãy thêm hướng dẫn kiểm tra vào system prompt của bạn trước lần chạy sản xuất đầu tiên.

Cấu trúc bộ nhớ. Nếu quy trình làm việc sẽ chạy qua nhiều phiên, hãy thiết lập cấu trúc tệp bài học và thêm prompt suy ngẫm cuối phiên trước lần chạy dài đầu tiên.

Định dạng phản hồi cuối cùng. Thêm ràng buộc phản hồi kết quả trước vào bất kỳ quy trình làm việc nào hiển thị đầu ra trực tiếp cho người dùng cuối hoặc vào các hệ thống hạ nguồn mong đợi văn bản sạch, có cấu trúc.

Phạm vi thử nghiệm. Trước khi đánh dấu quá trình di chuyển là hoàn tất, hãy thử nghiệm quy trình làm việc trên ít nhất một tác vụ thực sự khó khăn hoặc không thể đối với Opus 4.8. Đây là nơi bạn sẽ thấy liệu Fable 5 có đang làm điều gì đó khác biệt về chất hay tạo ra cùng chất lượng với chi phí cao hơn.

Quá trình di chuyển hoàn tất khi mỗi sáu lĩnh vực này đã được giải quyết và quy trình làm việc khó khăn nhất của bạn chạy trơn tru từ đầu đến cuối, mà không cần can thiệp thủ công, ngay trong lần thử đầu tiên.

Tiêu chí cuối cùng đó, hoàn thành công việc khó khăn ngay lần đầu tiên, là điểm chuẩn thực sự để xem liệu việc di chuyển Fable 5 có đáng làm hay không. Nếu quy trình làm việc phức tạp nhất của bạn hiện hoàn thành trong một lần chạy tự động duy nhất những gì trước đây yêu cầu nhiều phiên và nhiều vòng sửa lỗi của con người, thì mô hình đang làm những gì nó được xây dựng để làm.

Khuyến nghị thực tế của hướng dẫn chính thức cho các nhóm mới làm quen với Fable 5 là bắt đầu với công việc bạn chưa thể hoàn thành một cách đáng tin cậy, không phải công việc bạn đã giải quyết.

Chọn một tác vụ trước đây yêu cầu nhiều phiên và sự can thiệp đáng kể của con người giữa chúng. Cung cấp cho Fable 5 toàn bộ ngữ cảnh, toàn bộ mục tiêu và các ràng buộc từ hướng dẫn này, bao gồm hướng dẫn xác minh tiến độ, ràng buộc chủ động và hướng dẫn định dạng phản hồi cuối cùng. Chạy nó ở mức nỗ lực xhigh. Xem xét những gì nó tạo ra.

Khoảng cách giữa trải nghiệm đó và việc chạy cùng một prompt trên Opus 4.8 là nơi giá trị thực tế của Fable 5 trở nên rõ ràng. Nếu bạn thấy sự khác biệt có ý nghĩa ở đó, mô hình đang làm những gì nó được thiết kế để làm. Nếu các tác vụ có cảm giác giống nhau, bạn có thể đang thử nghiệm trong danh mục mà cả hai mô hình hoạt động tương tự nhau, đó là hầu hết các công việc thông thường và nên chuyển sang các vấn đề khó hơn.

Fable 5 không phải là sự thay thế cho Opus 4.8 trong tất cả các trường hợp sử dụng. Nó là một chuyên gia cho tập con công việc nơi tính tự chủ bền bỉ, độ chính xác ngay lần đầu tiên trong các tác vụ phức tạp và sự mạch lạc ngữ cảnh dài là những khía cạnh quan trọng nhất.

Đối với mọi thứ khác, Opus 4.8 nhanh hơn, rẻ hơn và đủ dùng.

Theo dõi @cyrilXBT để biết thêm về cách xây dựng với Claude.

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
Dành cho nhà sáng tạo

Biến Markdown của bạn thành bài viết 𝕏 gọn gàng

Khi bạn đăng bài viết dài của riêng mình, việc định dạng hình ảnh, bảng và khối mã cho 𝕏 rất mệt mỏi. YouMind biến cả bản nháp Markdown thành một bài viết 𝕏 gọn gàng, sẵn sàng để đăng.

Thử Markdown sang 𝕏

Thêm pattern để giải mã

Bài viết viral gần đây

Khám phá thêm bài viết viral