Fable 5 กลับมาให้บริการทั่วโลกอีกครั้งตั้งแต่วันนี้ 1 กรกฎาคม 2026
ก่อนที่คุณจะเปิดใช้และรันพรอมต์เดียวกันกับที่ใช้บน Opus 4.8 โปรดอ่านสิ่งนี้ Anthropic ได้เผยแพร่คู่มือการเขียนพรอมต์อย่างเป็นทางการสำหรับ Fable 5 โดยเฉพาะ และสิ่งสำคัญที่สุดที่คู่มือกล่าวคือ ทีมส่วนใหญ่ประเมินความสามารถของโมเดลต่ำเกินไป เพราะทดสอบกับสิ่งที่ผิด
Fable 5 ไม่ใช่เวอร์ชันที่ฉลาดขึ้นของเครื่องมือเดิมที่คุณเคยใช้ มันเป็นเครื่องมือคนละประเภทที่ต้องใช้พรอมต์คนละประเภท ทีมที่เห็นผลลัพธ์ดีที่สุดไม่ใช่ทีมที่เขียนคำถามได้ดีกว่า แต่เป็นทีมที่มอบปัญหาที่ยากขึ้น จัดโครงสร้างรันระยะยาวต่างออกไป และเข้าใจว่าการเปลี่ยนแปลงพฤติกรรมใดใน Fable 5 ที่ต้องอัปเดตพรอมต์ก่อนที่เวิร์กโฟลว์เดิมจะพัง
นี่คือรายละเอียดทั้งหมดของสิ่งที่คู่มือนั้นกล่าว พร้อมทุกสิ่งที่คุณต้องเริ่มใช้ Fable 5 ตามที่ Anthropic ตั้งใจ
Fable 5 มีไว้เพื่ออะไรจริงๆ
กรอบความคิดที่ชัดเจนที่สุดในคู่มืออย่างเป็นทางการของ Anthropic คือ: Fable 5 รับมือกับปัญหาที่ก่อนหน้านี้ซับซ้อน ใช้เวลานาน หรือคลุมเครือเกินไปสำหรับโมเดลรุ่นก่อน มันมีประสิทธิภาพเป็นพิเศษกับงานแบบ end-to-end ที่ใช้เวลาทำหลายชั่วโมง วัน หรือสัปดาห์
ประโยคนั้นมีความหมายมากกว่าที่เห็น มันกำลังบอกคุณว่าข้อได้เปรียบที่แท้จริงของโมเดลอยู่ที่ไหน และมันไม่ได้อยู่ที่การตอบคำถามง่ายๆ แบบครั้งเดียวที่เร็วขึ้น แต่อยู่ที่การทำงานแบบอัตโนมัติ หลายขั้นตอน และต่อเนื่อง ซึ่งโมเดลก่อนหน้านี้จะแตกเป็นชิ้นเล็กชิ้นน้อย สร้างภาพหลอน หรือหยุดทำงานอย่างถูกต้องกลางคัน
คู่มืออย่างเป็นทางการระบุชัดเจน: การทดสอบ Fable 5 เฉพาะกับงานที่เรียบง่ายมักจะประเมินความสามารถของมันต่ำเกินไป หากพรอมต์ประเมินผลของคุณเป็นงานสั้นๆ ที่กำหนดไว้ชัดเจน ซึ่งคุณทำได้ดีอยู่แล้วกับ Opus 4.8 คุณจะเห็นการปรับปรุงเพียงเล็กน้อยและสรุปว่า Fable 5 ไม่คุ้มกับต้นทุน ทีมที่รายงานผลลัพธ์ที่แตกต่างอย่างแท้จริงกำลังนำไปใช้กับปัญหาที่ยากที่สุดที่ยังแก้ไม่ได้ ซึ่งก่อนหน้านี้ต้องใช้การปรับแต่งของมนุษย์หลายชั่วโมง การสนทนาไปมาหลายรอบ หรือล้มเหลวในขั้นตอนการดำเนินการ
ในทางปฏิบัติ หมายความว่าคำถามแรกที่ต้องถามเมื่อประเมิน Fable 5 ไม่ใช่ "มันทำงานกับพรอมต์ปัจจุบันของฉันได้อย่างไร" แต่คือ "เราหยุดพยายามทำให้อะไรเป็นอัตโนมัติเพราะไม่มีโมเดลใดทำได้อย่างน่าเชื่อถือ" เวิร์กโฟลว์ที่ถูกทิ้งเหล่านั้นคือจุดที่ Fable 5 เริ่มดูเหมือนผลิตภัณฑ์คนละอย่าง
การเปลี่ยนแปลงพฤติกรรมที่ใหญ่ที่สุด: การตอบสนองใช้เวลานานขึ้น
สิ่งแรกที่ทำให้ทีมที่ย้ายจาก Opus 4.8 ไป Fable 5 ประหลาดใจคือความหน่วงในการตอบสนอง คู่มือของ Anthropic ระบุสิ่งนี้โดยตรงว่าเป็นสาเหตุของความสับสนที่พบบ่อยที่สุดสำหรับทีมที่เปลี่ยนมาใช้
ที่ระดับ effort สูง การตอบสนองครั้งเดียวอาจใช้เวลาหลายนาที ในการรันแบบอัตโนมัติ อาจใช้เวลาหลายชั่วโมง นี่ไม่ใช่บั๊กหรือสัญญาณของความไม่มีประสิทธิภาพ มันคือโมเดลที่ทำงานอย่างถูกต้อง Fable 5 วางแผนก่อนลงมือ ตรวจสอบงานของตัวเอง ขยายบริบทตามต้องการ และไม่รีบเร่งให้ผลลัพธ์เร็วๆ ที่ทำให้คุณต้องพรอมต์อีกทันทีเพื่อแก้ไขสิ่งที่ผิด
ผลในทางปฏิบัติคือ การตั้งค่า timeout ของคุณเกือบจะต้องอัปเดตแน่นอนหากคุณใช้ Fable 5 ผ่าน API Anthropic แนะนำให้ทบทวนกลยุทธ์ timeout โดยเฉพาะเมื่อย้ายจาก Opus 4.8 ค่า timeout ที่เหมาะสมกับโมเดลที่สร้างการตอบสนองในสิบวินาทีจะทำให้เวิร์กโฟลว์พังเมื่อ Fable 5 ใช้เวลาสามนาทีในการวางแผนงานหลายขั้นตอนที่ซับซ้อนอย่างถูกต้อง
พารามิเตอร์ effort ควบคุมว่า Fable 5 คิดลึกแค่ไหนก่อนตอบสนอง High เป็นค่าเริ่มต้นและเหมาะสมกับงานที่ต้องการมากที่สุด xhigh เป็นระดับสูงสุดและแนะนำเมื่อความถูกต้องในครั้งแรกสำคัญกว่าความเร็ว เนื่องจาก Fable 5 ที่ระดับ xhigh จะไตร่ตรองและตรวจสอบงานของตัวเองก่อนตอบสนอง Medium และ low มีให้สำหรับงานย่อยประจำที่ความสามารถเต็มรูปแบบไม่จำเป็นและต้นทุนสำคัญ
หลักการสำคัญ: ระดับ effort ไม่ใช่ปุ่มปรับคุณภาพที่คุณหมุนขึ้นเพื่อคำตอบที่ดีกว่า มันคือการแลกเปลี่ยนระหว่างต้นทุนและความหน่วงที่คุณปรับเทียบตามความต้องการเฉพาะของงาน การย้ายฐานโค้ดสมควรใช้ xhigh งานจัดรูปแบบง่ายๆ ไม่จำเป็น
วิธีควบคุม Effort ในพรอมต์
สำหรับงานที่คุณต้องการการใช้เหตุผลสูงสุดโดยไม่ต้องรันเวิร์กโฟลว์แบบไดนามิกกับเอเจนต์คู่ขนาน คุณสามารถควบคุม effort ได้โดยตรงในพรอมต์ของคุณ
สำหรับความลึกแบบเทิร์นเดียว ให้ใส่ "ultrathink" ในพรอมต์ของคุณ สิ่งนี้ส่งสัญญาณการใช้เหตุผลระดับ xhigh สำหรับการตอบสนองนั้นๆ โดยไม่เปลี่ยนการตั้งค่าเซสชันอื่นๆ หรือเรียกใช้การจัดระเบียบเวิร์กโฟลว์
สำหรับเวิร์กโฟลว์อัตโนมัติระดับเซสชัน ให้ตั้งค่า /effort ultracode ใน Claude Code สิ่งนี้รวมการใช้เหตุผลระดับ xhigh เข้ากับการจัดระเบียบเวิร์กโฟลว์แบบไดนามิกอัตโนมัติสำหรับทุกงานสำคัญในเซสชัน ข้อควรทราบสำคัญที่เอกสารของ Anthropic ทำให้ชัดเจน: ultracode ต้องใช้โมเดลที่รองรับ effort ระดับ xhigh ซึ่งปัจจุบันหมายถึง Fable 5, Opus 4.8 และ Opus 4.7 Sonnet 4.6 และโมเดลรุ่นก่อนไม่รองรับ
สำหรับการรวม API ให้ใช้พารามิเตอร์ effort โดยตรงในคำขอ ห่วงโซ่ความคิดดิบจะไม่ถูกส่งคืนสำหรับ Fable 5 และ Mythos 5 การตั้งค่า thinking.display ควบคุมว่าบล็อกความคิดประกอบด้วยอะไร: "summarized" ส่งคืนสรุปที่อ่านได้ "omitted" เป็นค่าเริ่มต้นและส่งคืนฟิลด์ความคิดที่ว่างเปล่า
พรอมต์การตรวจสอบความคืบหน้า
นี่คือเทคนิคพรอมต์ที่มีประโยชน์ที่สุดในคู่มืออย่างเป็นทางการของ Anthropic และมันเฉพาะกับรันอัตโนมัติระยะยาวของ Fable 5
ปัญหาที่มันแก้: ในงานหลายขั้นตอนที่ขยายออกไป Fable 5 บางครั้งสามารถรายงานว่าขั้นตอนหนึ่งเสร็จสมบูรณ์เมื่อยังไม่ได้ตรวจสอบกับผลการดำเนินการจริง นี่คือปัญหา "ฉันทำแล้ว" และมันมีแนวโน้มมากขึ้นเมื่องานยาวและซับซ้อนมากขึ้น
การทดสอบของ Anthropic พบว่าคำแนะนำเฉพาะหนึ่งข้อเกือบจะกำจัดปัญหานี้ได้แม้ในงานที่ออกแบบมาเพื่อกระตุ้นรายงานความคืบหน้าที่ไม่จริงโดยเฉพาะ เพิ่มสิ่งนี้ในพรอมต์งานระยะยาวใดๆ:
"ก่อนรายงานความคืบหน้า ให้ตรวจสอบแต่ละข้ออ้างกับผลลัพธ์ของเครื่องมือจากเซสชันนี้ รายงานเฉพาะงานที่คุณสามารถชี้หลักฐานได้ หากสิ่งใดยังไม่ได้รับการยืนยัน ให้พูดอย่างชัดเจน รายงานผลลัพธ์ตามจริง: หากการทดสอบล้มเหลว ให้พูดพร้อมกับผลลัพธ์ หากข้ามขั้นตอนใด ให้ระบุสิ่งนั้น เมื่อบางอย่างเสร็จและได้รับการยืนยัน ให้ระบุอย่างตรงไปตรงมาโดยไม่ลังเล"
คำแนะนำนี้ปรับโครงสร้างวิธีที่ Fable 5 ปฏิบัติต่อรายงานสถานะของตัวเอง แทนที่จะสรุปสิ่งที่มันเชื่อว่าเกิดขึ้น มันตรวจสอบข้ามแต่ละข้ออ้างกับผลการดำเนินการเครื่องมือจริงก่อนรายงาน คำว่า "ตรวจสอบ" (audit) ทำงานเฉพาะที่นี่ Anthropic ทดสอบหลายรูปแบบและพบว่าภาษาแบบ audit สร้างการตรวจสอบตัวเองที่น่าเชื่อถือมากกว่าคำที่อ่อนกว่า
สำหรับเวิร์กโฟลว์ใดๆ ที่รันนานกว่าสองสามนาทีหรือเกี่ยวข้องกับการดำเนินการเครื่องมือ คำแนะนำนี้ควรอยู่ใน system prompt ของคุณ ไม่ใช่แค่ task prompt
ปัญหาความคิดริเริ่มและวิธีจำกัด
Fable 5 มีความคิดริเริ่มมากกว่า Opus 4.8 อย่างเห็นได้ชัด ในทางปฏิบัติ หมายความว่ามันจะดำเนินการที่ไม่ได้รับการร้องขอบางครั้งเมื่อมันอนุมานว่าการกระทำนั้นจะเป็นประโยชน์ แม้ว่าคุณจะไม่ได้ขออย่างชัดแจ้ง
ตัวอย่างที่ Anthropic ให้ในคู่มืออย่างเป็นทางการ: ร่างอีเมลเมื่อไม่มีการร้องขอ หรือสร้าง git branch สำรองเพื่อป้องกันก่อนทำการเปลี่ยนแปลง พฤติกรรมเหล่านี้ไม่ใช่ข้อผิดพลาดจากมุมมองของ Fable 5 มันคือโมเดลที่ช่วยเหลืออย่างแท้จริงตามสิ่งที่มันอนุมานว่าคุณน่าจะต้องการ
ปัญหาคือการกระทำที่ไม่ได้รับการร้องขอในเวิร์กโฟลว์การผลิต โดยเฉพาะที่แตะต้องระบบภายนอก อีเมล git หรือไฟล์ สามารถก่อให้เกิดปัญหาจริงได้ โมเดลที่ส่งอีเมลถึงลูกค้าโดยไม่ถูกถาม หรือสร้าง branch ที่ไม่คาดคิดใน repository ไม่ใช่โมเดลที่คุณสามารถรันโดยไม่มีผู้ดูแลโดยไม่มีเกราะป้องกันที่ชัดเจน
วิธีแก้ไขตรงไปตรงมาแต่ต้องอยู่ในทุก system prompt สำหรับเวิร์กโฟลว์อัตโนมัติหรือไม่มีผู้ดูแล:
"เมื่อผู้ใช้กำลังอธิบายปัญหา ถามคำถาม หรือคิดออกเสียงมากกว่าขอให้เปลี่ยนแปลง ผลลัพธ์ที่ส่งมอบคือการประเมินของคุณ รายงานสิ่งที่คุณพบและหยุด อย่าใช้การแก้ไขจนกว่าจะถูกขอ ก่อนรันคำสั่งที่เปลี่ยนสถานะระบบ รวมถึงการรีสตาร์ท การลบ หรือการแก้ไขการตั้งค่า ให้ยืนยันว่าหลักฐานสนับสนุนการกระทำนั้นจริงๆ"
คำแนะนำนี้กำหนดขอบเขตระหว่างการสังเกตและการกระทำอย่างชัดเจน ซึ่ง Fable 5 ต้องการให้ระบุอย่างชัดเจนมากกว่าการอนุมาน ส่วนที่สำคัญที่สุดของข้อจำกัดนี้คือประโยคที่สอง: รายงานสิ่งที่พบและหยุด Fable 5 ต้องรู้ว่าการประเมินเป็นผลลัพธ์ที่สมบูรณ์ ไม่ใช่ขั้นตอนก่อนการดำเนินการทันที
พรอมต์ระบบหน่วยความจำ
Fable 5 มีประสิทธิภาพเป็นพิเศษเมื่อติดตั้งระบบหน่วยความจำถาวรที่สะสมบทเรียนข้ามเซสชัน คู่มืออย่างเป็นทางการแนะนำโครงสร้างเฉพาะสำหรับสิ่งนี้
แต่ละบทเรียนจะได้รับไฟล์ Markdown ของตัวเองพร้อมสรุปหนึ่งบรรทัดที่ด้านบน ไฟล์บันทึกสิ่งที่เรียนรู้ สิ่งที่ถูกแก้ไข แนวทางที่ได้รับการยืนยัน และเหตุผลที่แต่ละสิ่งเหล่านั้นสำคัญ ที่สำคัญ มันบันทึกเฉพาะสิ่งที่ repository หรือประวัติการแชทยังไม่ได้บันทึก บทเรียนที่ซ้ำกันจะถูกรวมแทนที่จะสะสม โน้ตที่กลายเป็นผิดจะถูกลบ ไม่ใช่แค่ละทิ้ง
พรอมต์ในทางปฏิบัติสำหรับการสร้างสิ่งนี้เมื่อเริ่มโปรเจกต์ระยะยาว:
"ดูแลรักษาระบบหน่วยความจำใน [โฟลเดอร์] เก็บหนึ่งบทเรียนต่อไฟล์พร้อมสรุปหนึ่งบรรทัดที่ด้านบน บันทึกทั้งการแก้ไขและแนวทางที่ได้รับการยืนยัน รวมถึงเหตุผลที่มันสำคัญ อย่าบันทึกข้อมูลที่มีอยู่ใน repo หรือประวัติการแชท อัปเดตโน้ตที่มีอยู่แทนที่จะสร้างโน้ตซ้ำ ลบโน้ตที่พิสูจน์แล้วว่าผิด"
เมื่อสิ้นสุดเซสชันงานสำคัญ ให้ปิดด้วย:
"ไตร่ตรองเซสชันที่เรามี ใช้ subagents เพื่อระบุธีมหลักและบทเรียน และเก็บไว้ใน [โฟลเดอร์] อ้างอิง [โฟลเดอร์] เมื่อเริ่มเซสชันในอนาคต"
สิ่งนี้สร้างฐานความรู้ที่อยู่ข้ามขอบเขตเซสชัน ซึ่งเป็นกลไกที่แท้จริงเบื้องหลังความสามารถของ Fable 5 ในการรักษาความต่อเนื่องข้ามงานหลายวัน หากไม่มีมัน แต่ละเซสชันเริ่มจากศูนย์ เมื่อมีมัน โมเดลเข้าสู่แต่ละเซสชันโดยรู้แล้วว่ามีการเรียนรู้อะไร แนวทางใดได้รับการยืนยัน และควรหลีกเลี่ยงอะไร
คำแนะนำการตอบสนองสุดท้าย
รันอัตโนมัติระยะยาวสร้างโหมดความล้มเหลวเฉพาะที่คู่มือของ Anthropic กล่าวถึงโดยตรง หลังจากการใช้เครื่องมือเป็นเวลานานและการดำเนินการหลายขั้นตอน โมเดลสะสมทางลัดบริบทภายในที่ทำให้ผลลัพธ์สุดท้ายยากต่อการตีความสำหรับใครก็ตามที่ไม่ได้ดูทุกขั้นตอน
ปัญหามีลักษณะเช่นนี้: Fable 5 เสร็จสิ้นการย้ายฐานโค้ดหลายขั้นตอนที่ซับซ้อน จากนั้นสรุปผลลัพธ์โดยใช้ตัวย่อภายใน ลูกศรเชื่อมโยง และชวเลขที่เข้าใจได้เฉพาะถ้าคุณติดตามทุกเอาต์พุตของเอเจนต์แบบเรียลไทม์ ผู้ใช้ที่แค่อยากรู้ว่าการย้ายสำเร็จหรือไม่และต้องทำอะไรต่อ ได้รับข้อมูลทางเทคนิคแทนคำตอบที่ชัดเจน
วิธีแก้ไขคือข้อจำกัดการตอบสนองสุดท้ายที่เพิ่มในพรอมต์เวิร์กโฟลว์ระยะยาวใดๆ:
"สำหรับการตอบสนองสุดท้ายของคุณหลังจากงานนี้: ระบุผลลัพธ์ก่อน จากนั้นรายละเอียดสนับสนุนที่สำคัญ อย่ารวมตัวย่อการทำงาน ป้ายภายใน หรือลูกศรเชื่อมโยงในผลลัพธ์ที่ผู้ใช้เห็น ผู้ใช้ต้องการผลลัพธ์ หลักฐาน ความเสี่ยงหากมี และขั้นตอนถัดไป"
คำแนะนำนี้ไม่เกี่ยวกับการทำให้ผลลัพธ์โง่ลง มันเกี่ยวกับการแยกกระบวนการทำงานภายในของโมเดลออกจากการตอบสนองที่ผู้ใช้ปลายทางได้รับจริง กระบวนการทำงานควรละเอียด การตอบสนองสุดท้ายควรสะอาด
รูปแบบการมอบหมาย Sub-Agent
Fable 5 สามารถสร้างและประสานงาน sub-agent ของตัวเองในงานที่ซับซ้อน แต่คู่มืออย่างเป็นทางการระบุว่ามันต้องการการอนุญาตอย่างชัดแจ้งและโครงสร้างการส่งมอบที่ชัดเจนเพื่อทำสิ่งนี้ได้ดี
รูปแบบการมอบหมายที่ให้ผลลัพธ์ดีที่สุดเกี่ยวข้องกับสามคำแนะนำที่ทำงานร่วมกัน ขั้นแรก บอก Fable 5 อย่างชัดแจ้งเมื่อมันได้รับอนุญาตให้มอบหมายเทียบกับเมื่อมันควรจัดการงานเอง ประการที่สอง ให้แต่ละ sub-agent มีขอบเขตเฉพาะที่จำกัดพร้อมเกณฑ์ความสำเร็จที่ชัดเจน แทนที่จะเป็นคำแนะนำคลุมเครือ ประการที่สาม ระบุสิ่งที่เอเจนต์ประสานงานควรทำในขณะที่ sub-agent กำลังทำงาน เนื่องจาก Fable 5 สามารถทำงานต่อในส่วนอิสระของงานเดียวกันแทนที่จะรอให้ sub-agent รายงานกลับ
รูปแบบในทางปฏิบัติสำหรับงานวิจัยหรือโค้ดเบสที่ซับซ้อน:
"มอบหมายงานย่อยอิสระให้ sub-agent และทำงานต่อไปในขณะที่พวกมันทำงาน แต่ละ sub-agent ควรได้รับขอบเขตเฉพาะที่จำกัดและเกณฑ์ความสำเร็จที่ชัดเจน สังเคราะห์ผลลัพธ์ของ sub-agent หลังจากทั้งหมดรายงานแล้วเท่านั้น หาก sub-agent ใดล้มเหลวหรือไม่สามารถทำขอบเขตให้เสร็จ ให้รายงานสิ่งนั้นอย่างชัดเจนในการสังเคราะห์แทนที่จะอนุมานสิ่งที่จะพบ"
บรรทัดที่สำคัญที่สุดคือบรรทัดสุดท้าย Fable 5 ไม่ควรเติมผลลัพธ์ sub-agent ที่ขาดหายไปด้วยการอนุมาน หาก sub-agent ล้มเหลว ความล้มเหลวนั้นคือข้อมูล และการสังเคราะห์สุดท้ายต้องสะท้อนมันอย่างถูกต้อง
ตัวจำแนกความปลอดภัยและการสำรอง
Fable 5 รวมตัวจำแนกความปลอดภัยที่กำหนดเป้าหมายเทคนิคความปลอดภัยทางไซเบอร์เชิงรุก เนื้อหาชีววิทยาและวิทยาศาสตร์สิ่งมีชีวิต และการแยกความคิดสรุปของโมเดล เมื่อคำขอเรียกใช้ตัวจำแนกเหล่านี้ การตอบสนองรวม stop_reason "refusal" เป็น HTTP 200 ไม่ใช่ข้อผิดพลาด
สำหรับการรวม API หมายความว่าการจัดการข้อผิดพลาดของคุณต้องตรวจสอบ stop_reason แยกจากสถานะ HTTP การปฏิเสธคือการเรียก API ที่สำเร็จพร้อมประเภทการตอบสนองเฉพาะ ไม่ใช่ความล้มเหลว Anthropic มี SDK middleware สำหรับการสำรองอัตโนมัติไปยัง Opus 4.8 เมื่อถูกปฏิเสธ และต้นทุน prompt-cache สำหรับการปฏิเสธที่ไม่มีเอาต์พุตถูกสร้างขึ้นจะได้รับการคุ้มครอง
ผลในทางปฏิบัติสำหรับผู้สร้างส่วนใหญ่: การปฏิเสธมีผลน้อยกว่าห้าเปอร์เซ็นต์ของคำถามนักพัฒนาทั่วไปตามการทดสอบของ Anthropic แต่สามารถปรากฏในงานชีววิทยาหรือตรวจสอบโค้ดที่ไม่เป็นอันตรายซึ่งแตะต้องโดเมนที่ละเอียดอ่อน การทดสอบเวิร์กโฟลว์เฉพาะของคุณสำหรับพฤติกรรมการปฏิเสธก่อนปรับใช้ในการผลิตเป็นสิ่งที่แนะนำ โดยเฉพาะหากกรณีการใช้งานของคุณเกี่ยวข้องกับโดเมนที่ถูกทำเครื่องหมาย
Mythos 5 ลบตัวจำแนกความปลอดภัยทางไซเบอร์ในขณะที่คงตัวจำแนกชีววิทยาและเคมีไว้ และมีให้เฉพาะพันธมิตร Project Glasswing เท่านั้น สำหรับคนอื่นๆ พฤติกรรมของ Fable 5 ในงานที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์จะถูกส่งไปยัง Opus 4.8 ซึ่งจัดการคำขอเดียวกันในราคา Opus แทนที่จะเป็นราคา Fable
การเขียนพรอมต์ Vision ใน Fable 5
ความสามารถด้านวิทัศน์ของ Fable 5 ได้รับการอัปเกรดอย่างมีความหมายจาก Opus 4.8 และคู่มืออย่างเป็นทางการให้คำแนะนำเฉพาะสำหรับการใช้มันอย่างมีประสิทธิภาพ
การเปลี่ยนแปลงสำคัญ: Fable 5 ตีความภาพทางเทคนิคที่หนาแน่น เว็บแอปพลิเคชัน และภาพหน้าจอโดยละเอียดด้วยความแม่นยำที่สูงขึ้นอย่างมาก มักใช้โทเค็นเอาต์พุตน้อยกว่า Opus 4.8 ในงานเดียวกัน มันยังได้รับการฝึกให้ใช้เครื่องมือ bash และ crop อย่างจริงจังเมื่อภาพที่อัปโหลดกลับด้าน เบลอ หรือมีสัญญาณรบกวน แทนที่จะพยายามตีความอินพุตที่เสื่อมคุณภาพโดยตรง
ผลในทางปฏิบัติสำหรับการเขียนพรอมต์คือคุณสามารถส่งภาพหน้าจอจริงดิบจากแอปพลิเคชันจริงให้ Fable 5 โดยไม่ต้องประมวลผลล่วงหน้า ในขณะที่ Opus 4.8 ต้องการภาพที่สะอาด คอนทราสต์สูง เพื่อดึงข้อมูลที่เป็นประโยชน์ Fable 5 จัดการอินพุตที่ยุ่งเหยิงกว่าและรู้ว่าเมื่อใดควรครอบตัดหรือประมวลผลใหม่ก่อนพยายามอ่านเนื้อหา
สำหรับเวิร์กโฟลว์การเขียนโค้ดโดยเฉพาะ Fable 5 สามารถใช้วิทัศน์เพื่อประเมินผลลัพธ์ของตัวเอง คู่มือระบุว่ามันได้รับการฝึกให้ตรวจสอบงานเขียนโค้ดกับดีไซน์หรือเป้าหมายดั้งเดิมโดยใช้ภาพหน้าจอ หมายความว่าคุณสามารถให้ภาพจำลองดีไซน์และภาพหน้าจอจริงของสิ่งที่มันสร้างขึ้น และขอให้มันระบุความแตกต่าง สิ่งนี้ปิดวงจรที่ก่อนหน้านี้ต้องมีผู้ตรวจสอบมนุษย์เปรียบเทียบผลลัพธ์ภาพ
รูปแบบพรอมต์ในทางปฏิบัติสำหรับงาน UI หรือ frontend:
"นี่คือเป้าหมายดีไซน์และภาพหน้าจอของการใช้งานปัจจุบัน ใช้วิทัศน์เพื่อระบุความแตกต่างและสร้างการเปลี่ยนแปลงที่จำเป็นเพื่อปิดช่องว่าง ครอบตัดและซูมเข้าในพื้นที่ใดๆ ที่การเปรียบเทียบไม่ชัดเจนก่อนรายงานสิ่งที่พบ"
คำแนะนำที่ชัดเจนให้ครอบตัดและซูมนั้นคุ้มค่าที่จะรวมเพราะมันปลดล็อกพฤติกรรมเครื่องมือ bash ที่จัดการอินพุตที่มีสัญญาณรบกวน หากไม่มีมัน Fable 5 อาจพยายามตีความพื้นที่เล็กหรือเบลอแทนที่จะประมวลผลล่วงหน้า
รายการตรวจสอบการย้าย
หากคุณกำลังย้ายเวิร์กโฟลว์ Opus 4.8 ที่มีอยู่ไปยัง Fable 5 คู่มือของ Anthropic ระบุชัดเจนว่าการเปลี่ยนชื่อโมเดลไม่ใช่การย้ายที่สมบูรณ์ พื้นที่ต่อไปนี้ต้องได้รับการตรวจสอบก่อนที่จะถือว่าการรวม Fable 5 พร้อมสำหรับการผลิต
Timeouts ค่า timeout ใดๆ ที่ตั้งไว้สำหรับความเร็วการตอบสนองของ Opus 4.8 น่าจะสั้นเกินไปสำหรับ Fable 5 ที่ effort สูง ตรวจสอบทุก timeout ในสแต็กของคุณและขยายก่อนทดสอบ
การจัดการการปฏิเสธ เพิ่มการจัดการ stop_reason "refusal" ในการแยกวิเคราะห์การตอบสนอง API นี่คือ HTTP 200 พร้อมโครงสร้างการตอบสนองเฉพาะ ไม่ใช่ข้อผิดพลาด ตั้งค่าการสำรองไปยัง Opus 4.8 สำหรับโดเมนใดๆ ที่อาจเรียกใช้ตัวจำแนกความปลอดภัย
ข้อจำกัดความคิดริเริ่ม เพิ่มข้อจำกัดที่ชัดเจนเกี่ยวกับการกระทำที่ไม่ได้รับการร้องขอใน system prompt ใดๆ ที่จะรันในบริบทอัตโนมัติหรือไม่มีผู้ดูแล อย่าสมมติว่า Fable 5 จะอนุมานขอบเขตเดียวกันกับที่ Opus 4.8 ดำเนินการภายใน
การตรวจสอบความคืบหน้า สำหรับเวิร์กโฟลว์ใดๆ ที่นานกว่าสองสามนาทีหรือเกี่ยวข้องกับการดำเนินการเครื่องมือ ให้เพิ่มคำแนะนำการตรวจสอบใน system prompt ของคุณก่อนการรันการผลิตครั้งแรก
โครงสร้างหน่วยความจำ หากเวิร์กโฟลว์จะรันข้ามหลายเซสชัน ให้ตั้งค่าโครงสร้างไฟล์บทเรียนและเพิ่มพรอมต์การไตร่ตรองเมื่อสิ้นสุดเซสชันก่อนการรันระยะยาวครั้งแรก
รูปแบบการตอบสนองสุดท้าย เพิ่มข้อจำกัดการตอบสนองที่ระบุผลลัพธ์ก่อนในเวิร์กโฟลว์ใดๆ ที่แสดงผลลัพธ์โดยตรงต่อผู้ใช้ปลายทางหรือเข้าสู่ระบบปลายน้ำที่คาดหวังข้อความที่มีโครงสร้างสะอาด
ขอบเขตการทดสอบ ก่อนทำเครื่องหมายว่าการย้ายเสร็จสมบูรณ์ ให้ทดสอบเวิร์กโฟลว์กับงานอย่างน้อยหนึ่งงานที่ยากหรือเป็นไปไม่ได้สำหรับ Opus 4.8 นี่คือจุดที่คุณจะเห็นว่า Fable 5 กำลังทำสิ่งที่แตกต่างอย่างมีนัยสำคัญหรือสร้างคุณภาพเดียวกันในต้นทุนที่สูงกว่า
การย้ายจะเสร็จสมบูรณ์เมื่อแต่ละหกพื้นที่เหล่านี้ได้รับการจัดการและเวิร์กโฟลว์ที่ยากที่สุดของคุณรันอย่างราบรื่นตั้งแต่ต้นจนจบ โดยไม่ต้องแทรกแซงด้วยตนเอง ในครั้งแรก
เกณฑ์สุดท้ายนั้น การทำงานหนักสำเร็จในครั้งแรก คือเกณฑ์มาตรฐานที่แท้จริงว่าการย้ายไป Fable 5 คุ้มค่าหรือไม่ หากเวิร์กโฟลว์ที่ซับซ้อนที่สุดของคุณตอนนี้เสร็จสมบูรณ์ในการรันอัตโนมัติครั้งเดียว ซึ่งก่อนหน้านี้ต้องใช้หลายเซสชันและการแก้ไขของมนุษย์หลายรอบ แสดงว่าโมเดลกำลังทำสิ่งที่มันถูกสร้างมา
คำแนะนำในทางปฏิบัติของคู่มืออย่างเป็นทางการสำหรับทีมที่ใหม่กับ Fable 5 คือเริ่มต้นกับงานที่คุณไม่สามารถทำให้เสร็จได้อย่างน่าเชื่อถือ ไม่ใช่งานที่คุณแก้ไขแล้ว
เลือกงานที่ก่อนหน้านี้ต้องใช้หลายเซสชันและการแทรกแซงของมนุษย์อย่างมีนัยสำคัญระหว่างเซสชัน ให้ Fable 5 มีบริบทเต็ม เป้าหมายเต็ม และข้อจำกัดจากคู่มือนี้ รวมถึงคำแนะนำการตรวจสอบความคืบหน้า ข้อจำกัดความคิดริเริ่ม และคำแนะนำรูปแบบการตอบสนองสุดท้าย รันที่ effort ระดับ xhigh ตรวจสอบสิ่งที่มันผลิต
ช่องว่างระหว่างประสบการณ์นั้นกับการรันพรอมต์เดียวกันบน Opus 4.8 คือจุดที่คุณค่าที่แท้จริงของ Fable 5 ปรากฏชัด หากคุณเห็นความแตกต่างที่มีความหมายที่นั่น แสดงว่าโมเดลกำลังทำสิ่งที่มันถูกออกแบบให้ทำ หากงานรู้สึกเหมือนเดิม คุณอาจกำลังทดสอบในหมวดหมู่ที่ทั้งสองโมเดลทำงานคล้ายกัน ซึ่งคืองานประจำส่วนใหญ่ และควรย้ายไปปัญหาที่ยากขึ้น
Fable 5 ไม่ใช่สิ่งทดแทน Opus 4.8 ในทุกกรณีการใช้งาน มันเป็นผู้เชี่ยวชาญสำหรับส่วนย่อยของงานที่ความเป็นอิสระอย่างต่อเนื่อง ความถูกต้องในครั้งแรกสำหรับงานที่ซับซ้อน และความต่อเนื่องในบริบทระยะยาวเป็นมิติที่สำคัญที่สุด
สำหรับทุกสิ่งอื่น Opus 4.8 เร็วกว่า ถูกกว่า และเพียงพอ
ติดตาม @cyrilXBT สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการสร้างด้วย Claude





