เพิ่มประสิทธิภาพ Claude Fable5 ให้สูงสุดก่อนวันที่ 7 กรกฎาคม: งานสำคัญและ 2 พรอมต์จากผู้เชี่ยวชาญ

@beku_AI
ญี่ปุ่น2 วันที่ผ่านมา · 02 ก.ค. 2569
482K
789
48
3
2.3K

TL;DR

บทความนี้อธิบายวิธีใช้ประโยชน์จากการเข้าถึง Claude Fable5 ในช่วงเวลาจำกัด โดยเน้นไปที่การตรวจสอบทักษะ Claude Code และการสร้างแผนการปรับโครงสร้างโค้ดอย่างละเอียดโดยใช้พรอมต์เฉพาะทาง 2 รูปแบบ

โมเดลที่ทรงพลังถึงขนาดเคยถูกห้ามใช้งานเนื่องจากข้อบังคับการส่งออกของสหรัฐฯ ได้กลับมาให้บริการอีกครั้ง

อย่างไรก็ตาม จะสามารถใช้งานได้ภายใต้ค่าสมัครสมาชิกจนถึงวันที่ 7 กรกฎาคมเท่านั้น

ในบทความนี้ ผมจะอธิบายให้คนที่ไม่ใช่วิศวกรเข้าใจได้ง่ายว่าคุณควรทำอะไรกับ Fable5 ก่อนถึงเส้นตายวันที่ 7 กรกฎาคม

ทำไมถึงกลับมาให้บริการอีกครั้ง?

คำตอบนั้นง่ายมาก

มีการติดตั้งมาตรการด้านความปลอดภัยเพิ่มเติมเพื่อให้เป็นไปตามมาตรฐานข้อบังคับ

เมื่อคุณใช้ Fable5 คุณอาจเห็นข้อความแจ้งเตือนว่า "Opus 4.8 ตอบกลับ" เป็นครั้งคราว

นี่ไม่ใช่ความผิดพลาดหรือการลดประสิทธิภาพ

นี่คือกลไกด้านความปลอดภัยที่กลายเป็นเงื่อนไขในการนำกลับมาให้บริการอีกครั้ง

นี่คือวิธีการทำงานภายใน:

ก่อนที่ Fable5 จะตอบคำถาม AI ที่ทำหน้าที่ตัดสินโดยเฉพาะจะตรวจสอบเนื้อหาของคำถามก่อน

มันจะมองหาคำถามที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์ ชีววิทยา/เคมี หรือความพยายามที่จะดึงความสามารถของ AI ออกมา

เฉพาะเมื่อถูกตัดสินว่าเกี่ยวข้องกับสามด้านนี้เท่านั้น โมเดลรุ่นก่อนหน้าอย่าง Opus 4.8 จะตอบแทน

ก่อนการเปิดตัว ทีมงานภายนอกใช้เวลากว่า 1,000 ชั่วโมงในการพยายามเจาะระบบ มีรายงานว่าไม่มีช่องโหว่ใด ๆ ที่จะเลี่ยงระบบทั้งหมดได้

การโต้ตอบจะถูกจัดเก็บเป็นเวลา 30 วันเพื่อการตรวจสอบด้านความปลอดภัย แต่คำแถลงอย่างเป็นทางการคือจะไม่ถูกนำไปใช้ในการฝึกอบรมโมเดล

พูดง่าย ๆ คือ กระบวนการคือ: "ถูกแบน -> เสริมมาตรการความปลอดภัย -> กลับมาให้บริการอีกครั้ง"

โปรดเข้าใจว่าความจริงที่เราสามารถใช้งานได้ตอนนี้ก็ต้องขอบคุณมาตรการความปลอดภัยเหล่านั้น

ความแตกต่างปรากฏให้เห็นในงานที่ซับซ้อน

ช่องว่างด้านประสิทธิภาพไม่ได้ปรากฏในเนื้อหาของคำถาม แต่อยู่ที่วิธีการให้ข้อมูล

ถ้าคุณเปลี่ยนมาใช้มัน ลองสองสามครั้ง แล้วรู้สึกว่า "ก็แค่นั้นเอง" นั่นเป็นเพราะวิธีที่คุณให้ข้อมูลยังคงเหมือนเดิม

คำอธิบายอย่างเป็นทางการคือ "ยิ่งงานยาวและซับซ้อนมากเท่าไหร่ ความแตกต่างจากโมเดลอื่น ๆ ก็ยิ่งมากขึ้นเท่านั้น"

ในทางกลับกัน แทบจะไม่มีความแตกต่างที่เห็นได้ชัดในการโต้ตอบสั้น ๆ

ตัวเลขก็สนับสนุนสิ่งนี้ ในการวัดประสิทธิภาพการเขียนโค้ด SWE-bench Pro มันได้คะแนน 80.3% ในขณะที่โมเดลอันดับต้นก่อนหน้านี้ Opus 4.8 อยู่ที่ 69.2%

ベク - inline image

ในการตรวจสอบความถูกต้องขององค์กรในช่วงแรก มีตัวอย่างอย่างเป็นทางการของงานที่ทีมมนุษย์ต้องใช้เวลากว่าสองเดือนในการทำให้เสร็จ แต่กลับเสร็จภายในวันเดียว

สิ่งที่เกี่ยวข้องอย่างมากสำหรับผู้ที่ไม่ใช่วิศวกรคือการทดสอบการวิเคราะห์สำหรับผู้เชี่ยวชาญด้านการเงิน Fable5 ทำคะแนนสูงสุดในบรรดาโมเดลทั้งหมด

การปรับปรุงอยู่ที่ความสามารถในการใช้เหตุผลขณะอ่านเอกสาร และความสามารถในการดึงตัวเลขจากกราฟและตาราง

พูดอีกอย่างคือ งานธุรการอย่าง "อ่านเอกสาร จัดระเบียบตัวเลข และสรุปเป็นรายงาน" มีประสิทธิภาพมากขึ้นอย่างมาก

ภารกิจที่ 1: การสำรวจและปรับปรุง Skills

เมื่อใช้ Claude Code "Skills" ถือเป็นสิ่งจำเป็น เมื่อคุณสอนวิธีการผ่าน Skills แล้ว Claude Code จะทำงานด้วยความสามารถในการทำซ้ำสูงตามวิธีการนั้นทุกครั้ง

อย่างไรก็ตาม ความแม่นยำของ Skills เหล่านี้ย่อมแตกต่างกันไปตามวิธีการเขียน Skilll.md หรือความรู้

ดังนั้น จึงควรปรับปรุงความแม่นยำของ Skills ของคุณในขณะที่ Fable5 ยังใช้งานได้

คุณจะไม่สามารถใช้ Fable5 ภายใต้ค่าสมัครสมาชิกได้ตลอดไป แต่ด้วยการใช้ความสามารถอันทรงพลังของ Fable5 เพื่อปรับปรุง Skills ของคุณตอนนี้ Claude Code จะสามารถทำงานได้อย่างแม่นยำมากขึ้นกว่าเดิมแม้เมื่อคุณกลับไปใช้โมเดลดั้งเดิม

พรอมต์สำหรับการสำรวจและปรับปรุง Skills

text
1Please inventory the skill group under .claude/skills/ and improve them from both defensive and offensive perspectives.
2
3## Purpose
4A skill is a "reproduction device for methods that worked in the past." Do two things:
5- Defense: Eliminate room for interpretation and outdated info so it works with the same quality regardless of the model or date.
6- Offense: Extract successful patterns from actual deliverables and feed them back into the skill to increase reproducibility.
7
8## Preparation
9- If the skills directory is under git, commit before working; if not, make a backup copy.
10- Location of usage history: [Path to work logs, deliverables, or products. If none, write "None" (Offense will be reduced)]
11
12## Defense: Diagnose all skills based on 6 items
13First, create a list (Skill Name / 1-line Role / Last Updated / Line Count). For each skill:
14- Triggering: Can the situation to use/not use be determined by the description alone? Are there overlapping trigger conditions with other skills?
15- Reproducibility: Are there instructions that change results based on the executor's interpretation (e.g., "appropriately," "nicely")? Are judgment criteria and default values written?
16- Examples: Is there at least one good and one bad example? (Examples define behavior most strongly)
17- Completion Criteria: Is what constitutes a pass written in an observable way?
18- Freshness: Do referenced paths, tools, and premises still exist? (Verify paths actually exist)
19- Structure: Is the main body bloated? Are details separated into reference files?
20
21## Offense: Strengthening from results
221. Feedback: Look for actual deliverables of each skill that were adopted, published, or passed without correction. If superior to existing examples in the skill, incorporate them as good examples. Conversely, extract NG examples and prohibited rules from corrected or rejected deliverables.
232. Discovery of Omissions: Look for work patterns repeated in logs but not yet turned into skills, and suggest them as new skill candidates (with trigger conditions, procedures, and completion criteria drafts).
24
25## Handling Changes
26- Implement directly: Objective corrections (dead paths, contradictions, factual errors) and additions that can be sourced from results. Always write the source for additions.
27- Proposals only: Things that change the skill's purpose, judgment criteria, or scope, or improvement ideas without a source. Provide options and recommendations for each proposal.
28
29## Completion Check
30For each modified skill, trace the procedure from the beginning as if you were an AI seeing it for the first time, and complete only after confirming no confusing parts remain.
31
32## Report
33- Diagnostic list (Severity: High/Medium/Low. Write "No issues" for skills with no problems)
34- Full diff of corrections (Offensive additions with sources)
35- List of new skill candidates and proposals requiring intention confirmation
36- How to revert

ภารกิจที่ 2: สร้างแผนแก้ไขสำหรับโค้ดที่เขียนไว้ก่อนหน้านี้

ถ้าคุณเคยให้ AI สร้างเครื่องมือหรือเว็บไซต์ คุณควรมีโค้ดอยู่ในมือ มันอาจจะทำงานได้ แต่เนื้อหาอาจซ้ำซ้อน หรือคุณอาจปล่อยให้สาเหตุของข้อผิดพลาดไม่ได้รับการแก้ไข

ให้ Fable5 อ่านทั้งหมดและให้มันจัดระเบียบและแก้ไขบั๊ก

สิ่งที่กำลังเป็นที่ฮือฮาที่สุดในต่างประเทศคือรายงานเกี่ยวกับด้าน "การแก้ไข" นี้ มันค้นหาและแก้ไขบั๊กเกมได้หกตัวในคืนเดียว ซึ่งไม่มีใครสามารถแก้ไขได้เป็นเวลาหลายสัปดาห์

มันอยู่ในระดับความแม่นยำที่ผู้รายงานเขียนว่า "เป็นครั้งแรกที่ฉันรู้สึกว่างานของฉันกำลังถูกแย่งไป"

อย่างไรก็ตาม ถ้าคุณให้ Fable5 ทำทุกอย่าง โทเค็นของคุณจะหมดในพริบตา คำแนะนำคือให้ Fable5 สร้างแผนแก้ไขและให้โมเดลอื่น ๆ ดำเนินการตามแผนนั้น

พรอมต์สำหรับการวางแผน Refactoring

text
1Please create a refactoring plan for [Project Path].
2This time, plan only. Do not change a single character of code.
3Since execution will be left to another AI, the success condition is: "The executor, given only this plan and the code, can complete the work safely and without hesitation."
4
5## Process
61. Read the entire code and create a structural map (roles of major files and dependencies).
72. Identify problems (duplication / giant functions / mixed responsibilities / dead code / inconsistent naming / error handling holes / scattered hardcoded values).
83. Prioritize by Effect x Risk and break down into work items.
94. Trace the completed plan from the beginning in execution order, verify that changes in previous items do not break premises for later items, and then submit.
10
11## Plan Structure
121. Current Understanding: What this code achieves and how (serves as context sharing for the executor).
132. Building a Safety Net (Execute first as Item 0):
14 - Pre-work commit procedure.
15 - Baseline verification method. If there are no tests, write "which behavior, with what input and expected output to fix" as characterization test specs at a granularity the executor can turn directly into test code.
163. Work Item List (Execution Order). Each item must include:
17 - ID / Target location (File path: line range)
18 - What the problem is (1-2 lines)
19 - How to change it (Specifically. For parts involving judgment, include code sketches before and after).
20 - Completion criteria (Command to run and expected result. For tests, include the target test name).
21 - Risk and how to revert if it fails.
22 - Dependency: ID of items that must be completed first.
234. "What Not to Do" List (Prohibit in advance things the executor might do out of goodwill, such as adding features, changing specs, or updating dependency libraries).
245. Instructions for the Executor (A format that can be copy-pasted when handing over the plan. Include "Execute one item at a time, commit after each item, and stop and report if completion criteria are not met").
25
26## Quality Standards
27- The executor has no context other than this plan and the code. Write down all premises in your head.
28- Split into granularity where 1 item = 1 commit and completion can be verified independently.
29- Do not leave expressions requiring the executor's interpretation, such as "organize XX," in work items.

สรุป

โมเดลที่ครั้งหนึ่งเคยถูกแบนได้กลับมาพร้อมกับชุดเกราะความปลอดภัย

ในตอนนี้ ภายในขอบเขตของการสมัครสมาชิก เรากำลังได้รับอนุญาตให้สัมผัสกับก้าวไปสู่อนาคต

วัสดุสำหรับตัดสินใจว่าจะใช้งานต่อไปหรือไม่นั้นไม่ใช่ตัวเลขมาตรฐาน แต่เป็นประสบการณ์ของคุณเอง

สรุปสามประเด็นหลัก:

  • Fable5 ใช้งานได้ฟรี (ภายใต้การสมัครสมาชิก) จนถึงวันที่ 7/7 หลังจากถูกแบน เสริมความปลอดภัย และนำกลับมาให้บริการอีกครั้ง
  • ช่องว่างของประสิทธิภาพจะกว้างขึ้นสำหรับงานที่ซับซ้อน
  • ลองปรับปรุง Skills และวางแผนแก้ไขโค้ดก่อน

ข้อควรระวัง: ถ้าการแตะต้อง Fable5 กลายเป็นเป้าหมาย นั่นก็เหมือนกับการสลับสับเปลี่ยนความสำคัญ

แม้ว่าคุณจะเปลี่ยนมีดทำครัวเป็นมีดระดับท็อป คุณก็ยังเป็นคนที่กำหนดเมนู

งานที่คุณต้องการมอบหมายมาก่อน การพูดถึงโมเดลมาทีหลัง

ช่วงเวลาที่คุณลืมลำดับนี้ คุณจะกลายเป็นแค่นักแสวงหาความแปลกใหม่

ถึงผู้ที่บุ๊กมาร์กไว้ครั้งที่แล้วและจบลงโดยไม่ได้ใช้ Fable5:

พลังที่ครั้งหนึ่งเคยถูกแบน กลับมาอยู่ตรงหน้าคุณอีกครั้งในช่วงเวลาจำกัด

ในโอกาสที่สองนี้ คุณจะลองมอบหมายอะไรให้มันทำ?

สุดท้ายนี้

ปกติผมจะโพสต์เกี่ยวกับข้อมูล AI ล่าสุดและวิธีการสร้างรายได้จาก AI

ถ้าบทความนี้มีประโยชน์ ผมยินดีถ้าคุณติดตามหรืออ้างอิงมัน

นอกจากนี้ ตอนนี้ผมกำลังแจกสิทธิประโยชน์หลัก 55 รายการฟรี รวมถึงคู่มือฉบับสมบูรณ์เกี่ยวกับวิธีการแนะนำ Claude Code และวิธีการสร้างรายได้ ถ้าคุณยังไม่ได้รับ กรุณารับได้ที่นี่

https://utage-system.com/line/open/cwgwX1a35XDK?mtid=FNAamIuYaEet

ベク - inline image

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
สำหรับครีเอเตอร์

เปลี่ยน Markdown ของคุณให้เป็นบทความ 𝕏 ที่สะอาดตา

เวลาคุณเผยแพร่งานเขียนยาวของตัวเอง การจัดรูปแบบรูปภาพ ตาราง และบล็อกโค้ดให้เข้ากับ 𝕏 นั้นน่าปวดหัว YouMind เปลี่ยนร่าง Markdown ทั้งฉบับให้เป็นบทความ 𝕏 ที่สะอาดตาและพร้อมโพสต์ทันที

ลอง Markdown เป็น 𝕏

แพตเทิร์นให้ถอดรหัสเพิ่มเติม

บทความไวรัลล่าสุด

สำรวจบทความไวรัลเพิ่มเติม