Come utilizzare al meglio Fable 5, direttamente dal team che lo ha creato

@cyrilXBT
INGLESE2 giorni fa · 02 lug 2026
400K
397
48
12
1.3K

TL;DR

Questa guida analizza le strategie ufficiali di Anthropic per Fable 5, concentrandosi sulla gestione di attività autonome ad alta latenza, sulla proattività del modello e sull'implementazione di sistemi di memoria persistente.

Fable 5 è tornato a livello globale da oggi, 1° luglio 2026.

Prima di aprirlo e lanciare gli stessi prompt che usavi su Opus 4.8, leggi questo. Anthropic ha pubblicato una guida ufficiale al prompting specifica per Fable 5, e la cosa più importante che dice è che la maggior parte dei team sottovaluta il modello testandolo sulle cose sbagliate.

Fable 5 non è una versione più intelligente dello stesso strumento che hai usato finora. È una categoria diversa di strumento che richiede una categoria diversa di prompt. I team che ottengono i risultati migliori non sono quelli che scrivono domande migliori. Sono quelli che gli affidano problemi più difficili, strutturano le esecuzioni lunghe in modo diverso e capiscono quali cambiamenti comportamentali in Fable 5 richiedono aggiornamenti ai prompt prima che i flussi di lavoro esistenti si rompano.

Questa è l'analisi completa di ciò che quella guida dice realmente, con tutto ciò di cui hai bisogno per iniziare a usare Fable 5 come Anthropic intende.

A Cosa Serve Realmente Fable 5

La cornice più chiara nella guida ufficiale di Anthropic è questa: Fable 5 affronta problemi che erano precedentemente troppo complessi, di lunga durata o ambigui per i modelli precedenti. È particolarmente efficace per lavori end-to-end che richiedono a una persona ore, giorni o settimane per essere completati.

Quella frase sta facendo più lavoro di quanto sembri. Ti sta dicendo dove risiede realmente il vantaggio del modello, e non è in risposte one-shot più veloci a domande semplici. È in un lavoro sostenuto, autonomo e multi-stadio che i modelli precedenti avrebbero frammentato, allucinato o semplicemente smesso di completare correttamente a metà strada.

La guida ufficiale è esplicita: testare Fable 5 solo su carichi di lavoro più semplici tende a sottovalutare le sue capacità. Se i tuoi prompt di valutazione sono compiti brevi e ben definiti che già completavi bene con Opus 4.8, vedrai un miglioramento marginale e concluderai che Fable 5 non vale il costo. I team che riportano risultati genuinamente diversi lo stanno applicando ai loro problemi irrisolti più difficili, quelli che in precedenza richiedevano ore di iterazione umana, sessioni multiple di andata e ritorno, o che crollavano nella fase di esecuzione.

In pratica, questo significa che la prima domanda da porsi quando si valuta Fable 5 non è "come se la cava con i miei prompt attuali?" È "cosa abbiamo smesso di cercare di automatizzare perché nessun modello riusciva a completarlo in modo affidabile?" Quei flussi di lavoro abbandonati sono dove Fable 5 inizia ad assomigliare a un prodotto completamente diverso.

Il Più Grande Cambiamento Comportamentale: Le Risposte Richiedono Più Tempo

La prima cosa che sorprende i team che migrano da Opus 4.8 a Fable 5 è la latenza di risposta. La guida di Anthropic nomina questo direttamente come la fonte più comune di confusione per i team che effettuano il passaggio.

Ad alto sforzo, una singola risposta può richiedere minuti. In esecuzioni autonome, può richiedere ore. Questo non è un bug o un segno di inefficienza. È il modello che fa correttamente il lavoro. Fable 5 pianifica prima di agire, controlla il proprio lavoro, espande il contesto secondo necessità e non si affretta a produrre un output rapido che richieda di fare subito un altro prompt per correggere ciò che è andato storto.

L'implicazione pratica è che le tue impostazioni di timeout quasi certamente necessitano di un aggiornamento se stai eseguendo Fable 5 tramite API. Anthropic raccomanda esplicitamente di rivedere la strategia di timeout come parte di qualsiasi migrazione da Opus 4.8. Un timeout che aveva senso per un modello che produceva una risposta in dieci secondi romperà i flussi di lavoro in cui Fable 5 sta correttamente impiegando tre minuti per pianificare un compito complesso multi-stadio.

Il parametro effort controlla quanto profondamente Fable 5 pensa prima di rispondere. High è l'impostazione predefinita ed è appropriata per la maggior parte dei lavori impegnativi. xhigh è il massimo ed è raccomandato quando la correttezza al primo tentativo è più importante della velocità, poiché Fable 5 a xhigh rifletterà e convaliderà il proprio lavoro prima di rispondere. Medium e low sono disponibili per sotto-attività di routine dove la piena capacità non è necessaria e il costo è importante.

Il principio chiave: il livello di effort non è una manopola della qualità che alzi per ottenere risposte migliori. È un compromesso tra costo e latenza che calibri in base a ciò che il compito specifico richiede realmente. Una migrazione di un codebase merita xhigh. Un semplice compito di formattazione no.

Come Controllare lo Sforzo nei Prompt

Per compiti in cui desideri il massimo ragionamento senza eseguire un flusso di lavoro dinamico con agenti paralleli, puoi controllare lo sforzo direttamente nel tuo prompt.

Per la profondità a turno singolo, includi "ultrathink" nel tuo prompt. Questo segnala uno sforzo di ragionamento xhigh per quella risposta specifica senza modificare altre impostazioni della sessione o attivare l'orchestrazione del flusso di lavoro.

Per flussi di lavoro automatici a livello di sessione, imposta /effort ultracode in Claude Code. Questo combina il ragionamento xhigh con l'orchestrazione automatica del flusso di lavoro dinamico per ogni compito sostanziale nella sessione. Una nota importante che la documentazione di Anthropic chiarisce: ultracode richiede un modello che supporti lo sforzo xhigh. Ciò attualmente significa Fable 5, Opus 4.8 e Opus 4.7. Sonnet 4.6 e modelli precedenti non lo supportano.

Per le integrazioni API, usa il parametro effort direttamente nella richiesta. La catena di pensiero grezza non viene mai restituita per Fable 5 e Mythos 5. L'impostazione thinking.display controlla cosa contengono i blocchi di pensiero: "summarized" restituisce un riepilogo leggibile, "omitted" è l'impostazione predefinita e restituisce campi di pensiero vuoti.

Il Prompt di Verifica del Progresso

Questa è la tecnica di prompt più utile nella guida ufficiale di Anthropic, ed è specifica per le lunghe esecuzioni autonome di Fable 5.

Il problema che risolve: in compiti multi-step estesi, Fable 5 a volte può segnalare che un passaggio è completo quando non è stato verificato rispetto ai risultati di esecuzione effettivi. Questo è il problema "l'ho fatto", e diventa più probabile quanto più lungo e complesso è il compito.

I test di Anthropic hanno scoperto che un'istruzione specifica elimina quasi completamente questo problema anche su compiti progettati esplicitamente per indurre rapporti di progresso fabbricati. Aggiungi questo a qualsiasi prompt di compito autonomo lungo:

"Prima di riportare il progresso, verifica ogni affermazione rispetto a un risultato dello strumento di questa sessione. Riporta solo il lavoro per cui puoi indicare prove. Se qualcosa non è ancora verificato, dillo esplicitamente. Riporta i risultati fedelmente: se i test falliscono, dillo con l'output. Se un passaggio è stato saltato, dichiaralo. Quando qualcosa è fatto e verificato, dichiaralo chiaramente senza esitazione."

Questa istruzione ristruttura il modo in cui Fable 5 tratta i propri rapporti di stato. Invece di riassumere ciò che crede sia successo, incrocia ogni affermazione con i risultati effettivi dell'esecuzione dello strumento prima di riportare. La parola "verifica" sta facendo un lavoro specifico qui. Anthropic ha testato molteplici formulazioni e ha scoperto che il linguaggio di verifica produceva un autocontrollo più affidabile rispetto a equivalenti più morbidi.

Per qualsiasi flusso di lavoro che duri più di qualche minuto o che coinvolga l'esecuzione di strumenti, questa istruzione appartiene al tuo prompt di sistema, non solo al prompt del compito.

Il Problema della Proattività e Come Contenerla

Fable 5 è più proattivo di Opus 4.8. Notevolmente di più. In pratica, ciò significa che a volte intraprenderà azioni non richieste quando deduce che un'azione sarebbe utile, anche se non gliel'hai chiesto esplicitamente.

Gli esempi che Anthropic fornisce nella guida ufficiale: abbozzare un'email quando non ne è stata richiesta nessuna, o creare un backup del ramo git difensivo prima di apportare modifiche. Questi comportamenti non sono errori dal punto di vista di Fable 5. Sono il modello che è genuinamente utile in base a ciò che deduce che probabilmente vuoi.

Il problema è che le azioni non richieste nei flussi di lavoro di produzione, specialmente quelli che toccano sistemi esterni, email, git o file, possono causare problemi reali. Un modello che invia un'email a un cliente senza che gli venga chiesto o crea rami imprevisti in un repository non è un modello che puoi eseguire incustodito senza esplicite barriere di protezione.

La soluzione è semplice ma deve essere in ogni prompt di sistema per qualsiasi flusso di lavoro automatizzato o incustodito:

"Quando l'utente sta descrivendo un problema, facendo una domanda o pensando ad alta voce piuttosto che richiedere una modifica, il risultato è la tua valutazione. Riporta le tue conclusioni e fermati. Non applicare una correzione finché non ti viene chiesto. Prima di eseguire un comando che modifica lo stato del sistema, inclusi riavvii, eliminazioni o modifiche alla configurazione, conferma che le prove supportano effettivamente quell'azione specifica."

Questa istruzione definisce esplicitamente il confine tra osservare e agire, che Fable 5 deve avere chiaramente indicato piuttosto che dedotto. La parte più importante di questo vincolo è la seconda frase: riporta le conclusioni e fermati. Fable 5 deve sapere che una valutazione è un risultato completo, non un precursore di un'azione immediata.

Il Prompt del Sistema di Memoria

Fable 5 è particolarmente potente quando è dotato di un sistema di memoria persistente che accumula lezioni attraverso le sessioni. La guida ufficiale raccomanda una struttura specifica per questo.

Ogni lezione ottiene il proprio file Markdown con un riepilogo di una riga all'inizio. Il file registra cosa è stato appreso, cosa è stato corretto, quale approccio è stato confermato e perché ciascuna di queste cose era importante. Fondamentalmente, registra solo ciò che il repository o la cronologia della chat non registrano già. I duplicati vengono uniti piuttosto che accumulati. Le note che si rivelano errate vengono cancellate, non solo abbandonate.

Il prompt pratico per stabilire questo all'inizio di un progetto lungo:

"Mantieni un sistema di memoria in [cartella]. Memorizza una lezione per file con un riepilogo di una riga all'inizio. Registra correzioni e approcci confermati allo stesso modo, incluso perché erano importanti. Non salvare informazioni già presenti nel repo o nella cronologia della chat. Aggiorna le note esistenti piuttosto che crearne di duplicate. Elimina le note che si sono rivelate errate."

Alla fine di sessioni di lavoro significative, chiudi con:

"Rifletti sulle sessioni che abbiamo avuto. Usa sotto-agenti per identificare temi e lezioni principali e memorizzali in [cartella]. Fai riferimento a [cartella] all'inizio delle sessioni future."

Questo crea una base di conoscenza che sopravvive ai confini della sessione, che è il meccanismo effettivo alla base della capacità di Fable 5 di mantenere coerenza in compiti di più giorni. Senza di essa, ogni sessione parte da zero. Con essa, il modello entra in ogni sessione già consapevole di ciò che è stato appreso, quali approcci sono stati convalidati e cosa evitare.

L'Istruzione per la Risposta Finale

Le lunghe esecuzioni autonome producono una specifica modalità di fallimento che la guida di Anthropic affronta direttamente. Dopo un uso prolungato degli strumenti e un'esecuzione multi-stadio, il modello accumula scorciatoie di contesto interno che rendono il suo output finale difficile da analizzare per chiunque non abbia seguito ogni passaggio.

Il problema si presenta così: Fable 5 completa una complessa migrazione multi-stadio, poi riassume il risultato usando abbreviazioni interne, catene di frecce e abbreviazioni che hanno senso solo se hai seguito ogni output dell'agente in tempo reale. L'utente, che voleva semplicemente sapere se la migrazione è riuscita e cosa fare dopo, riceve un dump tecnico invece di una risposta chiara.

La soluzione è un vincolo sulla risposta finale aggiunto a qualsiasi prompt di flusso di lavoro di lunga durata:

"Per la tua risposta finale dopo questo compito: indica prima il risultato, poi i dettagli di supporto chiave. Non includere abbreviazioni di lavoro, etichette interne o catene di frecce nell'output rivolto all'utente. Gli utenti hanno bisogno del risultato, delle prove, dei rischi se presenti e del passaggio successivo."

Questa istruzione non riguarda l'imbarbarimento dell'output. Riguarda la separazione del processo di lavoro interno del modello dalla risposta che l'utente finale riceve effettivamente. Il processo di lavoro dovrebbe essere approfondito. La risposta finale dovrebbe essere pulita.

Il Pattern di Delega ai Sotto-Agenti

Fable 5 può generare e coordinare i propri sotto-agenti su compiti complessi, ma la guida ufficiale nota che ha bisogno di un permesso esplicito e di una chiara struttura di passaggio di consegne per farlo bene.

Il pattern di delega che produce i migliori risultati coinvolge tre istruzioni che lavorano insieme. Primo, dì esplicitamente a Fable 5 quando è autorizzato a delegare rispetto a quando dovrebbe gestire il compito da solo. Secondo, dai a ogni sotto-agente un ambito specifico e delimitato con criteri di successo espliciti piuttosto che un'istruzione vaga. Terzo, specifica cosa dovrebbe fare l'agente coordinatore mentre i sotto-agenti sono in esecuzione, poiché Fable 5 può continuare a lavorare su parti indipendenti dello stesso compito invece di aspettare che i sotto-agenti riferiscano.

Un pattern pratico per lavori di ricerca complessi o codebase:

"Delega sotto-compiti indipendenti a sotto-agenti e continua a lavorare mentre sono in esecuzione. Ogni sotto-agente dovrebbe ricevere un ambito specifico e delimitato e criteri di successo espliciti. Sintetizza i risultati dei sotto-agenti solo dopo che tutti hanno riferito. Se un sotto-agente fallisce o non può completare il suo ambito, riportalo chiaramente nella sintesi piuttosto che dedurre ciò che sarebbe stato trovato."

La riga più importante è l'ultima. Fable 5 non dovrebbe riempire i risultati mancanti dei sotto-agenti con deduzioni. Se un sotto-agente fallisce, quel fallimento è informazione, e la sintesi finale deve rifletterlo accuratamente.

Il Classificatore di Sicurezza e il Fallback

Fable 5 include classificatori di sicurezza che prendono di mira tecniche offensive di cybersicurezza, contenuti di biologia e scienze della vita, e l'estrazione del pensiero riassunto del modello. Quando una richiesta attiva questi classificatori, la risposta include stop_reason "refusal" come HTTP 200, non un errore.

Per le integrazioni API, ciò significa che la gestione degli errori deve controllare stop_reason separatamente dallo stato HTTP. Un rifiuto è una chiamata API riuscita con un tipo di risposta specifico, non un fallimento. Anthropic fornisce middleware SDK per il fallback automatico a Opus 4.8 in caso di rifiuti, e i costi di prompt-cache sui rifiuti in cui non è stato generato alcun output sono coperti.

L'implicazione pratica per la maggior parte degli sviluppatori: secondo i test di Anthropic, i rifiuti riguardano meno del cinque percento delle tipiche query degli sviluppatori, ma possono apparire su compiti benigni di biologia o revisione del codice che toccano domini sensibili. Testare i tuoi flussi di lavoro specifici per il comportamento di rifiuto prima di distribuire in produzione è raccomandato, specialmente se il tuo caso d'uso coinvolge uno qualsiasi dei domini contrassegnati.

Mythos 5 rimuove i classificatori di cybersicurezza mantenendo quelli di biologia e chimica, ed è disponibile solo per i partner di Project Glasswing. Per tutti gli altri, il comportamento di Fable 5 sui compiti adiacenti alla cybersicurezza instraderà a Opus 4.8, che gestisce la stessa richiesta al prezzo di Opus piuttosto che al prezzo di Fable.

Il Prompt per la Visione in Fable 5

La capacità di visione di Fable 5 è significativamente migliorata rispetto a Opus 4.8, e la guida ufficiale dedica indicazioni specifiche per usarla efficacemente.

Il cambiamento principale: Fable 5 interpreta immagini tecniche dense, applicazioni web e screenshot dettagliati con una precisione sostanzialmente maggiore, spesso usando meno token di output rispetto a Opus 4.8 sullo stesso compito. È anche addestrato a usare attivamente gli strumenti bash e crop quando un'immagine caricata è capovolta, sfocata o altrimenti disturbata, piuttosto che tentare di interpretare un input degradato direttamente.

L'implicazione pratica per il prompting è che puoi passare a Fable 5 screenshot reali e grezzi da applicazioni live senza pre-elaborarli. Mentre Opus 4.8 richiedeva immagini pulite e ad alto contrasto per estrarre informazioni utili, Fable 5 gestisce input più disordinati e sa quando ritagliare o rielaborare prima di provare a leggere il contenuto.

Per i flussi di lavoro di codifica in particolare, Fable 5 può usare la visione per valutare il proprio output. La guida nota che è addestrato a controllare il lavoro di codifica rispetto a un design o obiettivo originale usando screenshot, il che significa che puoi dargli un mockup di design e uno screenshot live di ciò che ha costruito e chiedergli di identificare le differenze. Questo chiude un ciclo che in precedenza richiedeva un revisore umano che confrontasse l'output visivo.

Un pattern di prompt pratico per lavori UI o frontend:

"Ecco il target di design e uno screenshot dell'implementazione corrente. Usa la visione per identificare le differenze e generare le modifiche necessarie per colmare il divario. Ritaglia e ingrandisci in qualsiasi area in cui il confronto non è chiaro prima di riportare le conclusioni."

L'istruzione esplicita di ritagliare e ingrandire vale la pena di essere inclusa perché sblocca il comportamento dello strumento bash che gestisce input disturbati. Senza di essa, Fable 5 potrebbe tentare di interpretare un'area piccola o sfocata piuttosto che pre-elaborarla.

La Checklist di Migrazione

Se stai spostando un flusso di lavoro esistente di Opus 4.8 su Fable 5, la guida di Anthropic è esplicita: scambiare i nomi dei modelli non è una migrazione completa. Le seguenti aree necessitano di revisione prima di considerare un'integrazione di Fable 5 pronta per la produzione.

Timeout. Qualsiasi timeout impostato per la velocità di risposta di Opus 4.8 è probabilmente troppo breve per Fable 5 ad alto sforzo. Controlla ogni timeout nel tuo stack e estendili prima di testare.

Gestione dei rifiuti. Aggiungi la gestione di stop_reason "refusal" all'analisi della risposta API. Questo è un HTTP 200 con una struttura di risposta specifica, non un errore. Imposta il fallback a Opus 4.8 per qualsiasi dominio che possa attivare i classificatori di sicurezza.

Vincoli di proattività. Aggiungi il vincolo esplicito sulle azioni non richieste a qualsiasi prompt di sistema che verrà eseguito in un contesto automatizzato o incustodito. Non dare per scontato che Fable 5 dedurrà gli stessi confini entro cui operava Opus 4.8.

Verifica del progresso. Per qualsiasi flusso di lavoro più lungo di qualche minuto o che coinvolga l'esecuzione di strumenti, aggiungi l'istruzione di verifica al tuo prompt di sistema prima della prima esecuzione in produzione.

Struttura della memoria. Se il flusso di lavoro verrà eseguito attraverso più sessioni, imposta la struttura dei file delle lezioni e aggiungi il prompt di riflessione a fine sessione prima della prima esecuzione lunga.

Formato della risposta finale. Aggiungi il vincolo di risposta con il risultato per primo a qualsiasi flusso di lavoro che presenti output direttamente agli utenti finali o a sistemi downstream che si aspettano testo strutturato e pulito.

Ambito del test. Prima di segnare la migrazione come completa, testa il flusso di lavoro su almeno un compito che era genuinamente difficile o impossibile per Opus 4.8. È qui che vedrai se Fable 5 sta facendo qualcosa di materialmente diverso o producendo la stessa qualità a un costo maggiore.

La migrazione è completa quando ciascuna di queste sei aree è stata affrontata e il tuo flusso di lavoro più difficile viene eseguito in modo pulito dall'inizio alla fine, senza intervento manuale, al primo tentativo.

Quest'ultimo criterio, il completamento al primo tentativo di un lavoro difficile, è il vero parametro di riferimento per stabilire se una migrazione a Fable 5 è valsa la pena. Se il tuo flusso di lavoro più complesso ora si completa in una singola esecuzione autonoma ciò che in precedenza richiedeva sessioni multiple e diversi cicli di correzione umana, il modello sta facendo ciò per cui è stato costruito.

La raccomandazione pratica della guida ufficiale per i team nuovi a Fable 5 è di iniziare con il lavoro che non sei stato in grado di completare in modo affidabile, non con il lavoro che hai già risolto.

Scegli un compito che in precedenza richiedeva sessioni multiple e un significativo intervento umano tra di esse. Dai a Fable 5 il contesto completo, l'obiettivo completo e i vincoli di questa guida, inclusa l'istruzione di verifica del progresso, il vincolo di proattività e l'istruzione sul formato della risposta finale. Eseguilo a sforzo xhigh. Rivedi ciò che produce.

Il divario tra quell'esperienza e l'esecuzione dello stesso prompt su Opus 4.8 è dove il valore effettivo di Fable 5 diventa leggibile. Se vedi una differenza significativa lì, il modello sta facendo ciò per cui è progettato. Se i compiti sembrano uguali, probabilmente stai testando nella categoria in cui entrambi i modelli funzionano in modo simile, che è la maggior parte del lavoro di routine, e dovresti passare a problemi più difficili.

Fable 5 non è un sostituto di Opus 4.8 in tutti i casi d'uso. È uno specialista per il sottoinsieme di lavoro in cui l'autonomia sostenuta, la correttezza al primo tentativo su compiti complessi e la coerenza in contesti lunghi sono le dimensioni che contano di più.

Per tutto il resto, Opus 4.8 è più veloce, più economico e sufficiente.

Segui @cyrilXBT per saperne di più sulla creazione con Claude.

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
Per i creator

Trasforma il tuo Markdown in un articolo 𝕏 pulito

Quando pubblichi i tuoi testi lunghi, formattare immagini, tabelle e blocchi di codice per 𝕏 è una seccatura. YouMind trasforma un'intera bozza Markdown in un articolo 𝕏 pulito e pronto da pubblicare.

Prova Markdown verso 𝕏

Altri pattern da decodificare

Articoli virali recenti

Esplora altri articoli virali