Come ridurre il costo dei token di Fable 5 del 50% o più
Claude Fable 5 è il miglior modello AI che abbia mai usato. Punto.
Il problema è che costa incredibilmente caro.
Nelle prime ore di test, ho quasi esaurito il mio intero limite di utilizzo, e non stavo nemmeno facendo niente di folle.
Fable costa esattamente il doppio di Opus 4.8, ed essendo così intelligente, tende a pensarci troppo, creando loop e bruciando token in modi che nessun precedente modello Claude ha mai fatto.
Imparare a usare correttamente questo nuovo modello è più importante che mai.
In questa guida, ti spiegherò esattamente il sistema 10-80-10 che ho sviluppato per ridurre significativamente i costi dei token di Fable, e questi consigli arrivano direttamente dagli ingegneri di Anthropic.
Alla fine dell'articolo, ho creato un documento che puoi inserire direttamente in Fable e che riassume l'intero mio framework.
Questo documento ridurrà immediatamente la tua spesa in token.
Restate fino alla fine e lo condividerò direttamente con voi.

Il mio documento del framework
I: Spiegazione del Sistema 10-80-10
Il sistema 10-80-10 è un framework semplice per usare Fable in modo efficiente solo dove è realmente necessario.
Questo è esattamente il framework che gli ingegneri di Anthropic usano loro stessi.
Ecco come si suddivide:
Il primo 10%: Pianificazione
Prima di affrontare qualsiasi progetto AI, usa Fable per definire la struttura, l'approccio, i criteri di successo e i vincoli.
Pensa se dovessi costruire una casa. La parte più importante è ottenere l'architettura e la pianificazione giuste. Altrimenti, i costruttori eseguiranno un progetto scadente.
Fable 5 è un eccellente architetto; usalo come tale.
L'80% centrale: Esecuzione
La maggior parte dei token viene bruciata nel vai e vieni, nell'iterazione, nelle piccole correzioni, nel lavoro di routine del completamento delle attività.
Per il livello di esecuzione dei tuoi progetti AI, dovresti usare un modello più economico, come Opus 4.8 per lavori standard o Haiku per attività leggere.
Ottieni il vantaggio dell'architettura di Fable senza pagare i prezzi di Fable per ogni token di esecuzione (che è comunque eccessivo).
Il 10% finale: Revisione
Una volta completata l'esecuzione, richiama Fable. Fallo revisionare l'output rispetto all'architettura originale.
Il risultato corrisponde al piano? Ci sono lacune? C'è bisogno di correzioni prima del rilascio?
Questo passaggio finale è dove l'intelligenza di Fable coglie ciò che i modelli più economici perdono, e poiché sta revisionando un output finito anziché generare da zero, usa molti meno token di quanti ne userebbe se avesse svolto l'intera attività da solo.

Sistema 10-80-10
Questo è l'intero framework 10-80-10 che ti permette di ottenere tutti i vantaggi di Fable, senza gli svantaggi del costo dei token.
Modelli come Opus 4.8 sono altrettanto capaci di gestire il livello di esecuzione, e questo sistema evita la tendenza di Fable a volere tutto "perfetto" con molteplici loop, ricerche approfondite, ecc.
II: Spiegazione dei Loop
Farò un articolo approfondito su questo, ma voglio coprire brevemente /loop, poiché è il modo più potente per usare Fable 5 al momento.
Lance Martin ( @RLanceMartin ), un ingegnere di Anthropic, ha pubblicato una guida sulla progettazione di loop per modelli di classe Mythos.
Consiglio vivamente di leggere questo articolo, ma lo riassumerò qui sotto.
https://x.com/RLanceMartin/status/2064397389189071163
Il Vecchio Metodo vs Il Nuovo Metodo di Prompting
Il vecchio metodo di prompting funzionava così:
Tu fai un prompt → Claude risponde → Tu revisioni → Tu rifai il prompt → Ripeti
In quel modello, tu sei il loop.
Verifichi manualmente ogni passaggio di verifica, ogni correzione e ogni follow-up.
I loop automatizzano l'intero processo e ti rimuovono come collo di bottiglia.
Con l'ingegneria dei loop, dai a Fable un obiettivo in anticipo, e poi genererà sotto-agenti per lavorare verso quell'obiettivo.
Progetta il loop → Fable genera sotto-agenti di verifica → Gli agenti si auto-promptano per completare l'obiettivo

Ingegneria del prompt versus ingegneria del loop
/goal e /loop spiegati
Questi due comandi sono l'implementazione pratica dell'ingegneria dei loop all'interno di Claude Code.
/goal è il punto di partenza.
STRUTTURA DEL PROMPT
/goal [compito] fino a [stato finale misurabile] senza [vincoli]
/loop porta questo un passo oltre.
Invece di una singola esecuzione, /loop riesegue il prompt a un intervallo predeterminato.
/loop [il tuo prompt qui] --interval 30m --expires 8h

/goal versus /loop
La combinazione è estremamente potente.
Usa /goal per definire il compito una volta, e usa /loop per farlo eseguire automaticamente secondo la pianificazione più adatta al lavoro.
Usare praticamente l'ingegneria dei loop per una spesa di token più economica
È qui che il sistema 10-80-10 fa la sua magia.
Con il framework 10-80-10, Fable gestisce il 10% di pianificazione iniziale architettando il loop; il modello più economico gestisce l'80% di esecuzione; e Fable rientra in gioco solo quando il loop si chiude o quando necessario.
Puoi persino usare GPT-5.5 nel livello di esecuzione, il che può ridurre la spesa in token del 50% o più.
III: Consigli Generali per Risparmiare Token
Il sistema 10-80-10 e i loop gestiscono l'efficienza a grandi linee: questi sono gli aggiustamenti più piccoli che possono comunque fare la differenza.
- Selezione dello Sforzo
Inizia con sforzo medio, non massimo.
Fable con sforzo medio batte Opus con sforzo extra alto. Aumenta solo se riscontri realmente problemi di qualità. Impostare tutto al massimo è uno dei modi più veloci per bruciare il tuo limite.
Alcuni utenti riferiscono addirittura di usare Fable con sforzo Basso e ottenere output sorprendenti.
- Elimina vecchie skill e istruzioni
I prompt costruiti per modelli precedenti spesso funzionano peggio in Fable.
Istruzioni più brevi e pulite funzionano meglio e costano meno in Fable (Fable capirà comunque le cose da solo).
- Spiega a Fable il perché di tutto
Fable azzecca le cose al primo tentativo più spesso quando comprende l'intento dietro la richiesta.
Meno correzioni e cicli di iterazione significano anche molti meno token bruciati.
Nota che questo modello è costruito per lavoro completamente autonomo, e se non gli dai il "perché" delle cose, deve pensare di più per trovare i passaggi successivi.
- /usage
Monitora attivamente il tuo utilizzo. Esegui /usage regolarmente in Claude Code. Una volta che Fable passerà al pagamento per token il 7 luglio, questo diventerà essenziale.
Ho scritto un'intera guida al prompting di Fable 5 qui - molti dei suggerimenti menzionati qui ridurranno anche la tua spesa in token
https://x.com/aiedge_/status/2065064961999847849
IV: Errori Costosi con Fable
Questi sono i due errori che vale la pena evidenziare specificamente perché sono facili da trascurare e possono essere costosi se non li affronti.
Errore 1: Usare accidentalmente Fable quando non intendevi farlo.
Quando apri Claude Code o l'app Claude, ora viene impostato automaticamente su Fable.
Anthropic sta attivamente incentivando le persone a testare il modello in questo momento.
Consiglio semplice: Controlla il selettore del modello prima di ogni sessione. Mi sono già sorpreso a usare Fable accidentalmente in chat normali.
Errore 2: Nessun limite di spesa
Il 7 luglio, Fable uscirà dagli abbonamenti standard.
Se vuoi continuare a usarlo oltre il limite del tuo piano, dovrai aggiungere una carta di credito e pagare per token.
La trappola è non avere un limite massimo sulla tua carta di credito.
Fable brucia token velocemente in esecuzioni autonome e sessioni lunghe. Senza un limite, puoi accumulare una bolletta significativa prima ancora di rendertene conto.
Puoi impostare la tua spesa mensile in Impostazioni → Utilizzo → Regola Limite

Imposta spesa mensile
Conclusione
Quindi, ecco qua.
Il mio intero framework per ridurre significativamente i costi dei token di Fable.
Spero che questo articolo ti sia stato utile.
Se è stato così, assicurati di seguirmi @milesdeutscher e @aiedge_ - ogni singola settimana pubblico guide pratiche sull'AI per tenerti al passo in questo spazio pazzesco.
Come promesso, ho creato un documento che puoi inviare direttamente a Fable per ridurre la spesa in token il prima possibile.

Documento del sistema 10-80-10 anteprima
Per accedere al documento completo:
- Iscriviti gratuitamente alla newsletter AI Edge
- Unisciti alla mia community gratuita su Instagram così posso inviartelo
Inizia qui.👇

Grazie per aver letto, se sei arrivato fino a qui.💙





