So nutzen Sie Claude Fable 5, ohne pleitezugehen

@milesdeutscher
ENGLISCHvor 2 Tagen · 02. Juli 2026
120K
178
29
18
319

TL;DR

Miles Deutscher stellt das 10-80-10-Framework zur Optimierung der Nutzung von Claude Fable 5 vor. Dabei wird das Modell für Planung und Überprüfung eingesetzt, während die Ausführung an kostengünstigere Modelle delegiert wird.

So senken Sie Ihre Fable 5-Token-Kosten um über 50 %

Claude Fable 5 ist das beste KI-Modell, das ich je verwendet habe. Punkt.

Das Problem ist, dass es wahnsinnig teuer ist.

In den ersten Teststunden habe ich fast mein gesamtes Nutzungslimit aufgebraucht – und das, obwohl ich nichts Verrücktes gemacht habe.

Fable kostet genau doppelt so viel wie Opus 4.8, und weil es so intelligent ist, denkt es tatsächlich zu viel nach, gerät in Schleifen und verbrennt Tokens auf eine Weise, wie es kein früheres Claude-Modell getan hat.

Zu lernen, wie man dieses neue Modell richtig einsetzt, ist wichtiger denn je.

In diesem Leitfaden stelle ich Ihnen das genaue 10-80-10-System vor, das ich entwickelt habe, um meine Fable-Token-Kosten drastisch zu senken – und diese Ratschläge stammen direkt von den Anthropic-Ingenieuren selbst.

Ganz am Ende des Artikels habe ich ein Dokument erstellt, das Sie direkt in Fable einfügen können und das mein gesamtes Framework zusammenfasst.

Dieses Dokument wird Ihren Token-Verbrauch sofort reduzieren.

Bleiben Sie bis zum Ende dran, und ich werde es Ihnen direkt zur Verfügung stellen.

Miles Deutscher - inline image

Mein Framework \Dokument\

I: Das 10-80-10-System erklärt

Das 10-80-10-System ist ein einfaches Framework, um Fable nur dort effizient einzusetzen, wo es wirklich gebraucht wird.

Dies ist genau das Framework, das die Anthropic-Ingenieure selbst verwenden.

So funktioniert es:

Die ersten 10 %: Planung

Bevor Sie ein KI-Projekt angehen, sollten Sie Fable nutzen, um die Struktur, den Ansatz, die Erfolgskriterien und die Einschränkungen zu definieren.

Stellen Sie sich vor, Sie bauen ein Haus. Der wichtigste Teil ist, die Architektur und Planung richtig hinzubekommen. Sonst setzen die Bauarbeiter nur einen schlechten Plan um.

Fable 5 ist ein hervorragender Architekt; nutzen Sie es als solchen.

Die mittleren 80 %: Ausführung

Die meisten Tokens werden im Hin und Her, bei der Iteration, den kleinen Korrekturen und der eigentlichen Routinearbeit der Aufgabenerledigung verbrannt.

Für die Ausführungsebene Ihrer KI-Projekte sollten Sie ein günstigeres Modell verwenden, wie Opus 4.8 für Standardaufgaben oder Haiku für leichte Aufgaben.

Sie profitieren von Fables Architektur, ohne für jeden Ausführungs-Token Fable-Preise zu zahlen (was ohnehin übertrieben ist).

Die letzten 10 %: Überprüfung

Sobald die Ausführung abgeschlossen ist, holen Sie Fable wieder ins Boot. Lassen Sie es das Ergebnis mit der ursprünglichen Architektur abgleichen.

Entspricht das Ergebnis dem Plan? Gibt es Lücken? Muss etwas behoben werden, bevor es veröffentlicht wird?

In diesem letzten Durchlauf fängt Fables Intelligenz das ein, was günstigere Modelle übersehen, und da es ein fertiges Ergebnis überprüft, anstatt von Grund auf neu zu generieren, verbraucht es weit weniger Tokens, als wenn es die gesamte Aufgabe selbst erledigt hätte.

Miles Deutscher - inline image

10-80-10-System

Das ist das gesamte 10-80-10-Framework, mit dem Sie alle Vorteile von Fable nutzen können, ohne die Nachteile der Token-Kosten in Kauf nehmen zu müssen.

Modelle wie Opus 4.8 sind genauso leistungsfähig, wenn es um die Ausführungsebene geht, und dieses System vermeidet Fables Drang, mit mehreren Schleifen, tiefer Recherche usw. alles „perfekt" zu machen.

II: Schleifen erklärt

Ich werde dazu einen ausführlichen Artikel schreiben, aber ich möchte kurz auf /loop eingehen, da es derzeit die leistungsfähigste Methode ist, Fable 5 zu nutzen.

Lance Martin (@RLanceMartin), ein Ingenieur bei Anthropic, hat einen Leitfaden zum Entwerfen von Schleifen für Mythos-Klasse-Modelle veröffentlicht.

Ich empfehle Ihnen dringend, diesen Artikel zu lesen, aber ich fasse ihn unten zusammen.

https://x.com/RLanceMartin/status/2064397389189071163

Der alte Weg vs. der neue Weg des Promptings

Der alte Weg des Promptings sah so aus:

Sie prompten → Claude antwortet → Sie überprüfen → Sie prompten erneut → Wiederholung

Bei diesem Modell sind Sie die Schleife.

Sie überprüfen manuell jeden Verifizierungsschritt, jede Korrektur und jede Nachfrage.

Schleifen automatisieren diesen gesamten Prozess und machen Sie zum Flaschenhals.

Mit Schleifen-Engineering geben Sie Fable ein Ziel vor, und es startet dann Unteragenten, die auf dieses Ziel hinarbeiten.

Entwerfen Sie die Schleife → Fable startet verifizierende Unteragenten → Agenten prompten sich selbst, um das Ziel zu erreichen

Miles Deutscher - inline image

Prompt-Engineering versus Schleifen-Engineering

/goal und /loop erklärt

Diese beiden Befehle sind die praktische Umsetzung des Schleifen-Engineerings in Claude Code.

/goal ist der Ausgangspunkt.

PROMPT-STRUKTUR

/goal [Aufgabe] bis [messbarer Endzustand] ohne [Einschränkungen]

/loop geht noch einen Schritt weiter.

Anstelle eines einzelnen Durchlaufs führt /loop den Prompt in einem vorgegebenen Intervall erneut aus.

/loop [Ihr Prompt hier] --interval 30m --expires 8h

Miles Deutscher - inline image

/goal versus /loop

Die Kombination ist äußerst leistungsstark.

Verwenden Sie /goal, um die Aufgabe einmal zu definieren, und /loop, um sie automatisch in dem für die Arbeit sinnvollen Rhythmus ausführen zu lassen.

Praktische Anwendung des Schleifen-Engineerings für günstigeren Token-Verbrauch

Hier entfaltet das 10-80-10-System seine volle Wirkung.

Mit dem 10-80-10-Framework übernimmt Fable die 10 % Planung im Vorfeld, indem es die Schleife architekturiert; das günstigere Modell übernimmt die 80 % Ausführung; und Fable kommt nur dann wieder zum Einsatz, wenn die Schleife geschlossen wird oder wenn es nötig ist.

Sie können sogar GPT-5.5 in der Ausführungsebene verwenden, was den Token-Verbrauch um 50 % oder mehr senken kann.

III: Allgemeine Tipps zum Tokensparen

Das 10-80-10-System und Schleifen kümmern sich um die große Effizienz – hier sind die kleineren Anpassungen, die ebenfalls einen Unterschied machen können.

  1. Aufwandsauswahl

Beginnen Sie mit mittlerem Aufwand, nicht mit maximalem.

Fable auf mittlerem Aufwand schlägt Opus auf extra hoch. Erhöhen Sie den Aufwand nur, wenn Sie wirklich auf Qualitätsprobleme stoßen. Standardmäßig alles auf Maximum zu stellen, ist einer der schnellsten Wege, Ihr Limit zu sprengen.

Einige Leute berichten sogar, dass sie Fable mit niedrigem Aufwand verwenden und erstaunliche Ergebnisse erzielen.

  1. Alte Fähigkeiten und Anweisungen löschen

Prompts, die für frühere Modelle erstellt wurden, schneiden bei Fable oft schlechter ab.

Kürzere, sauberere Anweisungen funktionieren besser und kosten weniger innerhalb von Fable (Fable wird die Dinge ohnehin selbst herausfinden).

  1. Geben Sie Fable das „Warum" für alles

Fable bekommt Dinge beim ersten Mal öfter richtig, wenn es die Absicht hinter der Anfrage versteht.

Weniger Korrekturen und Iterationsrunden bedeuten auch weitaus weniger verbrannte Tokens.

Beachten Sie, dass dieses Modell für vollständig autonome Arbeit konzipiert ist. Wenn Sie das „Warum" hinter den Dingen nicht angeben, muss es härter nachdenken, um die nächsten Schritte zu entwickeln.

  1. /usage

Überwachen Sie Ihre Nutzung aktiv. Führen Sie /usage in Claude Code regelmäßig aus. Sobald Fable am 7. Juli auf ein Pay-per-Token-Modell umstellt, wird dies unerlässlich sein.

Ich habe hier einen gesamten Leitfaden zum Prompting mit Fable 5 geschrieben – viele der hier genannten Tipps werden auch Ihren Token-Verbrauch senken

https://x.com/aiedge_/status/2065064961999847849

IV: Teure Fable-Fehler

Dies sind die beiden Fehler, die es sich lohnt, besonders hervorzuheben, da sie leicht zu übersehen sind und teuer werden können, wenn Sie sie nicht beheben.

Fehler 1: Fable versehentlich ausführen, wenn Sie es nicht wollen.

Wenn Sie Claude Code oder die Claude-App öffnen, wird jetzt standardmäßig Fable verwendet.

Anthropic ermutigt die Leute derzeit aktiv, das Modell zu testen.

Einfacher Rat: Überprüfen Sie die Modellauswahl vor jeder Sitzung. Ich habe mich schon dabei ertappt, wie ich Fable versehentlich in normalen Chats verwendet habe.

Fehler 2: Kein Ausgabenlimit

Am 7. Juli wechselt Fable von den Standard-Abonnements.

Wenn Sie es über Ihr Planlimit hinaus weiter nutzen möchten, müssen Sie eine Kreditkarte hinzufügen und pro Token bezahlen.

Die Falle ist, kein festes Limit für Ihre Kreditkarte zu haben.

Fable verbrennt Tokens bei autonomen Läufen und langen Sitzungen schnell. Ohne ein Limit können Sie eine beträchtliche Rechnung anhäufen, bevor Sie überhaupt merken, was passiert ist.

Sie können Ihre monatlichen Ausgaben unter Einstellungen → Nutzung → Limit anpassen festlegen.

Miles Deutscher - inline image

Monatliche Ausgaben festlegen

Abschluss

So, das war's.

Mein gesamtes Framework zur deutlichen Reduzierung der Fable-Token-Kosten.

Ich hoffe, dieser Artikel war wertvoll für Sie.

Wenn ja, folgen Sie mir unbedingt @milesdeutscher und @aiedge_ – jede Woche veröffentliche ich praktische KI-Leitfäden, um Sie in diesem verrückten Bereich auf dem Laufenden zu halten.

Wie versprochen habe ich ein Dokument erstellt, das Sie direkt an Fable senden können, um den Token-Verbrauch so schnell wie möglich zu senken.

Miles Deutscher - inline image

10-80-10-System-Dokument \Vorschau\

So erhalten Sie Zugriff auf das vollständige Dokument:

  1. Melden Sie sich für den kostenlosen AI Edge-Newsletter an
  2. Treten Sie meiner kostenlosen Instagram-Community bei, damit ich es Ihnen senden kann

Starten Sie hier.👇

https://www.aiedgehq.co/

Miles Deutscher - inline image

https://www.aiedgehq.co/

Vielen Dank fürs Lesen, wenn Sie es bis hierher geschafft haben.💙

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
Für Creator

Verwandle dein Markdown in einen sauberen 𝕏-Artikel

Wenn du eigene Langtexte veröffentlichst, wird die 𝕏-Formatierung von Bildern, Tabellen und Codeblöcken mühsam. YouMind macht aus einem ganzen Markdown-Entwurf einen sauberen, sofort postbaren 𝕏-Artikel.

Markdown zu 𝕏 testen

Mehr Muster zum Entschlüsseln

Aktuelle virale Artikel

Mehr virale Artikel entdecken