90 % wissen es nicht: Der ultimative Leitfaden für Claude Code Best Practices, die intern bei Anthropic genutzt werden

Hast du diese Probleme bei der Verwendung von Claude Code?

・Wenn die Claude Code-Sitzung länger dauert, sinkt die Qualität der Antworten irgendwie.

・Was sind die Befehle? Ich verstehe die Unterschiede nicht wirklich.

・Ich kann mich nicht entscheiden, wann ich Subagents einsetzen soll.

・Der Kontext ist völlig durcheinander.

Genau jetzt macht ein Beitrag von Thariq (@trq212), einem Anthropic-Mitarbeiter, über "Claude Code-Sitzungsmanagement und den 1-Millionen-Token-Kontext" mit 540.000 Aufrufen die Runde 😳

Also, für alle, die diese Probleme haben, werde ich den Inhalt aufschlüsseln und leicht verständlich erklären 👇

Originalbeitrag hier: https://x.com/trq212/status/2044548257058328723?s=20

■ Grundlagen des 𝗰𝗼𝗻𝘁𝗲𝘅𝘁 𝘄𝗶𝗻𝗱𝗼𝘄

Zunächst einmal als Voraussetzung: Das Claude Code-Kontextfenster hat 1 Million Token.

Der Kontext umfasst all das Folgende:

・System-Prompt

・Bisheriger Gesprächsverlauf

・Alle Tool-Aufrufe und deren Ausgaben

・Inhalte geladener Dateien

Mit anderen Worten: Je länger die Sitzung, desto mehr Informationen sammeln sich in diesem Kontext.

■ Was ist 𝗰𝗼𝗻𝘁𝗲𝘅𝘁 𝗿𝗼𝘁?

Ein wichtiges Konzept hier ist "Context Rot".

Wenn der Kontext wächst, wird die Aufmerksamkeit des Modells über viele Token verteilt, und alte oder irrelevante Informationen werden zu Rauschen, das die aktuelle Aufgabe stört.

Laut Thariq wird Context Rot ab etwa 300.000 bis 400.000 Token im 1-Millionen-Token-Modell beobachtet. Dies ist jedoch keine strenge Regel, da es stark von der Aufgabe abhängt.

Da das Kontextfenster eine harte Grenze hat, musst du, wenn du dich der Grenze näherst, die bisherige Arbeit zusammenfassen und in einem neuen Kontext fortfahren. Dieser Prozess wird "Kompaktierung" genannt.

■ Jeder Schritt ist ein "Wendepunkt"

Was soll Claude Code tun, nachdem es eine Aufgabe erledigt hat? Dies ist tatsächlich der wichtigste Entscheidungspunkt.

Thariq listet fünf Optionen auf:

𝟭. 𝗖𝗼𝗻𝘁𝗶𝗻𝘂𝗲

Sende die nächste Nachricht in derselben Sitzung. Die natürlichste Wahl.

𝟮. /𝗿𝗲𝘄𝗶𝗻𝗱 (Doppeltippen auf Esc Esc)

Gehe zu einer früheren Nachricht zurück und starte von dort neu. Nachfolgende Nachrichten werden aus dem Kontext gelöscht.

𝟯. /𝗰𝗹𝗲𝗮𝗿 (Neue Sitzung)

Fasse wichtige Informationen selbst zusammen und starte eine neue Sitzung.

𝟰. /𝗰𝗼𝗺𝗽𝗮𝗰𝘁

Lass das Modell das bisherige Gespräch zusammenfassen und auf dieser Zusammenfassung weiterarbeiten.

𝟱. 𝗦𝘂𝗯𝗮𝗴𝗲𝗻𝘁𝘀

Delegiere den nächsten Arbeitsblock an einen Agenten mit einem eigenen sauberen Kontext, der nur das Ergebnis an die übergeordnete Sitzung zurückgibt.

■ Wann eine neue Sitzung starten

Dank des 1-Millionen-Token-Kontextfensters können lange Aufgaben wie die Entwicklung einer Full-Stack-App von Grund auf jetzt stabiler ausgeführt werden.

Allerdings bedeutet das nicht, dass du dieselbe Sitzung fortsetzen solltest, nur weil noch Kontextplatz vorhanden ist.

Thariqs Faustregel ist einfach:

🔥 "Wenn du eine neue Aufgabe beginnst, solltest du eine neue Sitzung starten."

Es gibt Ausnahmen. Zum Beispiel das Schreiben einer Dokumentation unmittelbar nach der Implementierung einer Funktion. Wenn du eine neue Sitzung startest, muss Claude Code die gerade implementierten Dateien erneut lesen, was langsam und kostspielig ist. Für Aufgaben wie Dokumentation, die keine "hohe Intelligenz" erfordern, ist es effizienter, eine gewisse Kontextverschmutzung zu akzeptieren und einfach fortzufahren.

■ 𝗿𝗲𝘄𝗶𝗻𝗱 ist die am meisten unterschätzte Funktion

Thariq nennt "Rewind" als die beste Gewohnheit für gutes Kontextmanagement.

In Claude Code kannst du zu jeder früheren Nachricht zurückgehen und neu starten, indem du die Esc-Taste doppelt drückst (oder den Befehl /rewind verwendest). Nachrichten nach diesem Punkt werden vollständig aus dem Kontext entfernt.

Betrachten wir ein konkretes Szenario:

Claude hat fünf Dateien gelesen und einen Ansatz versucht, der fehlgeschlagen ist.

❌ Normale Reaktion: "Das hat nicht funktioniert. Versuche stattdessen X."

→ Das gesamte Protokoll des fehlgeschlagenen Ansatzes bleibt im Kontext.

✅ Bessere Methode: Spule zurück bis direkt nach dem Lesen der Dateien und gib neue Anweisungen basierend auf dem Gelernten.

→ "Verwende Ansatz A nicht. Das foo-Modul stellt das nicht bereit. Gehe direkt mit B vor."

Dadurch verschwinden die Token des fehlgeschlagenen Versuchs und Irrtums, und ein erneuter Versuch in einem sauberen Zustand ist möglich.

Darüber hinaus ermöglicht die Funktion "von hier zusammenfassen", dass Claude sein eigenes Lernen zusammenfasst und eine "Notiz von vergangenem Selbst an zukünftiges Selbst" erstellt.

■ Der entscheidende Unterschied zwischen /𝗰𝗼𝗺𝗽𝗮𝗰𝘁 und /𝗰𝗹𝗲𝗮𝗿

Wenn eine Sitzung lang wird, gibt es zwei Möglichkeiten, das Gewicht zu reduzieren. Sie scheinen ähnlich, sind aber völlig unterschiedlich.

【/compact】

・Das Modell fasst das Gespräch zusammen und ersetzt den Verlauf durch diese Zusammenfassung.

・Verlustbehaftet – was wichtig ist, liegt im Ermessen von Claude.

・Du musst nichts schreiben, aber Claude könnte etwas übersehen.

・Du kannst Anweisungen geben, um es zu lenken (z. B. /compact focus on auth refactor, remove test debugging).

【/clear】

・Du schreibst die wichtigen Informationen selbst auf und startest eine neue Sitzung.

・Zum Beispiel: "Ziel ist Auth-Middleware, Einschränkungen sind X, relevante Dateien sind A und B, Ansatz Y ist ausgeschlossen."

・Es erfordert Aufwand, aber der resultierende Kontext besteht nur aus Informationen, die du ausgewählt hast.

Die Wahl zwischen ihnen ist ein Kompromiss zwischen Kontrolle und Bequemlichkeit.

■ Warum 𝗰𝗼𝗺𝗽𝗮𝗰𝘁 fehlschlägt

Bei langen Sitzungen kann die Qualität von Compact extrem schlecht werden.

Laut Thariq ist die häufigste Ursache für ein schlechtes Compact, "wenn das Modell die Richtung der Arbeit nicht vorhersagen kann."

Beispiel:

Nach einer langen Debugging-Sitzung wird Autocompact ausgelöst und fasst die Untersuchung zusammen.

→ Wenn du dann sagst "Behebe auch diese Warnung in bar.ts", könnten die Informationen über diese Warnung in der debug-fokussierten Zusammenfassung verloren gegangen sein.

Noch problematischer ist das Dilemma, dass das Modell aufgrund von Context Rot in seinem "niedrigsten Intelligenzzustand" ist, wenn es Compact ausführt. Mit anderen Worten: Die Zusammenfassung mit der niedrigsten Qualität wird in dem Moment erstellt, in dem die genaueste Zusammenfassung benötigt wird.

Da wir jetzt einen 1-Millionen-Token-Kontext haben, ist die beste Strategie, /compact selbst auszuführen, solange noch Platz ist, und eine Erklärung hinzuzufügen, was als nächstes zu tun ist.

■ Wann 𝗦𝘂𝗯𝗮𝗴𝗲𝗻𝘁𝘀 verwendet werden sollten

Subagents sind ebenfalls eine Form des Kontextmanagements.

Wenn Claude Code mit dem Agent-Tool einen Subagenten erstellt, hat dieser Subagent sein eigenes sauberes Kontextfenster. Er erledigt so viel Arbeit wie nötig, fasst das Ergebnis zusammen und gibt es an die übergeordnete Sitzung zurück.

Das Kriterium ist einfach:

👀 "Werde ich diese Tool-Ausgabe später noch einmal benötigen? Oder reicht die Schlussfolgerung?"

Wenn nur die Schlussfolgerung ausreicht, solltest du es einem Subagenten überlassen.

Claude Code ruft Subagents automatisch auf, aber explizite Anweisungen zu geben ist ebenfalls effektiv:

・"Starte einen Subagenten und überprüfe die Arbeitsergebnisse anhand dieser Spezifikationsdatei."

・"Verwende einen Subagenten, um zu lesen und zusammenzufassen, wie der Auth-Flow in einer anderen Codebasis implementiert ist. Verwende das als Referenz, um es hier zu implementieren."

・"Verwende einen Subagenten, um aus dem Git-Diff eine Dokumentation für diese Funktion zu schreiben."

Indem du Zwischenergebnisse nicht in den übergeordneten Kontext bringst, hältst du den Kontext sauber.

■ Zusammenfassung: 5 Techniken für das Kontextmanagement

Dinge, die du immer entscheiden solltest, bevor du die nächste Nachricht sendest, nachdem Claude einen Schritt abgeschlossen hat:

Hat sich die Aufgabe geändert? → /clear für eine neue Sitzung
Ist der Ansatz fehlgeschlagen? → /rewind, um zum Zeitpunkt direkt nach dem Laden der Dateien zurückzukehren
Wird die Sitzung lang? → /compact, solange noch Platz ist (mit Richtungsangabe)
Ist es eine Aufgabe mit vielen Zwischenergebnissen? → An einen Subagenten delegieren
Kann der Kontext für verwandte Aufgaben verwendet werden? → Einfach fortfahren

In Zukunft wird Claude selbst bei diesen Entscheidungen helfen, aber vorerst können Benutzer, die diese Urteile fällen, die Ausgabequalität von Claude Code erheblich verbessern.

Sitzungsmanagement ist eine subtile, aber grundlegende Fähigkeit, die das Claude Code-Erlebnis fundamental verändert 🔥

Für diejenigen, die diesen Artikel hilfreich fanden:

𝗖𝗹𝗮𝘂𝗱𝗲 𝗖𝗼𝗱𝗲 𝗦𝘁𝘂𝗱𝗶𝗼 @ 𝗝𝗮𝗽𝗮𝗻 (@ClaudeCode_love) ist ein Account, der von drei Claude Code-Enthusiasten betrieben wird.

Wir posten täglich über praktische CLI-Nutzung und Automatisierung.

Wir entwickeln derzeit gemeinsam mit einem börsennotierten Unternehmen einen KI-Agenten.

Unsere üblichen Inhalte 👇

・Reale Produktentwicklungsfälle mit Claude Code und Claude

・Claude Code-Nutzung / Vibe Coding / Organisation von Entwicklungstrends

・Neueste Informationen zu Claude Code aus dem Ausland

Von der Entwicklungsidee über Design, Implementierung und Verbesserung fassen wir Informationen aus dem Ausland und Primärquellen zusammen, um dir zu helfen, funktionierende Produkte zu veröffentlichen, nicht nur "fertig zu machen".

Wenn du interessiert bist, folge uns und schau vorbei! Es lohnt sich!

Use YouMind to read viral articles deeply

Aktuelle virale Artikel

Jupiter tritt am 30. Juni 2026 in den Löwen ein: So nutzen Sie Ihr Glück

Warum japanische Großkonzerne Gemini und Copilot als ihre Basis wählen

Ideengeneratoren: Reid Hoffman über Mark Pincus und die Theorie des Spiels

7 Hindernisse bei der Implementierung von KI-Agenten vor Ort und in der Organisation

10 Bücher, die jeder KI-Ingenieur im Jahr 2026 gelesen haben sollte

ArsenalOS™: Das digitale Rückgrat der modernen Verteidigungsfertigung