Claude Code im Detail: Architektur, Governance und Engineering-Praktiken

@HiTw93
CHINESISCHvor 4 Monaten · 12. März 2026
2.9M
8.6K
2.0K
191
17.2K

TL;DR

Ein umfassender Leitfaden zur Optimierung von Claude Code, der die Sechs-Schichten-Architektur, Context Engineering sowie den strategischen Einsatz von Skills, Hooks und Subagents für den Aufbau stabiler KI-Workflows behandelt.

0. TL;DR

Dieser Artikel basiert auf sechsmonatiger intensiver Nutzung von Claude Code und Erkenntnissen aus Ausgaben von Ausgaben von 40 $/Monat für zwei Konten. Hoffentlich bietet er allen wertvolle Anregungen.

Anfangs nutzte ich es als ChatBot, merkte aber bald, dass etwas schief lief: Der Kontext wurde chaotisch, die Tools wurden mehr, aber die Effektivität sank, und Regeln wurden ignoriert, obwohl sie länger waren. Nach der Recherche zu Claude Code selbst wurde klar, dass es kein Prompt-Problem war, sondern ein Systemdesign-Problem.

Ich möchte Folgendes behandeln: Wie Claude Code unter der Haube funktioniert, warum der Kontext chaotisch wird und wie man ihn regelt, wie man Skills und Hooks gestaltet, die korrekte Verwendung von Subagenten, die architektonischen Auswirkungen von Prompt Caching und wie man eine wirklich nützliche CLAUDE.md schreibt.

Der direkteste Weg, es zu verstehen, ist, Claude Code in sechs Schichten zu unterteilen:

Tw93 - inline image

Nur eine Schicht zu stärken, führt zu Ungleichgewicht. Ist die CLAUDE.md zu lang, verschmutzt sie den Kontext; zu viele Tools verursachen Verwirrung; zu viele Subagenten führen zu Zustandsabweichungen; das Überspringen der Verifikation macht es unmöglich zu finden, wo etwas schiefgelaufen ist.

1. Wie es unter der Haubeioniert

Tw93 - inline image

Der Kern von Claude Code ist nicht „Antworten", sondern eine sich wiederholende agentische Schleife:

text
1Kontext Sammeln → Aktion Ausführen → Ergebnis Verifizieren → [Fertig oder Schleife]
2 ↑ ↓
3 CLAUDE.md Hooks / Berechtigungen / Sandbox
4 Skills Tools / MCP
5 Memory

Mir wurde klar, dass Engpässe selten daran liegen, dass das Modell nicht intelligent genug ist, sondern daran, dass man ihm den falschen Kontext gibt oder keine Möglichkeit hat, zu beurteilen, ob die Ausgabe korrekt ist, oder um einen Rollback durchzuführen.

Fünf Schichten, auf die man sich konzentrieren sollte:

Tw93 - inline image

Betrachtet man diese Schichten, wird die Fehlersuche einfacher. Instabile Ergebnisse? Überprüfen Sie die Kontext-Ladereihenfolge. Automatisierung außer Kontrolle? Überprüfen Sie die Steuerungsebene. Nachlassende Qualität bei langen Sitzungen? Zwischenprodukte haben den Kontext verschmutzt; es ist besser, eine neue Sitzung zu starten, als die Prompts anzupassen.

2. Konzeptionelle Abgrenzungen: MCP / Plugin / Tools / Skills / Hooks / Subagents

Tw93 - inline image

Einfache Regel: Verwenden Sie Tools/MCP für neue Aktionen, Skills für Workflows, Subagents für isolierte Umgebungen, Hooks für verbindliche Einschränkungen/Prüfungen und Plugins für die projektübergreifende Verteilung.

3. Context Engineering: Die Wichtigste Systemeinschränkung

Viele betrachten Kontext als ein „Kapazitätsproblem", aber der Engpass ist meist Rauschen. Nützliche Informationen gehen in irrelevanten Inhalten unter.

Reale Kontextkostenzusammensetzung

Tw93 - inline image

Die 200K Kontext von Claude Code sind nicht vollständig verfügbar:

text
1200K Gesamtkontext
2├── Feste Gemeinkosten (~15-20K)
3│ ├── Systemanweisungen: ~2K
4│ ├── Skill-Beschreibungen: ~1-5K
5│ ├── MCP Server-Tooldefinitionen: ~10-20K ← Der größte versteckte Kostentreiber
6│ └── LSP-Zustand: ~2-5K
7
8├── Semifixe (~5-10K)
9│ ├── CLAUDE.md: ~2-5K
10│ └── Memory: ~1-2K
11
12└── Dynamisch Verfügbar (~160-180K)
13 ├── Chatverlauf
14 ├── Dateiinhalt
15 └── Tool-Ergebnisse
Tw93 - inline image

Ein typischer MCP Server (wie GitHub) enthält 20-30 Tooldefinitionen, jede davon ~200 Token, insgesamt 4.000-6.000 Token. Werden 5 Server verbunden, verbraucht das 25.000 Token (12,5%). Dies ist kritisch beim Lesen großer Code-Mengen.

Empfohlene Kontextschichtung

text
1Immer vorhanden → CLAUDE.md: Projektvertrag / Build-Befehle / Verbote
2Pfadbasiert → rules: Sprach-/Verzeichnis-/Dateityp-spezifische Regeln
3Auf Abruf → Skills: Workflows / Domainwissen
4Isoliert → Subagents: Großflächige Erkundung / Parallele Recherche
5Außerhalb Kontext → Hooks: Deterministische Skripte / Prüfung / Blockierung

Laden Sie keine Dinge, die Sie nur gelegentlich brauchen.

Kontext-Best Practices

  • Halten Sie CLAUDE.md kurz, präzise und ausführbar. Anthropics eigene ist ~2,5K Token.
  • Verschieben Sie große Referenzdokumente in die unterstützenden Dateien von Skills.
  • Verwenden Sie .claude/rules/ für Pfad-/Sprachregeln.
  • Nutzen Sie /context, um den Verbrauch zu überwachen.
Tw93 - inline image
  • Verwenden Sie /clear für Aufgabenwechsel und /compact für neue Phasen.
  • Schreiben Sie Kompakte Anweisungen in die CLAUDE.md, um zu steuern, was erhalten bleibt.

Tool-Ausgabe-Rauschen: Ein Weiterer Versteckter Kostentreiber

Dynamische Tool-Ausgaben (wie cargo test oder git log) können den Kontext leicht füllen. Claude muss nicht alles sehen.

RTK (Rust Token Killer) ist ein guter Ansatz: Es filtert die Befehlsausgabe, bevor sie Claude erreicht. Es kann zum Beispiel Tausende von Zeilen Testausgabe zu einer einzigen Erfolgsmeldung verdichten.

Kompressionsfallen

Die Standardkomprimierung könnte Architekturentscheidungen und Einschränkungen löschen.

Tw93 - inline image

Lösung: Geben Sie in der CLAUDE.md Kompakte Anweisungen an, um Architekturentscheidungen, geänderte Dateien, Verifizierungsstatus und TODOs zu priorisieren.

Eine weitere proaktive Lösung: Lassen Sie Claude vor dem Start einer neuen Sitzung eine HANDOFF.md schreiben, die den Fortschritt und Sackgassen erklärt.

Ingenieurwissenschaftlicher Wert des Plan-Modus

Tw93 - inline image

Der Plan-Modus trennt die Erkundung von der Ausführung.

Tw93 - inline image

Für komplexe Refactorings ist dies besser, als direkt loszucoden. Fortgeschrittener Tipp: Verwenden Sie einen Claude, um den Plan zu schreiben, und einen anderen als „Senior Engineer", der ihn überprüft.

4. Skills-Design: Workflows, die bei Bedarf geladen werden

Skills sind bei Bedarf abrufbares Wissen und Workflows.

Was einen guten Skill ausmacht

  • Die Beschreibung sollte sagen „wann man mich einsetzt", nicht „was ich mache".
  • Habe vollständige Schritte, Eingaben, Ausgaben und Abbruchbedingungen.
  • Halte den Hauptteil für die Navigation und die Kernbeschränkungen; verschiebe Details in unterstützende Dateien.
  • Setze für Skills mit Seiteneffekten disable-model-invocation: true.

Progressive Offenlegung

Claude Code betont die „progressive Offenlegung": Zuerst Indizes und Navigation bereitstellen, dann bei Bedarf Details nachziehen.

Drei Typische Skill-Typen

  1. Checkliste (Qualitäts-Gate): z.B. release-check.
  2. Workflow (Standardisierte Abläufe): z.B. config-migration mit Rollback.
  3. Domain-Experte (Entscheidungsrahmen): z.B. runtime-diagnosis.

Halten Sie die Deskriptoren kurz, um Kontextplatz zu sparen.

5. Tool-Design: Claude Helfen, die Richtige Wahl zu Treffen

Tools für Agenten sollten sich auf die einfache korrekte Verwendung konzentrieren, nicht auf die Vollständigkeit der Funktionen.

Gute vs. Schlechte Tools

Tw93 - inline image

Gestaltungsprinzipien: Verwenden Sie Präfixe (github_pr_*), unterstützen Sie prägnante Formate, geben Sie hilfreiche Fehlermeldungen und vermeiden Sie die Darstellung zu vieler fragmentierter Tools.

Evolution Internet Tools

Tw93 - inline image

Die Entwicklung des Tools „AskUserQuestion" zeigt, dass ein dediziertes Tool stabiler ist als Markdown-Formatierung oder Exit-Parameter.

Tw93 - inline image
Tw93 - inline image

Todo-Tools wurden zu einer „Fessel", als die Modelle stärker wurden. Such-Tools entwickelten sich von RAG zu Grep, um eine bessere Flexibilität und „progressive Offenlegung" zu erreichen.

6. Hooks: Obligatorische Logik Vor/Nach Operationen

Hooks holen deterministische Kontrolle über Prozesse wie Formatierung, Dateischutz und Benachrichtigungen zurück.

Tw93 - inline image

Geeignet für Hooks

Blockierung geschützter Dateien, automatische Formatierung nach Bearbeitungen, Injection dynamischen Kontexts (Git-Branch) und Benachrichtigungen.

Früherkennung von Fehlern

Tw93 - inline image

7. Subagents: Unabhängige Claude-Instanzen

Subagents bieten Isolation. Aufgaben wie das Scannen von Repos oder das Ausführen von Tests produzieren massive Ausgaben, die den Haupt-Thread nicht überladen sollten.

Explizite Einschränkungen

Beschränken Sie die Tools, wählen Sie das richtige Modell (Haiku für Erkundung, Opus für Überprüfung) und setzen Sie maxTurns.

8. Prompt Caching: Der Kern der Claude Code-Architektur

Claude Code ist um Prompt Caching herum aufgebaut. Hohe Trefferquoten sparen Geld und erhöhen die Ratenlimits.

Prompt-Layout für Caching

Tw93 - inline image

Die Reihenfolge ist wichtig für das Präfix-Matching: System Prompt → Tool Definitionen → Chat Verlauf → Benutzereingabe.

Wechseln Sie nicht mitten in der Sitzung das Modell

Das Wechseln des Modells zerbricht den Cache. Verwenden Sie stattdessen Subagents für Übergaben.

Implementierung der Kompaktierung

Tw93 - inline image

Die Kompaktierung verwendet einen Fork, um den Verlauf zu 1/10 der Kosten aufgrund von Cache-Treffern zusammenzufassen.

9. Verifikationsschleifen: Keine Verifikation, Kein Engineering-Agent

„Claude sagt, es ist erledigt" ist ohne Verifikation nutzlos. Definieren Sie die Verifikation explizit im Prompt, im Skill und in der CLAUDE.md.

10. Hochfrequenz-Befehle

Befehle wie /context, /clear, /compact und /memory helfen, den Kontext aktiv zu verwalten.

Governance und Parallelität

Tw93 - inline image

Nützliche versteckte Befehle: /simplify (Code-Review), /rewind (Checkpointing), /btw (Nebenrecherchen), /insight (Sitzung für CLAUDE.md-Updates analysieren).

11. Wie man eine Gute CLAUDE.md Schreibt

Es ist ein Vertrag, keine Wissensdatenbank.

Tw93 - inline image

Fügen Sie Build-/Test-Befehle, Architekturgrenzen, Codierungskonventionen, Sicherheitsvorkehrungen und Kompakte Anweisungen hinzu. Bitten Sie Claude, die CLAUDE.md zu aktualisieren, nachdem es seine Fehler korrigiert hat.

12. Aktuelle Erfahrungen

Erkenntnisse aus dem Bau von Kaku (Rust + Lua): Umgebungstransparenz ist lebenswichtig (verwenden Sie einen 'doctor'-Befehl), und Hooks sind großartig für Multi-Sprach-Projekte.

13. Anti-Patterns

Tw93 - inline image

14. Health Check

Verwenden Sie npx skills add tw93/claude-health, um Ihre Konfiguration zu überprüfen.

15. Fazit

Tw93 - inline image

Der Fokus verschiebt sich von „Wie verwende ich Funktionen" zu „Wie lasse ich den Agenten unter Einschränkungen laufen". Wenn Sie nicht definieren können, was „erledigt" bedeutet, ist die Aufgabe nicht bereit für einen Agenten.

Save to YouMind

Use YouMind to read viral articles deeply

Save the source, ask focused questions, summarize the argument, and turn a viral article into reusable notes in one AI workspace.

Explore YouMind

Mehr Muster zum Entschlüsseln

Aktuelle virale Artikel

Mehr virale Artikel entdecken