20 KI-Loop-Designmuster für produktionsreife Agenten

Die meisten KI-Ingenieure wissen, wie man einen Agenten baut.

Nur sehr wenige wissen, wie man ein System baut, das nach dem ersten Versuch besser wird.

Diese Lücke ist sechsstellig wert.

Hier ist der Unterschied:

Ein Agent ist ein Arbeiter.

Eine Schleife ist das, was den Arbeiter verbessert.

Die leistungsfähigsten KI-Systeme in der Produktion sind heute keine einzelnen Modellaufrufe.

Es sind Schleifen.

Generieren → Bewerten → Lernen → Verbessern.

Immer und immer wieder.

Bis die Ausgabe tatsächlich gut ist.

Hier sind 20 Schleifen-Entwurfsmuster, die in Produktions-KI-Systemen immer wieder auftauchen.

Speichere dir das. Du wirst mit diesen bauen.

Agenten vs. Schleifen

Alter Weg: Eingabeaufforderung → Antwort → Fertig.

Neuer Weg: Generieren → Kritisieren → Umschreiben → Bewerten → Wiederholen → Erinnern → Verbessern.

Einer ist ein Fabrikarbeiter, der die Arbeit einmal erledigt.

Der andere ist ein Fabrikarbeiter, der jeden Fehler studiert, das Drehbuch umschreibt und jede einzelne Schicht um 3 % besser wird.

Die Teams, die gerade Produktions-KI ausliefern, schreiben keine besseren Eingabeaufforderungen.

Sie bauen bessere Schleifen.

KATEGORIE 1 — QUALITÄTSVERBESSERUNGSSCHLEIFEN (Die Ausgabe verbessern, bevor sie das System verlässt)

1. Generieren → Kritisieren → Umschreiben

Die wichtigste Schleife im KI-Engineering.

Ausgabe generieren. Kritiker prüft sie. Generator schreibt basierend auf dem Feedback um. Wiederholen, bis die Qualitätsschwelle erreicht ist.

Nicht ein Modell. Zwei Rollen. Eine Pipeline.

text

1[Generator] → Entwurf
2[Kritiker] → "Absatz 3 ist vage. Belege fehlen. Ton ist falsch."
3[Generator] → Umschreibung basierend auf Kritik
4[Kritiker] → "Besser. Aber die Schlussfolgerung ist immer noch schwach."
5[Generator] → endgültige Umschreibung

Verwendet für: Schreiben, Code-Review, Berichte, Strategiedokumente, Verkaufs-E-Mails.

Die Erkenntnis: Das Modell, das generiert, ist nicht der beste Richter seiner eigenen Ausgabe.

Ein separater Kritiker findet jedes Mal, was der Generator übersehen hat.

2. Bewerten-und-Wiederholen-Schleife

Generieren. Bewerten. Wiederholen, wenn unter der Schwelle.

Einfach. Leistungsstark. Untergenutzt.

Punktzahl = bewerten(Ausgabe)

text

1punktzahl = bewerten(ausgabe)
2
3while punktzahl < schwellenwert:
4    ausgabe = generieren(eingabeaufforderung)
5    punktzahl = bewerten(ausgabe)
6    versuche += 1
7    if versuche > max_wiederholungen:
8        return bestes_bisher

Am besten, wenn die Qualität messbar ist – Extraktionsgenauigkeit, Formateinhaltung, faktische Korrektheit, Lead-Bewertung.

Der Generator weiß nicht, dass er benotet wird.

Der Bewerter schon.

Diese Trennung ist das Muster.

3. Multi-Kritiker-Schleife

Ein Kritiker hat blinde Flecken.

Verwende vier.

→ Korrektheitskritiker: Ist es faktisch korrekt?

→ Stilkritiker: Ist es klar und gut geschrieben?

→ Sicherheitskritiker: Ist es angemessen und sicher?

→ Bereichskritiker: Erfüllt es die Fachstandards?

Jeder bewertet unabhängig.

Die endgültige Ausgabe muss alle vier zufriedenstellen, bevor sie das System verlässt.

Verwendet in: Medizin-KI, juristischer Dokumentenprüfung, Finanzanalyse, regulierten Inhalten.

4. Adversariale Kritik-Schleife

Die einzige Aufgabe des Kritikers ist es, die Antwort zu zerlegen.

Nicht zu verbessern. Zu zerlegen.

Fragen, die der adversariale Kritiker stellt:

→ Welche Annahmen versagen hier? → Welche Beweise fehlen? → Was würde ein Skeptiker sagen? → Wo ist das selbstbewusst falsch?

Der Generator verteidigt oder schreibt dann um.

Die beste Antwort überlebt den Angriff.

Verwendet für: Forschungssynthese, Überprüfung von Investitionsthesen, strategische Planung, Risikoanalyse.

5. Richter-Ensemble-Schleife

Ein Richter gibt verrauschte Bewertungen.

Fünf Richter mitteln das Rauschen heraus.

Führe dieselbe Ausgabe durch mehrere Bewerter.

Aggregiere die Bewertungen.

Nur Ausgaben mit hohem Konsens kommen weiter.

Verwendet, wenn: Einzelmodellbewertung unzuverlässig ist, die Einsätze hoch sind, Grenzfälle wichtig sind.

KATEGORIE 2 — ERINNERUNGSSCHLEIFEN (Aus dem Gelernten lernen, damit es beim nächsten Mal klüger ist)

6. Reflexionsschleife

Das wichtigste Selbstverbesserungsmuster, das es gibt.

Agent scheitert. Agent analysiert, warum er gescheitert ist. Agent speichert die Lektion. Agent wiederholt mit dieser Lektion im Kontext.

Jede Iteration: klüger als die letzte.

text

1Versuch 1: scheitert
2Reflexion: "Ich habe X angenommen, aber X war falsch. Nächstes Mal zuerst X überprüfen."
3Versuch 2: integriert Lektion → teilweiser Erfolg
4Reflexion: "Besser. Aber ich habe Y übersprungen. Y-Prüfung hinzufügen."
5Versuch 3: erfolgreich

Der Unterschied zwischen einem System, das einmal scheitert, und einem System, das nur einmal scheitert.

7. Gedächtnisaktualisierungsschleife

Speichere nach jeder Aufgabe drei Dinge:

→ Welche Entscheidung getroffen wurde → Was das Ergebnis war → Was anders gemacht würde

Zukünftige Durchläufe erben dieses Wissen.

Das System in Monat 6 ist nicht dasselbe wie das System in Monat 1.

Es hat 6 Monate seiner eigenen Geschichte gelesen.

8. Fehlerbibliotheksschleife

Speichere jeden Fehler.

Falsche Antwort. Schlechte Ausgabe. Fehlgeschlagene Ausführung. Grenzfall.

Bevor du eine neue Aufgabe angehst:

Durchsuche zuerst die Fehlerbibliothek.

Wenn ein ähnlicher Fehler existiert → wende die bekannte Lösung an, noch bevor du beginnst.

Das System hört auf, denselben Fehler zweimal zu machen.

Das am meisten untergenutzte Muster in der Produktions-KI.

9. Erfolgsmusterschleife

Die meisten Ingenieure speichern nur Fehler.

Speichere auch Erfolge.

Wenn eine Aufgabe gut läuft:

→ Speichere den Ansatz → Speichere den Kontext → Speichere, was ihn erfolgreich gemacht hat

Rufe erfolgreiche Muster ab, wenn du vor ähnlichen Aufgaben stehst.

Lerne aus Erfolgen. Nicht nur aus Fehlern.

10. Gedächtniskomprimierungsschleife

Das Gedächtnis wächst ewig.

Unbegrenztes Gedächtnis ist unbrauchbares Gedächtnis.

Nachdem sich N Elemente angesammelt haben:

Komprimiere sie.

Viele spezifische Erinnerungen → weniger Abstraktionen auf höherer Ebene.

text

1Vor der Komprimierung:
2"Bei Aufgabe A wegen X gescheitert"
3"Bei Aufgabe B wegen X gescheitert"
4"Bei Aufgabe C wegen X gescheitert"
5
6Nach der Komprimierung:
7"Muster: X verursacht Fehler. Immer zuerst X überprüfen."

Der Kontext bleibt handhabbar. Muster bleiben zugänglich. Das System bleibt schnell.

KATEGORIE 3 — PLANUNGSSCHLEIFEN (Den Plan anpassen, wenn sich die Realität ändert)

11. Planen → Ausführen → Neuplanen

Der häufigste Fehler im KI-Agenten-Design:

Den Plan als feststehend betrachten.

Pläne brechen bei Kontakt mit der Realität.

Das Muster:

Plan erstellen → Schritt ausführen → Ergebnis beobachten → Plan aktualisieren → Fortfahren

Kein Wasserfall.

Eine Spirale.

Jede Runde verfeinert den Ansatz.

Verwendet, wenn: sich die Umgebung ändert, Aufgaben Abhängigkeiten haben, langfristige Ziele verfolgt werden.

12. Dynamische Workflow-Schleife

Die meisten Pipelines sind fest.

Schritt 1 → Schritt 2 → Schritt 3. Immer.

Dynamische Workflows ändern sich basierend auf Ergebnissen.

Wenn Ausgabe A → führe Zweig X aus Wenn Ausgabe B → führe Zweig Y aus Wenn Ausgabe C → springe zu Schritt 5

Die Pipeline entscheidet zur Laufzeit über ihre eigene Form.

Verwendet in: Multi-Dokumenten-Recherche, Kundensupport-Routing, adaptive Content-Pipelines.

13. Zielzerlegungsschleife

Großes Ziel tritt ein.

System zerlegt es in Unterziele.

Jedes Unterziel wird in Aufgaben zerlegt.

Jede Aufgabe wird in Schritte zerlegt.

Zerlege, bis jede Einheit klein genug ist, um in einem Aufruf ausgeführt zu werden.

text

1Ziel: "Eine umfassende Wettbewerbsanalyse schreiben"
2↓
3Unterziel 1: "Top 5 Wettbewerber identifizieren"
4Unterziel 2: "Produkt jedes Wettbewerbers analysieren"
5Unterziel 3: "Preismodelle vergleichen"
6Unterziel 4: "Lücken identifizieren"
7↓
8Jedes Unterziel → Aufgaben → einzelne Modellaufrufe

Die Schleife zerlegt weiter, bis das System handeln kann.

14. Fortschrittsbewertungsschleife

Alle N Schritte: anhalten und fragen.

"Kommen wir dem Ziel tatsächlich näher?"

Wenn ja: aktuelle Strategie fortsetzen. Wenn nein: Strategie, Werkzeuge oder Plan ändern.

Das System überwacht seinen eigenen Fortschritt.

Führt nicht nur blind aus.

Verwendet in: langlebigen Forschungsagenten, mehrtägigen autonomen Aufgaben, Debugging-Agenten.

15. Einschränkungserfüllungsschleife

Weiterlaufen, bis alle Einschränkungen erfüllt sind.

text

1while not alle_einschränkungen_erfüllt(ausgabe):
2    ausgabe = verbessern(ausgabe, unerfüllte_einschränkungen)
3
4einschränkungen = [
5    budget_unter_grenze,
6    qualität_über_schwellenwert,
7    latenz_unter_200ms,
8    ton_entspricht_marke,
9    keine_halluzinationen
10]

Sehr verbreitet in Produktionssystemen.

Die Ausgabe ist nicht fertig, bis jede Geschäftsregel bestanden ist.

KATEGORIE 4 — ERKUNDUNGSSCHLEIFEN (Die beste Antwort finden, indem man mehrere Wege ausprobiert)

16. Verzweigen-und-Erkunden-Schleife

Verpflichte dich nicht zu einem Weg.

Erkunde mehrere gleichzeitig.

text

1pfade = [
2    generieren(ansatz="konservativ"),
3    generieren(ansatz="aggressiv"),
4    generieren(ansatz="kreativ")
5]
6
7bewertungen = [bewerten(p) for p in pfade]
8bester = pfade[bewertungen.index(max(bewertungen))]

Ergebnisse vergleichen. Den besten Zweig wählen. Den Rest verwerfen.

Verwendet für: Inhaltsvarianten, Architekturentscheidungen, Debuggen mehrerer Hypothesen, A/B-Generierung.

17. Baumsuchschleife

Verzweigen-und-Erkunden geht eine Ebene tief.

Baumsuche geht so tief wie nötig.

Erweitere die vielversprechendsten Knoten. Beschneide die schwächsten. Erkunde weiter, bis die Lösung gefunden ist.

text

1wurzel → [A, B, C]
2A → [A1, A2]   # A sieht vielversprechend aus, erweitere es
3B → beschneiden # B ist schwach, hier aufhören
4A1 → [A1a, A1b]
5A1a → lösung ✓

Verwendet für: komplexe Denkketten, mehrstufige Planung, Code-Debugging, Forschungssynthese.

Rechenintensiv, findet aber Lösungen, die Einzeldurchlauf-Aufrufe nicht finden können.

18. Debattenschleife

Zwei Agenten. Ein Thema. Entgegengesetzte Positionen.

Agent A argumentiert für die Antwort. Agent B argumentiert dagegen.

Jede Runde hinterfragt Annahmen, fordert Beweise, legt schwache Logik offen.

Die endgültige Antwort entsteht durch Uneinigkeit.

Nicht durch Einigkeit.

Der adversariale Druck findet, was selbstbewusste Einzelagenten-Antworten übersehen.

Verwendet für: Investitionsentscheidungen, strategische Planung, Risikobewertung, Forschungskritik.

KATEGORIE 5 — SYSTEMOPTIMIERUNGSSCHLEIFEN (Die Schleife verbessert die Schleife)

19. Eingabeaufforderungs-Optimierungsschleife

Die meisten Ingenieure schreiben eine Eingabeaufforderung einmal und berühren sie nie wieder.

Eingabeaufforderungs-Optimierungsschleifen ändern das.

Das System:

→ Führt die Eingabeaufforderung auf einem Testsatz aus

→ Bewertet jede Ausgabe

→ Identifiziert, wo die Eingabeaufforderung versagt

→ Schreibt die Eingabeaufforderung um, um diese Fehler zu beheben → Führt erneut aus und bewertet neu

Die Eingabeaufforderung wird automatisch besser.

Ohne dass ein Mensch sie berührt.

text

1aktuelle_eingabeaufforderung = "Fasse dieses Dokument zusammen."
2
3for iteration in range(max_iterationen):
4    ausgaben = [ausführen(aktuelle_eingabeaufforderung, doc) for doc in testsatz]
5    bewertungen = [bewerten(o) for o in ausgaben]
6    durchschnittsbewertung = mittelwert(bewertungen)
7
8    if durchschnittsbewertung >= ziel:
9        break
10
11    fehler = [o for o, b in zip(ausgaben, bewertungen) if b < schwellenwert]
12    aktuelle_eingabeaufforderung = verbessere_eingabeaufforderung(aktuelle_eingabeaufforderung, fehler)
13    # Eingabeaufforderung schreibt sich basierend auf ihren Fehlern selbst um

Verwendet in: Produktionspipelines, automatisierte Contentsysteme, Klassifikationsaufgaben.

Die besten Eingabeaufforderungen in der Produktions-KI wurden nicht von einem Menschen geschrieben.

Sie wurden evolviert.

20. Workflow-Optimierungsschleife

Hier wird es interessant.

Die Schleife verbessert die Schleife.

Das System misst seine eigene Leistung:

→ Latenz: Wie lange dauert jeder Schritt?

→ Kosten: Wie viele Token verbraucht jeder Aufruf?

→ Qualität: Wie hoch ist die Ausgabebewertung in jeder Phase?

Dann modifiziert es seinen eigenen Workflow.

Zu langsam? Parallelisiere zwei Schritte. Zu teuer? Ersetze einen GPT-4-Aufruf durch ein kleineres Modell, wo die Qualität erhalten bleibt. Qualität sinkt? Füge vor der endgültigen Ausgabe einen Kritiker hinzu.

text

1metriken = messe_workflow(ausgaben, latenz, kosten)
2
3if metriken.latenz > ziel_latenz:
4    workflow = parallelisiere(langsame_schritte)
5
6if metriken.kosten > budget:
7    workflow = ersetze_durch_billigeres_modell(teure_schritte)
8
9if metriken.qualität < schwellenwert:
10    workflow = füge_kritiker_hinzu_vor(endgültiger_ausgabeschritt)

Hier beginnen wirklich selbstverbessernde Systeme.

Nicht nur Ausgaben, die sich verbessern.

Systeme, die sich selbst neu gestalten.

Das Muster hinter allen 20 Mustern

Jede einzelne Schleife oben teilt eine Struktur:

Handeln → Beobachten → Bewerten → Anpassen

Das ist das gesamte Rezept.

Die Ausgabe ist beim ersten Versuch nie endgültig.

Die Ausgabe ist ein Ausgangspunkt.

Die Schleife ist das, was aus einem Ausgangspunkt etwas Produktionstaugliches macht.

Die vollständige Karte

Kategorie 1 — Qualitätsschleifen (Ausgabe verbessern, bevor sie das System verlässt)

→ 1. Generieren → Kritisieren → Umschreiben

→ 2. Bewerten-und-Wiederholen

→ 3. Multi-Kritiker

→ 4. Adversariale Kritik

→ 5. Richter-Ensemble

Kategorie 2 — Erinnerungsschleifen (Aus dem Gelernten lernen)

→ 6. Reflexion

→ 7. Gedächtnisaktualisierung

→ 8. Fehlerbibliothek

→ 9. Erfolgsmuster

→ 10. Gedächtniskomprimierung

Kategorie 3 — Planungsschleifen (Anpassen, wenn sich die Realität ändert)

→ 11. Planen → Ausführen → Neuplanen

→ 12. Dynamischer Workflow

→ 13. Zielzerlegung

→ 14. Fortschrittsbewertung

→ 15. Einschränkungserfüllung

Kategorie 4 — Erkundungsschleifen (Beste Antwort finden, indem man viele Wege ausprobiert)

→ 16. Verzweigen-und-Erkunden

→ 17. Baumsuche

→ 18. Debatte

Kategorie 5 — Systemoptimierungsschleifen (Die Schleife verbessert die Schleife)

→ 19. Eingabeaufforderungs-Optimierung

→ 20. Workflow-Optimierung

Die meisten Ingenieure denken, Agenten seien die Zukunft.

Agenten sind nur Arbeiter.

Schleifen sind das, was Arbeiter verbessert.

Die größte Veränderung, die gerade in der KI stattfindet, sind nicht bessere Modelle.

Es ist der Wechsel von:

Eingabeaufforderung → Antwort

Generieren → Bewerten → Lernen → Verbessern

Die Teams, die das Schleifen-Design beherrschen, werden keine besseren Eingabeaufforderungen bauen.

Sie werden Systeme bauen, die jeden Tag nach der Bereitstellung besser werden.

Ohne dass jemand sie berührt.

Wenn das nützlich war:

→ Teile es mit jedem KI-Ingenieur, den du kennst

→ Folge @sairahul1 für weitere Muster wie dieses

→ Setze ein Lesezeichen – wähle eine Schleife aus und implementiere sie diese Woche

Ich schreibe über KI, Produktentwicklung und Systeme, die ohne dich funktionieren.

20 Loop-Designmuster, die jeder KI-Entwickler kennen sollte

Agenten vs. Schleifen

KATEGORIE 1 — QUALITÄTSVERBESSERUNGSSCHLEIFEN (Die Ausgabe verbessern, bevor sie das System verlässt)

1. Generieren → Kritisieren → Umschreiben

2. Bewerten-und-Wiederholen-Schleife

3. Multi-Kritiker-Schleife

4. Adversariale Kritik-Schleife

5. Richter-Ensemble-Schleife

KATEGORIE 2 — ERINNERUNGSSCHLEIFEN (Aus dem Gelernten lernen, damit es beim nächsten Mal klüger ist)

6. Reflexionsschleife

7. Gedächtnisaktualisierungsschleife

8. Fehlerbibliotheksschleife

9. Erfolgsmusterschleife

10. Gedächtniskomprimierungsschleife

KATEGORIE 3 — PLANUNGSSCHLEIFEN (Den Plan anpassen, wenn sich die Realität ändert)

11. Planen → Ausführen → Neuplanen

12. Dynamische Workflow-Schleife

13. Zielzerlegungsschleife

14. Fortschrittsbewertungsschleife

15. Einschränkungserfüllungsschleife

KATEGORIE 4 — ERKUNDUNGSSCHLEIFEN (Die beste Antwort finden, indem man mehrere Wege ausprobiert)

16. Verzweigen-und-Erkunden-Schleife

17. Baumsuchschleife

18. Debattenschleife

KATEGORIE 5 — SYSTEMOPTIMIERUNGSSCHLEIFEN (Die Schleife verbessert die Schleife)

19. Eingabeaufforderungs-Optimierungsschleife

20. Workflow-Optimierungsschleife

Das Muster hinter allen 20 Mustern

Die vollständige Karte

Die meisten Ingenieure denken, Agenten seien die Zukunft.

Wenn das nützlich war:

Turn one viral article into a full content workflow

Aktuelle virale Artikel

Das echte Handbuch, das ich nach einem Jahr täglicher Nutzung von NotebookLM entdeckt habe

Wie Anthropic-Ingenieure Fable 5 tatsächlich prompten

AAOI: Die Strategie der vertikalen Integration bei optischen KI-Transceivern

Tesla App 4.58.5 De-Compile

Der ultimative Anti-Ban-Leitfaden für Claude Code (Juli 2026)

PorTAL: Portable Task Adapters für LLMs