Wie erinnern sich KI-Agenten? Ein detaillierter Leitfaden von den Grundlagen bis zur Praxis

Kürzlich ist das Langzeitgedächtnis für Agenten sehr populär geworden, und alle reden über Gedächtnissysteme.

Aber wenn man sich diese Erklärungen ansieht, werfen die meisten nur die meisten einen Haufen Begriffe auf einen: Vektordatenbanken, RAG, Kontextfenster, Kompression, episodisches Gedächtnis ...

Nach dem Lesen kannst du immer noch nicht genau erklären, wie es funktioniert, oder?

Das liegt nicht an dir; die meisten Artikel setzen voraus, dass du bereits ein Grundwissen hast.

Allerdings sind Agent-Gedächtnissysteme derzeit das heißeste Thema in Vorstellungsgesprächen. Wenn du sie nicht verstehst, bist du sowohl bei der Arbeit als auch in Vorstellungsgesprächen im Nachteil.

Deshalb werde ich in diesem Beitrag einen anderen Ansatz verfolgen, von den Grundlagen beginnen, ohne Fachjargon anzuhäufen! Ich werde mein Bestes geben, um es für alle verständlich zu machen!!

Ich garantiere, dass du nach dem Lesen diese drei Fragen selbst beantworten kannst:

Was ist ein Gedächtnissystem?

Wie verstehen wir das Gedächtnissystem von OpenClaw?

Wie sieht eine Lösung auf Unternehmensebene aus? Ich habe mich für EverOS entschieden (github.com/EverMind-AI/EverOS

Dieser Artikel ist recht lang und hat mehrere Tage gedauert. Wenn du Freunde hast, die sich für Agent-Gedächtnis interessieren, kannst du ihn dir merken und später weiterleiten.

Grundwissen über Agent-Gedächtnissysteme

Dieser Abschnitt behandelt hauptsächlich, wie Agenten das Gedächtnis innerhalb einer einzelnen Sitzung und über verschiedene Sitzungen hinweg aufrechterhalten. Wenn du das bereits verstehst, kannst du gerne überspringen.

Zunächst einmal gibt es kein Gedächtnis zwischen zwei API-Aufrufen an ein großes Modell. Was bedeutet das?

Zum Beispiel: Wenn du beim ersten Aufruf sagst, dass du Orangen magst, aber beim zweiten Aufruf nicht „Ich mag Orangen“ an den Prompt anhängst, wird das Modell keine Erinnerung an deine Vorliebe haben.

Wie erhält ein Agent dieses Gedächtnis während eines Gesprächs aufrecht?

Zunächst sendet das zugrunde liegende System jedes Mal, wenn du etwas fragst, deinen gesamten vorherigen Chatverlauf. Das Modell sieht ihn und sorgt so für das Kurzzeitgedächtnis.

Aber wenn der Chatverlauf so lang wird, dass er das maximale Kontextfenster des Modells überschreitet, komprimiert es den Verlauf. Es fasst den aktuellen Gesprächsverlauf zusammen und steckt ihn zurück in den Prompt, um Platz für die Fortsetzung des Chats zu schaffen.

Das ist das Prinzip, wie ein Modell das Gedächtnis in einem einzigen langen Gespräch aufrechterhält. Wenn du etwas verwirrt bist, schau dir das Diagramm unten an:

Jetzt weißt du, wie das Gedächtnis in einer einzelnen Sitzung aufrechterhalten wird, aber wie wird es zwischen verschiedenen Chat-Sitzungen?

Hier kommt das Langzeitgedächtnissystem ins Spiel!!

Es speichert wichtige Informationen in einem Speicherplatz, wenn dein Kontext komprimiert wird oder wenn du bittest, etwas zu merken.

Wenn du dann ein neues Gespräch beginnst, extrahiert es die relevanten Informationen und fügt sie zum richtigen Zeitpunkt zum Prompt hinzu.

Durch „Austausch des Alten gegen das Neue“ entsteht die Illusion, sich an viele Dinge zu erinnern. Dies ähnelt dem menschlichen Arbeitsgedächtnis und Langzeitgedächtnis.

Okay, mit diesem Grundwissen über Gedächtnis können wir nun verstehen, was ein Gedächtnissystem ist.

Im Folgenden gebe ich dir einen konzeptionellen Rahmen. Wenn du ihn zu Ende liest, garantiere ich dir, dass du ein grundlegendes Verständnis jedes Gedächtnissystem-Lösung haben wirst.

Das Gedächtnissystem

Es gibt mindestens Dutzende von Lösungen, die behaupten, Agenten ein Langzeitgedächtnis zu geben. Wie sollen wir so viele studieren?

Als nächstes werde ich ein Paper aufschlüsseln, um dir ein grundlegendes Verständnis des Agent-Langzeitgedächtn-Langzeitgedächtnisses geben und dann die Unterschiede zwischen OpenClaw und anderen Gedächtnis-Frameworks zum besseren Verständnis vergleichen.

Google hat im November 2025 ein Paper mit dem Titel „Context Engineering, Sessions and Memory“ veröffentlicht.

In diesem Paper folgen sie den Methoden der Kognitionswissenschaft von vor einem halben Jahrhundert und unterteilen das Agentgedächtnis in drei Kategorien:

Episodisches Gedächtnis: Was gestern passiert ist, worüber wir letztes Mal gesprochen haben.
Semantisches Gedächtnis: Wie heißt du, was magst du magst, was ist deine Identität.
Prozedurales Gedächtnis: Wie man eine Aufgabe erledigt, wie der Ablauf ist.

Zusammen bilden diese drei Gedächtnistypen das Gedächtnis des Agenten.

Aber das ist nur die Hälfte der Geschichte; die andere Hälfte betrifft, wie man das Gedächtnis erhält und nutzt.

Genau wie Menschen können sich Agenten nicht an alles erinnern. Daher benötigt ein Gedächtnissystem eine zuverlässige Methode, um wichtige Informationen aus dem Gesprächsverlauf zu extrahieren und dann zu speichern.

Ich nenne diesen Schritt Extraktion.

Darüber hinaus müssen wir Erinnerungen organisieren und zusammenführen.

Zum Beispiel:

Vor drei Monaten habe ich gesagt ich, ich sei in Dali, aber später bin ich nach Chengdu gezogen. Wenn diese Informationen nicht zusammengeführt werden, enthält das Gedächtnis widersprüchliche Einträge.

Der richtige Ansatz ist, das Gedächtnis nach meinem Umzug auf „Benutzer ist in Chengdu“ zu aktualisieren.

Ich nenne diesen Schritt Aktualisierung.

Es gibt auch den Schritt des Abrufs, der viele Methoden umfasst: Stichwortsuche, semantische Suche, hybride Suche oder die Verwendung großer Modelle zum Abrufen.

Um ein Gedächtnissystem zu verstehen, musst du also nur diese beiden Aspekte verstehen:

Wie viele Kategorien von Gedächtnis gibt es und was speichert jede?
Wie wird Gedächtnis extrahiert, aktualisiert und abgerufen?

Lassen Sie uns nun mit diesem Rahmen herausfinden, wie das Langzeitgedächtnis von OpenClaw implementiert ist.

Wie viele Kategorien von Gedächtnis hat OpenClaw und was speichert jede?

Sein Gedächtnis ist in die folgenden drei Typen unterteilt:

memory.md (Gedächtnis): Gehört zum semantischen Gedächtnis; speichert deine Identität, Vorlieben und stabilen Fakten.

daily logs: Gehört zum episodischen Gedächtnis; zeichnet auf, was jeden Tag passiert ist, nach Datum organisiert. Es fügt nur neue Einträge hinzu und löscht nie.

session snapshots: Gehört zur episodischen Ebene; wenn du den Befehl /new oder /reset verwendest, um eine neue Sitzung zu starten, fasst es die letzten 15 „bedeutungsvollen“ Nachrichten aus dem alten Gespräch zusammen und speichert sie als Markdown-Datei.

Wie werden Extraktion, Aktualisierung und Abruführt?

Extraktion erfolgt in drei Situationen:

Wenn ein Gespräch kurz vor der Kompression steht: Wertvolle Informationen werden in die daily logs geschrieben.
Wenn du /new oder /reset verwendest, um eine neue Sitzung zu starten: Wertvolle Informationen werden in session snapshots gespeichert.
Wenn der Benutzer bittet, sich an etwas zu erinnern: Das System entscheidet, in welchem Gedächtnistyp es gespeichert wird.

Abruf erfolgt in zwei Situationen:

Beim Starten eines neuen Gesprächs: memory.md wird automatisch in den Prompt injiziert, und es liest auch die heutigen und gestrigen daily logs für den aktuellen Kontext.
Wenn OpenClaw es für notwendig hält, das Gedächtnis zu überprüfen: Es ruft die Gedächtnissuche auf, findet den Speicherort durch hybride Suche (Stichwörter + Vektoren) und liest dann den Dateiinhalt über memory get.

Wann erfolgt die Aktualisierung? Mein persönliches Verständnis ist, dass sie während der Extraktion stattfindet, bei der Entscheidung, was man sich merken soll, stattfindet.

Wenn du es immer noch nicht ganz verstehst, schau dir das Diagramm unten an:

Jetzt hast du ein gewisses Verständnis von Gedächtnissystemen, aber um ehrlich zu sein, hat OpenClaws System mehrere Probleme:

Es verbraucht viele Tokens.
Wenn das Markdown verschwindet, verschwindet das Gedächtnis.
Es vergisst oft Dinge.

Allerdings haben echte Gedächtnissysteme auf Unternehmensebene viele Optimierungen, um Stabilität zu gewährleisten. Die Technologie dahinter ist für jeden, der Technik liebt, wert zu verstehen.

Als nächstes werde ich Agent-Gedächtnissysteme auf Unternehmensebene analysieren!!

Agent-Gedächtnissysteme auf Unternehmensebene

Im KI-Zeitalter sollte jeder Programmierer die Technologie hinter Agent-Gedächtnissystemen auf Unternehmensebene verstehen; sonst verlierst du deinen Wettbewerbsvorteil.

Warum?

Weil große Modelle weiterhin unsere Programmierarbeit aufessen werden. Die einzige Wahl ist, unterstützende Systeme für sie zu bauen.

Um es einfacher zu erklären, werde ich eine Open-Source-Lösung namens EverOS auswählen, um sie aufzuschlüsseln.

Wenn du planst, mit diesem Projekt zu beginnen, Agent-Gedächtnissysteme zu lernen, gib ihm gerne einen Stern:

github.com/EverMind-AI/EverOS

Wie ich bereits gesagt habe, um ein Gedächtnissystem zu verstehen, musst du nur zwei Fragen beantworten.

Wie beantwortet EverOS sie?

Frage 1: Wie wird das Gedächtnis kategorisiert?

Das allgemeine Framework hat 3 Typen, aber EverOS unterteilt jeden weiter, wie unten gezeigt:

Semantisches Gedächtnis: Langzeitgedächtnis darüber, wer du bist, unterteilt in zwei Ebenen:
Stabile Merkmale: Du bist eine Nachteule, Programmierer, lebst in Peking – Dinge, die sich lange nicht ändern.
Vorübergehende Zustände: Du hast heute Nacht durchgemacht, warst diese Woche beschäftigt, hattest letzte Woche eine Erkältung.

Episodisches Gedächtnis: Unterteilt in drei Typen:
Episode: Eine verdichtete Zusammenfassung eines Gesprächs oder einer Aufgabe, kein tägliches Protokoll. Beispiel: Benutzer fragte, wie man ein Modell bereitstellt, blieb an Umgebungsvariablen hängen und verbrachte 30 Minuten damit.
EventLog: Extrahiert Schlüsselfakten aus Gesprächen, jeweils mit einem Zeitstempel. Beispiel: 2026-05-10 Benutzer kaufte einen Mac mini, 2026-05-12 Benutzer verknüpfte GitHub.
Foresight: Zeitbezogene „nächste Schritte“ – Dinge, die du gesagt hast, dass du tun wirst, oder die es ableitet, dass du später involviert sein wirst, mit Ablaufzeiten für Erinnerungen. Beispiel: Sende den Vorschlag vor nächstem Freitag.

Prozedurales Gedächtnis: Unterteilt in zwei Typen:
Agent Case: Nach Abschluss einer Aufgabe zeichnet es auf, „was beabsichtigt war + Schritt-für-Schritt-Aktionen + eine Qualitätsbewertung“. Beispiel: Eine E-Mail senden – es überprüft Kontakte, entwirft, bittet um Bestätigung, sendet dann – dieser gesamte Satz wird mit einer Qualitätsbewertung archiviert.
Agent Skill (Destillierte Fähigkeit): Nachdem ähnliche Aufgaben mehrmals ausgeführt wurden, destilliert es automatisch einen allgemeinen Ansatz aus diesen Archiven, mit einem Reifitätsbewertung. Je öfter es gemacht wird, desto zuverlässiger wird es. Beispiel: Nach 5 E-Mail-Aufgaben lernt es, zu überprüfen, ob der Empfänger eine wichtige Person ist, bevor es sich für einen formellen oder lockeren Ton entscheidet.

Wie du siehst, teilt EverOS die ursprünglichen 3 Kategorien in 6 Typen auf, was eine präzisere Speicherung und effektivere Erinnerung ermöglicht.

Darüber hinaus ähnelt es mehr dem menschlichen Gedächtnis – es sagt die Zukunft voraus und fasst Fähigkeiten zusammen/verfeinert sie.

Frage 2: Wie werden Extraktion, Aktualisierung und Abruf durchgeführt?

Wie wird Gedächtnis extrahiert?

EverOS beurteilt automatisch, ob „dieses Segment beendet ist“. Sobald es beendet ist, schneidet es es und packt es in eine Gedächtniseinheit.

Jede Einheit enthält 4 Dinge:

Handlung: Was besprochen und getan wurde – eine verdichtete Zusammenfassung, nicht wörtlich.
Schlüsselfakten: Welche Fakten darin sind es wert, separat notiert zu werden.
Voraussicht: Dinge, die du gesagt hast, dass du tun wirst, oder die es ableitet, dass du tun wirst, mit Ablaufzeiten für Erinnerungen.
Kontext-Tags: Wann, wo, wie glaubwürdig und welche Emotion zu der Zeit herrschte.

Du unterhältst dich einfach; es kümmert sich um die Segmentierungsdetails.

Wie wird Gedächtnis aktualisiert?

Zum Beispiel:

Vor einem Monat hast du der KI gesagt: Ich habe vor, mit dem Training zu beginnen. Zwei Wochen später sagtest du: Ich war beschäftigt, war nicht im Fitnessstudio. Heute sagst du: Vergiss es, ich trainiere nicht.

Gewöhnliche Lösungen häufen alle drei in das Protokoll. Welches das Modell abruft, das betrachtetrachtet es als Tatsache. Aber in Wirklichkeit. Aber in Wirklichkeit sollte die Antwort die neueste sein.

EverOS verlässt sich auf „Semantische Konsolidierung“, die drei Dinge tut:

Bestimmt automatisch, welches das neueste ist (Training eingestellt).
Führt Duplikate oder Dinge, die sich auf dasselbe Ereignis beziehen, zusammen.
Pflegt ein Benutzerprofil, das stabile Vorlieben von vorübergehende Zustände trennt (offiziell Profile Evolution genannt).

Details sind unten dargestellt:

Wie wird Gedächtnis abgerufen?

EverOS bietet dir 4 Abrufmethoden zur Auswahl, je nach Szenario:

Stichwörter: Exakte Übereinstimmung, geeignet für bestimmte Namen oder IDs. -IDs.
Vektorsuche: Semantische Übereinstimmung – verschiedene Wörter mit derselben Bedeutung können übereinstimmen.
Hybrid: Stichwörter + Vektoren zusammen, dann durch ein Rerank-Modell gefiltert – der empfohlene Standard.
Agentic: Für komplexe mehrteilige Fragen; das LLM beurteilt, was und wie gesucht werden soll, und iteriert, bis es gefunden wird (verwendet, wenn Hybrid nicht ausreicht).

Aber die 4 Methoden sind nicht der Schlüssel; der Schlüssel ist die Abruflogik.

Gewöhnliche Lösungen sind passiv – du gibst Stichwörter, es gibt passende Dokumente zurück, und das war's.

EverOS rekonstruiert aktiv den Kontext:

Analysiert, was du diesmal tun möchtest.
Aktiviert relevante thematische Szenarien.
Filtert abgelaufene Informationen heraus (z.B. Vorliebhaber von vor einem Jahr könnten ungültigültig sein).
Sucht iterativ, bis genügend Informationen gesammelt sind.

Gewöhnliche Lösungen sind wie eine Suchmaschine, die nach einer Suche fertig ist. EverOS sucht wiederholt aus verschiedenen Blickwinkeln, bis es ausreichende Informationen findet.

EverOS erreichte eine Gesamtgenauigkeit von 93,05% auf dem Langzeitgedächtnis-Benchmark LoCoMo (mit GPT-4o-mini) und schlug die Vergleichslösung Zep (85,22%) um fast 8 Prozentpunkte.

Nach dem Lesen dieses Abschnitts solltest du eine gute Vorstellung von produktionsreifen Agent-Gedächtnissystemen haben. Aber wie werden sie in der tatsächlichen Technik umgesetzt, und was kannst du damit machen?

Tatsächliche Produktionsimplementierung

Ich werde weiterhin dieses Open-Source-Projekt verwenden, um zu erklären, aus zwei Gründen: Die API ist kostenlos offen, und das Repository enthält 20 reale Fälle – perfekt, um die Implementierung zu besprechen!!

Kostenlose offene API

Die Cloud-API von EverOS ist kostenlos offen.

Drei Schritte zum Starten:

Öffne everos.evermind.ai in deinem Browser, um dich zu registrieren; die Seite gibt dir einen API-Key, speichere ihn.
Installiere das SDK über die Befehlszeile: pip install everos
Instanziiere den Client in Python und beginne mit der Nutzung.

EverOS ist nicht nur kostenlos auszuprobieren, sondern unterstützt auch die kürzlich populäre Skill Self-Evolution-Funktion zur Selbstentwicklung!!

Wie verwendet man Skill Self-Evolution?

Wenn ein Agent wiederholt ähnliche Aufgaben ausführt, destilliert EverOS automatisch die Erfahrung in wiederverwendbare Fähigkeiten. Wenn das nächste Mal eine ähnliche Aufgabe auftaucht, verwendet es direkt die Fähigkeit, anstatt von vorne zu beginnen.

Die Verwendung in Code beinhaltet das Verketten Code beinhaltet das Verketten von 3 APIs:

Zwei Punkte zu beachten:

Wenn du das erste Mal eine Trajektorie einspeist, wird nur ein Fall (Archiv einer einzelnen Aufgabe) generiert. Fähigkeiten werden erst nach mehreren ähnlichen Aufgaben geclustert und destilliert.
Du musst den Endpunkt /memories/agent verwenden; reguläre /memories extrahieren keine Fähigkeiten.

Wenn du die Funktion Skill Self-Evolution nicht verstehst, schau dir das Diagramm unten an:

Ich habe die Code-Verwendung kurz erwähnt, aber als Agent-Infrastruktur hat dieses Projekt äußerst wertvolle reale Anwendungsfälle.

Und diese Fälle sind alle Open-Source und bereit zum Lernen!!

20 reale Anwendungsfälle

Die README des Repositorys listet 20 Anwendungsfälle auf, hier sind einige:

MemoCare (Alzheimer-Gedächtnis-Assistent für Alzheimer): Bietet ein externes Gedächtnis, das nie vergisst, für Patienten mit kognitivem Abbau – dies ist eines der herzerwärmendsten gemeinnützigen Projekte.
Claude Code Plugin: Fügt Claude Code ein Langzeitgedächtnis hinzu, das sich über Sitzungen hinweg erinnert.
Game of Thrones: Füttert GoT-Handlungen an die KI, um Charaktere zu spielen, die sich langfristig daran erinnern, wer sie sind.
OpenHer: KI-Freundin, emotionale Begleitung + Gedächtnisentwicklung.
Computer-Use mit Gedächtnis: Lässt den Agenten den Computer steuern und sich an Erfahrungen aus jedem Vorgang erinnern.
Memory Graph Visualization: Stellt das Gedächtnissystem als Graph.

Die vollständige Liste befindet sich in der README unter github.com/EverMind-AI/EverOS.

Übrigens, hier sind einige offizielle Plugins:

APIs sind nicht genug, also hat EverOS Gedächtnisfähigkeiten in mehrere Plugins verpackt:

Claude Code Plugin: Fügt Claude Code ein Langzeitgedächtnis hinzu – speichert automatisch nach jeder Antwort und ruft den Kontext für jede Frage ab, mit einem visuellen Memory Hub-Bedienfeld. Mit einem Befehl installieren.
OpenClaw Plugin: Verbindet EverOS als „Gedächtnissteckplatz“ für OpenClaw – der Agent ruft automatisch relevante Gedächtnisinhalte (Handlungen, Profile, Fälle, Fähigkeiten) ab, bevor er ausgeführt wird, und speichert das Gespräch und die Tool-Aufrufe danach.
OpenClaw Skill: Verbindet EverOS-Gedächtniswerkzeuge mit OpenClaw / Claude Code als „Fähigkeiten“, sodass der Agent das Gedächtnis nach Bedarf auf Abruf auf das Gedächtnis zugreifen kann, anstatt es dauerhaft anzuhängen.

Zurück zu den drei Fragen am Anfang:

Was ist ein Gedächtnissystem? Wie ist das Gedächtnissystem von OpenClaw? Wie sieht eine Lösung auf Unternehmensebene aus?

Du solltest jetzt die Antworten haben.

EverMind ist ein ausgezeichnetes Projekt:

Das gesamte Projekt ist Apache 2.0 Open Source, derzeit mit 4500+ Sternen.
EverMind hat starke akademische und algorithmische Wurzeln, veröffentlicht ständig Papers; ihr vorheriges MSA war ebenfalls ein sehr fortschrittliches Konzept.
EverMind ist ein KI-natives Unternehmen unter Shanda, mit reichlich Ressourcen.

Wenn du planst, mit diesem Projekt zu beginnen, Agent-Gedächtnissysteme zu lernen, gib ihm gerne einen Stern:

github.com/EverMind-AI/EverOS

Sie haben auch neue Produkte, die Ende des Monats auf den Marktes kommen, ich freue mich darauf!!

Dies ist mein erfreut!!

Dies ist mein erster Versuch, technische Konzepte in einem Artikel zu erklären. Um es für die meisten Menschen verständlich zu machen, habe ich viele Details weggelassen.

Die beteiligte Technologie ist komplex; zögere nicht, Fehler in den Kommentaren zu korrigieren.

Wenn dir mein Artikel gefällt, kannst du ihn dir merken, kommentieren, an Freunde weiterleiten und mir folgen.

Grundwissen über Agent-Gedächtnissysteme

Das Gedächtnissystem

Agent-Gedächtnissysteme auf Unternehmensebene

Tatsächliche Produktionsimplementierung

Use YouMind to read viral articles deeply

Aktuelle virale Artikel

7 Hindernisse bei der Implementierung von KI-Agenten vor Ort und in der Organisation

Zusammenfassung der Informationen zum Resonance Alca Song

Scrolling gilt als minderwertig

ArsenalOS™: Das digitale Rückgrat der modernen Verteidigungsfertigung

27 Settings to Transform Claude Code into an Autonomous Agent System

Ideengeneratoren: Reid Hoffman über Mark Pincus und die Theorie des Spiels