AI 에이전트는 어떻게 기억하는가? 원리부터 실전까지 상세 가이드

최근에 Agent 의 장기 기억 시스템이 매우 인기를 끌면서, 모두가 메모리 시스템에 대해 이야기하고 있습니다.

하지만 그 설명들을 자세히 살펴보면, 대부분 그냥 용어들만 나열합니다: 벡터 데이터베이스, RAG, 컨텍스트 윈도우, 압축, 일화 기억...

읽고 나서도 정확히 어떻게 작동하는지 설명할 수 없죠?

여러분 탓이 아닙니다. 대부분의 글은 여러분이 이미 기본 지식을 갖추고 있다고 가정하기 때문입니다.

하지만 현재 Agent 메모리 시스템은 면접에서 가장 뜨거운 주제입니다. 이해하지 못하면 업무와 면접 모두에서 불리해집니다.

그래서 이 글에서는 다른 접근 방식을 취해, 기본부터 시작해서 전문 용어를 쌓아 올리지 않겠습니다! 최대한 누구나 이해할 수 있도록 설명해 보겠습니다!!

이 글을 다 읽고 나면, 다음 세 가지 질문에 스스로 답할 수 있을 것이라고 장담합니다:

메모리 시스템이란 무엇인가?

OpenClaw 의 메모리 시스템은 어떻게 이해해야 하는가?

엔터프라이즈급 솔루션은 어떤 모습인가? 저는 EverOS (github.com/EverMind-AI/EverOS)를 선택했습니다.

이 글의 주소를 한국어로 번역하지 않습니다. AI/EverOS))를 선택했습니다.

이 글은 꽤 깁니다. 며칠에 걸쳐 작성했습니다. Agent 메모리에 관심 있는 친구가 있다면, 북마크에 저장했다가 나중에 공유해 주세요.

Agent 메모.

Agent 메모리 시스템에 대한 기본 지식

이 센 지식

이 섹션에서는 주로 Agent 가 단일 세션 내에서 그리고 여러 세션에 걸쳐 메모리를 유지하는 방법을 다룹니다. 이미 이해하고 있다면 건너뛰어도 좋습니다.

먼저, 대규모 언어 모델에 대한 두 번의 API 호출 사이에는 메모리가 존재하지 않습니다. 무슨 뜻일까요?

예를 들어: 첫 번째 호출에서 오렌지 먹는 것을 좋아한다고 말했지만, 두 번째 호출에서 프롬프트에 "저는 오렌지 먹는 것을 좋아합니다"를 추가하지 않으면, 모델은 여러분의 선호도를 기억하지 못합니다.

그렇다면 Agent 는 대화 중에 이 메모리를 어떻게 유지할까요?

먼저, 질문할 때마다 기본 시스템이 이전 전체 대화 내역을 전송합니다. 모델이 이를 보고 단기 기억을 보장합니다.

하지만 대화 내역이 너무 길어져 모델의 최대 컨텍스트 윈도우를 초과하면, 내역을 압축합니다. 현재 대화 내역을 요약하여 다시 프롬프트에 집어넣어 대화를 계속할 공간을 만듭니다.

이것이 모델이 단일 긴 대화에서 메모리를 유지하는 원리입니다. 이해가 잘 안 된다면 아래 다이어그램을 확인해 보세요:

이제 단일 세션에서 메모리가 어떻게 유지되는지 알았습니다. 그렇다면 다른 채팅 세션 간에는 어떻게 유지될까요?

바로 여기에 장기 기억 시스템이 등장합니다!!

장기 기억 시스템이 하는 일은 컨텍스트가 압축되거나 사용자가 무언가를 요청할 때 중요한 정보를 저장 공간에 저장하는 것입니다.

그런 다음 새 대화를 시작할 때 적절한 시점에 관련 정보를 추출하여 프롬프트에 추가합니다.

"오래된 것을 새것으로 교체"함으로써 많은 것을 기억하는 듯한 착각을 만듭니다. 이는 인간의 작업 기억 및 장기 기억과 유사합니다.

자, 이제 메모리에 대한 기본 지식을 갖추었으니 메모리 시스템이 무엇인지 이해해 보겠습니다.

아래에서는 개념적 프레임워크를 제시하겠습니다. 다 읽으면, 어떤 메모리 시스템 솔루션이든 기본적으로 이해할 수 있을 것입니다.

메모리 시스템

Agent 에게 장기 기억을 제공한다고 주겠다고 주장하는 솔루션은 수십 가지에 달합니다. 어떻게 그 많은 것을 연구할 수 있을까요?

다음으로, 논문 하나를 분석하여 Agent 장기 기억에 대한 기본적인 이해를 돕고, OpenClaw 와 다른 메모리 프레임워크의 차이점을 비교하여 더 쉽게 이해할 수 있도록 하겠습니다.

Google 은 2025년 11월에 "Context Engineering, Sessions and Memory"라는 논문을 발표했습니다.

이 논문에서 그들은 반세기 전 인지 과학의 방법을 따라 Agent 메모리를 세 가지 범주로 나눕니다:

일화 기억 (Episodic Memory): 어제 무슨 일이 있었는지, 전에 무슨 이야기를 했는지.
의미 기억 (Semantic Memory): 당신의 이름은 무엇인지, 무엇을 좋아하는지, 당신의 정체성은 무엇인지.
절차 기억 (Procedural Memory): 작업을 완료하는 방법, 프로세스는 무엇인지.

이 세 가지 기억 유형의 메모리가 함께 Agent 의 메모리를 구성합니다.

하지만 이것은 이야기의 절반에 불과합니다. 나머지 절반은 메모리를 유지하고 사용하는 방법에 관한 것입니다.

인간과 마찬가지로 Agent 도 모든 것을 기억할 수 없습니다. 따라서 메모리 시스템은 대화 내역에서 중요한 정보를 추출한 다음 저장하는 신뢰할 수 있는 방법이 필요합니다.

저는 이 단계를 추출 (Extraction) 이라고 부릅니다.

또한, 메모리를 정리하고 병합해야 합니다.

예를 들어:

세 달 전에 제가 대구에 있다고 말했지만, 나중에 청주로 이사했습니다. 이 정보가 병합되지 않으면 메모리에는 모순된 항목이 포함됩니다.

올바른 접근 방식은 제가 이사한 후 메모리를 "사용자는 청주에 있습니다"로 업데이트하는 것입니다.

저는 이 단계를 업데이트 (Updating) 이라고 부릅니다.

또한 검색 (Retrieval) 단계가 있으며, 여기에는 키워드 검색, 의미 검색, 하이브리드 검색 또는 대규모 언어 모델을 사용한 검색 등 다양한 방법이 포함됩니다.

따라서, 메모리 시스템을 이해하려면 다음 두 가지 측면만 이해하면 됩니다:

메모리는 몇 가지 범주로 나뉘며, 각 범주는 무엇을 저장하는 것은 무엇을 저장하는가?
메모리는 어떻게 추출, 업데이트, 검색되는가?

자, 이제 이 프레임워크를 사용하여 OpenClaw 의 장기 기억이 어떻게 구현되는지 알아봅시다.

OpenClaw 의 메모리는 몇 가지 범주로 나뉘며, 각 범주는 무엇을 저장합니까?

메모리는 다음 세 가지 유형으로 구분됩니다:

memory.md (메모리): 의미 기억에 속하며, 사용자의 정체성, 선호도 및 안정적인 사실을 저장합니다.

daily logs (일일 로그): 일화 기억에 속하며, 매일 무슨 일이 있었는지 날짜별로 기록합니다. 새 항목만 추가하고 절대 삭제하지 않습니다.

session snapshots (세션 스냅샷): 일화 계층에 속하며, /new 또는 /reset 명령어로 새 세션을 시작할 때 이전 대화의 마지막 15개의 "의미 있는" 메시지를 요약하여 마크다운 파일로 저장합니다.

추출, 업데이트 및 업데이트, 검색은 어떻게 이루어지나요?

추출은 세 가지 상황에서 발생합니다:

대화가 압축되려고 할 때: 가치 있는 정보가 일일 로그에 기록됩니다.
/new 또는 /reset을 사용하여 새 세션을 시작할 때: 가치 있는 정보가 세션 스냅샷에 저장됩니다.
사용자가 무언가를 기억하도록 요청할 때: 시스템은 어떤 메모리 유형에 저장할지할지 결정합니다.

검색은 두 가지 상황에서 발생합니다:

새 대화를 시작할 때: memory.md 가 자동으로 프롬프트에 주입되고, 오늘과 어제의 일일 로그를 읽어 최근 컨텍스트를 제공합니다.
OpenClaw 가 메모리를 확인해야 한다고 판단할 때: 메모리 검색을 호출하여 하이브리드 검색(키워드 + 벡터)을 통해 메모리 위치를 찾은 다음, 메모리 가져오기를 통해 파일 내용을 읽습니다.

업데이트는 언제 발생하나요? 제 개인적인 이해로는 추출 중에 무엇을 기억할지 결정할 때 발생한다고 생각합니다.

여전히 이해가 되지 않는다면 아래 다이어그램을 확인해 보세요:

이제 메모리 시스템에 대해 어느 정도 이해하셨을 것입니다. 하지만 솔직히 말해서, OpenClaw 의 시스템에는 몇 가지 문제가 있습니다:

토큰을 많이 소모합니다.
마크다운 파일이 사라지면 메모리도 사라집니다.
자주 잊어버립니다.

하지만 진정한 엔터프라이즈급 메모리 시스템은 안정성을 보장하기 위해 많은 최적화를 거쳤습니다. 그 뒤에 숨은 기술은 기술을 사랑하는 모든 사람이 이해할 가치가 있습니다.

다음으로, 엔터프라이즈급 Agent 메모리 시스템을 분석해 보겠습니다!!

엔터프라이즈급 Agent 메모리 시스템

AI 시대에 모든 프로그래머는 엔터프라이즈급 Agent 메모리 시스템 뒤에 숨의 기술을 이해해야 합니다. 그렇지 않으면 경쟁력을 잃게 됩니다.

왜일까요?

대규모 언어 모델이 우리의 프로그래밍 작업을 계속 잠식할 것이기 때문입니다. 유일한 선택은 그들을 위한 지원 시스템을 구축하는 것입니다.

설명을 쉽게 하기 위해 EverOS 라는 오픈 소스 솔루션인 EverOS 를 선택하여 분석하겠습니다.

이 프로젝트부터 Agent 메모리 시스템을 배우기 시작하려면, 별표를 눌러 주세요:

github.com/EverMind-AI/EverOS

앞서 말했듯이, 메모리 시스템을 이해하려면 두 가지 질문에 답하면 됩니다.

EverOS 는 어떻게 답할까요?

질문 1: 메모리는 어떻게 분류됩니까?

일반적인 프레임워크에는 3가지 유형이 있지만, EverOS 는 각 유형을 더 세분화합니다. 아래 그림과 같습니다:

의미 기억 사용자에 대한 장기 기억으로, 두 가지 계층으로 나뉩니다:
안정적인 특성 (Stable Traits): 당신은 올빼미형이고, 프로그래머이며, 베이징에 산다—오랫동안 변하지 않는 것들.
임시 상태 (Temporary States): 오늘 밤을 샜다, 이번 주에 바빴다, 지난주에 감기에 걸렸다.

일화 기억 세 가지 유형으로 나뉩니다:
에피소드 (Episode): 대화나 작업의 압축된 요약으로, 일일 로그가 아닙니다. 예: 사용자가 모델을 배포하는 방법을 물었고, 환경 변수에서 막혀 30분 동안 작업했습니다.
EventLog: 대화에서 주요 사실을 추출된 사실을 추출하며, 각각 타임스탬프가 있습니다. 예: 2026-05-10 사용자가 Mac mini 를 구매함, 2026-05-12 사용자가 GitHub 를 연결함.
예측 (Foresight): 시간과 관련된 "다음 단계"—사용자가 하겠다고 말한 일 또는 Agent 가 사용자가 나중에 관련될 것이라고 추론하는 일로, 알림을 위한 만료 시간이 있습니다. 예: 다음 주 금요일까지 제안서를 보내세요.

절차 기억 두 가지 유형으로 나뉩니다:
Agent 사례 (Agent Case): 작업을 완료한 후 "의도 + 단계별 단계별 작업 + 품질 점수"를 기록합니다. 예: 이메일 보내기—연락처 확인, 초안 작성, 확인 요청, 전송—이 전체 세트가 품질 점수와 함께 보관됩니다.
Agent 스킬 (Agent Skill, 정제된 스킬): 유사한 작업을 여러 번 수행한 후, 이러한 아카이브에서 일반적인 접근 방식을 자동으로 정제하며, 성숙도 점수가 있습니다. 많이 할수록 더 신뢰할 수 있게 됩니다. 예: 5번의 이메일 작업 후, 수신자가 중요한 사람인지 확인한 후 격식 또는 캐주얼한 어조를 결정하는 방법을 학습합니다.

보시다시피, EverOS 는 원래 3개 범주를 6개 유형으로 분할하여 더 정확하게 저장하고 더 효과적으로 메모리를 할 수 있게 합니다.

게다가, 인간의 기억을 예측하고 기술을 요약/정제한다는 점에서 인간의 기억과 더 유사합니다.

질문 2: 추출, 업데이트 및 검색은 어떻게 이루어집니까?

메모리는 어떻게 추출됩니까?

EverOS 는 "이 세그먼트가 끝났는지"를 자동으로 판단합니다. 끝나면 잘라서 메모리 유닛으로 패킹합니다.

각 유닛은 4가지를 포함합니다:

줄거리 (Plot): 논의되고 수행된 내용—축약된 요약, 그대로가 아님.
핵심 사실 (Key Facts): 내에서 별도로 주목할 가치가 있는 사실.
예측 (Foresight): 사용자가 하겠다고 말한 일 또는 Agent 가 할 것이라고 추론하는 일로, 알림을 위한 만료 시간이 포함됨.
컨텍스트 태그 (Context Tags): 언제, 어디서, 얼마나 신뢰할 수 있는지, 당시 감정은 어.

사용자는 채팅만 하면 됩니다. 시스템이 세분화 세부 사항을 처리합니다.

메모리는 어떻게 업데이트됩니까?

예를 들어:

한 달 전, AI 에게 말했습니다: 운동을 시작하려고 합니다. 2주 후, 말했습니다: 바빠서 헬스장에 가지 못했습니다. 오늘 말합니다: 관뒀습니다, 운동 안 합니다.

일반적인 솔루션은 세 가지를 모두 로그에 쌓습니다. 모델이 검색하는 것이 무엇이든 사실로 간주합니다. 하지만 실제로는 최신 답변이어야 합니다.

EverOS 는 "의미 통합 (Semantic Consolidation)"에 의존하며, 세 가지 작업을 수행합니다:

자동으로 최신 항목 결정 (운동 중단).
- 중복되거나 동일한 이벤트를 참조하는 항목 병합.
사용자 프로필 유지, 안정적인 선호도와 임시 상태 분리 (공식적으로 프로필 진화라고 함).

자세한 내용은 아래와 같습니다:

메모리는 어떻게 검색됩니까?

EverOS 는 시나리오에 따라 선택할 수 있는 4가지 검색 방법을 제공합니다:

키워드: 정확 일치, 특정 이름이나 ID에 적합.
벡터 검색: 의미 일치—의미가 같은 다른 단어도 일치 가능.
하이브리드: 키워드 + 벡터를 함께 사용한 다음, rerank 모델로 필터링—권장 기본값.
Agentic: 복잡한 다중 부분 질문에 사용됨; LLM 이 무엇을 어떻게 검색할지 판단하고, 찾을 때까지 반복 (하이브리드로 충분하지 않을 때 사용).

하지만 4가지 방법이 핵심이 아닙니다. 핵심은 검색 로직입니다.

일반적인 솔루션은 수동적입니다—키워드를 제공하면 일치하는 문서를 반환하고 끝입니다.

EverOS 는 컨텍스트를 적극적으로 재구성합니다:

이번에 무엇을 할 일을 분석합니다.
관련 주제 시나리오를 활성화합니다.
만료된 정보를 필터링합니다 (예: 1년 전 선호도는 유효하지 않을 수 있음).
충분한 정보가 수집될 때까지 반복적으로 검색합니다.

적인 솔루션은 한 번 검색하고 끝나는 검색 엔진과 같습니다. EverOS 는 충분한 정보를 찾을 때까지 다양한 각도에서 반복적으로 찾습니다.

EverOS 는 장기 기억 벤치마크 LoCoMo (GPT-4o-mini 사용)에서 전체 정확도 93.05%를 달성하여 비교 솔루션인 Zep (85.22%)을 거의 8% 포인트 차이로 이겼습니다.

이 섹션을 읽고 나면 프로덕션 등급의 Agent 메모리 시스템에 대해 잘 알게 되었을 것입니다. 하지만 이것이 실제 엔지니어링에 어떻게 적용되며, 무엇을 할 수 있을까요?

실제 프로덕션 구현

이 오픈 소스 프로젝트를 계속 사용하여 설명하겠습니다. 이유는 두 가지입니다: API 가 무료로 공개되어 있고, 리포지토리에는 20개의 실제 사례가 포함되어 있어 구현에 대해 논의하기에 완벽합니다!!

무료 오픈 API

EverOS 의 Cloud API 는 무료로 공개되어 있습니다.

시작하는 세 단계:

브라우저에서 everos.evermind.ai 를 열어 등록하면 페이지에서 API Key 를 제공합니다. 저장하세요.
명령줄을 통해 SDK 설치: pip install everos
Python 에서 클라이언트를 인스턴스화하고 사용을 시작합니다.

EverOS 는 무료로 사용해 볼 수 있을 뿐만 아니라, 최근 인기 있는 스킬 자체 진화 (Skill Self-Evolution) 기능도 지원합니다!!

스킬 자체 진화는 어떻게 사용하나요?

Agent 가 반복적으로 유사한 작업을 수행하면, EverOS 는 자동으로 경험을 재사용 가능한 스킬로 정제합니다. 다음에 유사한 작업이 들어오면 처음부터 시작하는 대신 스킬을 직접 사용합니다.

코드에서 사용하는 방법은 3개의 API 를 연결하는 것입니다:

두 가지 주의할 점:

처음 궤적을 제공하면 사례 (단일 작업 아카이브)만 생성됩니다. 스킬은 여러 유사한 작업 후에만 클러스터링되고 정제됩니다.
/memories/agent 엔드포인트를 사용해야 합니다. 일반 /memories 는 스킬을 추출하지 않습니다.

스킬 자체 진화 기능을 이해하지 못하겠다면 아래 다이어그램을 확인해 보세요:

코드 사용법을 간략히 언급했지만, Agent 인프라로서 이 프로젝트는 매우 귀중한 실제 사용 사례를 가지고 있습니다.

그리고 이러한 사례들은 모두 오픈 소스로 공개되어 학습할 준비가 되어 있습니다!!

20가지 실제 사용 사례

리포지토리 README 에는 20가지 사용 사례가 나열되어 있습니다. 몇 가지 소개합니다:

MemoCare (알츠하이머 기억 도우미): 인지 저하 환자에게 잊지 않는 외부 기억을 제공합니다—가장 감동적인 공익 프로젝트 중 하나입니다.
Claude Code 플러그인: Claude Code 에 장기 기억을 추가하여 세션 간에 기억합니다.
왕좌의 게임: AI 에 왕좌의 게임을 주입하여 장기적으로 자신이 누구인지 기억하는 캐릭터를 연기하게 합니다.
OpenHer: AI 여자 친구, 감정적 교감 + 기억 진화.
Computer-Use with Memory: Agent 가 컴퓨터를 제어하고 각 작업의 경험을 기억하게 합니다.
**Memory.
Memory Graph Visualization: 메모리 시스템을 그래프로 시각화합니다.

전체 목록은 github.com/EverOS 의 README 에 있습니다.

그리고 공식 플러그인 몇 가지를 소개합니다:

API 만으로는 부족했는지, EverOS 는 메모리 기능을 몇 가지 즉시 사용 가능한 플러그인으로 패키징했습니다:

Claude Code 플러그인: Claude Code 에 장기 기억을 추가합니다—각 응답 후 자동 저장하고 각 질문에 대한 컨텍스트를 불러오며, 시각적인 Memory Hub 패널을 제공합니다. 한 번의 명령으로 설치할 수 있습니다.
OpenClaw 플러그인: EverOS 를 OpenClaw 의 "메모리 슬롯"으로 연결합니다—Agent 가 실행 전에 관련 메모리 (줄거리, 프로필, 사례, 스킬)를 자동으로 검색하고, 실행 후 대화 및 도구 호출을 저장합니다.
OpenClaw 스킬: EverOS 메모리 도구를 OpenClaw / Claude Code 에 "스킬"로 연결하여 Agent 가 필요에 따라 메모리를 호출할 수 있게 하며, 영구적으로 연결되지 않습니다.

처음의 세 가지 질문으로 돌아가 보겠습니다:

메모리 시스템이란 무엇인가? OpenClaw 의 메모리 시스템은 어떠한가? 엔터프라이즈급 솔루션은 어떤 모습인가?

이제 답을 알 수 있을 것입니다.

EverMind 는 훌륭한 프로젝트입니다:

전체 프로젝트는 Apache 2.0 오픈 소스이며, 현재 4500+ 개의 별표를 받았습니다.
EverMind 는 강력한 학문적 및 알고리즘적 기반을 가지고 있으며, 지속적으로 논문을 발표하고 있습니다. 이전의 MSA 도 매우 진보된 개념이었습니다.
EverMind 는 Shanda 산하의 AI 네이티브 회사로, 충분한 자원을 보유하고 있습니다.

이 프로젝트부터 Agent 메모리 시스템을 배우기 시작하려면, 별표를 눌러 주세요:

github.com/EverMind-AI/EverOS

또한 이달 말에 신제품을 출시할 예정입니다. 기대됩니다!!

기술적 개념을 글로 설명하려는 첫 번째 시도입니다. 대부분의 사람들이 이해할 수 있도록 많은 세부 사항을 생략했습니다.

관련 기술은 복잡합니다. 오류가 있으면 댓글로 지적해 주시면 수정하겠습니다.

제 글이 마음에 드셨다면, 북마크, 댓글, 친구들에게 공유, 그리고 팔로우를 해 주세요.

AI 에이전트는 어떻게 기억하는가? 원리부터 실전까지 상세 가이드

Agent 메모.

Agent 메모리 시스템에 대한 기본 지식

메모리 시스템

엔터프라이즈급 Agent 메모리 시스템

실제 프로덕션 구현

Turn one viral article into a full content workflow

최근 바이럴 아티클

스크롤링은 낮은 가치를 지닌 행동입니다

일본 대기업들이 Gemini와 Copilot을 기반으로 선택하는 이유

AI를 활용해 1인 기업을 구축하는 방법

ArsenalOS™: 현대 방산 제조의 디지털 중추

Claude Code로 유료 광고를 운영하는 방법: 메가 가이드

ORACLE: Polymarket 공식 AI 에이전트 트레이딩