지난 2년 동안 구축해 온 AI 시스템이 방금 2770만 달러 규모의 익스플로잇을 막아냈습니다. 이 프로젝트는 우리에게 25만 달러의 현상금을 지급했으며, 이는 AI가 완전히 발견한 취약점에 대해 지급된 역대 최대 규모의 현상금입니다.
어떤 인간도 이 탐색을 지시하지 않았습니다. 시스템이 스스로 찾아냈습니다. 우리는 세계 최고 수준의 보안 연구원 팀과 함께 이를 검증하고 신고했습니다.
AI는 이미 올림피아드 수학 문제를 풀고, 새로운 단백질을 발견하며, 질병 진단에서 의사를 능가하고 있습니다. 이제 여기에 하나가 더 추가되었습니다.
모든 것을 시작한 테제
우리는 특정한 테제를 바탕으로 이 시스템을 구축하기 시작했습니다. 인간 감사자가 상호 작용하는 시스템을 추적할 수 있는 깊이에는 인지적 한계가 있습니다. 세계 최고의 연구자들도 약 4~5단계의 시스템 상호 작용에서 한계에 부딪힙니다. 그리고 감사를 통과하는 대부분의 치명적인 버그는 바로 그 한계 아래에 존재합니다.
그래서 우리는 AI가 이를 넘을 수 있는지 알아보고자 했습니다.
우리가 구축한 것은 또 다른 스캐너가 아닙니다. 거짓 양성(false positive)으로 가득한 또 다른 ChatGPT 래퍼도 아닙니다. 우리는 기존 AI 모델 위에 추론 아키텍처를 구축하여, 원래 설계된 범위를 훨씬 넘어서도록 확장했습니다. 7개 이상의 상호 작용하는 시스템 계층을 동시에 추적하며, 인간조차 찾을 생각조차 하지 못하는 취약점을 발견하는 시스템입니다.
선도적인 AI 연구소들의 프론티어 모델은 모두 근본적인 추론 한계를 가지고 있습니다. 여러 계층의 상호 작용 시스템에 걸친 복잡한 논리를 유지하고 추적할 수 없습니다. 어떤 연구소도 이 문제를 해결하지 못했습니다. 우리가 해냈습니다. 동일한 모델을 사용해도 우리 시스템은 완전히 다른 수준의 출력을 얻습니다. 마치 모델이 30% 성능으로만 작동하고 있었는데 아무도 눈치채지 못한 것과 같습니다.
내가 참여하게 된 과정
저는 수년간 버그 헌팅을 해왔습니다. 모든 세대의 'AI 보안 도구'가 등장하는 것을 지켜봤습니다. 고수준 스캐너는 명백한 문제만 지적하고, ChatGPT 래퍼는 수백 개의 거짓 양성을 쏟아냅니다. 모두 시간 낭비였습니다.
@0xitsgreg가 자신이 구축한 것을 보여주었을 때, 저는 평소와 같은 데모를 기대했습니다. 하지만 제가 본 것은 각 코드베이스를 극도로 심층 분석하여 가장 난해하고 찾기 어려운 버그를 발굴하는 시스템이었습니다.
저는 공동 창업자이자 CEO로 합류했습니다.
우리가 찾은 가장 어려운 검증의 장
우리는 암호화폐를 선택했습니다. 라이브 프로토콜에서 취약점이 악용되면 실제 자금이 몇 분 만에 빠져나갑니다. '다음 분기에 패치하겠습니다'라는 말은 통하지 않습니다. 그리고 가장 큰 프로토콜들은 이미 세계 최고의 기업들에 의해 3번, 4번, 5번씩 감사를 받았습니다.
만약 우리 시스템이 그들이 모두 놓친 것을 찾아낼 수 있다면, 그것이 상상할 수 있는 가장 강력한 증거가 될 것입니다.
지난 몇 달 동안 이 시스템은 이더리움, Lido, Chainlink, Aave, Uniswap, Polygon 등에서 확인된 라이브 취약점을 발견했습니다. 이 프로토콜들은 모두 수십억 달러를 보호하고 있습니다. 모두 이전에 최고의 기업들에 의해 여러 번 감사를 받았습니다. 모든 발견 사항은 모든 인간 검토자가 놓쳤습니다.
25만 달러의 발견
시스템은 우리가 Deep Invariant Analysis라고 부르는 방법을 사용하여 주요하고 철저히 감사된 프로토콜을 분석했습니다. 코드베이스를 흡수하고, 모든 모듈, 모든 종속성, 시스템 간의 모든 상호 작용을 매핑했습니다. 실행 경로를 추적하여 불변 조건(invariant), 즉 절대 깨지면 안 되지만 특정 조건에서 깨질 수 있는 것들을 찾았습니다.

유망한 실마리를 발견하면, 연결된 하위 에이전트를 가동하여 다양한 각도를 병렬로 탐색하고, 샌드박스를 실행하며, 개념 증명 익스플로잇을 작성하고, 반복적으로 공격 경로를 개선하여 완전히 재현 가능한 결과를 얻을 때까지 정교화했습니다.
그런 다음 우리에게 알렸습니다.
우리는 또 다른 중간 심각도의 에지 케이스일 것이라고 예상하며 발견 내용을 열어보았습니다. 하지만 우리가 본 것은 여러 시스템의 상호 작용에서 발생하는 치명적인 논리적 결함이었습니다. 2770만 달러의 사용자 자금이 단 한 번의 공격으로 직접 인출될 위험에 처해 있었습니다.
우리는 이를 검증하고 @HackenProof를 통해 신고했습니다. 프로토콜 측에서 확인하고 즉시 패치했으며, 최고 심각도 현상금으로 25만 달러를 지급했습니다.
이것이 의미하는 바
암호화폐 업계는 최근 많은 익스플로잇을 목격했으며, 대부분의 프로토콜은 책임을 회피하고 있습니다. 한편 공격자들은 점점 더 정교해지고 AI의 도움을 받고 있으며, 보안 검토의 깊이는 따라가지 못하고 있습니다.
인간만으로 달성할 수 있는 보안의 한계는 수년간 유지되어 왔습니다. 이 현상금은 이제 AI가 그 한계를 돌파할 수 있다는 증거입니다. 그리고 우리는 이미 주요 AI 연구소 중 한 곳으로부터 우리가 구축한 시스템을 탐구해보자는 제안을 받았습니다.
오늘 우리는 스텔스 모드에서 벗어납니다. 우리는 @therealgregoai라고 부릅니다. 이제 막 시작했습니다.
자신의 프로토콜이 놓친 취약점이 무엇인지 알아보고 싶다면, 저에게 DM을 보내주세요.





