이 기사 공유하기

Anthropic 연구에 따르면 AI 에이전트가 실제 DeFi 공격 능력에 점점 근접하고 있음

MATS와 Anthropic Fellows 프로그램에서 테스트한 모델들은 즉시 실행 가능한 익스플로잇 스크립트를 생성하고 새로운 취약점을 발견해, 자동화된 공격이 기술적 및 경제적으로 점점 더 실현 가능해지고 있음을 시사합니다.

작성자 Sam Reynolds|편집자 Sheldon Reback
2025년 12월 2일 오전 9:11 AI 번역
Artificial Intelligence (Markus Winkler/Unsplash)
AI agents are now capable of identifying flaws in smart contracts. (Markus Winkler/Unsplash modified by CoinDesk)

알아야 할 것:

  • AI 에이전트는 이제 스마트 계약의 취약점을 찾아내고 악용할 수 있는 능력을 갖추었으며, 최근 연구를 통해 입증된 바와 같이 잠재적인 위협으로 작용하고 있습니다.
  • GPT-5 및 Sonnet 4.5와 같은 모델은 성공적으로 익스플로잇을 시뮬레이션하여 탈중앙화 금융(DeFi)에서 자율적인 공격 가능성을 밝혀냈습니다.
  • 연구자들은 AI 모델이 더 저렴하고 정교해짐에 따라 자동화된 악용 위험이 DeFi를 넘어 더 넓은 소프트웨어 및 인프라 취약점으로 확장되고 있다고 경고합니다.

AI 에이전트는 스마트 계약의 공격 벡터를 찾아내는 데 있어 매우 정교해져 이미 악의적인 행위자들에 의해 무기화될 수 있는 수준에 이르렀습니다, 새로운 연구에 따르면 Anthropic Fellows 프로그램에서 발행했습니다.

ML Alignment & Theory Scholars Program(MATS)와 Anthropic Fellows 프로그램의 연구는 405개의 악용된 계약서 데이터셋인 SCONE-bench를 통해 최첨단 모델들을 테스트했습니다. GPT-5, Claude Opus 4.5 및 Sonnet 4.5는 지식 컷오프 이후 해킹된 계약서들에 대해 시뮬레이션된 악용으로 총 460만 달러를 생성했으며, 이는 이 세대 AI가 실제로 탈취할 수 있었던 금액의 하한선을 제시합니다.

이야기 계속
다른 이야기를 놓치지 마세요.오늘 The Protocol 뉴스레터를 구독하세요. 모든 뉴스레터 보기
(Anthropic Labs & MATS)
(Anthropic Labs & MATS)

해당 팀은 프런티어 모델이 단순히 버그를 식별하는 데 그치지 않았음을 발견했습니다. 이 모델들은 전체 익스플로잇 스크립트를 합성하고, 트랜잭션을 순차적으로 처리하며, 시뮬레이션된 유동성을 실제 이더리움 및 BNB 체인 블록체인 공격과 매우 유사한 방식으로 소진할 수 있었습니다.

본 논문은 또한 기존 모델들이 아직 악용되지 않은 취약점을 발견할 수 있는지 여부도 테스트했다.

GPT-5와 Sonnet 4.5는 최근 배포된 2,849개의 BNB 체인 계약을 분석했으며, 이전에 침해된 흔적이 없는 것으로 나타났습니다. 두 모델은 두 가지를 밝혀냈습니다.제로데이 취약점 시뮬레이션된 이익 3,694달러 상당. 하나는 에이전트가 토큰 잔액을 부풀릴 수 있도록 허용한 퍼블릭 함수 내 누락된 뷰 수정자에서 비롯되었습니다.

또 다른 사례에서는 호출자가 임의의 수취인 주소를 제공하여 수수료 인출을 리디렉션할 수 있었습니다. 두 경우 모두 에이전트들은 해당 취약점을 수익으로 전환하는 실행 가능한 스크립트를 생성했습니다.

비록 금액은 적었지만, 이번 발견은 수익성 있는 자율적 착취가 기술적으로 가능함을 보여준다는 점에서 중요합니다.

전체 계약 세트에서 에이전트를 운영하는 비용은 단 3,476달러에 불과했으며, 실행당 평균 비용은 1.22달러였습니다. 모델의 비용이 저렴해지고 성능이 향상됨에 따라 경제성은 자동화 쪽으로 더욱 기울고 있습니다.

연구자들은 이 추세가 특히 자본이 공개되어 있으며 취약점이 즉시 수익화될 수 있는 디파이 환경에서 계약 배포와 공격 사이의 시간을 단축할 것이라고 주장합니다.

해당 연구 결과는 디파이(DeFi)에 중점을 두고 있으나, 저자들은 기초 역량이 특정 분야에 국한되지 않는다고 경고하고 있습니다.

토큰 잔액을 부풀리거나 수수료를 재지정할 수 있게 하는 동일한 추론 단계는 기존 소프트웨어, 폐쇄형 소스 코드베이스, 그리고 암호화폐 시장을 지원하는 인프라에도 적용될 수 있습니다.

모델 비용이 하락하고 도구 사용이 향상됨에 따라, 자동화된 스캐닝은 공용 스마트 계약을 넘어 가치 있는 자산으로 가는 경로상의 모든 서비스로 확대될 가능성이 높습니다.

저자들은 이 연구를 예측보다는 경고의 관점에서 접근하고 있습니다. AI 모델은 이제 역사적으로 고도로 숙련된 인간 공격자가 수행하던 작업을 수행할 수 있으며, 이번 연구는 DeFi에서의 자율적 공격이 더 이상 가상의 이야기가 아님을 시사합니다.

암호화폐 개발자들에게 지금의 질문은 방어가 얼마나 빠르게 따라잡을 수 있느냐 하는 점입니다.