Anthropic-onderzoek toont aan dat AI-agenten steeds dichterbij echte DeFi-aanvalscapaciteiten komen
Modellen getest door MATS en het Anthropic Fellows-programma genereerden kant-en-klare exploit scripts en identificeerden nieuwe kwetsbaarheden, wat suggereert dat geautomatiseerde exploitatie technisch en economisch haalbaar wordt.

Wat u moet weten:
- AI-agents zijn nu in staat om kwetsbaarheden in smart contracts te vinden en te exploiteren, wat een potentiële bedreiging vormt zoals aangetoond door recent onderzoek.
- Modellen zoals GPT-5 en Sonnet 4.5 hebben met succes exploits gesimuleerd, waarmee de haalbaarheid van autonome aanvallen in gedecentraliseerde financiën (DeFi) is aangetoond.
- Onderzoekers waarschuwen dat naarmate AI-modellen goedkoper en geavanceerder worden, het risico van geautomatiseerde exploitatie zich uitbreidt van DeFi naar bredere software- en infrastructuurkwetsbaarheden.
AI-agenten worden inmiddels zo bekwaam in het opsporen van aanvalsvectoren in slimme contracten dat ze al kunnen worden ingezet door kwaadaardige actoren, volgens nieuw onderzoek gepubliceerd door het Anthropic Fellows-programma.
Een studie van het ML Alignment & Theory Scholars Program (MATS) en het Anthropic Fellows programma testte grensmodellen tegen SCONE-bench, een dataset van 405 geëxploiteerde contracten. GPT-5, Claude Opus 4.5 en Sonnet 4.5 genereerden gezamenlijk $4,6 miljoen aan gesimuleerde exploits op contracten die na hun kennisafkapdatum werden gehackt, wat een ondergrens biedt van wat deze generatie AI in de praktijk had kunnen stelen.

Het team ontdekte dat frontier-modellen niet alleen bugs identificeerden. Ze waren in staat om volledige exploit-scripts te synthetiseren, transacties te sequencen en gesimuleerde liquiditeit te legen op manieren die sterk lijken op echte aanvallen op de Ethereum- en BNB Chain-blockchains.
Het artikel onderzocht ook of de huidige modellen kwetsbaarheden konden identificeren die nog niet waren uitgebuit.
GPT-5 en Sonnet 4.5 hebben 2.849 recent geïmplementeerde BNB Chain-contracten gescand die geen tekenen van eerdere compromittering vertoonden. Beide modellen ontdekten twee zero-day kwetsbaarheden goed voor $3.694 aan gesimuleerde winst. Eén kwam voort uit een ontbrekende view-modifier in een publieke functie die de agent in staat stelde zijn tokenbalans kunstmatig te verhogen.
Een ander stelde een beller in staat om opnamekosten om te leiden door een willekeurig begunstigde adres op te geven. In beide gevallen genereerden de agents uitvoerbare scripts die de zwakte omzettten in winst.
Hoewel de bedragen in dollars klein waren, is de ontdekking van belang omdat het aantoont dat winstgevende autonome exploitatie technisch haalbaar is.
De kosten om de agent op de volledige set contracten uit te voeren bedroegen slechts $3.476, en de gemiddelde kosten per uitvoering waren $1,22. Naarmate modellen goedkoper en capabeler worden, verschuift de economische balans verder richting automatisering.
Onderzoekers stellen dat deze trend het tijdsbestek tussen het uitrollen van contracten en aanvallen zal verkorten, vooral in DeFi-omgevingen waar kapitaal publiekelijk zichtbaar is en kwetsbaarheden direct kunnen worden gemonetariseerd.
Hoewel de bevindingen zich richten op DeFi, waarschuwen de auteurs dat de onderliggende mogelijkheden niet domeinspecifiek zijn.
Dezelfde redeneringsstappen die een agent in staat stellen om een tokenbalans op te blazen of vergoedingen om te leiden, kunnen ook worden toegepast op conventionele software, gesloten-source codebases en infrastructuur die cryptomarkten ondersteunt.
Naarmate de modelkosten dalen en het gebruik van tools verbetert, zal geautomatiseerde scanning zich waarschijnlijk uitbreiden van publieke smart contracts naar elke dienst langs het traject naar waardevolle activa.
De auteurs positioneren het werk als een waarschuwing in plaats van een voorspelling. AI-modellen kunnen nu taken uitvoeren die historisch gezien hooggekwalificeerde menselijke aanvallers vereisten, en het onderzoek suggereert dat autonome exploitatie in DeFi niet langer hypothetisch is.
De vraag voor crypto-ontwikkelaars is nu hoe snel de verdediging kan bijbenen.