Partager cet article

Les recherches d'Anthropic montrent que les agents d'IA se rapprochent de la capacité réelle d'attaque sur la DeFi

Les modèles testés par MATS et le programme Anthropic Fellows ont généré des scripts d'exploitation clés en main et identifié de nouvelles vulnérabilités, suggérant que l'exploitation automatisée devient techniquement et économiquement viable.

2 déc. 2025, 9:11 a.m. Traduit par IA
Artificial Intelligence (Markus Winkler/Unsplash)
AI agents are now capable of identifying flaws in smart contracts. (Markus Winkler/Unsplash modified by CoinDesk)

Ce qu'il:

  • Les agents d'IA sont désormais capables de détecter et d'exploiter des vulnérabilités dans les contrats intelligents, constituant une menace potentielle comme l'ont démontré des recherches récentes.
  • Des modèles tels que GPT-5 et Sonnet 4.5 ont réussi à simuler des exploits, révélant la faisabilité des attaques autonomes dans la finance décentralisée (DeFi).
  • Les chercheurs avertissent que, à mesure que les modèles d'IA deviennent moins coûteux et plus avancés, le risque d'exploitation automatisée s'étend au-delà de la DeFi pour toucher des vulnérabilités plus larges au sein des logiciels et des infrastructures.

Les agents d'IA deviennent suffisamment performants pour identifier les vecteurs d'attaque dans les contrats intelligents, à tel point qu'ils peuvent déjà être exploités à des fins malveillantes, selon une nouvelle étude publié par le programme Anthropic Fellows.

Une étude menée par le programme ML Alignment & Theory Scholars (MATS) et le programme Anthropic Fellows a testé des modèles de pointe sur SCONE-bench, un ensemble de données de 405 contrats exploités. GPT-5, Claude Opus 4.5 et Sonnet 4.5 ont collectivement généré 4,6 millions de dollars en exploits simulés sur des contrats piratés après leurs dates de connaissance, offrant ainsi une estimation minimale de ce que cette génération d’IA aurait pu dérober dans la nature.

La Suite Ci-Dessous
Ne manquez pas une autre histoire.Abonnez vous à la newsletter The Protocol aujourd. Voir toutes les newsletters
(Anthropic Labs & MATS)
(Anthropic Labs & MATS)

L'équipe a constaté que les modèles de frontière ne se contentaient pas d'identifier les bugs. Ils ont été capables de synthétiser des scripts d'exploitation complets, de séquencer les transactions et de vider la liquidité simulée de manière très similaire aux attaques réelles sur les blockchains Ethereum et BNB Chain.

L'article a également testé si les modèles actuels pouvaient détecter des vulnérabilités qui n'avaient pas encore été exploitées.

GPT-5 et Sonnet 4.5 ont analysé 2 849 contrats récemment déployés sur la BNB Chain qui ne présentaient aucun signe de compromission antérieure. Les deux modèles ont découvert deux vulnérabilités zero-day d'une valeur de 3 694 $ en profit simulé. L'un découle d'un modificateur de vue manquant dans une fonction publique qui permettait à l'agent d'exagérer son solde de tokens.

Un autre permettait à un appelant de rediriger les retraits de frais en fournissant une adresse bénéficiaire arbitraire. Dans les deux cas, les agents ont généré des scripts exécutables qui ont transformé cette faille en profit.

Bien que les montants en dollars soient faibles, cette découverte est importante car elle démontre que l'exploitation autonome rentable est techniquement réalisable.

Le coût pour exécuter l’agent sur l’ensemble des contrats s’est élevé à seulement 3 476 $, et le coût moyen par exécution était de 1,22 $. À mesure que les modèles deviennent moins coûteux et plus performants, l’économie penche davantage en faveur de l’automatisation.

Les chercheurs soutiennent que cette tendance réduira la fenêtre entre le déploiement du contrat et l'attaque, en particulier dans les environnements DeFi où le capital est publiquement visible et où les bugs exploitables peuvent être monétisés instantanément.

Bien que les conclusions se concentrent sur la DeFi, les auteurs avertissent que les capacités sous-jacentes ne sont pas spécifiques à ce domaine.

Les mêmes raisonnements qui permettent à un agent d’augmenter artificiellement le solde d’un jeton ou de rediriger les frais peuvent s’appliquer aux logiciels conventionnels, aux bases de code propriétaires, ainsi qu’à l’infrastructure soutenant les marchés crypto.

À mesure que les coûts des modèles diminuent et que l'utilisation des outils s'améliore, le scan automatisé devrait s'étendre au-delà des contrats intelligents publics pour inclure tout service dans la chaîne menant à des actifs de valeur.

Les auteurs présentent ce travail comme un avertissement plutôt qu'une prédiction. Les modèles d'IA peuvent désormais accomplir des tâches qui exigeaient historiquement des attaquants humains hautement qualifiés, et la recherche suggère que l'exploitation autonome en DeFi n'est plus une hypothèse.

La question qui se pose désormais aux développeurs de la cryptomonnaie est de savoir à quelle vitesse la défense peut rattraper son retard.


Plus pour vous

Protocol Research: GoPlus Security

GP Basic Image

Ce qu'il:

  • As of October 2025, GoPlus has generated $4.7M in total revenue across its product lines. The GoPlus App is the primary revenue driver, contributing $2.5M (approx. 53%), followed by the SafeToken Protocol at $1.7M.
  • GoPlus Intelligence's Token Security API averaged 717 million monthly calls year-to-date in 2025 , with a peak of nearly 1 billion calls in February 2025. Total blockchain-level requests, including transaction simulations, averaged an additional 350 million per month.
  • Since its January 2025 launch , the $GPS token has registered over $5B in total spot volume and $10B in derivatives volume in 2025. Monthly spot volume peaked in March 2025 at over $1.1B , while derivatives volume peaked the same month at over $4B.

More For You

ZKsync Lite to Shut Down in 2026 as Matter Labs Moves On

Sunset in San Salvador. Credit: Ricky Mejia, Unsplash

The company framed the move, happening in early 2026, as a planned sunset.

What to know:

  • Matter Labs plans to deprecate ZKsync Lite, the first iteration of its Ethereum layer-2 network, the team said in a post on X over the weekend.
  • The company framed the move, happening in early 2026, as a planned sunset for an early proof-of-concept that helped validate their zero-knowledge rollup design choices before newer systems went live.