OpenAIとパラダイム、AI活用のスマートコントラクト評価へ

OpenAIと暗号資産(仮想通貨)ファンドのParadigmは18日、AIエージェントがイーサリアム仮想マシン(EVM)ベースのスマートコントラクトにおける脆弱性を検出・修正・悪用する能力を測定する、オープン評価フレームワーク「EVMbench」を共同で公開した。
3つの評価モードで能力を測定
EVMbenchは「検出」「修正」「悪用」の3つのモードで構成される。
検出モードでは、AIエージェントがスマートコントラクトのコードを解析して脆弱性を特定し、修正モードでは脆弱なコードを編集しながら既存のテストが引き続き通過することを確認する。
悪用モードでは、エージェントが実際のイーサリアム環境と対話しながらエンドツーエンドの攻撃を実行する。
フレームワークには、40件の異なる監査から抽出した120件の高深刻度脆弱性が収録されている。
その大部分はオープンなコード監査コンペティションから取得したもので、未公開コントラクトのカスタムタスクも含まれる。
単一の検出成功ではなく、包括的な脆弱性カバレッジを測定できる現実的な評価環境を実現している点が特徴だ。
1,000億ドル超の資産を保護
このフレームワークが開発された背景には、ブロックチェーンセキュリティの深刻な課題がある。
オープンソースの仮想通貨コントラクトには常時1,000億ドル以上の資産が保管されており、標準化されたAIセキュリティ評価の必要性が高まっていた。
スマートコントラクトの悪用による損失はこれまでに数十億ドル規模に達しており、業界全体で信頼性の高いセキュリティ評価ツールへの需要が拡大している。
技術面では、RustベースのトランザクションReplayフレームワークを採用し、ローカルのイーサリアムノードに対してエージェントのトランザクションを再実行する仕組みを取る。
高速かつ再現性のある評価が可能で、不正行為の防止にも対応している。
各タスクはコンテナ化されており、エージェントは隔離された現実的な環境で動作し、オンチェーンのイベントやアカウント残高によってブロックチェーンの状態が評価される。
また、各タスクには「解答キー」が用意されており、ベンチマーク自体が解答可能であることを検証できる。オラクルパッチや悪用コードも検証目的で提供されている。
データセット、評価ハーネス、ツール群はすべてオープンソースで公開されており、スマートコントラクトセキュリティに関する継続的な研究を支援する。
実用的な監査エージェントのインターフェースはParadigmの公式サイトから利用できる。
業界の専門家は、EVMbenchがAIを活用したセキュリティツールの新たな標準を確立し、スマートコントラクトの悪用件数の減少や、攻撃ではなく防御目的でのAI活用促進につながると期待している。
大規模言語モデルがコード解析や実行能力を急速に向上させる中、AI仮想通貨がもたらすリスクへの可視性とガバナンスの確保が急務となっている。