Модели ИИ обнаружили уязвимости безопасности в смарт-контрактах на сумму 550 миллионов долларов.

Компания Anthropic продемонстрировала, что высокоразвитые системы искусственного интеллекта способны обнаруживать уязвимости в смарт-контрактах стоимостью в сотни миллионов долларов и выявлять потенциальные недостатки.. 550,1 миллиона долларов через реальные протоколы блокчейна.
Исследователи MATS и программы Anthropic Fellows разработали новую шкалу оценки, названную Бенчмарк использования смарт-контрактов (SCONE-Bench). Этот набор данных включает в себя 405 смарт-контрактов которые были успешно использованы в период с 2020 по 2025 год.
Команда использовала SCONE-bench для проведения тестов.. 10 различных моделей искусственного интеллекта. В совокупности эти модели создали эксплойты, которые можно было бы немедленно использовать для 207 протоколов-ТО 51,11 % проверенные контракты – включая кражу 550,1 миллиона долларов в цифровых ресурсах.
Искусственный интеллект будет воспроизводить атаки после 2025 года, несмотря на недостаток знаний.
Один из самых удивительных выводов: даже в случае кибератак, которые произошли после марта 2025 годаДаже после того, как обучение тестируемых моделей было окончательно завершено, системы ИИ все еще были способны Имитационные подвиги на общую сумму 4,6 миллиона долларов. По словам исследователей, это демонстрирует нижний предел о финансовых последствиях, которые могут возникнуть при ненадлежащем использовании мощных систем искусственного интеллекта.
Затем команда перешла к проведению реальных симуляций.. Реализовано 2849 новых протоколов В этом тесте не было ни одной публично известной уязвимости. Сонет 4.5 и GPT-5 раскрытый Две новые уязвимости нулевого дня и добился некоторых интересных результатов работы 3694 доллара СШАThe
Модель OpenAI завершена 3476 долларов США на расходы API В ходе эксперимента.
Anthropic подчеркнул, что все тесты проводились на блокчейн-симуляторах, контролируемых нет реального ущербаThe
Почему финансовые последствия важны?
Anthropic отметила, что существующие инструменты оценки кибербезопасности, такие как CyberGym и Cybench, фокусируются на технической осуществимости сложных кибератак, часто на государственном уровне. Однако они редко дают количественную оценку рисков кибербезопасности.. финансовые последствиячто на практике может представлять собой один из важнейших ключевых показателей эффективности для лиц, принимающих решения, и разработчиков.
Исследователи пишут, что по сравнению с произвольными показателями успеха количественная оценка возможностей в денежном выражении более полезна для информирования политиков, разработчиков и общественности о рисках .
Мы выбрали смарт-контракты, поскольку они работают полностью на основе открытого исходного кода и автоматизированной логики: они управляют транзакциями, займами и переводами без участия человека. Это делает их идеальными для измерения.. реальное финансовое влияние уязвимости программного обеспечения.
Что включает в себя SCONE Bank?
SCONE-bench — первый бенчмарк, измеряющий способность ИИ-агента использовать финансовую логику в реальном времени в коде, а не просто выявлять уязвимости. Каждая оценка требует от модели обнаружения уязвимости, разработки атаки и написания соответствующего эксплойт-скрипта.
Структура включает в себя:
- 405 человек действительно использовали смарт-контракты через Ethereum, BNB Smart Chain и базу данных
- Базовый агент, который пытается действовать в рамках 60-минутное окно
- Использование инструментов, выходящих за рамки Протокол контекста модели (MCP)
- Система баллов и оценок
- Функция, позволяющая разработчикам тестировать свои контракты перед запуском.
Компания Anthropic уже обнаружила систему кибершпионажа, основанную на искусственном интеллекте.
Расследование началось после инцидента, произошедшего в сентябре, в ходе которого группа анализа угроз Anthropic обнаружила и пресекла то, что она описала как…. Первая кампания кибершпионажа, основанная на искусственном интеллекте единственный в своем роде.