Modelos de IA descubren vulnerabilidades de seguridad en contratos inteligentes por un valor de 550 millones de dólares.

Anthropic ha demostrado que sistemas de IA altamente avanzados pueden descubrir vulnerabilidades en contratos inteligentes que valen cientos de millones de dólares e identificar posibles exploits.. 550,1 millones de dólares a través de protocolos de blockchain reales.
Investigadores de MATS y el programa Anthropic Fellows han desarrollado una nueva escala de evaluación llamada “ Punto de referencia para la explotación de contratos inteligentes (SCONE-Bench). Este conjunto de datos incluye 405 Contratos inteligentes que se utilizaron con éxito entre 2020 y 2025.
El equipo utilizó SCONE-bench para realizar pruebas. 10 modelos de IA diferentes. En conjunto, los modelos generaron exploits inmediatamente utilizables para 207 protocolos-o 51,11 % de los contratos probados – de los cuales el robo de 550,1 millones de dólares en activos digitales.
La IA reproducirá ataques después de 2025 a pesar de la brecha de conocimiento
Uno de los hallazgos más sorprendentes: incluso en el caso de los ataques de piratas informáticos que tuvieron lugar después de marzo de 2025Incluso después de la última parada de entrenamiento para los modelos probados, los sistemas de IA aún pudieron Imitación de exploits por un valor total de 4,6 millones de dólares. Según los investigadores, esto demuestra una límite inferior sobre las implicaciones financieras que podrían tener los poderosos sistemas de IA si se utilizan incorrectamente.
Luego el equipo pasó a realizar simulaciones en vivo.. 2.849 protocolos recién implementados que no tenía vulnerabilidades conocidas públicamente. En esta prueba Soneto 4.5 y GPT-5 reveló Dos nuevas vulnerabilidades de día cero y generó exploits de trabajo que valen la pena 3.694 dólares estadounidensesEl
Modelo de OpenAI recopilado $3,476 en costos de API Durante el experimento.
Anthropic enfatizó que todas las pruebas se realizaron en simuladores de blockchain controlados con ningún daño realEl
Por qué son importantes las implicaciones financieras
Anthropic señaló que las herramientas de evaluación cibernética existentes, como CyberGym y Cybench, se centran en la viabilidad técnica de los ciberataques avanzados, a menudo a nivel de estado-nación. Sin embargo, rara vez cuantifican la consecuencias financieras, que en la práctica pueden ser uno de los indicadores clave de desempeño más importantes para los tomadores de decisiones políticas y los desarrolladores.
“En comparación con las métricas de éxito arbitrarias, cuantificar las capacidades en términos monetarios es más útil para informar a los responsables de las políticas, a los desarrolladores y al público sobre los riesgos”, escribieron los investigadores.
Se eligieron los contratos inteligentes porque funcionan completamente mediante código público y lógica automatizada: gestionan transacciones, préstamos y transferencias sin supervisión humana. Esto los hace ideales para medir… impacto financiero real de vulnerabilidades del software.
Qué incluye SCONE Bank
SCONE-bench es el primer punto de referencia que mide la capacidad de un agente de IA para explotar la lógica financiera en tiempo real del código, no solo para identificar vulnerabilidades. Cada evaluación requiere que el modelo detecte una vulnerabilidad, diseñe un ataque y escriba el script de explotación correspondiente.
El punto de referencia incluye:
- 405 realmente explotaron contratos inteligentes a través de Ethereum, BNB Smart Chain y Base
- Un agente base que intenta operar dentro de un ventana de 60 minutos
- Uso de herramientas que van más allá de lo Protocolo de Contexto Modelo (MCP)
- Un sistema de puntos y calificación
- Una función que permite a los desarrolladores probar sus propios contratos antes del lanzamiento.
Anthropic descubrió previamente el espionaje cibernético impulsado por inteligencia artificial.
La investigación sigue a un incidente ocurrido en septiembre en el que el equipo de análisis de amenazas de Anthropic descubrió y detuvo lo que describieron como…. Primera campaña de ciberespionaje impulsada por IA de su tipo.