Modelos de IA encontraram vulnerabilidades de segurança em contratos inteligentes avaliados em 550 milhões de dólares.

A Anthropic demonstrou que sistemas de inteligência artificial altamente avançados podem detectar vulnerabilidades em contratos inteligentes avaliados em centenas de milhões de dólares e identificar possíveis falhas.. US$ 550,1 milhões por meio de protocolos blockchain reais.
Pesquisadores do MATS e do programa Anthropic Fellows desenvolveram uma nova escala de avaliação chamada Benchmark de uso de contratos inteligentes (SCONE-Bench). Este conjunto de dados inclui 405 contratos inteligentes que foram utilizadas com sucesso no período de 2020 a 2025.
A equipe utilizou o SCONE-bench para realizar os testes.. 10 modelos diferentes de inteligência artificial. Em conjunto, esses modelos criaram vulnerabilidades que podiam ser imediatamente exploradas para 207 protocolos-QUE 51,11% contratos verificados – incluindo roubo US$ 550,1 milhões em recursos digitais.
A inteligência artificial será capaz de reproduzir ataques após 2025, apesar da falta de conhecimento.
Uma das descobertas mais surpreendentes: mesmo no caso de ataques cibernéticos que ocorreram após março de 2025Mesmo após a conclusão do treinamento dos modelos de teste, os sistemas de IA ainda eram capazes de Imitações que totalizaram US$ 4,6 milhões. Segundo os pesquisadores, isso demonstra limite inferior sobre as consequências financeiras que podem surgir do uso indevido de sistemas poderosos de inteligência artificial.
Em seguida, a equipe passou a executar simulações reais.. 2849 novos protocolos foram implementados. Não foram encontradas vulnerabilidades publicamente conhecidas neste teste.. Soneto 4.5 e GPT-5 divulgado Duas novas vulnerabilidades de dia zero e alcançou alguns resultados de trabalho interessantes. 3694 dólares americanosO
O modelo da OpenAI está completo. US$ 3.476 em despesas com API Durante o experimento.
A Anthropic enfatizou que todos os testes foram conduzidos em simuladores de blockchain controlados por sem danos reaisO
Por que as consequências financeiras são importantes?
A Anthropic observou que as ferramentas de avaliação de cibersegurança existentes, como o CyberGym e o Cybench, focam na viabilidade técnica de ciberataques complexos, frequentemente em nível de Estado-nação. No entanto, raramente fornecem uma avaliação quantitativa dos riscos de cibersegurança.. consequências financeiraso que, na prática, pode representar um dos indicadores-chave de desempenho mais importantes para tomadores de decisão e desenvolvedores.
Em comparação com métricas de sucesso arbitrárias, quantificar as oportunidades em termos monetários é mais útil para comunicar os riscos aos formuladores de políticas, aos desenvolvedores e ao público, escrevem os pesquisadores.
Optamos pelos contratos inteligentes porque eles operam inteiramente com código aberto e lógica automatizada: gerenciam transações, empréstimos e transferências sem intervenção humana. Isso os torna ideais para mensuração.. impacto financeiro real vulnerabilidades de software.
O que o SCONE Bank inclui?
O SCONE-bench é o primeiro benchmark a medir a capacidade de um agente de IA de implementar lógica financeira em tempo real em seu código, em vez de simplesmente identificar vulnerabilidades. Cada avaliação exige que o modelo detecte uma vulnerabilidade, desenvolva um ataque e escreva um script de exploração correspondente.
A estrutura inclui:
- 405 pessoas realmente usaram contratos inteligentes. via Ethereum, BNB Smart Chain e banco de dados
- Um agente básico que tenta agir dentro da estrutura. janela de 60 minutos
- Utilizar ferramentas além do escopo Protocolo de Contexto do Modelo (MCP)
- Sistema de pontos e classificação
- Uma funcionalidade que permite aos desenvolvedores testar seus contratos antes do lançamento.
A Anthropic já descobriu um sistema de ciberespionagem baseado em inteligência artificial.
A investigação começou após um incidente em setembro, no qual a equipe de análise de ameaças da Anthropic descobriu e interrompeu o que descreveu como…. A primeira campanha de ciberespionagem baseada em inteligência artificial. um de cada tipo.