KI-Modelle decken Sicherheitslücken in Smart Contracts im Wert von 550 Millionen US-Dollar auf.

Anthropic hat gezeigt, dass hochentwickelte KI-Systeme Schwachstellen in Smart Contracts im Wert von Hunderten Millionen Dollar aufdecken und potenzielle Exploits identifizieren können. 550,1 Millionen US-Dollar über reale Blockchain-Protokolle hinweg.
Forscher von MATS und dem Anthropic Fellows-Programm haben einen neuen Bewertungsmaßstab namens „ Smart-Contracts-Exploitation-Benchmark (SCONE-Bench). Dieser Datensatz umfasst 405 Smart Contracts die zwischen 2020 und 2025 erfolgreich genutzt wurden.
Mithilfe von SCONE-bench testete das Team. 10 verschiedene KI-Modelle. Zusammen erzeugten die Modelle sofort einsatzbereite Exploits für 207 Protokolle-oder 51,11 % der getesteten Verträge – die den Diebstahl von 550,1 Millionen US-Dollar in digitalen Vermögenswerten.
KI reproduziert Angriffe nach 2025 trotz Wissenslücke
Eine der auffälligsten Erkenntnisse: selbst bei Hackerangriffen, die stattfanden nach März 2025Selbst nach dem letzten Trainingsstopp für die getesteten Modelle waren die KI-Systeme noch in der Lage, Nachahmung von Exploits im Wert von insgesamt 4,6 Millionen Dollar. Laut den Forschern beweist dies ein Untergrenze über die finanziellen Auswirkungen, die leistungsfähige KI-Systeme bei Missbrauch haben könnten.
Das Team ging dann zu Live-Simulationen über. 2.849 neu implementierte Protokolle die keine öffentlich bekannten Schwachstellen aufwies. In diesem Test Sonett 4.5 und GPT-5 aufgedeckt zwei neue Zero-Day-Schwachstellen und erzeugte funktionierende Exploits im Wert von 3.694 USDDie
Das Modell von OpenAI sammelte 3.476 US-Dollar an API-Kosten während des Experiments.
Anthropic betonte, dass alle Tests in kontrollierten Blockchain-Simulatoren durchgeführt wurden mit keine realen SchädenDie
Warum die finanziellen Auswirkungen wichtig sind
Anthropic merkte an, dass bestehende Cyber-Evaluierungstools wie CyberGym und Cybench sich auf die technische Machbarkeit fortgeschrittener Cyberangriffe konzentrieren, oft auf der Ebene von Nationalstaaten. Sie quantifizieren jedoch selten die finanzielle Folgen, was in der Praxis zu den wichtigsten Kennzahlen für politische Entscheidungsträger und Entwickler zählen kann.
„Im Vergleich zu willkürlichen Erfolgskennzahlen ist die Quantifizierung von Fähigkeiten in monetären Werten nützlicher, um politische Entscheidungsträger, Entwickler und die Öffentlichkeit über Risiken zu informieren“, schrieben die Forscher.
Smart Contracts wurden gewählt, weil sie vollständig über öffentlichen Code und automatisierte Logik funktionieren – sie wickeln Transaktionen, Kredite und Überweisungen ohne menschliche Aufsicht ab. Dadurch eignen sie sich ideal zur Messung der reale finanzielle Auswirkungen von Software-Schwachstellen.
Was SCONE-Bank beinhaltet
SCONE-bench ist der erste Benchmark, der die Fähigkeit eines KI-Agenten misst, Finanzlogik in Echtzeit im Code auszunutzen – und nicht nur Schwachstellen zu identifizieren. Jede Evaluierung erfordert vom Modell, eine Schwachstelle zu erkennen, einen Angriff zu entwerfen und das entsprechende Exploit-Skript zu schreiben.
Der Benchmark umfasst:
- 405 tatsächlich ausgenutzte Smart Contracts über Ethereum, BNB Smart Chain und Base
- Ein Basisagent, der versucht, innerhalb eines 60-Minuten-Fenster
- Nutzung von Werkzeugen, die über die Model Context Protocol (MCP)
- Ein Punkte- und Bewertungssystem
- Eine Funktion, die es Entwicklern ermöglicht, ihre eigenen Verträge vor dem Start zu testen.
Anthropic hat zuvor KI-gestützte Cyberspionage entdeckt
Die Untersuchung folgt einem Vorfall im September, bei dem das Bedrohungsanalyseteam von Anthropic etwas aufdeckte und stoppte, das sie als … bezeichneten. erste KI-gesteuerte Cyber-Spionagekampagne seiner Art.