人工智能模型已发现价值 5.5 亿美元的智能合约存在安全漏洞。

人为因素证明,高度先进的人工智能系统可以检测价值数亿美元的智能合约中的漏洞,并识别潜在的缺陷。. 5.501亿美元 通过真正的区块链协议。
来自MATS和人类学研究员项目的研究人员开发了一种名为“评估量表”的新评估量表。 智能合约使用基准测试(SCONE-Bench). 该数据集包含 405份智能合约 这些措施在 2020 年至 2025 年期间得到了成功应用。
该团队使用 SCONE-bench 进行测试。. 10种不同的人工智能模型. 这些模型共同造成了可立即被利用的漏洞。 207项协议-什么 51.11% 已核实的合同——包括盗窃。 5.501亿美元 数字资源。
2025 年之后,即使缺乏先验知识,人工智能也能够复制攻击。
最令人惊讶的发现之一:即使在网络攻击事件中也是如此。 2025年3月之后即使测试模型的训练已经完成,人工智能系统仍然能够…… 假冒商品总额达460万美元. 研究人员表示,这表明 下限 关于滥用强大的人工智能系统可能造成的经济后果。
接下来,团队开始进行现实世界的模拟。. 实施了 2849 项新规程。 本次测试未发现任何已公开的漏洞。. Sonnet 4.5 和 GPT-5 发布 新增两个零日漏洞 并取得了一些有趣的工作成果. 3694美元这
OpenAI模型已完成。. API费用为3,476美元 实验过程中。
Anthropic强调,所有测试均在由区块链模拟器控制的区块链模拟器上进行。 没有实际损害这
为什么经济后果如此重要?
Anthropic 指出,现有的网络安全评估工具,例如 CyberGym 和 Cybench,主要关注复杂网络攻击的技术可行性,通常针对国家层面。然而,它们很少提供网络安全风险的量化评估。. 财务后果实际上,这可以代表决策者和开发人员最重要的关键绩效指标之一。
研究人员写道,与任意的成功指标相比,用货币量化机会对于向政策制定者、开发商和公众传达风险更有帮助。
我们选择智能合约是因为它们完全基于开源代码和自动化逻辑运行:它们无需人工干预即可管理交易、贷款和转账。这使得它们成为衡量指标的理想选择。. 实际财务影响 软件漏洞。
SCONE银行包含哪些内容?
SCONE-bench 是首个衡量人工智能代理在其代码中实现实时金融逻辑能力(而不仅仅是识别漏洞)的基准测试。每次评估都要求模型检测漏洞、设计攻击方案并编写相应的漏洞利用脚本。
该结构包括:
- 实际使用智能合约的人数为 405 人。 通过以太坊、BNB智能链和数据库
- 试图在结构内发挥作用的基本代理。. 60分钟窗口期
- 使用超出范围的工具 模型上下文协议(MCP)
- 积分和排名系统
- 允许开发者在发布前测试合约的功能。
人为因素已经发现了一种基于人工智能的网络间谍系统。
此次调查源于9月份发生的一起事件,当时Anthropic公司的威胁分析团队发现并破坏了其所描述的……. 首次基于人工智能的网络间谍活动。 独一无二。