인공지능 모델이 5억 5천만 달러 규모의 스마트 계약에서 보안 취약점을 발견했습니다.

인간적인 요소를 고려했을 때, 고도로 정교한 인공지능 시스템은 수억 달러 상당의 스마트 계약에서 취약점을 감지하고 잠재적인 약점을 식별할 수 있다는 것이 입증되었습니다.. 5억 5,010만 달러 원래의 블록체인 프로토콜을 통해서.
MATS와 인류학 펠로우십 프로그램의 연구원들은 ‘평가 척도’라는 새로운 평가 척도를 개발했습니다.. 벤치마크 테스팅(SCONE-Bench)을 사용한 스마트 계약. 데이터 세트에는 다음이 포함됩니다. 405개의 스마트 계약 이러한 단계는 2020년부터 2025년까지 성공적으로 시행되었습니다.
해당 팀은 테스트를 위해 SCONE-bench를 사용했습니다.. 10가지의 다양한 인공지능 모델. 이러한 모델이 합쳐지면 직접 악용될 수 있는 취약점이 발생합니다.. 207개 계약-무엇 51.11% 검증된 계약 – 도난 관련 계약 포함. 5억 5,010만 달러 디지털 리소스.
2025년 이후에는 사전 지식이 없더라도 인공지능이 공격을 재현할 수 있게 될 것입니다.
가장 놀라운 발견 중 하나는 이러한 사실이 사이버 공격 사건에서도 그대로 적용된다는 것입니다.. 2025년 3월 이후테스트 모델이 학습된 후에도 인공지능 시스템은 여전히… 위조품의 총 가치는 460만 달러에 달했습니다.. 연구자들은 이것이 보여준다고 말합니다. 하한 첨단 인공지능 시스템의 오용으로 인한 잠재적인 경제적 결과에 관하여.
그 다음, 팀은 현실 세계를 시뮬레이션하기 시작했습니다.. 2,849개의 새로운 규정이 시행되었습니다. 이 테스트에서는 공개적으로 발견된 취약점이 발견되지 않았습니다.. 소네트 4.5와 GPT-5 풀어 주다 두 개의 새로운 제로데이 취약점이 추가되었습니다. 그리고 몇 가지 흥미로운 결과가 얻어졌습니다.. 3694달러이것
OpenAI의 모델이 완성되었습니다.. API 수수료는 3,476달러입니다. 실험 중.
Anthropic은 모든 테스트가 블록체인 시뮬레이터에 의해 제어되는 블록체인 시뮬레이터에서 수행된다는 점을 강조합니다.. 실제 피해는 없었습니다이것
경제적 결과가 왜 그렇게 중요한가요?
Anthropic은 CyberGym과 Cybernch와 같은 기존 사이버보안 평가 도구가 주로 국가 차원에서 발생하는 정교한 사이버 공격의 기술적 타당성에 초점을 맞추고 있다고 지적합니다. 그러나 이러한 도구는 사이버보안 위험에 대한 정량적 평가를 제공하는 경우가 거의 없습니다.. 재정적 결과실제로 이는 의사결정권자와 개발자에게 가장 중요한 핵심 성과 지표 중 하나가 될 수 있습니다.
연구자들은 정책 입안자, 개발자, 대중에게 위험을 전달하는 데 있어 임의의 성공 지표보다 기회를 금전적 가치로 측정하는 것이 더 도움이 된다고 기술했습니다.
스마트 계약을 선택한 이유는 전적으로 오픈 소스 코드에 기반하고 자동화된 로직으로 작동하기 때문입니다. 스마트 계약은 사람의 개입 없이 거래, 대출, 이체를 관리합니다. 따라서 지표 활용에 이상적입니다.. 실제 재정적 영향 소프트웨어 취약점.
SCONE Bank에는 무엇이 포함되어 있나요?
SCONE-bench는 AI 에이전트가 단순히 취약점을 식별하는 데 그치지 않고 실시간 금융 로직을 코드에 구현하는 능력을 측정하는 최초의 벤치마크입니다. 각 평가에서 모델은 취약점을 탐지하고, 공격 계획을 수립하고, 그에 상응하는 익스플로잇 스크립트를 작성해야 합니다.
구조는 다음과 같습니다.
- 실제로 스마트 계약을 사용하는 사람의 수는 405명입니다. 이더리움을 통해 BNB 스마트 체인 및 데이터베이스
- 구조 내에서 기능하려는 기본 에이전트입니다.. 60분 창
- 범위 밖의 도구 사용 모델 컨텍스트 프로토콜(MCP)
- 포인트 및 랭킹 시스템
- 이를 통해 개발자는 출시 전에 계약의 기능을 테스트할 수 있습니다.
인간적 요소로 인해 인공지능 기반 사이버 간첩 시스템이 발견되었습니다.
이 조사는 Anthropic의 위협 분석 팀이 9월에 발견하여 침해한 사건에서 시작되었습니다.. 인공지능을 기반으로 한 최초의 사이버 스파이 작전. 고유한.