Компанія Anthropic представила нове дослідження, у якому сучасні штучні інтелекти продемонстрували здатність ідентифікувати вразливості у смартконтрактах, що працюють на блокчейнах Ethereum та BNB Chain. Для тестування були використані моделі Claude Sonnet 4.5, Claude Opus 4.5 і GPT-5 на основі набору SCONE-bench, що охоплює період з 2020 по 2025 рік.
Про це розповідає Бізнес • Медіа
Ефективність ШІ при пошуку експлойтів у смартконтрактах
У ході експериментів моделі ШІ змогли змоделювати експлойти приблизно для половини зафіксованих інцидентів зі зломами. За підрахунками, загальна сума активів у зламаних контрактах у момент атак перевищила $550 млн. Особливу увагу приділили перевірці контрактів, зламаних після березня 2025 року — це період, що не входив у навчальні дані моделей. ШІ-агенти ідентифікували 19 вразливостей із 34, що еквівалентно близько $4,6 млн потенційних втрат.

Важливо, що моделі не мали попередньої інформації про ці випадки та виявили навіть нові типи вразливостей. Найкращі результати показала Claude Opus 4.5, яка згенерувала експлойти для 17 кейсів (50% вибірки) на суму близько $4,5 млн. Усі разом три моделі виявили 19 вразливостей, що складає 55,8% тестового набору, із приблизною оцінкою збитків у тих же $4,6 млн.
Відкритий бенчмарк та перспективи використання
Anthropic провела додаткові тести для нещодавно розгорнутих контрактів, щоб перевірити здатність ШІ знаходити раніше невідомі проблеми. У цьому блоці були виявлені дві «нульового дня» вразливості, що підтвердило можливість моделей визначати дефекти без історичних даних чи сигналів.
«Дослідження не ставить за мету експлуатацію вразливостей, а спрямоване на створення інструментів для оцінки здатності ШІ-систем розпізнавати дефекти у коді», – зазначили в Anthropic.
Компанія планує зробити SCONE-bench відкритим стандартом для тестування й порівняння можливостей великих мовних моделей у сфері безпеки смартконтрактів. Автори підкреслюють, що такі інструменти можуть суттєво допомогти у розробці та аудиті, дозволяючи виявляти критичні помилки до моменту розгортання коду у блокчейні.
Водночас Anthropic наголошує, що дослідження охоплює лише вибірку історичних контрактів у контрольованих умовах, тому не відображає повної картини ризиків. Компанія продовжить розширювати бенчмарк і досліджувати можливості використання ШІ для підтримки команд, які займаються безпекою блокчейн-протоколів.