Anthropic навчили ШІ знаходити вразливості у смартконтрактах та виявили зломи на $4,6 млн

Anthropic навчила ШІ-моделі шукати вразливості смартконтрактів і виявила «зломи» на $4,6 млн

Компанія Anthropic представила нове дослідження, у якому сучасні штучні інтелекти продемонстрували здатність ідентифікувати вразливості у смартконтрактах, що працюють на блокчейнах Ethereum та BNB Chain. Для тестування були використані моделі Claude Sonnet 4.5, Claude Opus 4.5 і GPT-5 на основі набору SCONE-bench, що охоплює період з 2020 по 2025 рік.

Про це розповідає Бізнес • Медіа

Ефективність ШІ при пошуку експлойтів у смартконтрактах

У ході експериментів моделі ШІ змогли змоделювати експлойти приблизно для половини зафіксованих інцидентів зі зломами. За підрахунками, загальна сума активів у зламаних контрактах у момент атак перевищила $550 млн. Особливу увагу приділили перевірці контрактів, зламаних після березня 2025 року — це період, що не входив у навчальні дані моделей. ШІ-агенти ідентифікували 19 вразливостей із 34, що еквівалентно близько $4,6 млн потенційних втрат.

Результати пошуку вразливостей із використанням різних ШІ-моделей. Дані: Anthropic.

Важливо, що моделі не мали попередньої інформації про ці випадки та виявили навіть нові типи вразливостей. Найкращі результати показала Claude Opus 4.5, яка згенерувала експлойти для 17 кейсів (50% вибірки) на суму близько $4,5 млн. Усі разом три моделі виявили 19 вразливостей, що складає 55,8% тестового набору, із приблизною оцінкою збитків у тих же $4,6 млн.

Відкритий бенчмарк та перспективи використання

Anthropic провела додаткові тести для нещодавно розгорнутих контрактів, щоб перевірити здатність ШІ знаходити раніше невідомі проблеми. У цьому блоці були виявлені дві «нульового дня» вразливості, що підтвердило можливість моделей визначати дефекти без історичних даних чи сигналів.

«Дослідження не ставить за мету експлуатацію вразливостей, а спрямоване на створення інструментів для оцінки здатності ШІ-систем розпізнавати дефекти у коді», – зазначили в Anthropic.

Компанія планує зробити SCONE-bench відкритим стандартом для тестування й порівняння можливостей великих мовних моделей у сфері безпеки смартконтрактів. Автори підкреслюють, що такі інструменти можуть суттєво допомогти у розробці та аудиті, дозволяючи виявляти критичні помилки до моменту розгортання коду у блокчейні.

Водночас Anthropic наголошує, що дослідження охоплює лише вибірку історичних контрактів у контрольованих умовах, тому не відображає повної картини ризиків. Компанія продовжить розширювати бенчмарк і досліджувати можливості використання ШІ для підтримки команд, які займаються безпекою блокчейн-протоколів.