OpenAI выпустила бенчмарк для оценки способности ИИ-агентов взламывать смарт-контракты - ДАЙДЖЕСТ.RU
Главная страница » OpenAI выпустила бенчмарк для оценки способности ИИ-агентов взламывать смарт-контракты

OpenAI выпустила бенчмарк для оценки способности ИИ-агентов взламывать смарт-контракты

leon663
0 комментариев


Компания OpenAI совместно с Paradigm представила EVMbench — бенчмарк для оценки способности ИИ-агентов выявлять, исправлять и эксплуатировать бреши в смарт-контрактах.

Инструмент основан на 120 отобранных уязвимостях из 40 аудитов. Большинство примеров взяты из открытых платформ по анализу кода. Также он включает несколько сценариев атак из проверки безопасности блокчейна Tempo — специализированной сети первого уровня, разработанной Stripe и Paradigm для высокопроизводительных и недорогих платежей в стейблкоинах.

Интеграция с Tempo позволила добавить в бенчмарк платежные смарт-контракты — сегмент, где ожидается активное применение «стабильных монет» и ИИ-агентов.

Для создания тестовой среды OpenAI адаптировала существующие эксплойты и скрипты, предварительно убедившись в их практической применимости.

EVMbench оценивает три режима возможностей:

OpenAI протестировала передовые модели во всех трех режимах. В категории Exploit модель GPT-5.3-Codex достигла 72,2%, GPT-5 — 31,9%. При этом показатели обнаружения и исправления уязвимостей оказались скромнее — многие проблемы по-прежнему сложно находить и устранять.

В Detect ИИ-агенты иногда останавливаются после нахождения одной уязвимости вместо проведения полного аудита. В режиме Patch им пока сложно закрывать неочевидные проблемы так, чтобы сохранить полную функциональность контракта.

Напомним, в ноябре 2025 года Microsoft представила среду для тестирования ИИ-агентов и выявила уязвимости, присущие современным цифровым помощникам.



Источник

Вам также может понравиться

О нас

Портал о бизнесе, инвестициях и финансах. Актуальные новости, статьи и полезные материалы.

@2025 — All Right Reserved. Designed and Developed by PenciDesign