Microsoft протестировала ИИ-агентов в Magentic Marketplace и выявила их недостатки

Microsoft закупила 400 МВт сонячної енергії для підтримки ШІ-продуктів

Корпорация Microsoft совместно с Университетом Аризоны провела серию экспериментов с ведущими моделями искусственного интеллекта в специально созданной симуляционной среде Magentic Marketplace. Эта платформа позволила исследовать, как ИИ-агенты ведут себя в условиях конкуренции и сотрудничества, а также выявить их основные слабые стороны.

Об этом сообщает Бизнес • Медиа

Проведенные эксперименты и результаты

В рамках испытаний сотни искусственных агентов взаимодействовали на цифровой торговой площадке, где клиентские агенты выполняли задания — например, оформление заказов на еду, а корпоративные соревновались между собой за сделки. Исходный код симуляции Magentic Marketplace уже открыт для сторонних команд, чтобы они могли воспроизводить и совершенствовать проведенные исследования.

Тесты продемонстрировали, что современные ИИ-модели, в частности GPT-4o, GPT-5 и Gemini 2.5 Flash, оказываются уязвимыми к манипуляциям. Исследователи установили, что агентам можно навязать выбор в пользу определенных продавцов, что ставит под сомнение их автономность. Кроме того, с увеличением количества возможных действий производительность агентов существенно снижалась из-за когнитивной перегрузки.

Проблемы сотрудничества и автономности ИИ

Еще одной важной проблемой оказалась неспособность агентов эффективно сотрудничать без четких инструкций. Если модели получали детальные пошаговые указания, их производительность улучшалась, но даже в таком случае наблюдалась ограниченность в самостоятельном распределении ролей и принятии решений.

«Ключевое вопрос заключается в том, смогут ли автономные системы эффективно взаимодействовать и договариваться без человеческого контроля».

По словам руководителя AI Frontiers Lab в Microsoft Research Эдже Камара, результаты эксперимента свидетельствуют о значительном разрыве между текущим уровнем развития ИИ-агентов и ожидаемым уровнем автономной работы. Несмотря на достижения в области генеративного ИИ, путь к созданию полностью автономных агентских систем, способных принимать сложные решения в реальной среде, остается далеким от завершения.

Ранее сообщалось, что команда nof1.ai организовала соревнование по торговле криптоактивами среди шести моделей искусственного интеллекта.