Компания Anthropic запустила проект под названием Claude Plays Pokémon, в рамках которого их новейшая модель Claude 3.7 Sonnet пытается пройти классическую игру для Game Boy на протяжении более чем месяца. Несмотря на улучшения в планировании и запоминании, ИИ все еще не способен «победить» покемонов, сообщают эксперты ArsTechnica.
Об этом сообщает Бизнес • Медиа
Разработчики отмечают, что новая модель демонстрирует лучшие результаты в запоминании целей и адаптации к изменениям в игре. Однако она сталкивается с многочисленными проблемами, такими как застревание в тупиках, неудачное взаимодействие с NPC и повторение одних и тех же ошибок. Одной из основных трудностей остается восприятие визуальной информации.
Ограничения в обработке изображений и памяти
Claude 3.7 Sonnet способен понимать текстовые элементы игры и считывает игровые данные из памяти, однако его возможности интерпретации пиксельных изображений ограничены. По мнению Дэвида Херші, разработчика проекта, улучшение графики могло бы значительно помочь в распознавании элементов игры. Еще одной проблемой является навигация: Claude иногда не понимает, что определенные объекты являются непроходимыми, и тратит много времени на преодоление препятствий.
Вызовы в запоминании и самокоррекция
Что касается памяти, контекстное окно модели ограничено 200 000 токенами, и заполняя его, ИИ пытается обобщить накопленную информацию, что иногда приводит к потере важных деталей. Если модель допускает ошибку, она может зациклиться на неправильных данных, ошибочно полагая, что выход с экрана расположен не там, где он действительно есть. Тем не менее, последние версии Claude уже демонстрируют признаки самокоррекции, что является важным шагом для дальнейшего развития ИИ.
Эксперты считают, что улучшенная обработка визуальной информации и расширение контекста могут приблизить Claude к успешному прохождению игры. Однако результаты эксперимента свидетельствуют о том, что даже самые современные языковые модели, несмотря на достижения в текстовом анализе и планировании, все еще имеют значительные ограничения во взаимодействии с окружающим миром, что отводит их от истинного Общего Искусственного Интеллекта (AGI).
«ИИ позволил парализованному пациенту управлять роботизированной рукой с помощью силы мысли».