Компанія Anthropic запустила проєкт під назвою Claude Plays Pokémon, в рамках якого їхня новітня модель Claude 3.7 Sonnet намагається пройти класичну гру для Game Boy протягом більше ніж місяця. Попри покращення в плануванні та запам’ятовуванні, ШІ все ще не здатен «перемогти» покемонів, повідомляють експерти ArsTechnica.
Про це розповідає Бізнес • Медіа
Розробники відзначають, що нова модель демонструє кращі результати в запам’ятовуванні цілей та адаптації до змін у грі. Проте вона стикається з численними проблемами, такими як застрявання у глухих кутах, невдале взаємодія з NPC та повторення однакових помилок. Однією з основних труднощів залишається сприйняття візуальної інформації.
Обмеження в обробці зображень та пам’яті
Claude 3.7 Sonnet здатен розуміти текстові елементи гри та зчитує ігрові дані з пам’яті, проте його можливості інтерпретації піксельних зображень обмежені. На думку Девіда Херші, розробника проєкту, покращення графіки могло б суттєво допомогти в розпізнаванні елементів гри. Ще однією проблемою є навігація: Claude іноді не розуміє, що певні об’єкти є непрохідними, і витрачає багато часу на те, щоб долати перешкоди.
Виклики в запам’ятовуванні та самокорекція
Що стосується пам’яті, контекстне вікно моделі обмежене 200 000 токенами, і заповнюючи його, ШІ намагається узагальнити накопичену інформацію, що іноді призводить до втрати важливих деталей. Якщо модель допускає помилку, вона може зациклитися на неправильних даних, помилково вважаючи, що вихід з екрану розташований не там, де він дійсно є. Разом з тим останні версії Claude вже демонструють ознаки самокорекції, що є важливим кроком для подальшого розвитку ШІ.
Експерти вважають, що поліпшене оброблення візуальної інформації та розширення контексту можуть наблизити Claude до успішного проходження гри. Проте результати експерименту свідчать про те, що навіть найсучасніші мовні моделі, попри досягнення в текстовому аналізі та плануванні, все ще мають суттєві обмеження у взаємодії з навколишнім світом, що відводить їх від справжнього Загального Штучного Інтелекту (AGI).
«ШІ дав змогу паралізованому пацієнтові керувати роборукою за допомогою сили думки».