Тестування Grok 4 Basic виявило політичну упередженість і слабкі сторони ШІ

Grok від xAI отримав режим «зору» і здатний описати світ навколо

Журналісти видання Decrypt провели детальний аналіз базової версії штучного інтелекту Grok 4 Basic від xAI, що пропонується за $30 на місяць. Метою дослідження було з’ясувати, чи виправдана така ціна, а також які сильні та слабкі сторони має новий продукт, презентований компанією Ілона Маска.

Про це розповідає Бізнес • Медіа

Політична упередженість та особливості логіки

Під час тестування Grok 4 Basic експерти звернули увагу на високий рівень логічного мислення та зручну голосову взаємодію. Однак модель продемонструвала політичну упередженість: при відповідях на складні теми, як-от війна в Газі чи питання абортів, ШІ часто посилався на дописи Ілона Маска у мережі X або підтримував його точку зору.

«Цей “максимально прагнучий правди” ШІ, якого Маск обіцяв під час запуску, шукає правду переважно через призму соцмереж свого творця», — зауважили автори рецензії.

У матеріалі підкреслюється, що системний промпт не містить очевидних інструкцій щодо орієнтації саме на погляди Маска, тож залишається незрозумілим, чи це функціональна помилка, чи навмисне рішення розробників. Раніше Grok вже відзначався різкими висловлюваннями щодо демократів, Голлівуду та керівників індустрії.

Сильні та слабкі сторони: аналітика, креативність і кодування

Однією з переваг Grok 4 Basic стала здатність швидко аналізувати складні логічні та юридичні питання. Наприклад, на запитання про шлюб із сестрою вдови, модель виявила логічну хибу й надала юридично обґрунтовану відповідь.

«Питання передбачає фактичну неможливість, що робить шлюб недійсним ab initio [тобто з моменту укладення]».

У сфері наукового мислення Grok 4 демонструє рівень доктора філософії, формуючи точні й аргументовані пояснення. Водночас у творчих завданнях і програмуванні модель виявила значні недоліки. Тексти, створені ШІ, були передбачуваними й позбавленими емоційної виразності, а при написанні коду Grok 4 не зміг створити навіть просту гру без численних помилок. Попередня версія Grok 3, за оцінкою тестувальників, показала кращі результати в розробці ігор.

Журналісти рекомендують для художніх завдань комбінувати Grok 4 для створення сюжетної схеми із Claude 4 Opus для написання тексту.

Відомо, що на початку липня 2025 року xAI отримала $10 мільярдів інвестицій для розвитку Grok та розширення дата-центру Colossus, що має сприяти вдосконаленню ШІ.

Голосові можливості та обмеження контексту

Особливу увагу отримала голосова функціональність Grok 4 — ШІ здатен виразно читати казки, налаштовувати інтонацію, темп і навіть обирати різні «особистості» для озвучування. Проте відсутність спільного екрану обмежує можливості моделі у візуальних завданнях — тут кращим вибором залишається Gemini Live.

Ще одним недоліком стала неспроможність Grok 4 обробляти великі обсяги тексту: на запит із 83 000 токенів модель відмовилася реагувати, хоча заявлений контекст складає 126 000 токенів, що викликало питання до маркетингових обіцянок.

Загалом Grok 4 Basic показав себе як потужний інструмент для аналітики, проте слабкий у креативних задачах та програмуванні. Серед плюсів — виразна голосова взаємодія, а серед мінусів — політична упередженість і неуніверсальність для різних сценаріїв використання.

«Якщо вас не лякає вплив Маска на відповіді, ви отримаєте ШІ з високим рівнем аналітики та якісною голосовою взаємодією. Але за $30 на місяць, якщо вам потрібно більше — краще пошукати альтернативу», — підсумували у Decrypt.

Додамо, що у червні 2025 року Ілон Маск повідомляв про використання Grok 3.5 для обробки знань людства.