Grok 4 Basic Testing Выявляет Политическую Предвзятость и Слабости ИИ

Grok від xAI отримав режим «зору» і здатний описати світ навколо

Журналисты из Decrypt провели детальный анализ базовой версии искусственного интеллекта Grok 4 Basic от xAI, который предлагается за 30 долларов в месяц. Целью исследования было определить, оправдана ли эта цена, и выявить сильные и слабые стороны нового продукта, представленного компанией Илона Маска.

Об этом сообщает Бизнес • Медиа

Политическая Предвзятость и Логические Особенности

Во время тестирования Grok 4 Basic эксперты отметили высокий уровень логического мышления и удобное голосовое взаимодействие. Однако модель продемонстрировала политическую предвзятость: отвечая на сложные темы, такие как война в Газе или вопросы абортов, ИИ часто ссылался на посты Илона Маска на платформе X или поддерживал его точку зрения.

“Этот ИИ, стремящийся к истине, который Маск обещал при запуске, ищет истину в первую очередь через призму социальных медиа своего создателя,” отметили авторы обзора.

В статье подчеркивается, что системный запрос не содержит явных инструкций для согласования с взглядами Маска, что оставляет неясным, является ли это функциональной ошибкой или преднамеренным решением разработчиков. Ранее Grok уже был замечен за резкими высказываниями о демократиях, Голливуде и лидерах отрасли.

Сильные и Слабые Стороны: Аналитика, Креативность и Программирование

Одним из преимуществ Grok 4 Basic является его способность быстро анализировать сложные логические и юридические вопросы. Например, когда его спросили о браке с сестрой вдовы, модель выявила логическую ошибку и предоставила юридически обоснованный ответ.

“Вопрос подразумевает фактическую невозможность, что делает брак недействительным ab initio [т.е. с момента его заключения].”

В области научного мышления Grok 4 демонстрирует уровень квалификации PhD, формируя точные и хорошо обоснованные объяснения. Однако в креативных задачах и программировании модель проявила значительные недостатки. Тексты, генерируемые ИИ, были предсказуемыми и лишены эмоциональной выразительности, а при написании кода Grok 4 не смог создать даже простую игру без множества ошибок. Предыдущая версия, Grok 3, была оценена тестировщиками как более успешная в разработке игр.

Журналисты рекомендуют сочетать Grok 4 для создания сюжетов с Claude 4 Opus для написания текстов в художественных задачах.

Известно, что в начале июля 2025 года xAI получила 10 миллиардов долларов инвестиций для разработки Grok и расширения дата-центра Colossus, что, как ожидается, улучшит ИИ.

Голосовые Возможности и Ограничения Контекста

Особое внимание было уделено голосовым функциям Grok 4 — ИИ может выразительно читать истории, подстраивая интонацию, темп и даже выбирая разные “личности” для повествования. Однако отсутствие общего экрана ограничивает возможности модели в визуальных задачах — здесь Gemini Live остается лучшим выбором.

Еще одним недостатком была неспособность Grok 4 обрабатывать большие объемы текста: столкнувшись с запросом на 83 000 токенов, модель отказалась отвечать, несмотря на то, что заявленный контекст составляет 126 000 токенов, что вызывает вопросы о маркетинговых обещаниях.

В целом, Grok 4 Basic оказался мощным инструментом для аналитики, но слабым в креативных задачах и программировании. Среди его сильных сторон — четкое голосовое взаимодействие, в то время как к слабостям относятся политическая предвзятость и отсутствие универсальности для различных случаев использования.

“Если вас не смущает влияние Маска на ответы, вы получите ИИ с высоким уровнем аналитики и качественным голосовым взаимодействием. Но за 30 долларов в месяц, если вам нужно больше, лучше поискать альтернативы,” заключили в Decrypt.

Кроме того, в июне 2025 года Илон Маск сообщил о использовании Grok 3.5 для обработки знаний человечества.