Anthropic представила Sonnet 4.6 с контекстом до 1 миллиона токенов и улучшенной логикой

Anthropic представила Sonnet 4.6 — покращена логіка та контекст до 1 млн токенів

Anthropic анонсировала обновленную версию искусственного интеллекта Claude Sonnet 4.6, которая стала базовой моделью для сервисов Claude и Claude Cowork. Новинка получила значительные улучшения в плане кодирования, работы с документами и логического анализа данных, а также сохранила конкурентную стоимость использования на уровне предыдущей версии.

Об этом сообщает Бизнес • Медиа

Ключевые изменения и новые возможности

Sonnet 4.6 выделяется контекстным окном до 1 миллиона токенов в бета-режиме, что позволяет модели обрабатывать масштабные кодовые базы, длинные контракты и большие массивы исследовательских материалов за один запрос. Это открывает новые возможности для анализа сложных данных в различных сферах бизнеса и разработки.

Модель демонстрирует повышенную точность выполнения инструкций, уменьшение количества ошибок и «галлюцинаций», а также стабильнее справляется с многопроцессными задачами. Увеличились и навыки взаимодействия с компьютерными интерфейсами: Sonnet 4.6 может имитировать действия пользователя, например, виртуальные клики или ввод текста, что позволяет автоматизировать сложные рабочие процессы.

«Sonnet 4.6 получила контекстное окно до 1 млн токенов (в бета-режиме). По словам разработчиков, это позволяет обрабатывать большие кодовые базы, длинные контракты и наборы исследовательских материалов в одном запросе».

Сравнение с Opus и безопасность

По результатам внутренних тестов и внедрений, Sonnet 4.6 показала рост эффективности при анализе документов, финансовых расчетах и управлении агентными задачами. На практике новая модель приблизилась к уровню возможностей Opus, оставаясь при этом более доступной по цене — от $3 до $15 за миллион токенов.

Anthropic подчеркивает, что разработчики с ранним доступом чаще отдают предпочтение именно Sonnet 4.6, иногда даже вместо флагманской Opus 4.5. Кроме того, модель прошла расширенные тесты на безопасность и демонстрирует уровень надежности, который не уступает предыдущим решениям компании или даже превышает их.

Стоит отметить, что ранее искусственный интеллект Claude уже был задействован в специальных операциях США, в частности, во время кампании против Мадуро, что свидетельствует о признании инструмента на высшем государственном уровне.

Сравнение Claude Sonnet 4.6 с ведущими AI-моделями по ключевым бенчмаркам. Данные: Anthropic.