OpenAI анонсировала инструмент для создания музыки на основе текста и аудио

OpenAI має намір впровадити ID-верифікацію для доступу до нових ШІ-моделей через API

OpenAI работает над новым инструментом, который позволит генерировать музыку, используя текстовые описания и аудиозаписи. Разработка даст возможность пользователям создавать музыкальное сопровождение для видео, а также добавлять, например, гитарный аккомпанемент к вокальным трекам.

Об этом сообщает Бизнес • Медиа

Сотрудничество с музыкальными академиями и принцип работы

Для повышения качества модели OpenAI привлекает студентов Джульярдской школы — известного музыкального учебного заведения, которые занимаются аннотированием партитур. Такое сотрудничество помогает обучить инструмент лучше понимать структуру и композицию музыкальных произведений.

«Компания уже имеет опыт в генерации звука, но после запуска ChatGPT сосредоточилась на моделях синтеза речи. Новый проект может стать первым крупным возвращением OpenAI в сферу музыкального ИИ».

Конкуренты и перспективы нового продукта

Инструмент позволит интегрировать музыку в уже существующие видео и вокальные записи. Пока неизвестно, станет ли этот сервис отдельным продуктом или войдет в состав ChatGPT или видеомодели Sora. Дата релиза и окончательный формат на данный момент не определены.

OpenAI имеет опыт в сфере генерации звука, однако в последние годы фокусировалась прежде всего на языковых технологиях. Тем не менее, новый музыкальный инструмент может стать ключевым шагом компании в развитии искусственного интеллекта именно для музыки.

На рынке генерации музыки уже активно работают Google и стартап Suno, причем последний интегрировал свою модель в Microsoft Copilot. Эксперты считают, что в случае успешной интеграции текстовых и аудиомоделей OpenAI сможет создать конкурентоспособный инструмент, который дополнит экосистему продуктов компании на пересечении технологий и творчества.

Напомним, ранее сообщалось, что OpenAI планирует создать ИИ-банкира.