OpenAI работает над новым инструментом, который позволит генерировать музыку, используя текстовые описания и аудиозаписи. Разработка даст возможность пользователям создавать музыкальное сопровождение для видео, а также добавлять, например, гитарный аккомпанемент к вокальным трекам.
Об этом сообщает Бизнес • Медиа
Сотрудничество с музыкальными академиями и принцип работы
Для повышения качества модели OpenAI привлекает студентов Джульярдской школы — известного музыкального учебного заведения, которые занимаются аннотированием партитур. Такое сотрудничество помогает обучить инструмент лучше понимать структуру и композицию музыкальных произведений.
«Компания уже имеет опыт в генерации звука, но после запуска ChatGPT сосредоточилась на моделях синтеза речи. Новый проект может стать первым крупным возвращением OpenAI в сферу музыкального ИИ».
Конкуренты и перспективы нового продукта
Инструмент позволит интегрировать музыку в уже существующие видео и вокальные записи. Пока неизвестно, станет ли этот сервис отдельным продуктом или войдет в состав ChatGPT или видеомодели Sora. Дата релиза и окончательный формат на данный момент не определены.
OpenAI имеет опыт в сфере генерации звука, однако в последние годы фокусировалась прежде всего на языковых технологиях. Тем не менее, новый музыкальный инструмент может стать ключевым шагом компании в развитии искусственного интеллекта именно для музыки.
На рынке генерации музыки уже активно работают Google и стартап Suno, причем последний интегрировал свою модель в Microsoft Copilot. Эксперты считают, что в случае успешной интеграции текстовых и аудиомоделей OpenAI сможет создать конкурентоспособный инструмент, который дополнит экосистему продуктов компании на пересечении технологий и творчества.
Напомним, ранее сообщалось, что OpenAI планирует создать ИИ-банкира.