ElevenLabs представила Music v2 — нейросеть для генерации музыки по частям

Компания ElevenLabs анонсировала выпуск Music v2 — обновлённой модели для создания музыкальных композиций с помощью искусственного интеллекта. Новая версия демонстрирует значительные улучшения в работе с вокалом, инструментами и аранжировками в различных музыкальных жанрах. Модель поддерживает создание текстов на нескольких языках и предоставляет расширенные возможности управления структурой песни.

ElevenLabs представила Music v2 — нейросеть для генерации музыки по частям

Music v2 уже доступна пользователям через платформы ElevenMusic и ElevenCreative. Для разработчиков функционал появится в ElevenAPI позже, при этом ранний доступ можно получить через обращение в отдел продаж компании. Одновременно с запуском новой версии ElevenLabs снизила стоимость использования как Music v1, так и Music v2 на 50%.

Ключевое отличие Music v2 от предыдущих решений заключается в принципиально новом подходе к контролю над результатом генерации. Модель создаёт треки не целиком, а разбивает их на структурные секции: интро, куплеты, припевы и другие части композиции. Такой подход позволяет формировать не короткие музыкальные фрагменты, а полноценные песни с логичной структурой и связью между различными секциями. Пользователь получает возможность не просто сгенерировать трек по текстовому описанию, но и детально проработать его по отдельным частям.

Существенно улучшена технология inpainting, которая теперь позволяет выделять любой участок готовой композиции и перегенерировать исключительно его. Например, можно заменить бридж без изменения припева и остальных частей песни. Это даёт беспрецедентный уровень контроля над финальным результатом и экономит время на доработку материала. Модель способна справляться со сложными музыкальными задачами: быстрым рэпом с плотным текстом, резкими переходами между жанрами и включением немузыкальных звуковых эффектов внутри трека.

По заявлениям ElevenLabs, Music v2 способна создавать композиции с радикальными жанровыми переходами без потери качества звучания. Песня может начинаться с оперного фрагмента, плавно переходить к хэви-металу и возвращаться обратно, сохраняя при этом целостность композиции. Технология лежит в основе трёх различных продуктов компании, каждый из которых ориентирован на свою целевую аудиторию.

Платформа ElevenMusic предназначена для авторов и музыкантов, которые могут слушать готовые композиции, создавать ремиксы и генерировать собственные треки. ElevenCreative ориентирована на бренды и контент-команды, которым необходима фоновая музыка для рекламных роликов, видеоматериалов и брендированного контента. Через ElevenAPI разработчики смогут интегрировать возможности генерации музыки, inpainting и подбора звучания по референсу непосредственно в свои программные продукты.

Работа с сервисом организована интуитивно. В ElevenMusic пользователь вводит текстовое описание и указывает желаемое настроение композиции, либо загружает референсный трек в качестве образца. Система генерирует песню, которую затем можно дорабатывать или трансформировать в ремикс. В ElevenCreative процесс предполагает задание параметров: жанра, темпа, настроения и голоса бренда, после чего Music v2 создаёт трек, соответствующий заданным критериям для использования в коммерческих целях.

Запуск Music v2 демонстрирует стратегическое расширение деятельности ElevenLabs за пределы основного направления по генерации голоса. Компания чётко сегментирует сценарии использования по разным платформам: EevenMusic для независимых авторов, ElevenCreative для корпоративных клиентов и ElevenAPI для разработчиков программного обеспечения. Важным аспектом является заявление компании об использовании исключительно лицензированных данных для обучения модели, что снимает юридические риски. Созданные с помощью Music v2 треки можно использовать в коммерческих проектах без дополнительных лицензионных отчислений, задержек с получением разрешений и ограничений на использование.

Этот релиз продолжает тенденцию расширения функционала платформы ElevenLabs. В сентябре компания запустила Studio 3.0 — редактор на базе искусственного интеллекта для работы со звуком и видео. В ноябре в сервисе появился специализированный раздел для генерации изображений и видеороликов непосредственно в интерфейсе платформы. Music v2 стала логичным продолжением стратегии по созданию комплексной экосистемы для работы с мультимедийным контентом, где музыкальная составляющая занимает одно из ключевых мест наравне с голосовыми технологиями.

Читайте также: