Grok научился создавать видео по текстовому запросу: инструкция и возможности

Чат-бот Grok от xAI получил значительное обновление функционала генерации контента. Теперь инструмент Imagine способен создавать короткие видеоролики непосредственно по текстовым описаниям, без необходимости предварительной загрузки изображений. Нейросеть самостоятельно генерирует видео с движением, звуком и озвучкой на основе текстового промта.

До этого обновления Grok Imagine мог только анимировать готовые изображения, добавляя к ним движение или эмоциональные эффекты. Функция появилась без официального анонса и уже доступна пользователям, причем даже без оплаты подписки. Это делает Grok одним из самых доступных инструментов для генерации видео среди конкурентов.

Процесс создания видео в обновленном Grok Imagine максимально упрощен и состоит из нескольких последовательных действий. Пользователю необходимо открыть чат-бот Grok и перейти во вкладку Imagine. В поле для промта вводится текстовое описание желаемой сцены с указанием персонажей, действий, движений или реплик. На следующем этапе справа выбирается формат будущего видео — доступны три варианта соотношения сторон: квадратное 1:1, вертикальное 9:16 или горизонтальное 16:9. После выбора формата нажатие стрелки запускает процесс генерации.

По завершении обработки нейросеть выдает готовый видеоролик, который можно сразу скачать или запросить повторную генерацию. Дополнительно система предлагает несколько альтернативных стартовых изображений, расположенных ниже основного результата. На их основе можно создать новые версии видео, просто нажав кнопку воспроизведения под каждым вариантом. Это позволяет быстро получить несколько интерпретаций одного промта без повторного ввода текста.

Для улучшения качества финального варианта предусмотрена функция апскейла. После получения удовлетворительного результата нужно нажать на три точки в правом верхнем углу видеоплеера и выбрать пункт «Улучшить качество видео». Система пересоберет ролик в HD-разрешении, что повысит четкость и детализацию изображения. Тестовый промт на русском языке «барсук и лис обсуждают проблемы ИИ на подкасте, в стиле 3D Pixar» успешно обрабатывается системой и выдает соответствующий результат.

Появление этого обновления знаменует новый этап развития визуальных возможностей Grok. Эволюция инструмента прошла путь от создания статичных изображений к анимации готовых картинок, а теперь достигла уровня полноценной генерации видео из текста. По функциональности Grok Imagine приближается к лидерам индустрии — Sora 2 от OpenAI и Veo 3.1 от Google. Основные отличия пока заключаются в длительности генерируемых роликов и степени контроля над процессом создания.

Ключевое преимущество Grok перед конкурентами — бесплатный доступ к генерации видео. В то время как большинство аналогичных сервисов требуют платной подписки для использования продвинутых функций, Grok предоставляет возможность создавать видеоконтент без финансовых вложений. Это делает технологию доступной широкому кругу пользователей и снижает барьер входа для экспериментов с ИИ-генерацией видео.

Читайте также:

neuronews.by

Grok научился создавать видео по текстовому запросу: инструкция и возможности

Последние новости: