Вышла GPT Images 2 — модель для генерации изображений с поддержкой текста и веб-поиском

OpenAI представила обновленную модель генерации изображений GPT Images 2, которая стала доступна пользователям ChatGPT. Новинка распространяется поэтапно и охватывает даже владельцев бесплатных аккаунтов. Ключевое улучшение касается работы с текстовыми элементами на изображениях — области, где предыдущие версии регулярно допускали ошибки.

Вышла GPT Images 2 - модель для генерации изображений с поддержкой текста и веб-поиском

Теперь модель способна корректно отображать сложные надписи и целые страницы текста. Многоязычная поддержка работает одновременно с несколькими языками, включая русский. Владельцы платных подписок получают доступ к расширенному функционалу с режимом рассуждений и поиском информации в интернете.

Компания OpenAI запустила GPT Images 2 — новое поколение своей модели для создания изображений. Развертывание происходит постепенно, охватывая пользователей ChatGPT за последние часы. Примечательно, что базовая быстрая версия доступна даже тем, кто использует платформу бесплатно.

Главный акцент разработчики сделали на улучшении обработки текстовых элементов. Предыдущая версия GPT Images 1.5 часто ошибалась даже при генерации коротких надписей, тогда как новая модель корректно воспроизводит целые страницы текста в одном изображении. Прогресс затронул не только английский язык — система эффективно работает с несколькими языками одновременно. Практические тесты показывают качественное отображение русскоязычных надписей без характерных для предыдущих версий искажений.

Владельцы подписок Plus и более дорогих тарифов получают расширенные возможности. Для них доступна рассуждающая версия GPT Images 2, активируемая через специальный режим в главном меню. В этом режиме модель генерирует изображения в несколько этапов: сначала уточняет и дорабатывает исходный запрос пользователя, затем создает черновой вариант изображения, анализирует полученный результат на предмет ошибок и при необходимости выполняет дополнительную итерацию для их исправления.

Еще одна особенность рассуждающей версии — интеграция с поиском в интернете. Когда пользователь запрашивает изображение по мотивам свежих событий, которые не вошли в обучающую выборку модели, система самостоятельно ищет релевантные изображения в сети и использует их как референсы для генерации. Это решает проблему актуальности данных и расширяет возможности создания контента на основе последних новостей и трендов.

Читайте также: