ChatGPT запустила голосовой режим: теперь текст и изображения работают в едином интерфейсе
OpenAI провела значительное обновление пользовательского интерфейса ChatGPT, кардинально изменив подход к голосовому взаимодействию. Теперь функция голосового общения интегрирована непосредственно в основное окно чата, устраняя необходимость переключения между режимами. Пользователи получили возможность одновременно видеть текстовые ответы, изображения и другой визуальный контент прямо во время голосовой беседы с ИИ.

Это решение устраняет главную проблему предыдущей версии, когда приходилось выходить из голосового режима для просмотра текста или графики. Обновление уже распространяется на всех пользователей как в веб-версии, так и в мобильных приложениях. Изменения затрагивают базовую архитектуру взаимодействия с чат-ботом и направлены на повышение удобства работы. Компания также сохранила возможность возврата к классическому интерфейсу для тех, кто предпочитает прежний формат.
Предыдущая версия голосового режима требовала перехода на отдельный экран с характерной анимацией в виде синего круга. В этом режиме пользователи могли прослушивать ответы ассистента, управлять микрофоном и включать запись видео, однако текстовые и визуальные элементы оставались недоступными. Каждый раз, когда требовалось прочитать ответ или посмотреть сгенерированное изображение, приходилось покидать голосовой режим и возвращаться в обычный чат. Такая фрагментация интерфейса вызывала недовольство у значительной части аудитории.
Новая реализация полностью меняет логику работы. Активация голосового режима происходит простым нажатием иконки звука, расположенной рядом с полем ввода текста. После этого обычный чат трансформируется в голосовой интерфейс, но при этом сохраняет все возможности визуального отображения информации. Ответы генерируются и появляются на экране мгновенно, независимо от формата: текст, изображения, карты или гиперссылки. Все элементы доступны без дополнительных действий и переключений между экранами.
OpenAI сделала новый формат стандартным для всех платформ. Обновление развертывается автоматически для пользователей веб-интерфейса и мобильных приложений на iOS и Android. Это означает унификацию пользовательского опыта независимо от устройства доступа.
При этом разработчики учли предпочтения тех, кто привык к прежнему формату работы. В настройках приложения предусмотрена опция возврата к классическому отдельному голосовому режиму с анимированным интерфейсом. Это позволяет каждому пользователю выбрать наиболее комфортный для себя вариант взаимодействия с системой.
Нововведение представляет собой существенный шаг в развитии мультимодальных возможностей ChatGPT, объединяя различные форматы контента в едином пространстве взаимодействия и упрощая рабочий процесс для конечных пользователей.
Читайте также:
- OpenAI запустила шопинг-ассистента Shopping Research в ChatGPT
- OpenAI запустила GPT-5-Codex: новый ИИ-помощник для разработчиков
- OpenAI представила Sora 2: как нейросеть создаёт видео по тексту и как меняет сферу видеопроизводства
- ChatGPT Atlas получил крупное обновление: 3 изменения в AI-браузере от OpenAI
- GPT-5 создаёт полноценные приложения за минуты: этот случай удивит даже опытных промпт-инженеров
- OpenAI представила GPT-5.1: новые режимы Instant и Thinking с повышенной точностью ответов
Последние новости:
- Apple впервые за 14 лет обогнала Samsung по продажам смартфонов
- OpenAI прогнозирует рост платных подписчиков ChatGPT до 220 млн к 2030 году
- Microsoft представила функцию шопинга с ИИ-помощником Copilot в браузере Edge
- OpenAI разрабатывает ИИ-устройство, которое заменит привычные смартфоны
- Складной iPhone выходит в 2026 году: известна цена революционной новинки