ChatGPT запустила голосовой режим: теперь текст и изображения работают в едином интерфейсе

OpenAI провела значительное обновление пользовательского интерфейса ChatGPT, кардинально изменив подход к голосовому взаимодействию. Теперь функция голосового общения интегрирована непосредственно в основное окно чата, устраняя необходимость переключения между режимами. Пользователи получили возможность одновременно видеть текстовые ответы, изображения и другой визуальный контент прямо во время голосовой беседы с ИИ.

Это решение устраняет главную проблему предыдущей версии, когда приходилось выходить из голосового режима для просмотра текста или графики. Обновление уже распространяется на всех пользователей как в веб-версии, так и в мобильных приложениях. Изменения затрагивают базовую архитектуру взаимодействия с чат-ботом и направлены на повышение удобства работы. Компания также сохранила возможность возврата к классическому интерфейсу для тех, кто предпочитает прежний формат.

Предыдущая версия голосового режима требовала перехода на отдельный экран с характерной анимацией в виде синего круга. В этом режиме пользователи могли прослушивать ответы ассистента, управлять микрофоном и включать запись видео, однако текстовые и визуальные элементы оставались недоступными. Каждый раз, когда требовалось прочитать ответ или посмотреть сгенерированное изображение, приходилось покидать голосовой режим и возвращаться в обычный чат. Такая фрагментация интерфейса вызывала недовольство у значительной части аудитории.

Новая реализация полностью меняет логику работы. Активация голосового режима происходит простым нажатием иконки звука, расположенной рядом с полем ввода текста. После этого обычный чат трансформируется в голосовой интерфейс, но при этом сохраняет все возможности визуального отображения информации. Ответы генерируются и появляются на экране мгновенно, независимо от формата: текст, изображения, карты или гиперссылки. Все элементы доступны без дополнительных действий и переключений между экранами.

OpenAI сделала новый формат стандартным для всех платформ. Обновление развертывается автоматически для пользователей веб-интерфейса и мобильных приложений на iOS и Android. Это означает унификацию пользовательского опыта независимо от устройства доступа.

При этом разработчики учли предпочтения тех, кто привык к прежнему формату работы. В настройках приложения предусмотрена опция возврата к классическому отдельному голосовому режиму с анимированным интерфейсом. Это позволяет каждому пользователю выбрать наиболее комфортный для себя вариант взаимодействия с системой.

Нововведение представляет собой существенный шаг в развитии мультимодальных возможностей ChatGPT, объединяя различные форматы контента в едином пространстве взаимодействия и упрощая рабочий процесс для конечных пользователей.

Читайте также:

neuronews.by

ChatGPT запустила голосовой режим: теперь текст и изображения работают в едином интерфейсе

Последние новости: