Уже этой осенью новый и продвинутый голосовой режим ChatGPT станет доступен подписчикам Plus
Компания Open Ai представила передовой голосовой режим для своего чат-бота ChatGPT, доступный пока только подписчикам программы ChatGPT Plus.
Эта новая функция, основанная на модели GPT-4o, позволяет боту не только слушать и понимать голосовые команды, но и отвечать им без использования внешних систем.
Пользователи уже активно делятся своими впечатлениями о новой технологии в сети. ChatGPT может петь, имитировать различные акценты, корректировать произношение и рассказывать эмоциональные истории. Бот поддерживает запросы на десятках языков, что делает его универсальным инструментом для многоязычного общения. Однако точное количество поддерживаемых языков может варьироваться.
Используя передовые нейронные сети, технология синтеза речи значительно превосходит традиционные системы «текст-в-речь». В боте представлены разнообразные мужские и женские голоса, созданные на основе обширных данных. Например, голос «Sky», моделированный по образу Скарлетт Йоханссон, был временно удален из системы.
Полноценный запуск нового голосового режима для всех подписчиков ChatGPT Plus запланирован на осень 2024 года. Этот шаг демонстрирует значительный прогресс в области обработки естественного языка и открывает перспективы для более естественного и качественного многоязычного взаимодействия с искусственными интеллектами.
Рекомендуем к прочтению
- Маск анонсировал выпуск ИИ-модели Grok-5 до конца года в ответ на релиз GPT-5
- OpenAI представила GPT-5: версию мультимодального ИИ с улучшенным мышлением и памятью до миллиона токенов
- Утечка GitHub раскрыла новшества и версии GPT-5: mini, nano, chat и тарифные планы
- Google запустила ИИ-репетитора Guided Learning — конкурента аналога ChatGPT
- Илон Маск анонсировал открытие исходного кода чат-бота Grok 2 от xAI