Google запустил Gemini 3.5 Live Translate: перевод речи на 70+ языков в реальном времени

Компания Google анонсировала запуск инновационной аудиомодели Gemini 3.5 Live Translate, которая обеспечивает перевод речи в режиме реального времени. Технология разработана для того, чтобы сделать коммуникацию между людьми, говорящими на разных языках, максимально естественной и комфортной. Основное отличие новой системы от традиционных решений заключается в отсутствии привычных пауз между фразами.

Вместо пошагового перевода модель работает в потоковом режиме, генерируя перевод практически синхронно с речью собеседника. Разработчики подчеркивают, что задержка составляет всего несколько секунд, что позволяет поддерживать естественный ритм беседы. Это существенный прорыв в области языковых технологий, который может изменить подход к международной коммуникации.

Gemini 3.5 Live Translate поддерживает автоматическое распознавание более чем 70 языков. Система самостоятельно определяет, на каком языке говорит собеседник, без необходимости предварительной настройки. Особое внимание разработчики уделили качеству передачи речи: модель сохраняет интонацию, темп и высоту голоса оригинального говорящего. Это делает перевод не просто понятным, но и эмоционально насыщенным, что критично для полноценного общения.

Технология демонстрирует высокую устойчивость к фоновым шумам, что особенно важно при использовании в реальных условиях — на улице, в офисе или общественных местах. Система способна выделять речь человека даже в шумной обстановке и обеспечивать качественный перевод. Это достигается за счет продвинутых алгоритмов обработки звука и машинного обучения.

Внедрение новой технологии происходит поэтапно через различные продукты экосистемы Google. Для корпоративных клиентов функция живого перевода будет интегрирована в сервис Google Meet, что откроет новые возможности для международных видеоконференций и деловых встреч. Участники смогут общаться на родных языках, получая мгновенный перевод без прерывания диалога. Это значительно упростит взаимодействие в мультикультурных командах и международных проектах.

Для рядовых пользователей технология станет доступна через приложение Google Translate на устройствах Android и iOS. При активации режима живого перевода с подключенными наушниками пользователи смогут слышать более плавную и естественную речь переводчика. Звук будет передаваться непосредственно в наушники, создавая эффект личного синхронного переводчика. Это особенно удобно для путешественников, деловых встреч или просто для практики иностранных языков.

Владельцы Android-устройств получат дополнительную возможность — новый «режим прослушивания». Эта функция позволяет использовать телефон как обычную трубку: достаточно поднести устройство к уху, и переведенный аудиопоток будет воспроизводиться через динамик телефона. Такой подход делает использование технологии еще более интуитивным и не требует постоянного ношения наушников. Режим подходит для коротких разговоров или ситуаций, когда наушники недоступны.

Запуск Gemini 3.5 Live Translate представляет собой значительный шаг вперед в развитии систем машинного перевода. В отличие от предыдущих поколений переводчиков, которые работали с завершенными фразами и создавали заметные паузы, новая модель обрабатывает речь непрерывно. Это приближает опыт использования автоматического перевода к работе с профессиональным синхронным переводчиком.

Технология имеет широкий спектр применения: от туризма и образования до международного бизнеса и дипломатии. Возможность общаться на родном языке, получая мгновенный перевод с сохранением эмоциональной окраски, снимает один из главных барьеров в межкультурной коммуникации. Google продолжает расширять функциональность своих ИИ-решений, делая их все более доступными и практичными для повседневного использования.

Читайте также:

neuronews.by

Google запустил Gemini 3.5 Live Translate: перевод речи на 70+ языков в реальном времени

Последние новости: