OpenAI на DevDay 2024 анонсировала новые инструменты для разработчиков
На этой неделе OpenAI привлекла внимание широкой общественности благодаря нескольким важным новостям, особенно в преддверии DevDay 2024, когда компания стремится привлечь новых разработчиков для создания передовых инструментов на основе своих моделей искусственного интеллекта.
Запуск бета-версии Realtime API
Одним из главных событий стало представление бета-версии Realtime API. Этот инструмент позволяет разработчикам создавать приложения с минимальными задержками и получать голосовые ответы, сгенерированные ИИ. Хотя функциональность отличается от Advanced Voice Mode в ChatGPT, он всё же предоставляет схожие возможности для взаимодействия с пользователями.
На пресс-брифинге Кевин Вейл, отвечающий за продуктовую стратегию OpenAI, отметил, что недавние увольнения технического директора Миры Мурати и главного исследователя Боба Макгрю не замедлят развитие компании. Он подчеркнул важность вклада этих специалистов в достижения OpenAI и подтвердил, что компания продолжает движение вперёд без замедлений.
Конкуренция и снижение цен OpenAI нацелена сохранить статус лидера в области разработки AI-приложений, имея более 3 миллионов разработчиков в своём сообществе. Однако конкуренция на рынке усиливается. В последние два года компания снизила цены на доступ к своему API на 99%, вероятно, в ответ на действия таких компаний, как Meta и Google.
Какие возможности дает Realtime API специалистам
Realtime API предоставляет разработчикам возможность создавать приложения с практически мгновенной реакцией, выбирая из шести уникальных голосов от OpenAI. Эти голоса отличаются от тех, что используются в ChatGPT, и разработчики не могут использовать сторонние голосовые шаблоны по соображениям авторского права.
На демонстрации Ромен Хью, ответственный за работу с разработчиками в OpenAI, показал приложение для планирования поездки в Лондон, использующее Realtime API. Это приложение обеспечивало быстрые ответы пользователям и включало инструменты для аннотирования карт, показывая рестораны.
Хью также продемонстрировал, как Realtime API может взаимодействовать по телефону для уточнения заказа еды на мероприятие. Тем не менее, стоит отметить, что OpenAI API не поддерживает прямые звонки в рестораны или магазины, а взаимодействует с сервисами, такими как Twilio.
Кроме того, OpenAI представила функцию тонкой настройки визуального восприятия в своём API. Эта новинка направлена на улучшение работы GPT-4o при анализе изображений и визуальной информации.
Рекомендуем к прочтению
- Xiaomi Mix Flip 2: встречайте новую эру раскладушек раньше времени
- CAPTCHA под угрозой: как искусственный интеллект меняет «игру» в кибербезопасности
- Проблемы с ChatGPT: пользователи сообщают о сбоях и ошибках в работе сервиса
- Будущее уже здесь: прогнозы Forbes на 2025 год в мире ИИ и технологий
- Li Auto: путь к лидерству в искусственном интеллекте и робототехнике