OpenAI на DevDay 2024 анонсировала новые инструменты для разработчиков

На этой неделе OpenAI привлекла внимание широкой общественности благодаря нескольким важным новостям, особенно в преддверии DevDay 2024, когда компания стремится привлечь новых разработчиков для создания передовых инструментов на основе своих моделей искусственного интеллекта.

Запуск бета-версии Realtime API

Одним из главных событий стало представление бета-версии Realtime API. Этот инструмент позволяет разработчикам создавать приложения с минимальными задержками и получать голосовые ответы, сгенерированные ИИ. Хотя функциональность отличается от Advanced Voice Mode в ChatGPT, он всё же предоставляет схожие возможности для взаимодействия с пользователями.

На пресс-брифинге Кевин Вейл, отвечающий за продуктовую стратегию OpenAI, отметил, что недавние увольнения технического директора Миры Мурати и главного исследователя Боба Макгрю не замедлят развитие компании. Он подчеркнул важность вклада этих специалистов в достижения OpenAI и подтвердил, что компания продолжает движение вперёд без замедлений.

Конкуренция и снижение цен OpenAI нацелена сохранить статус лидера в области разработки AI-приложений, имея более 3 миллионов разработчиков в своём сообществе. Однако конкуренция на рынке усиливается. В последние два года компания снизила цены на доступ к своему API на 99%, вероятно, в ответ на действия таких компаний, как Meta и Google.

Какие возможности дает Realtime API специалистам

Realtime API предоставляет разработчикам возможность создавать приложения с практически мгновенной реакцией, выбирая из шести уникальных голосов от OpenAI. Эти голоса отличаются от тех, что используются в ChatGPT, и разработчики не могут использовать сторонние голосовые шаблоны по соображениям авторского права.

На демонстрации Ромен Хью, ответственный за работу с разработчиками в OpenAI, показал приложение для планирования поездки в Лондон, использующее Realtime API. Это приложение обеспечивало быстрые ответы пользователям и включало инструменты для аннотирования карт, показывая рестораны.

Хью также продемонстрировал, как Realtime API может взаимодействовать по телефону для уточнения заказа еды на мероприятие. Тем не менее, стоит отметить, что OpenAI API не поддерживает прямые звонки в рестораны или магазины, а взаимодействует с сервисами, такими как Twilio.

Кроме того, OpenAI представила функцию тонкой настройки визуального восприятия в своём API. Эта новинка направлена на улучшение работы GPT-4o при анализе изображений и визуальной информации.