Инженеры Apple разработали умное приложение для создания 3D-объектов на основе ИИ
Инженерная команда Apple представила революционную модель искусственного интеллекта под названием Depth Pro. Этот инструмент способен анализировать двумерные изображения и определять глубину, что позволяет преобразовывать обычные фотографии в трехмерные (3D).
Принципы восприятия глубины Depth Pro
Человеческое и животное восприятие глубины основывается на бинокулярном зрении. Мозг обрабатывает два слегка различающихся изображения, поступающих от каждого глаза, и на основе этих различий формирует представление о пространственном расположении объектов. Подобный принцип используется в некоторых видеокамерах для создания 3D видео. Смартфоны, оснащенные одной камерой для фотосъемки и видеозаписи, применяют различные аппаратные и программные решения для создания эффекта глубины.
Инженеры Apple разработали алгоритм, который позволяет генерировать полные карты глубины исключительно на основе данных из исходного изображения, без необходимости в дополнительных метаданных о камере.
Что такое карта глубины?
Карта глубины представляет собой визуальное отображение трехмерной информации, извлеченной из двумерного изображения. Каждый пиксель карты содержит данные о расстоянии от соответствующей точки объекта до камеры. Это позволяет добавить третье измерение к плоскому изображению и создавать 3D эффекты, которые превосходят стандартные технологии смартфонов.
Применение этой технологии
По утверждению команды Apple, приложения, использующие эту модель, могут создавать карты глубины всего за каких-то 0,3 секунды с использованием самого стандартного графического процессора. Для этого не требуются дополнительные данные о камере, что значительно упрощает процесс создания трехмерных моделей.
Такая быстрая работа данного алгоритма открывает перед пользователями совершенно новые возможности для создания 3D изображений в реальном времени с использованием однообъективной камеры. Эта технология на основе ИИ может быть полезна в робототехнике и других областях, где необходимо строить трехмерные карты в реальном времени, например, в системах автономного вождения.
Рекомендуем к прочтению
- OpenAI выпустила GPT-4.1 и GPT-4.1 mini в ChatGPT с улучшенными возможностями для разработчиков
- Alibaba представляет Qwen 3: новое поколение языковых моделей с открытым исходным кодом
- OpenAI представляет Deep Research: революционный инструмент для исследований теперь доступен бесплатно
- Названы 8 скрытых возможностей ChatGPT для повышения эффективности работы
- ChatGPT получил функцию Memory with Search для персонализированного веб-поиска