Инженеры Apple разработали умное приложение для создания 3D-объектов на основе ИИ

Инженерная команда Apple представила революционную модель искусственного интеллекта под названием Depth Pro. Этот инструмент способен анализировать двумерные изображения и определять глубину, что позволяет преобразовывать обычные фотографии в трехмерные (3D).

Принципы восприятия глубины Depth Pro

Человеческое и животное восприятие глубины основывается на бинокулярном зрении.  Мозг обрабатывает два слегка различающихся изображения, поступающих от каждого глаза, и на основе этих различий формирует представление о пространственном расположении объектов. Подобный принцип используется в некоторых видеокамерах для создания 3D видео. Смартфоны, оснащенные одной камерой для фотосъемки и видеозаписи, применяют различные аппаратные и программные решения для создания эффекта глубины.

Инженеры Apple разработали алгоритм, который позволяет генерировать полные карты глубины исключительно на основе данных из исходного изображения, без необходимости в дополнительных метаданных о камере.

Что такое карта глубины?

Карта глубины представляет собой визуальное отображение трехмерной информации, извлеченной из двумерного изображения. Каждый пиксель карты содержит данные о расстоянии от соответствующей точки объекта до камеры. Это позволяет добавить третье измерение к плоскому изображению и создавать 3D эффекты, которые превосходят стандартные технологии смартфонов.

Применение этой технологии

По утверждению команды Apple, приложения, использующие эту модель, могут создавать карты глубины всего за каких-то 0,3 секунды с использованием самого стандартного графического процессора. Для этого не требуются дополнительные данные о камере, что значительно упрощает процесс создания трехмерных моделей.

Такая быстрая работа данного алгоритма открывает перед пользователями совершенно новые возможности для создания 3D изображений в реальном времени с использованием однообъективной камеры. Эта технология на основе ИИ может быть полезна в робототехнике и других областях, где необходимо строить трехмерные карты в реальном времени, например, в системах автономного вождения.