Инженеры Apple разработали умное приложение для создания 3D-объектов на основе ИИ
Инженерная команда Apple представила революционную модель искусственного интеллекта под названием Depth Pro. Этот инструмент способен анализировать двумерные изображения и определять глубину, что позволяет преобразовывать обычные фотографии в трехмерные (3D).
Принципы восприятия глубины Depth Pro
Человеческое и животное восприятие глубины основывается на бинокулярном зрении. Мозг обрабатывает два слегка различающихся изображения, поступающих от каждого глаза, и на основе этих различий формирует представление о пространственном расположении объектов. Подобный принцип используется в некоторых видеокамерах для создания 3D видео. Смартфоны, оснащенные одной камерой для фотосъемки и видеозаписи, применяют различные аппаратные и программные решения для создания эффекта глубины.
Инженеры Apple разработали алгоритм, который позволяет генерировать полные карты глубины исключительно на основе данных из исходного изображения, без необходимости в дополнительных метаданных о камере.
Что такое карта глубины?
Карта глубины представляет собой визуальное отображение трехмерной информации, извлеченной из двумерного изображения. Каждый пиксель карты содержит данные о расстоянии от соответствующей точки объекта до камеры. Это позволяет добавить третье измерение к плоскому изображению и создавать 3D эффекты, которые превосходят стандартные технологии смартфонов.
Применение этой технологии
По утверждению команды Apple, приложения, использующие эту модель, могут создавать карты глубины всего за каких-то 0,3 секунды с использованием самого стандартного графического процессора. Для этого не требуются дополнительные данные о камере, что значительно упрощает процесс создания трехмерных моделей.
Такая быстрая работа данного алгоритма открывает перед пользователями совершенно новые возможности для создания 3D изображений в реальном времени с использованием однообъективной камеры. Эта технология на основе ИИ может быть полезна в робототехнике и других областях, где необходимо строить трехмерные карты в реальном времени, например, в системах автономного вождения.
Рекомендуем к прочтению
- Опасность неофициального доступа к нейросетям: предупреждение эксперта
- Право (диалог) – первый ИИ-помощник в Телеграмме для арбитражных процессов
- ChatGPT покоряет сердца стилем Ghibli: сервера не выдержали ажиотажа
- Google представила бесплатный доступ к мощному ИИ Gemini 2.5 Pro
- YandexGPT 5 Lite Instruct: новая модель для бизнеса и разработчиков