Инженеры Apple разработали умное приложение для создания 3D-объектов на основе ИИ
Инженерная команда Apple представила революционную модель искусственного интеллекта под названием Depth Pro. Этот инструмент способен анализировать двумерные изображения и определять глубину, что позволяет преобразовывать обычные фотографии в трехмерные (3D).
Принципы восприятия глубины Depth Pro
Человеческое и животное восприятие глубины основывается на бинокулярном зрении. Мозг обрабатывает два слегка различающихся изображения, поступающих от каждого глаза, и на основе этих различий формирует представление о пространственном расположении объектов. Подобный принцип используется в некоторых видеокамерах для создания 3D видео. Смартфоны, оснащенные одной камерой для фотосъемки и видеозаписи, применяют различные аппаратные и программные решения для создания эффекта глубины.
Инженеры Apple разработали алгоритм, который позволяет генерировать полные карты глубины исключительно на основе данных из исходного изображения, без необходимости в дополнительных метаданных о камере.
Что такое карта глубины?
Карта глубины представляет собой визуальное отображение трехмерной информации, извлеченной из двумерного изображения. Каждый пиксель карты содержит данные о расстоянии от соответствующей точки объекта до камеры. Это позволяет добавить третье измерение к плоскому изображению и создавать 3D эффекты, которые превосходят стандартные технологии смартфонов.
Применение этой технологии
По утверждению команды Apple, приложения, использующие эту модель, могут создавать карты глубины всего за каких-то 0,3 секунды с использованием самого стандартного графического процессора. Для этого не требуются дополнительные данные о камере, что значительно упрощает процесс создания трехмерных моделей.
Такая быстрая работа данного алгоритма открывает перед пользователями совершенно новые возможности для создания 3D изображений в реальном времени с использованием однообъективной камеры. Эта технология на основе ИИ может быть полезна в робототехнике и других областях, где необходимо строить трехмерные карты в реальном времени, например, в системах автономного вождения.
Рекомендуем к прочтению
- Xiaomi Mix Flip 2: встречайте новую эру раскладушек раньше времени
- CAPTCHA под угрозой: как искусственный интеллект меняет «игру» в кибербезопасности
- Проблемы с ChatGPT: пользователи сообщают о сбоях и ошибках в работе сервиса
- Будущее уже здесь: прогнозы Forbes на 2025 год в мире ИИ и технологий
- Li Auto: путь к лидерству в искусственном интеллекте и робототехнике