Disparity map - как машины видят глубину картинки?

Когда мы смотрим двумя глазами, мозг автоматически определяет, где ближе, а где дальше. Это называется бинокулярное зрение.

Левый и правый глаз видят одну и ту же сцену под немного разным углом.

Если закрыть один глаз, а потом другой — объекты «прыгают» из стороны в сторону. Чем ближе предмет, тем сильнее он смещается.

📌 Точно так же работает стереозрение в компьютерном зрении.

Если у нас есть два изображения одной сцены, снятых с небольшим смещением (например, с двух камер или в разное время), мы можем посчитать, насколько каждый пиксель "сдвинулся" между кадрами.

Это и есть disparity — разность в положении пикселя на левом и правом изображении.

Когда мы для каждой точки в кадре определяем такую разность — мы получаем disparity map, или карту смещений.

🟦 Чем объект ближе, тем сильнее он смещается.

🟪 Чем он дальше — тем меньше disparity.

Disparity map — это изображение, где:

яркие области (высокая disparity) — ближе к камере, тёмные (низкая disparity) — дальше. Фактически, это "карта глубины", но полученная без лидара или других дорогих датчиков. Только с помощью камеры и математики.

Где это применяется?

  • В автомобилях с автопилотом, чтобы понимать, на каком расстоянии находятся другие машины и пешеходы

  • В дронах и роботах, чтобы видеть, где преграда, а где свободный проход

  • В дополненной реальности — чтобы правильно «поставить» виртуальный объект на стол, а не в воздух

  • В 3D-сканировании, когда нужно создать модель объекта или помещения

  • В медицине, промышленности, играх, где нужно видеть "в объёме", а не просто на фото

📌 Disparity map — один из способов научить компьютер видеть не просто картинку, а трёхмерную сцену.

#компьютерноезрение #машинноезрение #cv #computervision #нейросети1

Disparity map - как машины видят глубину картинки? | Сетка — социальная сеть от hh.ru Disparity map - как машины видят глубину картинки? | Сетка — социальная сеть от hh.ru