Построение трёхмерной сцены на основе стереоскопических изображений


 Построение трехмерной сцены на основе двух моноскопических изображений


Реально наблюдаемые объекты сцены находятся в трехмерном пространстве. Для наблюдения за ними большинство биологических объектов, в том числе и человек, имеет два глаза, разнесённых примерно на 6,5 сантиметров. Благодаря этому мы легко вычисляем расстояния до предметов и, как следствие, определяем с высокой точностью их истинные размеры. Каким же образом наше сознание по двум плоским изображениям воспринимает трехмерную сцену и существует ли техническое решение этой задачи?
Общая схема получения стереоскопических изображений приведена на рисунке 1, где две видеокамеры разнесены на некоторую базу. Каждая видеокамера имеет свой угол обзора, а пересечение углов обзора левой и правой видеокамер образует стереоклин.

 


Рисунок 1 - Схема получения стереоскопического изображения

Определение расстояния возможно только в области стереоклина, а поскольку интересующий нас объект может находиться вне его зоны, нужна система позиционирования, внешний вид которой приведен на рисунке 2.

Рисунок 2 - Стереосистема

Для того, чтобы измерить расстояние до одного из объектов, необходимо исходные изображения наложить друг на друга (рисунок 3) и сконвергировать на одном из объектов. При этом образовавшийся угол конвергенции позволит определить расстояние до объекта.

Рисунок 3 - Стереокадр, несконвергированный 



Рисунок 4 Стереокадр, сконвергированный на ближнем объекте

Рисунок 4 Стереокадр, сконвергированный на дальнем объекте 


Точность измерения расстояния зависит от углового разрешения оптоэлектронной системы, стереобазы и углового разрешения. 
Однако такой подход является механистическим и не может быть использован в реальных системах по причине того, что задача построения трехмерной сцены относится к задачам большой размерности. Расстояние необходимо знать не только до объектов, но и до их фрагментов, только тогда восприятие будет объемным. Для построения трехмерной сцены в автоматическом режиме должны быть разработаны математические методы и алгоритмы, обеспечивающие решение следующих задач:
- автоматическое выделение границ (краёв);

- сегментация изображений (переход от матричной формы описания изображений к списковой. При этом однородные участки изображений заменяются сегментами с учетом выделенных границ);

- фрагментация изображений – задача объединения сегментов в однородные группы по одному или нескольким признакам.

Только после решения вышеперечисленных задач можно приступить к восстановлению трехмерной сцены по двум плоским изображениям, полученным стереопарой.