Обработка видеоизображений


Сегментация и фрагментация изображений

Формирование  изображений в видеокамере осуществляется путем проекции светового потока, сфокусированного оптической системой, на ПЗС-матрицу и накопления зарядов на ней в течение заданного промежутка времени. Качество получаемых изображений зависит от освещенности объекта, расстояния до него, степени наведения резкости и т.п. Перечисленные параметры могут существенно изменяться в процессе наблюдения. Учитывая вариативность перечисленных параметров, изменение освещенности компенсируется изменением времени накопления зарядов (выдержкой) и параметрами светового потока, регулируемого диафрагмой. Компенсация дальности до объектов осуществляется использованием трансфокаторов,  обеспечивающих изменение фокусного расстояния, при этом всегда изменяется угловое разрешение. Качество изображения существенно зависит также от разрешающей способности ПЗС-матрицы. На рисунке 1 приведено исходное  цветное изображение размерностью 800*600 пикселей.

Рисунок 1 – Исходное изображение

Объем памяти для хранения такого изображения равен 800*600*3=1440000 байт. Таким образом, для передачи изображения в реальном времени с частотой 25 кадров в секунду требуется поток 36000000 байт в секунду. Современный компьютер на базе процессора Pentium-4 может только захватывать и визуализировать такие изображения, при этом затрачивая около 90% всей производительности. С целью снижения размерности исходного изображения с использованием различных методов выделяют контура объектов и сегментируют изображения. При этом объем памяти, требуемый для хранения изображения, снижается от 3-х до 7-и раз в зависимости от наблюдаемого изображения. Пример сегментированного изображения приведен на рисунке 2.

Рисунок 2 – Сегментированное изображение

С целью дальнейшего снижения размерности исходного описания изображения используются различные методы выделения их границ (краев), после чего однородные участки между границами аппроксимируют сегментами. В настоящее время в компьютерной графике наибольшее распространение получила аппроксимация трехмерных поверхностей треугольниками. При этом все изображения состоят из треугольников и для каждого треугольника выбирается материал, текстура, цвет и т.д. Эту технологию на аппаратном уровне поддерживают все современные видеокарты. В нашем случае аппроксимация изображений производится трапециями, высота которых постоянна, а длина и наклон зависят от типа границ, между которыми осуществляется аппроксимация. При этом реальное сжатие фрагментированных изображений может изменяться от 9 до 30 раз по отношению к исходному изображению. Пример фрагментированного изображения приведен на рисунке 3.

 

 

Рисунок 3 – Фрагментированное изображение

Качество такого изображения сравнительно невысокое, однако, объем занимаемой памяти становится вполне приемлемым, что позволяет решать задачи обработки с использованием современной вычислительной техники. Изображение на рисунке 3 состоит из 126 фрагментов, каждый фрагмент описывается шестью байтами. Любой из этих фрагментов может быть замаскирован. Так, выхлоп объекта может быть замаскирован с помощью 4-х фрагментов. Сам же  объект представлен 26-ю фрагментами. При движении объекта все 26 фрагментов могут быть объединены в таксон, так как все они имеют одинаковую скорость и направление движения, поэтому все остальные фрагменты могут быть замаскированы. С использованием таксонов может быть решена задача обнаружения движущихся объектов в условиях реальной фоно-помеховой обстановки. На рисунке 4 приведено изображение таксона, при этом все остальные фрагменты замаскированы.

Рисунок 4 – Изображение с выделенным таксоном

Для такого таксона может быть определена относительная скорость только в том случае, если движение объекта осуществляется в горизонтальной плоскости, да и то при небольших угловых разрешениях. Для решения задач сопровождения, определения текущих координат (целенаведения), скорости, ускорения, истинных размеров объекта необходима компонента Z, характеризующая величину дальности до объекта или до фрагмента, принадлежащего объекту (или фону). Для решения этой задачи предлагается использовать стереоэффект, что позволяет естественным образом определять расстояния до объектов и их фрагментов. Необходимость знания информации о дальности так же необходима при фрагментации сегментированных изображений, в противном случае для значительной части  сегментов имеется неопределенность в принадлежности к одному из нескольких прилегающих фрагментов, что является одной из основных причин низкого качества фрагментации (рис. 3).