МОДЕЛИРОВАНИЕ ФОНА НА ОСНОВЕ СМЕСЕЙ НОРМАЛЬНЫХ РАСПРЕДЕЛЕНИЙ - Студенческий научный форум

V Международная студенческая научная конференция Студенческий научный форум - 2013

МОДЕЛИРОВАНИЕ ФОНА НА ОСНОВЕ СМЕСЕЙ НОРМАЛЬНЫХ РАСПРЕДЕЛЕНИЙ

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Реферат

Работа по научно-исследовательской практике выполнена на 14 листах машинописного текста, содержит 2 рисунков, 10 формул, 6 источников.

Ключевые слова: видеоаналитика, передний план, сегментация.

Содержание

  1. Введение

В связи с бурным развитием технологий вычислительные мощности нашего времени позволяют решать такие задачи, мысли о которых раньше были не больше чем мечтой. К одной из таких задач относится видеоаналитика, получающая последнее время все большее развитие. Автоматизация систем наблюдения на сегодняшний день является одной из наиболее актуальных проблем видеоаналитики.

При реализации любой видеоаналитической системы, например такой как распознавание объектов, одним из первых и очень важных шагов является отделения переднего плана от фона. Существует множество алгоритмов, решающих эту задачу, в данной работе рассмотрена реализация одного из них.

  1. Постановка задачи

Необходимо реализовать метод выделения переднего плана на видео. Алгоритм должен учитывать периодические и квазипериодические явления (покачивания деревьев, проезжающий транспорт и т.д.), адаптироваться под изменения среды (смена погоды, времени года и т.д.), иметь приемлемую вычислительную нагрузку (видео должно обрабатываться в реальном времени).

  1.  
    1. Моделирование фона на основе смесей нормальных распределений

Как было указано выше, в одних и тех же точках видеоизображения может с некоторой периодичностью появляться несколько величин яркости. Другим словами, фоновое изображение задают процессы, которые имеют периодическую или квазипериодическую природу. Наиболее часто, такие условия встречаются при размещении камер видеонаблюдения на улице, где могут наблюдаться следующие явления:

  • качающиеся деревья (колышущиеся листья и ветви);

  • осадки (снег, дождь);

  • водная рябь;

  • мельтешение насекомых вокруг осветительных приборов.

В помещениях также могут встречаться похожие эффекты, к которым можно отнести:

  • мерцание мониторов;

  • вращение лопастей вентиляторов;

  • качающиеся занавески.

Последовательность таких изображений не может быть описана с помощью единственного нормального распределения. По этой причине, для того чтобы фоновая модель учитывала несколько составляющих фона используются смеси нормальных распределений, которые представляют собой сумму взвешенных нормальных распределений:

; (3)

. (2)

где - весовой коэффициент равный вероятности появления процесса с индексом в этой точке сцены, по этой причине можно добавить выражение:

. (4)

В общем виде модель смесей нормальных распределений можно записать в виде:

. (5)

Смесь нормальных распределений аппроксимирует экспериментально получаемые распределения, что схематично изображено на рисунке 1. Таким образом, каждому пикселю схемы соответствует набор нормальных распределений, каждое из которых характеризует один из процессов. Например, участок неба, который периодически закрывается качающимся на ветру листом дерева, может быть описан суперпозицией двух распределений, каждое из которых моделирует яркость пикселя в соответствующую фазу колебательного процесса (наличия или отсутствия листа).

Количество распределений, которое требуется для создания полноценной модели фона, определяется на этапе настройки детектора, сегодня это решение принимает человек. Формально, необходимо анализировать природу и свойства процессов участка внешнего мира, которые соотносятся с каждым пикселем видеоизображения и, исходя из этого, выбирать размерность смеси для каждого пикселя . На практике в том виде, как это делается сегодня, решить эту задачу невозможно, поэтому количество процессов , учитывающихся в модели фона, принимается одинаковым для точек всего кадра. Как правило, число учитываемых процессов не превышает пяти , это связано тем, что с ростом размерности смеси, возрастает вычислительная сложность метода.

рис. 1. - Гистограмма распределения яркости в точке и аппроксимируемая ей смесь нормальных распределений

Отдельно следует заметить, что актуальной является задача автоматической оценки требуемого количества распределений для каждой точки видеоизображения. Это позволит, в ряде случаев, сократить время обработки кадров, наряду с улучшением качества сегментации изображения. Кроме этого, дальнейшим возможным направлением развития этого подхода является введение механизмов динамической подстройки размерности нормального распределения к изменяющимся условиям внешнего мира.

Таким образом, задача построения фоновой модели сводится к поиску характеристик для каждого распределения, входящего в модель. Как правило, для их вычисления используется EM-алгоритм (Expectation-Maximization), который позволяет подобрать характеристики распределений имеющие максимальные веса распределений.

Вычисление смеси нормальных распределений должно выполняться для каждой точки последовательности изображений. Кроме этого, смеси должны постоянно адаптироваться под изменения реального мира, такие как смещение источника света (перемещение солнца относительно объекта наблюдения в течение дня), появление, изменение интенсивности и прекращение осадков. Для того чтобы учесть эти требования необходимо производить пересчет моделей для каждого нового кадра. Если использовать EM-алгоритмы, постоянная адаптация модели фона к внешним условиям многократно повышает вычислительную сложность метода, что делает невозможным применения такой модели в системах реального времени. По этой причине вычисление характеристик нормальных распределений производится на основе алгоритма К – средних, который приведен на рисунке 2.

рис. 2. - Алгоритм поиска характеристик смеси нормальных распределений

  1.  
    1. Инициализация модели фона

При появлении первого кадра видеопоследовательности производится инициализация модели, при этом каждый пиксель первого кадра сегментируется в задний план. Каждой точке изображения ставится в соответствие процесс, имеющий параметры:

,

где

- текущее значение в пикселе с координатами ;

- дисперсия по умолчанию (выбирается вручную).

  1.  
    1. Поиск соответствующих процессов точкам изображения

Все точки последовательности кадров анализируются на предмет соответствия одному из присутствующих в модели процессов. Поиск процесса, производится на основе выражения:

, (6)

где

 задаваемый вручную порог, который, как правило, равен 3.

Если текущее значение соотносится с одним из существующих процессов через выражение 6, то соответствующий процесс считается текущим и производится обновление его статистики. Если для не подходит ни один из существующих процессов, то производится создание нового процесса или замена характеристик распределения с минимальным весом .

  1.  
    1. Создание нового процесса

Создание нового процесса производится в том случае, если количество процессов – распределений не достигло своего максимального количества . Оценки математического ожидания, дисперсии и весового коэффициента нового распределения принимают следующие величины:

.

Следующим шагом является обновление весовых коэффициентов для каждого присутствующего в модели процесса. Обновление выполняется в соответствии с рекуррентным выражением:

, (7)

где

 параметр, отвечающий за скорость изменения веса;

 количество присутствующих в модели процессов, на момент выполнения операции обновления коэффициентов.

  1.  
    1. Коррекция «слабого» процесса

В случае если в модели присутствует максимальное число распределений , то производится поиск процесса с наименьшим весом . Для выбранного процесса весовой коэффициент остается неизменным, а величины математического ожидания и дисперсии приравниваются к параметрам нового процесса:

.

После этого проводится классификация с целью его отнесения к фону или переднему плану.

  1.  
    1. Классификация

На этапе классификации принимается решение о том, к чему отнести точку кадра , к модели фона или к перемещающимся объектам. Эта процедура производится при выполнении одного из двух условий:

  • для был найден соответствующий процесс, в этом случае точка изображения текущего кадра должна быть отнесена к фону ;

  • не найдено соответствия ни одному процессу фоновой модели, при наличии максимально возможного числа найденных процессов .

Для второго условия классификация проводится на основе выражения:

(8)

где

 пороговый коэффициент определяемый при настройке алгоритма.

Если считается, что модель не закончила обучение и классификация не производится. Также может быть введен минимально допустимый порог статистической обеспеченности, при которой допускается классификация:

 минимальное количество кадров, требуемое для обучения фоновой модели.

  1.  
    1. Обновление статистики текущего процесса

Для распределений, которым соответствуют текущие точки кадра , производится коррекция оценок математического ожидания и дисперсии, которые обновляются с помощью низкочастотного фильтра рекурсивного сглаживания:

(9)

, (10)

где

 параметры фильтра, позволяющие регулировать скорость изменения математического ожидания;

 параметры фильтра, позволяющие регулировать скорость изменения дисперсии;

 математическое ожидание процесса на текущем шаге;

 дисперсия процесса на текущем шаге;

 математическое ожидание процесса на предыдущем шаге;

 дисперсия процесса на предыдущем шаге.

Обновление весовых коэффициентов производится по аналогии с методом их обновления при создании нового процесса, на основе выражения 7.

  1. Заключение

В ходе работы по сегментированию переднего плана видео был реализован метод основанный на смеси гауссиан К-средних. Маска переднего плана корректно отображается, выполнены требования предъявляемые к алгоритму: адаптация к изменениям среды, устойчивость по отношению к периодическим и квазипериодическим явлениям, производительность алгоритма позволяет обрабатывать видео в режиме реального времени. Получены навыки работы с видео в среде MATLAB и С++. Также реализация использует технологию параллельных вычислений при помощью библиотеки tbb.

5. Список литературы

1) Л. Шапиро, Дж. Стокман Компьютерное зрение. - М.: БИНОМ, 2006. - 752 с.;

2) Я.А. Фурман Введение в контурный анализ. - М.: ФИЗМАТЛИТ, 2003. - 561 с.;

3) Р. Гонсалес, Р. Вудс Цифровая обработка изображений. - М.: Техносфера, 2005. - 1072 с.;

4) Н.Н. Митропольский Агломеративная сегментация и поиск однородных объектов на растровых изображениях. - М.: МГТУ, 2010. - 137 с.;

5) А.А. Лукьяница, А.Г. Шишикин Цифровая обработка видеоизображений. - М.: "Ай-Эс-Эс Пресс", 2009. - 518 с.;

6) Н.Г. Загоруйко Прикладные методы анализа данных и знаний. - Новосибирск: ИМ СО РАН, 1999. - 270 с.

Просмотров работы: 1609