Введение.
Распознавание изображений является одной из важнейших задач систем управления и обработки информации, автоматизированных систем, информационно-измерительных систем и систем принятия решений. Системы идентификации используются в робототехнике, информационном поиске, мониторинге и анализе визуальных данных, исследовании искусственного интеллекта. Алгоритмическая обработка и классификация изображений применяются в системах безопасности, контроля и управления доступом, системах видеонаблюдения, системах виртуальной реальности и информационных поисковых системах. В настоящее время в производстве широко используются системы, позволяющие распознавать рукописный текст, автомобильные номера, отпечатки пальцев или человеческие лица. Они используются в интерфейсах программных продуктов, связанных с безопасностью и идентификацией личности, а также используются и в других прикладных целях.
Разработки в этой области имеют многолетнюю историю, однако, несмотря на достигнутые успехи, современные исследования подтверждают тот факт, что алгоритмы распознавания изображений до настоящего времени не имеют полноценных способностей биологических зрительных систем, таких как способность функционировать на не ограниченном сверху множестве классов распознавания, устойчивости к инвариантных преобразований и вариативности объектов в пределах категорий.
Таким образом, актуальностью стати является проблема распознавания изображения под влиянием трансформаций, способных значительно изменить форму изображения, не влияя при этом на принадлежность объекта к категории распознавания. Актуальность данной проблемы особенно высока в областях, где распознавание образов применяется в природной среде (видеонаблюдение, анализ данных камер мониторинга, робототехнические зрительные системы), где зрительный сенсор может иметь произвольный ограниченный угол обзора по отношению к искомому объекту.
Цель исследования — является анализ основных методов распознавания изображений, разработка программного продукта для информационно-измерительных систем и систем автоматического управления и исследования алгоритма компьютерного видения, что будет способствовать повышению уровня безопасности и уменьшению стоимости подобных систем.
Материал и методы исследования
В ходе исследования, были проанализированы научные работы отечественных и зарубежных ученых, был проведен анализ существующего программного обеспечения для распознавания лиц и разработан программный продукт.
Результаты исследования и их обсуждение
Задачи распознавания человека по изображению его лица можно условно разделить на три больших класса: задача поиска в базах данных, задача контроля доступа и задача, касающаяся контроля фотографий в документах. Задачи различаются как по требованиям систем распознавания, так и по способам их решения, и поэтому представляют собой отдельные классы.
Требования, предъявляемые к ошибкам первого и второго рода для таких классов [1, 2], также различны. Ошибкой первого рода (type I error, misdetection) называется ситуация, когда результат распознавания объекта заданного класса является отрицательным (не распознается системой). Ошибка второго рода (type II error, false alarm) происходит, когда объект заданного класса принимается объектом другого класса.
Также следует отметить различие понятий верификации и распознавания (идентификации) [3]. В задаче верификации известно, что некоторый объект представляет собой известную систему, то есть относится к известному ей классу. Система должна подтвердить или опровергнуть это утверждение. В системах верификации ошибка первого рода означает, что объект, относящийся к известным системам классов, принимается за объект, относящийся к неизвестным системе классов, и в доступе ему отказывают. Ошибка второго рода противоположна ошибке первого рода. Когда объект неизвестного класса принимается за объект, относящийся к известным системам классов, и ему разрешается доступ [4, 1]. При распознавании нужно отнести объект к одному из n известных классов или сделать вывод о том, что этот объект не относится к известным классам.
В настоящее время решение задачи идентификации человека рассматривается с двух позиций в соответствии с назначением автоматизированных систем идентификации: режима реального времени (on-line) и поиска изображений объекта в больших базах данных (off-line). Таким образом, существующие разработки в соответствии с целями можно разделить на два класса:
1. Системы идентификации человека по фотографии в большой (10000-3000000) на базе изображений лиц.
2. Системы идентификации человека в режиме реального времени (системы наблюдения служб безопасности, обеспечение доступа небольшой группе 10 – 100 человек и закрытие его для посторонних).
Как правило, системы, реализующие решение задач первого класса, возвращают набор изображений, наиболее похожих на искомое, и выбор окончательного решения предоставляется эксперту. Следует отметить, что по статистике реальной базе данных, содержащей 100 000 портретов, 417 человек будут иметь двойников. Поскольку базы содержат сотни тысяч изображений, существующие системы работать в режиме реального времени не в состоянии. Цель – решение задачи за разумное время.
Наибольшее количество публикаций, относящихся к теме анализа изображений людей по их фотографиям, посвящены нахождению оптимальных методов решения задачи первого класса. Существует около десятка принципиально разных подходов к решению данной проблемы. оценке – стоимость построенных на их основе алгоритмов и достоверность распознавания.
Рис. 1 – Основные подходы, применяемые при построении off-line систем идентификации личности
Каждое изображение лица можно рассматривать как вектор. Если ширина и высота изображения w и h соответственно, количество компонент этого вектора w × h.
Каждый пиксель кодируется одним векторным компонентом. Строки изображения размещаются рядом друг с другом, как показано на рисунке 2.
Рис. 2 – Формирование вектора лица
Этот вектор относится к пространству, являющемуся пространством изображения, размер которого равен w×h пикселям. Изображение базисного пространства составляют следующие векторы (рис. 3)
Рис. 3 – Изображение базисного пространства
Все лица похожи друг на друга. Все они имеют два глаза, рот, нос и т.д., которые находятся на том же месте. Таким образом, все собственные векторы находятся в очень узком кластере в пространстве изображений, как показано на рисунке 4.
Рис. 4 – Кластер в пространстве изображений
Следовательно, полное изображение пространства не оптимально для описания лица. Задача направлена на создание меньшего пространства, лучше описывающего лицо. Базовые векторы этого пространства называются принципиальными компонентами.
Размер пространства изображения w×h. Обычно все пикселы лица не актуальны, и каждый пиксель зависит от его соседей. Таким образом, размерность пространства лица меньше размерности пространства изображения. Размер личного пространства не может быть определен, но оно, несомненно, будет гораздо меньше, чем пространство изображения.
Модель системы идентификации личности по изображению ее лица представлена на рисунке 5.
Рис. 5 – Модель системы идентификации личности по изображению ее лица
На рисунке 5 отмечено:
БЗ – биометрический считыватель;
БПО – блок предварительной обработки;
ПО – программное обеспечение;
БД – база данных.
В качестве биометрического считывателя системы идентификации личности можно использовать любое мультимедийное устройство, результатом работы которого является изображение.
Полученная из биометрического считывателя информация передается на блок предварительной обработки, где выполняется выделение лица, его масштабирование и центрирование. Это позволяет повысить точность распознавания и снизить вероятность ошибочных срабатываний.
Данные блока предварительной обработки поступают в программное обеспечение одновременно с фотографиями из базы данных и сравнивает их. После сравнения изображений с БД и входного изображения система принимает решение – предоставлять доступ или нет. Работа программы показана на рисунке 6.
Рис. 6 – Результат работы программы
Выводы
На основе проведенного обзора аналогичных решений и их анализа для разработки системы автоматического распознавания был выбран метод Eigenface, поскольку алгоритм распознавания изображений, представленных комбинацией собственных лиц, является относительно быстрым, простым и практичным и имеет относительно высокую точность распознавания.
Был подробно рассмотрен метод Eigenfaces, основанный на методе главных компонентов. Основная идея метода заключается в нахождении "среднего лица", то есть обобщенного и усредненного варианта всех фотографий пользователей в базе данных. Посредством полученного «среднего лица» для каждой фотографии пользователя находится «собственное лицо», то есть разница между фотографией и «средним лицом». Первоначальное «собственное лицо» представляет те черты лица, которые реже всего встречаются на других изображениях в базе данных. При получении изображения на входе системы вычисляется его «собственное лицо» и сравнивается с каждым лицом в базе данных с помощью евклидового расстояния. Использование подхода, основанного на методе главных компонент, позволило повысить эффективность за счет кэширования изображений в обучающей базе, а точность за счет предварительной обработки и повышения качества изображений для одного человека.
Разработано программное обеспечение с применением современных программных технологий, а именно языки программирования Java в среде IntelliJ IDEA и среды MATLAB, позволяющие использовать их преимущества в вычислительной мощности и строить сложные системы контроля. Для обеих программ был разработан удобный пользовательский интерфейс, что бесспорно является преимуществом, поскольку их применение не требует дополнительных знаний и умений.
Список литературы
Браунли К.А. Статистическая теория и методология в науке и технике.
Горелик А.Л., Скрипкин В.А. Методы распознавания.– М: Высшая школа, 1984. – 208 с.
Накамура О., Mathur S. and Minami T. Identification of human faces основанные на идентичности maps // Pattern Recognition, 1991. - Vol. 24. – P. 263-272.
Пентланд А.С., Чаудхар Т. Распознавание лиц для интеллектуальных сред // Открытые системы. – 2000. – №3. (http://www.osp.ru/os/2000/03/).
Самаль Д.И. Построение систем идентификации личности на базе антропометрических точек лица // Цифровая обработка изображений. – Минск: Ин-т техн. кибернетики НАН Беларуси, 1998. – С.72-79.
Синельников, Д. А. Анализ и разработка программного средства сравнения изображений на языке Python с использованием библиотеки компьютерного зрения opencv / Д. А. Синельников, А. А. Мозговенко // Современные проблемы геометрического моделирования и информационные технологии : Материалы I Межрегиональной научно-практической конференции преподавателей и студентов, Мелитополь, 23 мая 2023 года. – Мелитополь: Государственное образовательное учреждение высшего образования "Мелитопольский государственный университет", 2023. – С. 130-137. – EDN YNORZU.