ПРИМЕНЕНИЕ КОМПЬЮТЕРНОГО ЗРЕНИЯ ПРИ ОРИЕНТИРОВАНИИ В ПРОСТРАНСТВЕ - Студенческий научный форум

X Международная студенческая научная конференция Студенческий научный форум - 2018

ПРИМЕНЕНИЕ КОМПЬЮТЕРНОГО ЗРЕНИЯ ПРИ ОРИЕНТИРОВАНИИ В ПРОСТРАНСТВЕ

Сергеев Е.И. 1
1Северо-Восточный федеральный университет им. М.К. Аммосова, Политехнический институт (филиал) в г. Мирном
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение. В наше поколение производство играет важную роль в жизни человечества, и научное развитие тесно затрагивает эту сферу жизнедеятельности. Поиск рациональных и менее затратных методов производства являлся и является по сегодняшний день важнейшим вопросом и в настоящее время человечество перешло на автоматизацию сложных или монотонных процессов. В наше время, было придумано множество различных роботов и в скором бедующем они станут незаменимым элементом в труде. Робот – автоматизированное устройство, машина, имеющая сложную систему алгоритмов, и для каждого робота необходима рабочая среда, но не все они способны сразу начать работать, в отличие от статичных промышленных роботов, такие как манипуляторы, есть передвижные. Таким тоже необходима рабочая среда, но им необходимо ее найти. В таком вопросе помогают дополнительные системы навигации и зрения. Моей задачей является интегрирование компьютерного зрения в ориентирование в пространстве робота снегоуборщика. Об одной из систем и пойдет речь в данной статье.

Основная часть. Компьютерное зрение – совокупность методов получение информации из изображений. Применение, которому могут быть как системы управления процессами, системы видеонаблюдения, а также объектное моделирование. Система компьютерного зрения должна состоять из бортового вычислительного устройства, видеокамеры, источника питания и непосредственно сам робот. Процесс ориентирования в пространстве начинается с передачи стереокамеры видео или изображений на бортовое вычислительное устройство, далее эти данные обрабатываются и робот принимает те или иные решения по строго заданному алгоритму. Принцип стерео зрения основан на поиске блоков пикселей с левого изображения на эпиполярной линии на правом изображении, и вычисления расстояния на основе разности координат блоков на двух изображениях .Таким образом, можно создавать 3D реконструкции окружающего пространства. При движении по незнакомой местности, стереокамера помогает определять положение препятствий и расстояние до них. Так же присутствует видео идентификация, позволяющая искать в базе данных сохраненное местоположение статичных объектов, позволяющая значительно упростить ориентирование в пространстве, также и динамичные объекты, такие как машины, люди, животные. Естественно для машинного обучения необходимо “обучить” или восполнить базу данных и правильно определять тот или иной объект, что является одной из ключевых проблем в данной реализации.

Процесс ориентирования начинается с получения видеопотока или набора изображений с стереокамеры, Одна из важных задач стереозрения – процесс преобразования двух плоских изображений в трехмерную сцену с восстановлением информации о глубине каждой точки плоского изображения (расстоянии от стереокамеры до соответствующей точки реальной сцены). Но необходимо выполнить предобработку для значительного уменьшения вероятности ошибок глубины пикселя, такую как выделение контуров на изображении. Зная информацию о глубине можно генерировать 3D модели ландшафта. В частности, знание об удаленности точек изображения от реального прообраза позволяет делать захват опорных точек движущегося объекта для получения трехмерных координат.

В результате мы получаем 3D модель пространства. Имея возможность сохранять эту модель в базу данных мы можем в последующем использовать для определения местонахождение используя всего лишь базу данных, сам процесс поиска пространства происходит так: собирая 3D модель мы сравниваем его с остальными 3D моделями, именно количество схожих точек границ помогает нам определить пространство. Такой метод поможет нам уменьшить необходимую память и повысить скорость работы робота.

Для написания программы для робота использовались открытые библиотеки как : OpenCV (Open Source Computer Vision Library) – библиотека алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов общего 4 назначения с открытым кодом,OpenGL- OpenGL (Open Graphics Library) – открытая графическая библиотека, предоставляющая программный интерфейс для написания приложений, использующих двумерную и трехмерную графику. Обеспечивает аппаратное ускорение при визуализации 2D и 3D графики.

Рис. 1. Фрагмент кода получения и обработки фото или видео

В результате мы получили один из методов ориентирования робота в пространстве, необходимого для подвижного робота, аспекта. Такой подход позволяет использовать стереокамеру, которая, по моему мнению, не является слишком затратной в плане финансов и предоставляет автономность и не сложную систему алгоритмов.

Существует множество подобных методов, еще из простых примеров можно привести такой как использование одной простой камеры, но появляется необходимость смещения камеры для определения расстояния до объекта, сперва необходимо как минимум два изображения с известным шагом (схождения) камеры, затем ректифицировать их в дальнейшем получить карту смещений для получения карты глубины. Отсюда мы можем уже воссоздать трехмерное пространство.

Рис. 2. Определение координат трехмерных точек

Расстояние до объекта и координаты здесь рассчитываются из подобных треугольников, и выглядит следующим образом:

.

Здесь w и h — ширина и высота картинки, они нам известны, f — фокусное расстояние камеры (расстояние от центра камеры до поверхности ее экрана), и B — шаг.

Рис. 3. Фрагмент кода воссоздания 3D модели пространства из 2-ух изображений

В будущем планируется интегрировать в эту систему идентификацию и классификацию объектов с целью предотвращения столкновений и создания помех движению. Система аналогично сравнивает с базой данных сам объект и по алгоритму придает действиям определенные условия работы.

Для начала используется детектирование движения, выявления изменений положения объекта, далее классификация, такие как лица людей или номера автомобиля. Само распознавание происходит из наборов признаков объекта.

Все это послужит одним из элементов ориентирования в пространстве для робота снегоуборщика. Система из всех элементов даст полную автономность и функциональность даже при помехах или полной неисправности одной из систем ориентирования, что позволит увеличить время эксплуатации и точность определения местоположения всех объектов в пространстве.

Вывод. Такая система в скором будущем, возможно, станет актуальной и мультифункциональной где она будет интегрирована не только в простых роботов, но и роботов с искусственным интеллектом, что позволит ускорить вычислительную мощность и придать такой системе неотъемлемость роботов в получении информации. По сегодняшний день изучение робототехники идет полным ходом и идей для проектов и их реализации намного больше, чем кажется, поэтому этот вопрос является актуальным и останется таким очень долгое время.

Список литературы

1. Гриценко А.В., Дорошенко Н.С. Исследование и классификация методов распознавания изображения в системах компьютерного зрения // Наука. Инновации. Технологии. 2011. № 4. С. 84-89.

2. Семенов Д. Технологии компьютерного зрения // Инновации. 2009. № S2. С. 136.

3. Копычев М.М., Путов В.В., Путов А.В., Игнатьев К.В. Система управления роботом с компьютерным зрением // Международная конференция по мягким вычислениям и измерениям. 2015. Т. 1. С. 269-272.

4. Мороз Ю.С., Тутов И.А. Робототехническая система в интеграции с компьютерным зрением / В сборнике: Молодежь и современные информационные технологии Сборник трудов XI Международной научно-практической конференции студентов, аспирантов и молодых ученых. 2013. С. 255-257.

5. Hirschmuller, H. Semi-Global Matching-Motivation, Developments and Applications. Available online: http://hgpu.org/?p=6161 (accessed on 8 May 2015).

6. Селетков И.П., Машкин С.В. Построение 3d-модели среды по видео изображению c некалиброванной камеры в режиме реального времени // Вестник Пермского университета. Серия: Информационные системы и технологии. 2011. № 12. С. 80-85.

Просмотров работы: 207