Использование современных информационных систем оптического распознавания образов (OCR) в сфере образования - Студенческий научный форум

XII Международная студенческая научная конференция Студенческий научный форум - 2020

Использование современных информационных систем оптического распознавания образов (OCR) в сфере образования

Нестеров А.С. 1
1БГУ имени И.Г. Петровского
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

С задачей распознавания образов человек сталкивается постоянно с момента своего появления. В частности, информация, поступающая из органов чувств, обрабатывается мозгом, который в свою очередь распределяет информацию, обеспечивает принятие решения, а далее с помощью электрохимических импульсов передает необходимый сигнал далее, например, органам движения, которые реализуют необходимые действия. Затем происходит изменение окружающей обстановки, и вышеуказанные явления происходят заново. И если разобраться, то каждый этап сопровождается распознаванием образов.

В современном мире из-за обилия информации и огромного количества информационных процессов люди должны рационально расходовать свое время и ресурсы. На помощь приходят системы оптического распознавания образов - OCR.

Для сферы образования ключевым моментом в работе технических наук является изучение современных информационных систем оптического распознавания образов (OCR) и их практическое применение в сфере образования, где системы оптического распознавания образов служат главными помощниками в обработке различных документов.

Особенности информационных систем оптического распознавания образов

Долгое время проблема распознавания образов привлекала внимание только ученых области прикладной математики. В результате, работы Р. Фишера, созданные в 20-х годах, привели к формированию дискриминантного анализа — одного из разделов теории и практики распознавания образов [1].

В 50-60-е годы ХХ века появилась теория статистических решений. В рамках кибернетики начало складываться новое направление, связанное с разработкой теоретических основ и практической реализацией механизмов, а также систем, предназначенных для распознавания объектов и процессов. Новая дисциплина получила название «Распознавание образов». В рамках этой дисциплины изучались ключевые понятия: «образ» и «распознавание образов» [2].

Образ — это классификационная группировка, которая позволяет объединить группу объектов по некоторым признакам. Образы обладают характерной чертой, проявляющейся в том, что ознакомление с конечным числом явлений из одного множества дает возможность узнать большое количество его представителей. В классической постановке задачи распознавания множество разбивается на части.

Распознавание образов (объектов) — это задача идентификации объекта по его изображению (оптическое распознавание), аудиозаписи (акустическое распознавание) или другим характеристикам [3].

На сегодняшний день существует огромное множество программ для оптического распознавания образов, выполняющих различные задачи:

распознавание букв;

распознавание штрих-кодов;

распознавание автомобильных номеров;

распознавание лиц и других биометрических данных;

распознавание изображений;

распознавание речи.

Но в сфере образования активно используются системы оптического распознавания символов.

Особенности информационных систем оптического распознавания символов

Оптическое распознавание символов (Optical Character Recognition, OCR) — это механическое или электронное преобразование изображения рукописного или отпечатанного текста (обычно полученного путём сканирования) в текст, поддающийся обработке текстовыми процессорами.

Оптическое распознавание текста — более общее понятие, которое включает в себя не только распознавание собственно символов, но и анализ разбивки страниц и выделение нетекстовых элементов (рисунки, таблицы). Часто под OCR подразумевают распознавание текста и называют системы распознавания текста OCR-системами. Также говорят, что основной принцип автоматического распознавания образов — это обучение программ определению всевозможных эталонных образцов, с которыми будет сравниваться распознаваемый объект. В OCR-системах это буквы, цифры, знаки препинания. Обучение осуществляется за счет того, что машине показываются образцы символов различных классов. На основании этих образцов машина формирует прототип описания каждого класса объектов. Затем в процессе распознавания неизвестные символы сравниваются с заранее полученными образцами и определяется класс, с которым обнаружено больше всего совпадений [2].

Изучив и проанализировав рынок систем оптического распознавания символов, мы можем предложить следующие рекомендации использования систем оптического распознавания символов (OCR) в сфере образования:

Для обучения в средне-специальных и высших учебных заведениях подходит программа Abbyy Fine Reader. Она обладает мощным инструментарием, высоким качеством распознавания. По ней в достаточно высоком уровне можно изучить технологию оптического распознавания образов.

Для студентов, школьников для распознавания образов можно посоветовать систему Online OCR. Она достаточно удобна в использовании и на высоком уровне справляется с распознаванием текста, подходит также для преподавателей. Главным плюсом этой информационной системы является ее доступность.

Для учреждений дополнительного музыкального образования можно использовать информационную систему Smart Score, которая помогает распознавать ноты и оцифровывать их. Она отлично подходит для авторов-исполнителей, которые могут проверить как будет звучать их написанное произведение.

Список литературы:

Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин. – М.: Наука, 2004. – 384 с.

Исакова А.И. Основы информационных технологий: учебное пособие / А.И. Исакова; Министерство образования и науки Российской Федерации. - Томск: ТУСУР, 2016. – С.8-13.

Потапов А.С. Распознавание образов и машинное восприятие. – С-Пб.: Политехника, 2007.

Официальный сайт Abbyy Fine Reader [Электронный ресурс]. – режим доступа: https://www.abbyy.com/ru-ru/finereader/. – (Дата обращения: 15.12.2019).

Официальный сайт Online OCR [Электронный ресурс]. – режим доступа: https://www.onlineocr.net/ru/. – (Дата обращения: 11.12.2019).

Официальный Soda PDF OCR [Электронный ресурс]. – режим доступа https://www.sodapdf.com/ocr-pdf/ . – (Дата обращения: 03.12.2019).

Мультимедиа [Электронный ресурс]. – режим доступа: http://soft-lenta.ru/index.php?newsid=1146389194. – (Дата обращения:10.12.2019).

Просмотров работы: 9