Обзор популярных программ, основанных на технологии оптического распознавания образов (OCR) - Студенческий научный форум

XIV Международная студенческая научная конференция Студенческий научный форум - 2022

Обзор популярных программ, основанных на технологии оптического распознавания образов (OCR)

Нестеров А.С. 1, Васина О.Ю. 1
1БГУ имени И.Г. Петровского
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

На сегодняшний день отечественный и зарубежный рынок предлагает изобилие программ, которые, по мнению производителей, являются профессиональными помощниками в сфере образования. И в качестве этих «помощников» выступает технология оптического распознавания образов (OCR).

Как мы знаем, работникам сферы образования приходится постоянно работать с различными бумажными изданиями. Поэтому мы провели анализ отечественного рынка и составили обзор актуальных программ систем оптического распознавания образов. Мы выяснили, что наиболее популярными программами являются: Microsoft One Note 2010, SODA PDF OCR, Abbyy Fine Reader, Online OCR, SmartScore. Рассмотрим функционал каждой программы более подробно.

SODAPDFOCR

Официальный сайт: https://www.sodapdf.com/ocr-pdf;

Лицензия: Бесплатное ПО/Коммерческое ПО;

Операционные системы: Windows, Linux, FreeBSD, Mac OS X, Android;

Категория: Распознавание текста.

Бесплатный online-сервис с использованием технологии OCR.Сервис может распознавать текст на многих языках, включая русский. Позволяет также конвертировать форматы текстовых документов только за покупку подписки. Может распознавать файлы размером не больше 2 Мб. Сервис позволяет распознавать текст на многих языках, включая русский. Распознавание происходит на хорошем уровне в том случае, если текст получен из изображений, на которых текст был напечатан на компьютере. Но со сканированными книгами дела обстоят намного хуже. [3]

Рисунок 1. Интерфейс системы SODA PDF OCR

OnlineOCR

Официальный сайт: https://www.onlineocr.net/ru;

Лицензия: Бесплатное ПО;

Операционные системы: Windows, Linux, FreeBSD, Mac OS X, Android;

Категория: Распознавание текста.

Online OCR сервис позволяет вам конвертировать любое изображение (отсканированный документ, фотографию или просто картинку) в редактируемый текстовый выходной файл. Если в документе присутствуют слова или предложения на разных языках, например, английском и русском, то для достижения наиболее точного результата рекомендуется при распознавании задать соответствующие языки. Сервис предоставляет возможность выбора языков распознавания. Всего представлено 28 языков: английский, белорусский, болгарский, венгерский, голландский, греческий, датский, испанский, итальянский, латвийский, латинский, литовский, молдаванский, немецкий, польский, португальский, румынский, русский, сербский, словацкий, словенский, турецкий, украинский, финский, французский, чешский, шведский, эстонский.

При распознавании текста можно задать любое количество языков одновременно.

Результат распознавания мы можем получить в нескольких выходных форматах одновременно. Всего представлено шесть форматов:

- AdobePDF;

- MSWord 2003/XP;

- MSExcel 2003/XP;

- Html 4.0;

- RTF Word 2000;

- TextPlain.

Входными файлами могут быть любые графические изображения следующих форматов:

- TIFF (в том числе многостраничный файл);

- JPEG/JPG;

- BMP;

- PCX;

- PNG;

- GIF;

- PDF (в том числе многостраничный файл).

Желательное разрешение картинки не меньше 200 DPI.

Единственное ограничение - размер файла не должен превышать 15Мб. [2]

Рисунок 2. Интерфейс системы Online OCR

AbbyyFineReader

Официальный сайт: https://www.abbyy.com/ru-ru;

Лицензия: Коммерческое ПО;

Операционныесистемы: Microsoft Windows 10 / 8 / 7 / Vista / XP Microsoft Windows Server 2012 / 2012 R2 / 2008 / 2008 R2 / 2003;

Категория: Распознавание текста.

Abbyy Fine Reader - омнифонтовая система оптического распознавания текстов без предварительного обучения. Она поддерживает возможность распознавания текста, набранного практически любыми шрифтами и дальнейшего воссоздания текста как последовательности символов. К преимуществам данной программы можно отнести малую чувствительность к дефектам печати и высокую точность распознавания [1].

Входными файлами могут быть документы следующих форматов:

BMP;

PCX, DCX;

JPEG, JPEG 2000;

JBIG2;

PNG;

TIFF;

PDF;

XPS (Требуется Microsoft .NET Framework 3.0 или 3.5);

DjVu;

GIF;

WDP.

Результат распознавания мы можем получить в нескольких выходных форматах одновременно. Представленные форматы:

DOC;

DOCX;

XLS;

XLSX;

PPTX;

RTF;

PDF, PDF/A;

HTML;

CSV;

TXT;

ODT;

EPUB;

FB2;

DjVu;

BMP;

TIFF;

PCX, DCX;

JPEG, JPEG 2000;

JBIG2;

PNG. [4]

В Abbyy Fine Reader используется технология ADRT. Технология ADRT (Adaptive Document Recognition Technology) осуществляет синтез и анализ документа на логическом уровне. Анализируется изображение всего документа, а распознанные слова объединяются в группы в зависимости от начертания, окружения и местоположения на странице. Программа определяет разметку документа и позволяет сохранить исходный формат. Благодаря ADRT Fine Reader способен обнаруживать, распознавать и воспроизводить основной текст, колонтитулы, номера страниц, заголовки, оглавление, таблицы, сноски шрифты и стили и др. [1].

Рисунок 3. Интерфейс системы Abbyy Fine Reader 12

В системе представлена широкая интеграция с другими программными обеспечениями:

Microsoft Word 2003 (11.0), 2007 (12.0), 2010 (14.0), 2013 (15.0) и 2016 (16.0);

Microsoft Excel 2003 (11.0), 2007 (12.0), 2010 (14.0), 2013 (15.0) и 2016 (16.0);

Microsoft PowerPoint 2003 (11.0) (с использованием Microsoft Office Compatibility Pack дляформатов Word, Excel и PowerPoint 2007), 2007 (12.0), 2010 (14.0), 2013 (15.0) и 2016 (16.0);

Microsoft SharePoint Online (Microsoft Office 365);

Apache OpenOffice 3.4, 4.0;

Corel WordPerfect X5, X6;

Adobe Acrobat/Reader (8.0 и позднее).

Abbyy Fine Reader распознает документы на 190 языках на основе кириллицы, латиницы, греческого, армянского и арабского алфавитов, а также языки на основе иероглифического письма. Для 48 языков предусмотрена словарная поддержка и проверка орфографии. [1]

MicrosoftOneNote 2010

Официальный сайт: https://www.microsoft.com/ru-ru;

Лицензия: Коммерческое ПО;

Операционные системы: Microsoft Windows 10 / 8 / 7 / Vista / XP, Mac;

Категория: программа для создания заметок и организации личной информации.

Microsoft One Note — это цифровая записная книжка, предназначенная для сбора заметок и другой информации, и предоставляющая широкие возможности поиска данных и создания простых в использовании общих записных книжек. Это помогает справиться с информационной перегрузкой и эффективно организовать совместную работу с другими людьми.

В отличие от бумажных записных книжек, текстовых редакторов, систем электронной почты и других офисных программ, One Note обеспечивает гибкие возможности сбора и упорядочения текста, изображений, цифрового рукописного текста, звуковых файлов, видеозаписей и многого другого — и все это реализовано в одной цифровой записной книжке на компьютере. One Note позволяет повысить производительность труда благодаря наличию под рукой всех необходимых данных и экономии времени, которое тратится на поиск информации в сообщениях электронной почты, бумажных записных книжках, папках для хранения документов и печатных материалах.

Приложение One Note интегрировано в пакет Microsoft Office, что повышает эффективность сбора, упорядочения, поиска и совместного использования заметок и другой информации. Широкие возможности поиска позволяют извлекать информацию из текста в рисунках или из речи в звуковых и видеозаписях. Простые в использовании средства совместной работы помогают группам сотрудников совместно работать со всеми видами данных в общих записных книжках как при подключении к сети, так и в автономном режиме. [4]

В One Note поддерживается распознавание текста (OCR). Это функция, позволяющая распознавать текст на изображениях. Приложение One Note способно извлечь текст, распознанный на изображении, так что вы можете вставить его в другое место в заметках (или в другое приложение), а затем изменить и отформатировать его в соответствии со своими пожеланиями. Это удобный способ сохранения полезной и важной информации, которую вам иначе пришлось бы набирать вручную (например, это может быть текст визитной карточки или товарного чека).

Распознавание текста можно использовать для таких изображений, как фотографии, снятые мобильным телефоном или камерой другого типа, снимки экрана, сделанные на компьютере Mac, и изображения, полученные с помощью планшетного или переносного сканера. [5]

Рисунок 4. Интерфейс системы Microsoft One Note

SmartScore

Официальный сайт: https://www.musitek.com/index.html;

Лицензия: Коммерческое ПО;

Операционные системы: Windows, MacOS;

Категория: распознавание музыкального текста.

Профессиональная система-оцифровщик нот, распознает партитуры без каких-либо ограничений по количеству партий. Исходное изображение может быть загружено из файла или введено со сканера. Для доводки и подчистки изображения имеется несложный графический редактор с набором основных функций — монтажа, поворота, рисования линий, стирания участков. Есть эффективная функция устранения перекоса (deskew): при помощи мыши изображается линия, параллельная горизонтали на изображении, после чего нужный поворот выполняется автоматически.

Выполняет обработку оркестровых аранжировок, опер, гимнов, мюзиклов, инструментальных и сольных партий, а также полных дирижёрских партитур. SmartScore является незаменимым инструментом для наборщика, аранжировщика, исполнителя или педагога по музыке. Поддерживается обработка многостраничных файлов PDF и TIFF.

Распознает, воспроизводит дирижерские партитуры, аранжировки, оперы, хоралы, транскрипции и ноты в формате PDF. Можно извлечь отдельные партии и преобразовать их в аудио. Распознавание сложных обозначений, поддерживается распознавание и редактирование межстановых вязок и голосов, обозначений метра и ключевых знаков. [6]

Рисунок 5. Интерфейс системы Smart Score

Список использованных источников

Abbyy Fine Reader [Электронный ресурс]. - режим доступа: https://www.abbyy.com/ru-ru/finereader/ .- (Дата обращения: 10.10.2021, 15-45).

Online OCR [Электронный ресурс]. - режим доступа: https://www.onlineocr.net/ru/. –(Дата обращения: 11.10.2021, 10-38).

Soda PDF OCR [Электронный ресурс]. - режим доступа https://www.sodapdf.com/ocr-pdf/ .- (Дата обращения: 03.11.2021, 21-53).

One Note [Электронный ресурс]. - режим доступа: https://support.office.com/ru-ru/article/Основные-задачи-в-onenote-2010-29a50122-eb92-4eaf-8a39-ae5f01094ddc. – (Дата обращения:10.12.2021, 18-20).

One Note [Электронный ресурс]. - режим доступа: https://support.office.com/ru-ru/article/Копирование-текста-из-вставленных-изображений-в-onenote-для-mac-b840c9a0-6f25-423c-bbb5-f240cc07d4db. – (Дата обращения:18.10.2021,11-41).

Soft lenta [Электронный ресурс]. - режим доступа: http://soft-lenta.ru/index.php?newsid=1146389194. – (Дата обращения:10.10.2021, 18-52).

Просмотров работы: 78