Использование ИТ для распознавания текстов - Студенческий научный форум

XII Международная студенческая научная конференция Студенческий научный форум - 2020

Использование ИТ для распознавания текстов

Аджиева Д.Р. 1, Баммаева Г.А. 2
1Дагестанский государственный университет
2 Дагестанский государственный университет
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

За сотни лет население земли накопило большой объем информации на классических бумажных носителях (книгах, печатных изданиях, журналах и т. п.). В настоящее время есть надобность (у электронных библиотек, к примеру) переносить определенную информацию в память компьютера. Естественно, это возможно устроить с поддержкой клавиатуры и текстового редактора, но, предположите для себя, сколько времени уйдет даже у профессионального оператора на ввод, скажем, романа «Война и мир»? Нужно как-то ускорить этот процесс. Возникает вопрос, невозможно ли применить сканер для ввода текстовой информации? Правда, в данном случае появляется неувязка : все, что введено с поддержкой сканера, хранится в памяти ЭВМ как изображение. Надобно «объяснить» компьютеру, что значок «с» - не простая закорючка, а буква, и хранить и обрабатывать его нужно как букву.

Ввод в компьютер печатного и рукописного текста

Есть программы, позволяющие вводить тексты в ПК с поддержкой сканера. Применяя особые методы, они распознают буковки, дают возможность редактировать распознанный текст и сохранять его во всевозможных форматах. Известной программой такого типа считается АВВY FineReader. Работать с данной программой нетрудно.

В начале нужно отсканировать текст (управлять сканером возможно прямо в среде (FineReader), после разбить этот текст на куски, затем различить эти фрагменты, отредактировать приобретенный текст и, в конце концов, сохранить его в подходящем текстовом формате. Интерфейс программы позволяет овладеть этими операциями легко и быстро.

Задача определения текста относится к области задач, которые решает наука под названием «Искусственный интеллект». Современные распознающие программы могут декламировать не только напечатный текст, но и текст, написанный наиболее «корявым» почерком.

Оптическое распознавание символов (англ. OpticalCharacterRecognition – OCR) – это разработка, которая разрешает преобразовывать всевозможные типы документов, такие как отсканированные документы, PDF-файлы или же фото с цифровой видеокамеры, в редактируемые форматы с возможностью поиска.

Для получения документа в формате текстового файла нужно выполнить распознавание текста, то есть конвертировать составляющие графического изображения в последовательности текстовых знаков.

Преобразование бумажного документа в электронный вид происходит с помощью трех ведущих шагов:

Сканирование. Настраиваются характеристики сканирования (разрешение, размер, тип сканирования) и происходит собственно сканирование.

Сегментация и распознавание текста. Прежде чем получить готовый текст, необходимо разбить фрагменты документа на блоки, для верногораспределения текста.

Проверка орфографии и передача текстового документа в необходимое приложение для последующей работы или сохранение в файл.

Преобразованием графического изображения в текст занимаются специальные программыраспознавания текста (OpticalCharacterRecognition - OCR). Современная OCR обязана уметь распознавать тексты, набранные не только определенными шрифтами (именно так работали OCR первого поколения), но и самыми экзотическими, вплоть до рукописных, распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной нарезки или третьей машинописной копии. Само собой, разлить текст - это еще полдела. Не менее принципиально гарантировать вероятность сохранения результата в файле известного текстового формата - скажем, формата Microsoft Word.

Как видим, для того, чтобы получить электронную, готовую к редактированию копию любого печатного текста, программе OCR нужно исполнить «цепочку» из множества отдельных операций:

В начале нужно различить структуру размещения текста на странице: отметить колонки, таблицы, изображения и так далее. Далее выделенные текстовые  графического изображения страницы странички нужно конвертировать в текст.и

В случае если исходный документ содержит типографское качество (достаточно крупный шрифт, отсутствие плохо напечатанных символов или исправлений), то задача распознавания решается способом сопоставления с растровым шаблоном. В начале растровое изображение страницы делится на изображения отдельных символов. После каждый из них поочередно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством отличных от входного изображения точек. При распознавании документов с низким качеством печати (машинописный текст, факс и так далее) используется способ определения знаков по наличию в них конкретных структурных составляющих (отрезков, колец, дуг и др.).

Болееизвестные системы оптического определениязнаков, например, ABBYY FineReader и CuneiForm от Cognitive, используют как растровый, так и структурный способы распознавания.

Качество распознавания во многом зависит от того, насколько хорошее изображение получено при сканировании. 

Рукопечатные тексты (данные вводятся в поля печатными буквами от руки) распознаются с поддержкой систем оптического распознавания форм и вносятся в компьютерные базы данных.иГлавная проблема, которую решает распознавание рукописного ввода - экономия времени. На то, чтобы вручную перепечатать текст нужно потратить колоссальное количество времени, эта работа быстро утомляет

Распознавая текст по технологии OCR нужно помнить о том, что программы не каждый раз будут считывать текст без промахов. Временами нужно выполнять повторное сканирование, также нужно проверить отсканированный текст на наличие ошибок.иииииииииииииииииииииииииииииииииииииииии

Основные системы преобразования текста:ииииииииииииииииииииии

FineReader – омнифонтовая (то есть система, распознающая символы буквально любых размеров и начертаний) система оптического определенияслов. Это означает, что она позволяет распознавать тексты, набранные практически любыми шрифтами, без предварительного обучения. Особенностью программы FineReader является высокая точность распознавания и малая чувствительность к дефектам печати.

Делают акцент на применении устройств, созданных природой. В базе данных этих устройств лежат три фундаментальных принципа: целостность, целенаправленность и адаптивность (принципы IPA).

Компания ABBYY, делая упор на результаты многолетних исследований, реализовала принципы IPA в компьютерной программе.

Система оптического распознавания символов ABBYY FineReader – единственная в мире система OCR, действующая в соответствии с вышеописанными принципами на всех этапах обработки документа. Эти принципы делают программу максимально гибкой и интеллектуальной, предельно приближая ее работу к тому, как распознает символы человек. На первом этапе распознавания система постранично анализирует изображения, из которых состоит документ, определяет структуру страниц, выделяет текстовые блоки, таблицы. Кроме того, современные документы часто содержат всевозможные составляющие дизайна: иллюстрации, колонтитулы, цветной фон или фоновые изображения.

В следствие этого недостаточно просто найти и различить обнаруженный текст, принципиально с самого начала определить, как устроен рассматриваемый документ: есть ли в нем сегменты и подразделы, ссылки и сноски, таблицы и графики, оглавление, проставлены ли номера страниц и т. д. Затем в текстовых блоках выделяются строки, отдельные строки разделяются на слова, слова на символы.ииииииииииии

Принципиально обозначить, что выделение символов и их распознавание также реализовано в виде составных частей единой процедуры. Это разрешает в абсолютной мере использовать преимущества принципов IPA. Выделенные изображения символов поступают на рассмотрение механизмов распознавания букв, называемых классификаторами.ииииииииииииииииииии

FineReader содержит массы дополнительных функций и удобный интерфейс:

распознавание текста;

все найденные программой промахи отличаются цветом. Затем программа производит проверку текста на присутствие орфографических ошибок, и все некорректные слова подчеркивает красными линиями. Обнаруженные изображения программа выделяет красным цветом и в дальнейшем их не обрабатывает, а оставляет их такими, какие они есть, соответственно и передает их такими, как они получились при сканировании.

редактирование полученного документа.

PDFelementPro- идеальный инструмент для OCR распознавания PDF-файлов. Он имеет возможностьмеханически распознавать отсканированные файлы PDF и делать их редактируемыми с поддержкой интегрированных инструментов редактирования. Не считая этого, он поддерживает некоторое колиечство языков OCR. Вы можете легко редактировать ваши PDF-тексты, изображения, ссылки и иные составляющие.

Еще у вас есть возможность преобразовывать PDF-файлы в другие форматы.

iSkysoft PDF ConverterPro для Mac может стать вам замечательным ассистентом в OCR распознавании отсканированных PDF. Вы можете импортировать PDF-файл, который был на базе изображения, в программу, затем выполнить распознавание OCR и после этого свободно преобразовывать его в другие форматы.

Интерфейс программы PDFelementPro напоминает последние версии самой известной офисной программы, поэтому у пользователей не будет трудностей с внедрением приложения. ииииииииииииииииииииии

OCR Desktop -это OCR приложение для настольного компьютера включает в себя искусственный интеллект и нейронные сети для совершенствования свойств работы. Конвертер курсивного письма PDF в текст обучали более, чем четырём миллионам вариантов шрифтов, так что вы можете быть уверены, преобразованный текст будет точным насколько это вообще возможно. Он также обладает новейшей технологией OCR для решения любой задачи в распознавании почерка.ииииииииииииииииииииииииииииииииииииииииии

SimpleOCR – одна из самых известных бесплатных программ OCR доступных в сети. Она достаточно ординарна, но в ее арсенале есть все главные функции сканирования и конвертации, которые актуальны при работе с OCR распознаванием рукописных текстов. Однако если вы желаете расширенные возможности, то тогда вам нужно воспользоваться коммерческой версией.

 TopOCR

Разработчики TopOCR говорят, что они создали болеесильную систему определения, на базе нейронной сети, которая доступна на рынке, а также обещают пользователям наилучшие итоги OCR определения данных, сделанных с поддержкой цифровой камеры.

Голосовое распознавание.

Развитие технологий распознавания голоса даёт пользователям новые возможности для взаимодействия с различными устройствами. Мы постепенно привыкаем к голосовым ассистентам, но с помощью голоса мы имеем возможность не только узнавать погоду или слушать музыку, но и набирать большие объёмы текста.

Голосовой ввод текста - это функция, базирующаяся на технологии распознавании речи. Программа голосового ввода воспринимает произнесенные слова и конвертирует их в письменный текст.

Не стоит путать голосовой ввод с голосовым управлением. Вторая технология упрощает пользователю выполнение каких-либо действий на устройстве - к примеру, включает музыку или запускает приложения без помощи рук.

Голосовой же ввод решает более узкую задачу - набор текста с помощью голоса. Для применения голосового ввода необходимтолько микрофон.

Обладатели ноутбуков имеют возможность использовать микрофон, встроенный в аппарат, а обладатели стационарных компьютеров - тот, что есть в веб-камерах, которые подключаются к ПК.

В принципе, для голосового ввода подойдёт любой микрофон, в случае если говорить чётко и не очень быстро. Особой настройки оборудования тоже не потребуется. Достаточно убедиться в том, что система принимает звук через микрофон.

Список использованных источников

1.https://www.it-world.ru/tech/admin/139030.html

2.https://www.kp.ru/guide/raspoznavanie-teksta.html

3.https://www.abbyy.com/ru-ru/science/technologies/ocr/

4.https://cloud.yandex.ru/docs/vision/concepts/ocr/

5.https://img2txt.com/ru

Просмотров работы: 17