Методы и алгоритмы проверки орфографии в научном тексте - Студенческий научный форум

XIII Международная студенческая научная конференция Студенческий научный форум - 2021

Методы и алгоритмы проверки орфографии в научном тексте

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Орфография в последнее время стала менее востребованной и её важность значительно уменьшилась за счёт средств проверки орфографии, которые есть во многих программах по обработке текста.

Некоторые реформаторы образования считают, что учащиеся с помощью подобных программ будут развивать навыки правописания через чтение обработанных данными программами текстов.

Современные технологии являются мощнейшим инструментом, облегчающим процесс обучения. Некоторые утверждают, что он достаточно мощный, чтобы делать обучение написанию ненужным. В конце концов, для чего нужна проверка орфографии? Проверка орфографии - прекрасный инструмент для исправления мелких ошибок, которые допускают хорошие орфографы, и для типичных опечаток. 

Если учащийся обладает достаточными языковыми знаниями, программа для проверки правописания значительно экономит время.

Программы для проверки орфографии встроены во многие популярные текстовые редакторы, например, компания «Информатик» лицензировала свою технологию проверки правописания компании Microsoft для MS Office.

Благодаря этому внедрению огромное число пользователей получили возможность автоматически исправлять тексты, не теряя свое время на длительную проверку текста [2]. В современном обществе это является одним из самых важных достоинств текстовых программ.

При написании различных текстов, таких как рефераты, научные статьи, курсовые работы, различного рода проекты, дипломные работы, юридические документы, заявления и другие тексты, часто требуется его проверка на наличие орфографических или пунктуационных ошибок. Эти программы созданы для того, чтобы не искать справочник по русскому языку и не занимать этим много времени, а также на случай если многие правила основательно забыты после окончания школы.

Особенно важно грамотное написание текстов юридической направленности, здесь каждая лишняя запятая может привести к длительным судебным тяжбам и многочисленным лингвистическим экспертизам. 

Текстовый редактор Microsoft Word необходим для анализа представленного вами документа и предложения вам наиболее выгодным для вас условиям написания текста, таких как орфография, грамматика и стилистика, например, сделать предложения более краткими, выбрать более простые слова или написать более формально.

Для более эффективной работы по поиску и исправлению ошибок в редакторе есть дополнительные инструменты, которые мы рассмотрим на примере Word 2016. Однако интерфейс отчасти схож с предыдущими выпусками приложения.

По умолчанию, Word использует подчеркивание красной линией незнакомых ему слов, которые он считает за ошибку.

Для того, чтобы исправить неизвестное ему слово необходимо нажать правой клавишей мыши на подчеркнутое слово или области этого слова и приложение автоматически предложит варианты его исправления. Но в некоторых случаях бывает и так, что альтернативы подчёркнутого слова нет или предлагаемые программой варианты вам не подходят.

В большинстве случаев Word не знаком с названиями различных компаний и мест, фамилиями и некоторыми именами. Для того, чтобы в будущем при использовании подчёркнутых слов они не были не известны программе, необходимо добавить его в словарь, выбрав через контекстное меню опцию «Добавить в словарь» и слово не будет считаться за ошибку и запомнится программой на всё время. К тому же, если выбрать в контекстном меню пункт «Пропустить все» в текущем документе вы избавитесь от назойливых подчеркиваний.

Подобным образом работает и проверка грамматики в документе. Разница лишь в том, что цвет подчеркивания не красный, а синий. Ошибкой это является не всегда, часто это является мнение тектового редактора, которое основывается на встроенных в него правилах.

Настроить набор доступных грамматических правил, включить или отключить данную опцию можно через меню «Файл» – «Параметры» – вкладка «Правописание».

Для того, чтобы проверить все ошибки в документе последовательно необходимо перейти во вкладку под названием «Рецензирование» и нажать на кнопку «Правописание». После этого Word будет показывать вам ошибки последовательно и справа в документе откроется окно, в котором будут представлены варианты исправления ошибки и кнопки по управлению процедурой. Данная опция действительно в значимой степени экономит время при работе с большими документами, последовательно показывая вам ошибки в тексте, вместо того, чтобы вы самостоятельно выискивали каждое подчеркнутое редактором слово.

Также средство проверки правописания Word может помочь и в проверке пунктуации. Так, если в предложении есть или возможны пунктуационные ошибки, то оно будет подчёркнуто зелёным цветом. Причину «недовольства» Word можно узнать, нажав на контекстное меню. Причина отобразится на экране и сообщит пользователю о возможных проблемах с расставлением знаков препинаний.

Конечно, создание программы, обнаруживающей абсолютно все ошибки практически невозможно, ведь алгоритм, используемый для проверки русского языка достаточно сложен. Учитывая особенности употребления различных языковых конструкций в конкретных ситуациях, все многообразие форм и другие нюансы, можно сказать, что включение их в программу практически невозможно.

Одним из самых сложных задач, возложенных на программу является оценивание правильности расстановки запятых. Так, если проверяет человек, он может подойти к процессу творчески и чем лучше он знает базовые правила языка, тем быстрее и качественнее будет проверка. В том случае, если проверяет программа, некоторые ошибки ей могут просто игнорироваться, а некоторые, наоборот, без оснований выделяются. Подобные случаи происходят довольно таки часто.

Для подобных программ также важен набор включенных в них словарей. Так качество и быстрота проверки в основном зависит от количества слов в подключенных словарях. Например, многие программы не знакомыы с такими словами, как биткоины, блогер или файервол, несмотря на то, что они давно задействованы в русском языке.

Программы и системы для проверки правописания в документах, которые используются в огромном количестве современных текстовых редакторов, могут позволить выявление большей части допущенных опечаток и ошибок. Принципом действия таких систем является сдедующий: система для проверки правописания находит проверяемое слово во встроенном в неё словаре в нужной пользователю грамматической форме. В случае, если программа нашла слово, то оно будет считаться написанным по правилам, а если слово не было найдено программой во встроенном словаре, но есть похожие слова, то программа выдаёт сообщение об ошибке и предлагаются возможные варианты замены.

В случае, если программа не смогла найти ни это слово, ни похожие на него слова, то она предлагает либо исправить его, либо занести его в словарь.

Также проверка орфографии по словарю не выявляет случаи, в которых ошибка допущена так, что слово есть в словаре. Такие ошибки скрыты от программы, но человек их легко заметит. Примерами таких случаев можно считать следующие: 1. «Иван Петрович шлет Вам по клон». В данном случае нам сразу же видно где ошибка, здесь подразумевалось слово поклон. 2. «Я не нашел нежный файл». Здесь ошибка в слове «нежный» и сразу понятно, что необходимо было написать слово нужный. В обоих случаях программа не увидела ошибки, так как эти слова соответствовали словам в словаре, но не подходили по смыслу, что сразу видно человеку.

Но также существуют и программы, являющиеся более интеллектуальными, которые позволяют выявлять ошибки в согласовании форм слов и расстановке знаков препинания. Они хранят в себе набор специальных правил, которые записаны в формальном виде. Подобная система позволяет обратить внимание пользователя на подозрительные места, напрмер, в фразе про Ивана Петровича, она предположит, что слово «клон» употреблено не в том падеже или пропущено связующее слово между ним и предлогом «по». В любом из этих случаев, пользователь обратит внимание на выделенную ошибку и исправит её.

Подводя итог, мы можем сказать, что программы для проверки правописания обнаруживают достаточно много ошибок и опечаток и чем больше словарь программы, тем больше правил и алгоритмов для проверки текстов она знает, и, соответственно, процент обнаружения ей ошибок достаточно велик. Но любая система для проверки правописания не может гарантировать полное отсутствие ошибок и опечаток в тексте, а также абсолютной правильности построения смысловых цепочек.

В работе предложен метод и алгоритм проверки орфографии в научном тексте.

Список литературы

1.Алгазина, Н.Н. Методика изучения орфографических правил/- М.: Просвещение. 1982.- 48с.

2.Жиленко А.Г. Использование алгоритмов при изучении орфографии // РЯШ. - 1986. - N5. - С.53-55.

3.Методика развития речи / Под ред. Ладыженской Т. А. - М., 1991.,242 с.

4.Такташкин Д.В., Масенко И.А.. Модель вариантов использования программы для писателей «Сюжет» // Современные научные исследования и инновации 2016. № 3 [Электронный ресурс]. URL:http://web.sna.uka..ru/issues/2016/03/64882 (дата. обращения: 05.12.2020)

5.Поваляев Е. Системы проверки орфографии [Электронный ресурс] . URL:http://compress.ru/a.rticle.a.spx?id=9511 (дата обращения: 05.12.2020).

Просмотров работы: 216