ПОСТАНОВКА ЗАДАЧИ ДЛЯ РАЗРАБОТКИ АЛГОРИТМОВ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ АННОТИРОВАНИЯ ДОКУМЕНТОВ - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

ПОСТАНОВКА ЗАДАЧИ ДЛЯ РАЗРАБОТКИ АЛГОРИТМОВ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ АННОТИРОВАНИЯ ДОКУМЕНТОВ

Бурмистров А.С. 1, Свиридова О.В. 1
1ВПИ (филиал) ВолгГТУ
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение

Объём научно-технической информации представленной в электронном виде растёт с каждым днём. За несколько лет его количество становиться настолько большим, что возникают трудности с поиском нужного материала. Происходит процесс обесценивания информации за счёт большого объёма при поиске. Поисковые системы в сети интернет выдают материал разного рода, основываясь только по вводным словам в строке поиска. Следовательно, множество результатов данного поиска являются не приемлемыми. Узнать, подходит ли найденный материал, - это не малый объём времени и сил, здесь и появляется необходимость в наличии аннотации к любому текстовому материалу. Аннотации присутствуют не у каждого научно-технического материала, и поэтому автоматизированная система аннотирования документов является очень актуальным решением данной проблемы.

Постановка задачи

Для достижения поставленной цели были решены следующие исследовательские задачи:

  • Провести анализ современных подходов и методов, применяющихся при решении задачи автоматического аннотирования текста.

  • Разработать метод формализованного описания структуры научно- технического текста на русском языке, позволяющий автоматизировать процесс аннотирования

  • Разработать алгоритм определения функциональных отношений между фрагментами текста.

  • Разработать алгоритм построения структуры на основе множества функциональных отношений между фрагментами текста.

Реализовать систему автоматического аннотирования текста на основе разработанных алгоритмов и провести оценку эффективности разработанных методов и алгоритмов.

Заключение

Создание новых более эффективных алгоритмов и методов, существующих на данный момент, является актуальной задачей. Полученные алгоритмы должны учитывать иерархическую природу текста и его нелинейность. Итогом работы системы будет являться текст, представляющий собой сжатое изложение на русском языке исходного документа.

Библиографический список

  1. Малюкова О.И., Свиридова О.В. Исследование и разработка алгоритмов информационной системы обработки статистических данных для медико-коммерческих фирм // Современная техника и технологии. 2016. № 10 [Электронный ресурс]. URL: http://technology.snauka.ru/2016/10/10774 (дата обращения: 03.01.2017).

  1. Шохина Н.В., Свиридова О.В. Исследование и разработка алгоритмов автоматизированного формирования сопутствующей документации при использовании производственных ресурсов //NovaInfo.Ru (Электронный журнал.) – 2017 г. – № 58; [Электронный ресурс]. URL: http://novainfo.ru/article/10840 (дата обращения: 03.01.2017).

  1. Яцко В.А. // Алгоритмы и программы автоматической обработки текста // Вестник ИГЛУ №1 (17) , 2012. [Электронный ресурс]. URL: http://cyberleninka.ru/article/n/algoritmy-i-programmy-avtomaticheskoy-obrabotki-teksta

Просмотров работы: 256