АНАЛИЗ И ИССЛЕДОВАНИЕ МЕТОДОВ АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ ОНТОЛОГИИ - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

АНАЛИЗ И ИССЛЕДОВАНИЕ МЕТОДОВ АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ ОНТОЛОГИИ

Куркин А.Н. 1, Макушкина Л.А. 1
1Волжский политехнический институт (филиал) федерального государственного бюджетного образовательного учреждения высшего образования «Волгоградский государственный технический университет»
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Введение

Как правило, построение онтологии требует использования больших ресурсов, а также экспертных знаний в предметной области, и занимает существенный объем времени образом, автоматизация процесса построения онтологии является актуальной задачей.

Представляется возможным автоматическое построение онтологии по коллекции текстовых документов преимущественно на основе статистических методов анализа текстов на естественном языке. Содержание документов в коллекции непосредственно влияет на качество получаемой онтологии. Если тематически тексты документов слабо связаны, скорее всего, построенная онтология окажется невыразительной, поскольку будет описывать отдельные аспекты различных предметных областей, не создавая при этом общей картины.

Целью данной работы является:повышение эффективности построения онтологических моделей за счет автоматизации выделения вершин и их связей.

Для достижения поставленной цели были решены следующие исследовательские задачи:

  • Провести анализ и исследование методов автоматической генерации онтологии.

  • Составить математическое описание программной системы автоматической генерации онтологии на основе структурированного материала.

  • Выполнить программную реализацию системы автоматической генерации онтологии на основе структурированного материала.

  • Проверить эффективность реализованных алгоритмов программной системы автоматической генерации онтологии на основе структурированного материала.

Постановка задачи

В настоящее время онтологические модели различных предметных областей получают все большее распространение и производятся различного рода исследования по их разработке и использованию.

Онтология – это способ представления знаний о предметной области с помощью конечного множества понятий предметной области и отношений между ними. Другими словами, онтология – это некоторое описание взгляда на мир применительно к конкретной области интересов, которое состоит из терминов и правил использования этих терминов, ограничивающих их значения в рамках конкретной области.

Для представления предметной области определим онтологию как упорядоченную тройку вида O = { T, R, F },где T - конечное множество терминов (концептов, понятий, классов) предметной области, которую представляет онтология O;R - конечное множество отношений между понятиями заданной предметной области; F - конечное множество функций интерпретации (аксиоматизация), заданных на концептах и/или отношениях онтологии O.

Далее были рассмотрены основные методы автоматического построения онтологий по коллекции текстовых документов. Методы автоматического построения онтологий можно условно разделить на три основные группы в зависимости от области заимствования основного подхода: методы, основанные на подходах из области искусственного интеллекта, статистические методы и методы, использующие лингвистические подходы.

Далее был выполнен анализ систем, позволяющих выполнять работу с онтологиями, выделены основные функции подобных систем и проведен их сравнительный анализ.

Большинство из рассмотренных инструментальных средств не зависят от языка представления, имеют открытый код или свободный доступ к своим функциям.

Наибольшее распространение и применение получили лингвистические онтологии по естественным наукам и технологиям, онтологии химии, онтологии по медицинской диагностике.

Анализ существующих методов построения онтологий показал, что процесс разработки объединяет спецификацию, концептуализацию, формализацию, объединение и реализацию. В основе концептуализации лежат категории абстракций, которые носят субъективный характер. Для каждой онтологии существуют своя собственная абстракция.

Эффективное автоматическое построение онтологий основано на использовании методов искусственного интеллекта, способных извлекать из текста элементы знаний и нетривиально их перерабатывать. Однако, не достаточно распространены системы лингвистического анализа текста, способных интерпретировать семантические отношения между словами и, вследствие этого, низкая достоверность автоматически извлекаемых из текста утверждений и фактов.

Библиографический список

  1. Попов Д.В., Макушкина Л.А. Исследование методов построения конвертера онтологических моделей курса //Попов Д.В., Макушкина Л.А.Современные научные исследования и инновации. 2014. № 1 (33). С. 3.

  2. Андрич О.Ф., Макушкина Л.А. Исследование методов оценки качества онтологических моделей // Андрич О.Ф., Макушкина Л.А.Современные наукоемкие технологии. 2014. № 5-2. С. 18-19.

  3. Маслова О.В., Макушкина Л.А. Анализ методов генерации онтологических моделей по коллекции текстовых документов//Маслова О.В., Макушкина Л.А.Вестник магистратуры. 2014. № 4-1 (31). С. 85-89.

  4. Макушкина Л.А., Рыбанов А.А.Оценка качества структурирования учебного материала на основе метрик онтологических моделей//Макушкина Л.А., Рыбанов А.А.Актуальные вопросы профессионального образования. 2014. Т. 11. № 14 (141). С. 86-89.

Просмотров работы: 388