ОНТОЛОГИЧЕСКИЙ ИНЖИНИРИНГ В РАЗРАБОТКЕ БАЗ ЗНАНИЙ ТЕКСТОВ УЧЕБНО-МЕТОДИЧЕСКОГО ХАРАКТЕРА - Студенческий научный форум

IV Международная студенческая научная конференция Студенческий научный форум - 2012

ОНТОЛОГИЧЕСКИЙ ИНЖИНИРИНГ В РАЗРАБОТКЕ БАЗ ЗНАНИЙ ТЕКСТОВ УЧЕБНО-МЕТОДИЧЕСКОГО ХАРАКТЕРА

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
Одной из важных составляющих образовательного процесса являются созданные высококвалифицированными специалистами учебно-методические комплексы (УМК). Однако даже наличие всякого рода документов, содержащих рекомендации по структуре и содержанию УМК, не гарантирует ни соответствие УМК требованиям ФГОС по соответствующей учебной дисциплине, ни оценку качества УМК.

Оценка качества УМК - это очень сложный процесс, для которого отсутствуют общепризнанные критерии, что может привести к некоторому несоответствию между предметным содержанием УМК и прописанным в ГОС требованиям к знаниям и умениям по учебной дисциплине.

В то же время правильно и хорошо составленное УМК, без сомнения, очень важно не только при заочной форме обучения, когда студент по большей части должен самостоятельно осваивать материал, а также для дистанционной поддержки традиционной формы обучения.

Поэтому разработка программ, даже в незначительной степени автоматизирующих процесс оценивания качества УМК, является актуальной и востребованной на практике.

В данной ситуации, наиболее подходящим к процессу составления УМК является подход, основанный на инженерии знаний. Учитывая преимущества, которые дают онтологии при обработке неструктурированной информации, в качестве предлагаемого подхода был выбран онтологический инжиниринг.

С помощью онтологического подхода мы можем наиболее цельно представить сведения о рассматриваемой проблемной области. Кроме того, материал, представленный в единой форме, вместе с цепочкой взаимосвязей между понятиями, определениями одних терминов посредством других, с учетом типа взаимосвязей, и их синонимами дает не только более полное понимание предметной области, но и лучше воспринимается, тиражируется и воспроизводится. Так, построив онтологию УМК одной дисциплины, мы совершенно логичным образом, без переписывания кода, сможем расширить ее и использовать программное средство для оценки УМК другой дисциплины.

Не менее важно предоставить высококвалифицированному специалисту удобное  и доступное средство для создания и визуального представления онтологий. Что позволит создавать и редактировать онтологии в простой и наглядной форме.

Поэтому для автоматической проверки соответствия предметного содержания учебно-методических текстов заявленной тематике была разработана демонстрационная версия подсистемы OntoCtrl 2.0.

В ходе разработки подсистемы OntoCtrl 2.0, был проведен онтологический анализ структуры УМК по дисциплине, ФГОС ВПО третьего поколения и структуры основной образовательной программы (ООП).

В данной статье рассмотрено несколько способов формального представления онтологий.

Множества

Один из наиболее распространенных путей задания онтологий это использование множеств. При таком подходе онтология определяется как тройка множеств:, где

X - множество концептов (понятий, терминов) предметной области, которую представляет онтология O;

R - множество отношений между концептами заданной предметной области;

F - множество функций интерпретации, заданных на концептах и/или отношениях онтологии O.

В табл. 1 представлена классификация моделей онтологий с помощью множеств.

Подход к описанию онтологий с помощью теории множеств очень близок к подходу на дескриптивных логиках, однако является более абстрактным. При работе с моделью в теории множеств, все свойства модели необходимо разрабатывать и доказывать, используя алгебру множеств, что, несомненно, усложняет задачу. Кроме того, в случае использования данного подхода, необходимо разрабатывать подходы к проверке непротиворечивости онтологии и получении данных из нее самостоятельно, в то время как дескриптивные логики позволяют использовать подобные средства.

С другой стороны наиболее важным преимуществом данного подхода является максимальная абстрактность, что увеличивает гибкость. Тем не менее, подход на дескриптивных логиках также использует множества в качестве базы, но предоставляет дополнительную теорию, в связи с чем, дескриптивные логики кажутся более удачным выбором.

Графовый подход

Онтология также может быть представлена в виде графа. Графовый подход предоставляет множества преимуществ в работе, как для разработчика, так и для пользователя-непрограммиста.

В случае представления онтологии в виде графа мы получим простой ориентированный граф с циклами. В этом графе понятия онтологии задаются как вершины, а отношения между понятиями с помощью дуг графа. Таким образом, онтология будет иметь вид 12O=<G,R>´>, где G - граф, а 12R´> - набор правил.

Одно из главных преимуществ этого подхода - это удобство представления и наглядность визуализации, которые позволяют легко выявлять основные свойства модели и ее поведения. Следующее преимущество графовой модели - это наличие развитой теории. Существует ряд доказанных формальных свойств графов, которые облегчают доказательство желаемых свойств модели, а также большое количество эффективных уже разработанных алгоритмов на графах.

Еще одним преимуществом такого подхода будет возможность задания для связей семантического расстояния, и удобная их обработка с использованием алгоритмов на графах. Еще одним несомненным плюсом является удобство визуализации. Рассмотрение структуры графа позволяет лучше структурировать информацию, представляемую графом, облегчает процесс усвоения этой информации человеком.

Однако при подобном подходе мы лишаемся возможности адекватного представления семантики унифицированным образом, поскольку в этом случае необходимо множество логических правил описывающих допустимые ограничения для понятий онтологии.

Автоматный подход

Еще один способ представления онтологий основывается на конечных автоматах и отношениях, лежащих в основе каждой онтологии. Этот подход позволяет ввести операции на онтологиях используя операции алгебры регулярных языков и автоматах. При таком подходе типы онтологий и их иерархия не детализируется с целью подчеркивания общности рассматриваемых операций.

Конечный автомат - в теории алгоритмов математическая абстракция, позволяющая описывать пути изменения состояния объекта в зависимости от его текущего состояния и входных данных, при условии, что общее возможное количество состояний конечно [13]. Конечный автомат является частным случаем абстрактного автомата.

Конечный автомат M - это пятерка

 [5], где

Q - конечное множество состояний автомата;

 - начальное состояние автомата;

 - конечное множество заключительных состояний (при достижении одного из этих состояний работа автомата прекращается);

 -  конечный входной алфавит (конечное множество допустимых входных символов), из которого формируются строки, считываемые автоматом;

 - функция, которая отображает множество  на множество Q и называется функцией переходов автомата М.

Будем предполагать, что онтологии представляются в виде орграфа G = (V, E), где множество вершин V представляет множество предметных областей, а множество ребер E- бинарное отношение между этими предметными областями. С каждым таким орграфом G = (V, E) будем ассоциировать конечный (вообще говоря) частичный детерминированный автомат без выходов 

A=(V, X=V , f, S, F), где

V - множество состояний, которое также служит входным алфавитом данного автомата, 

S- подмножество начальных состояний,

F - подмножество заключительных состояний (которое, в частности, может быть пустым), а функция переходов данного автомата определяется следующим образом: f(u,v) = v тогда и только тогда, когда (u,v)  E и не определено в остальных случаях.

Представление онтологий в виде конечного автомата без выходов позволяет ввести операции на онтологиях: объединение, пересечение, конкатенация или умножение двух автоматов, итерация, обращение.

Алгебраические свойства введенных операций на онтологиях вытекают из соответствующих свойств операций алгебры регулярных языков. Это значит, что данные операции удовлетворяют следующим законам: коммутативность и ассоциативность операций объединения и пересечения, ассоциативность умножения, дистрибутивность операции умножения относительно операций объединения и пересечения.

Но возникают проблемы на пути реализации данных операций.

Первая проблема (и возможно основная при работе с онтологиями) связана с тем, что корректное выполнение описанных выше операций требует создания некоторого общего глоссария предметных областей и понятий, с помощью которого можно было бы однозначно идентифицировать соответствующие объекты.

Вторая проблема, возникающая при реализации операций, связана с имеющейся иерархией областей и понятий. Дело в том, что в различных онтологиях одни и те же понятия и объекты могут находиться на разных уровнях иерархии и это необходимо учитывать при применении операций. В предлагаемом подходе эта проблема решается с помощью построения транзитивного замыкания отношения достижимости на состояниях автоматов, представляющих данные онтологии. Однако, авторы не уверены в том, что этого замыкания достаточно для решения проблемы. Здесь, по-видимому, необходимы
эксперименты на реальных онтологиях и их представлениях [13].

Третья проблема связана с полнотой знаний, имеющихся в представленных онтологиях. Эта проблема является основной в процессе спецификации и верификации программного и технического обеспечения.

Преимуществом же данного подхода является простота визуализации и полученные свойства операций на онтологиях. Однако в связи с перечисленными выше проблемами, данный подход представляется не самым эффективным и надежным, поскольку не обеспечивает непротиворечивости.

Дескриптивная логика

Модели представления знаний еще издавна разделились на две группы: логики предикатов первого порядка и специальные структуры (фреймы и семантические сети). При этом логики предикатов первого порядка обеспечивали очень мощный обобщенный механизм работы, однако с точки зрения простоты практического использования для человека выигрывал второй подход. Именно поэтому, в результате длительных исследований, ученые пришли к идее дескриптивной логики.

В дескриптивной логике используются два непересекающихся алфавита символов: элементарные понятия и элементарные роли. Элементарные понятия это унарные предикаты, а элементарные роли - бинарные, и они используются для задания отношений между понятиями. Пересечение, объединение и дополнение элементарных понятий называют логическим умножением, логическим сложением и отрицанием соответственно.

Описание существования и единственности выполняется с использованием кванторов Например, для описания «индивидов имеющих дочь» будет использоваться следующая конструкция а для описания тех индивидов, у которых «все дети дочери» будет использоваться

Таблица 2. Операции в дескриптивной логике

Символ

Операция

12вЉҐ´>

Пустой концепт

12вЉє´>

Все концепты

12вЉ"´>

Пересечение или конъюнкция концептов

12вЉ"´>

Объединение или дизъюнкция концептов

¬

Отрицание или дополнение концептов

12вЉ‘´>

Включение концептов

12в‰Ў´>

Эквивалентность концептов

12в‰ђ´>

Определение концепта

:

Присвоение концепта или роли

 

Недавняя разработка консорциума W3C-формальная модель онтологии, на основе дескриптивных логик, лежащей в основе OWL 2.

Основной частью является карта типов: 12D = ( NDT, NLS, NFS, fDT, fLS, fFS)´>, где

12NDT´> - множество типов данных за исключением типа данных литерал;

12NLS´> - функция, которая ставит в соответствие каждому типу данных 12DTв€€NDT´> множество строк 12NLS(DT)´>;

12NFS´> - функция, которая ставит в соответствие каждому типу данных  множество > пар - это ограничительный фасет, а  - ограничительное значение;

12fDT´> - интерпретирующая функция, которая каждому типу данных  ставит в соответствие множество  - пространство значений типа данных;

12fLS´> - интерпретирующая функция, которая каждой паре с типом данных  и лексической формой > ставит в соответствие значение

12fFS´> - интерпретирующая функция, которая каждой паре , для каждого типа данных  ставит в соответствие множество

Словарем 12V´> на карте типов будет:

где

12VC ´> - множество классов, содержащее, как минимум, классы: Thing (общий родитель для всех классов) и Nothing (класс без потомков), обозначаемые, соответственно, 12вЉєРёвЉҐ´>);

12VOP´> - множество свойств объектов, содержащее, как минимум, свойства topObjectProperty (общий родитель для всех ролей) и bottomObjectProperty (класс без потомков);

12VDP´> - множество свойств данных, содержащих, как минимум, свойства topDataProperty (общий родитель для всех свойств) и bottomDataProperty (класс без потомков);

12VI´>  - множество экземпляров, как именованных, так и неименованных;

12VDT´> - все типы данных, включая тип данных литерал (Literal);

12VLT´> - множество литералов вида где  - тип данных, а  - лексическая форма;

12VFA´> - множество пар  для каждого ограничивающего фасета, типа данных  и лексической формы таких что где  - лексическая форма для 12lt´> и 12DT1´> ‑ тип данных 12lt´>.

Интерпретация для словаря построенного на карте типов задается:

где

  - непустое множество, называемое доменом объектов;

 - непустое, непересекающееся с 12О"I´> множество-домен данных;

- функция, которая ставит в соответствие каждому классу 12Cв€€VC ´> подмножество 12(РЎ)РЎв€€О"I´> так что: 12(Thing)C=О"I´>, а 12(Nothing)C=в€...´>;

 - функция, которая ставит в соответствие каждому свойству 12OPв€€VOP ´> подмножество 12(OP)OPв€€О"IГ-О"I´>, так что: 12(TopObjectProperty)OP=О"IГ-О"I´>, а 12(BottomObjectProperty)OP=в€...´>;

 - функция, которая ставит в соответствие каждому свойству DP 12в€€VDP ´>  подмножество 12(DP)DPв€€О"IГ-О"D´> так что: 12(TopDataProperty)DP=О"IГ-О"D´>, а 12(BottomDataProperty)DP=в€...´>;

 - функция, которая ставит в соответствие каждому экземпляру 12aв€€VI´> элемент 12(a)Iв€€О"I´>;

 - функция, которая ставит в соответствие каждому типу данных 12DTв€€VDT´> подмножество 12(DT)DTвЉ†О"D´>;

- функция, которая ставит в соответствие каждой лексической форме тип данных  ‑ лексическая форма 12lt´>, а 12DT´> ‑ тип данных 12lt´>;

 - функция, которая каждой паре  ставит в соответствие лексическую форму

- функция, которая для каждой пары  задает соответствие вида где 12F´> ‑ это фасет.

Можно сказать, что онтология 12O´> описывается с помощью интерпретации 12I´> на карте типов 12D´> и словаре 12V´>.

В OWL 2 существует большое количество аксиом и свойств, с помощью которых осуществляется логический вывод. Которые также помогают контролировать логическую непротиворечивость онтологии, эквивалентность онтологий, кардинальность.

Представление онтологии проблемной области с помощью
дескриптивной логики

Согласно временному положению о содержании УМК третьего поколения, ФГОС ВПО третьего поколения и структуре основной образовательной программы в рамках данной работы был проведен онтологический анализ структуры УМК, ФГОС ВПО 3-го поколения, структуры ООП.

Основными терминами выделенными на первом шаге итеративного процесса были:

ФГОС

Цикл

Компетенции

Профиль

УМК по учебной дисциплине

Раздел УМК

ООП

Дисциплина

Данная группа понятий входит в множество 12VC´> словаря на карте типов формальной модели. В нашем случае, это следующие классы:

Class(:ФГОС)

Class(:Цикл)

Class(:Компетенции)

Class(:Профиль)

Class(:УМК по учебной дисциплине)

Class(:ООП)

Class(:Дисциплина)

Class(:Раздел УМК)

Следующим шагом согласно приведенному алгоритму онтологического инжиниринга является построение таксономии понятий. Среди приведенных основных терминов, например, подклассом термина «Раздел УМК» будут такие понятия как (рис. 1):

Раздел 1. Титульный лист

Раздел 2. Краткая аннотация  УМК по дисциплине

Раздел 3. Цели и задачи изучения дисциплины

Раздел 4. Входные требования. Порядок проведения входного контроля

Раздел 5. Структура, цели, объем дисциплины, организация текущего контроля

Раздел 6. Цели (результаты) обучения

Раздел 7. Содержание дисциплины

Раздел 8. Порядок освоения разделов и тем дисциплины

Раздел 9. Текущий контроль. Организация текущего контроля

Раздел 10. Промежуточная аттестация (итоговая аттестация студента по дисциплине).

Раздел 11. Сводный перечень обеспечения дисциплины.

 Рис.1 Фрагмент онтологии проблемной области в Protege

Так, например, это будет выглядеть для отношения типа «класс-подкласс»:

SubClassOf(:Титульный_лист : Раздел_УМК)

SubClassOf(:Обьем_дисциплины: Раздел_УМК)

Следующим шагом онтологического анализа определим взаимосвязи между понятиями, т.е. выявим другие, отличные от выявленных на предыдущем шаге алгоритма связей «is-a» виды отношений между понятиями проблемной области.

В данной проблемной области, прежде всего, была выявлена связь «часть-целое» («a_part_of»), «has part» - обратная связи «a part of», а также добавлена связь «the same» и связь «is used to». Например,

Аннотация на русском_языке a part of Раздел 2. Краткая_аннотация_УМК_по_дисциплине

В нотации OWL 2 такое отношение будет выглядеть следующим образом:

SubClassOf(:Аннотация_на_русском_языке ObjectSomeValuesFrom(:a_part_of :Раздел_2._Краткая_аннотация_УМК_по_дисциплине))

Примеры выявленных связей подробнее показаны на рис. 2.

 

Рис. 2 Фрагмент онтологии проблемной области в Protégé

Таким образом, введенные нами связи будут выглядеть в нотации owl подобным образом:

ObjectProperty(:a_part_of)

ObjectPropertyDomain(:a_part_of owl:Thing)

ObjectPropertyRange(:a_part_of owl:Thing)

ObjectProperty(:is used to)

ObjectPropertyDomain(:is used to owl:Thing)

ObjectPropertyRange(:is used to owl:Thing)

ObjectProperty(:has_part)

ObjectPropertyDomain(:has_part owl:Thing)

ObjectPropertyRange(:has_part owl:Thing)

Представленные результаты онтологического анализа были созданы с помощью графического редактора, а также фреймворка для представления знаний Protégé.

Библиографический список

  1. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. СПб.:Питер, 2000. 383 с.
  2. Нариньяни А.С. Кентавр по имени ТЕОН: Тезаурус+Онтология // Труды Международной конференции ДИАЛОГ-2001. М., 2001. С.184-188.
  3. Клещев А.С., Артемьева И.Л. Математические модели онтологий предметных областей. СПб.: Питер, 2005, 100 с.
  4. Майкевич Н.В. От информационного пространства к пространству знаний. Онтологии в Интернет. - Пущино, Россия, 1998. 158 с.
  5. Загорулько Ю.А., Попов И.Г. Описание сложных предметных областей на основе интеграции средств представления знаний. М: Москва, 2001, 115 с.
  6. Козлов С.А. Генерация образовательных траекторий на основе динамических профилей обучаемых//Вестник пермского университета «Математика, механика, информатика» 2009 выпуск 3(29). С.139-142
  7. Захарова Н.И. Онтологический подход к разработке баз знаний учебно-методических комплексов // Сборник тезисов конференции "Актуальные проблемы механики, математики, информатики". Пермь, 2010. С. 138.
  8. Захарова Н.И. Онтологический инжиниринг в задачах разработки баз знаний Учебно-методических комплексов // Межвузовский сборник научных статей «Математика программных систем». Пермь, 2010.
  9. Кривой С., Матвеева Л., Лукъянова Е., Седлецкая О. Онтологический взгляд на теорию автоматов. XII-th International Conference KDS 2007, ITHEA, Sofia, 2007. p.427‑436.
  10. Описательные логики - Искусственный интеллект. [Электронный ресурс]. URL: http://rriai.org.ru/opisatelnyie-logiki.html [Проверено: 25 декабря 2011]
  11. Чуприна С.И. К вопросу о совершенствовании процесса разработки и оценки качества УМК в инновационном вузе Всероссийская с международным участием научно-практическая конференция «Высшее профессиональное образование, бизнес, власть: опыт и перспективы взаимодействия в подготовке управленческих кадров, ориентированных на инновации», НОУ ВПО «Западно-Уральский институт экономики и права», С. 321-324
  12. OWL Working Group - OWL 2. [Электронный ресурс]. URL: http://www.w3.org/2007/OWL/wiki/OWL_Working_Group [Проверено: 25 декабря 2011]
  13. Ходзинский А.Н. Крывый С. Л. Автоматное представление онтологий и операции онтологиях. [Электронный ресурс]. URL: http://shcherbak.net/avtomatnoe-predstavlenie-ontologij-i-operacii-na-ontologiyax/ [Проверено: 25 декабря 2011]

Научный руководитель:
Кандидат физико-математических наук, зав. кафедрой МОВС, С.И.Чуприна

Просмотров работы: 10