Модели представления знаний имеют множество различных применений, одним из наиболее распространённых является исследование искусственного интеллекта. Фундаментом любого искусственного интеллекта являются знания и для того, чтобы этот фундамент был прочным, разрабатываются специальные модели представления знаний и языки для описания знаний.
Исследования искусственного интеллекта имеют несколько направлений. Для простоты понимания можно разделить их на прикладной и теоретический. Модели представления знаний — это прикладное направление. Его суть в том, что мыслительная деятельность человека – «черный ящик». В связи с этим не ставится вопрос об адекватности используемых в компьютере моделей представления знаний тем моделям, которыми пользуется в аналогичных ситуациях человек, а рассматривается лишь итоговый результат решения конкретной задачи.
С понятием моделирования знаний неразрывно связана проблема выбора языка представления знаний. Для классификации моделей представления знаний выделяется семь ключевых требований к моделям знаний [1]:
общность (универсальность);
наглядность представления знаний;
однородность;
реализация в модели свойства активности знаний;
открытость;
возможность отражения структурных отношений объектов предметной области;
возможность оперирования нечеткими знаниями;
Ни одна из существующих на данный момент моделей не может в полной мере удовлетворить этим требованиям, именно это причина активных исследований в области представления знаний.
Рассмотрим четыре наиболее часто используемые и популярные на сегодняшний день модели представления знаний:
продукционные модели – модели, основанные на правилах, позволяют представить знание в виде предложений типа: «ЕСЛИ условие, ТО действие»;
семантические сети – графическое изображение модели, чаще всего в виде графов. Узлы этого графа соответствуют понятиям и объектам, а дуги – отношениям между объектами;
фреймовые модели основывается на таком понятии как фрейм (англ. frame – рамка, каркас). Фрейм – структура данных для представления некоторого концептуального объекта. Информация, относящаяся к фрейму, содержится в составляющих его слотах. Слоты могут быть терминальными либо являться сами фреймами, т.о. образуя целую иерархическую сеть;
модель нечеткой логики основывается на неточных числах, коэффициентах уверенности, вероятности, нечетких множествах. Последние содержат упорядоченные пары, включающие номер элемента множества и функцию степени принадлежности этого элемента множеству.
Продукционная модель.
Продукционную модель можно считать самой распространенной моделью представления знаний. Пример такой модели:
ЕСЛИ у фигуры три стороны И один угол равен 90° ТО это прямоугольный треугольник.
Системы обработки знаний, которые используют продукционную модель называются «продукционными системами». В состав таких систем входят база правил (знаний), рабочая память и интерпретатор правил (решатель), реализующий определенный механизм логического вывода. Любое продукционное правило состоит из двух частей: антецендента и консеквента. Антецедент - это посылка правила (условная часть), состоит из элементарных предложений, соединенных логическими связками «и», «или». Консеквент (заключение) включает одно или несколько предложений, выражающих либо некоторый факт, либо указание на определенное исполняемое действие.
Существуют два типа продукционных систем – с прямыми и обратными выводами. Прямые выводы выполняют стратегию «от фактов к заключениям». При обратных выводах выдвигаются гипотезы вероятностных заключений, которые могут быть подтверждены или опровергнуты на основании поступающих фактов. Существуют системы и с двунаправленными выводами.
Основные достоинства систем продукционного вида – это простота представления знаний, легкость организации логических выводов и модульность применения правил (легко удалять и добавлять знания в базе знаний).
К недостаткам таких систем относятся:
низкая эффективность обработки знаний;
неясность взаимных отношений правил;
отсутствие гибкости в логическом выводе;
сложность оценки целостного образа знаний.
При разработке небольших систем на основе данной модели проявляются положительные качества продукционной модели, но с увеличением объема знаний все сильнее проявляются ее недостатки.
Продукционная модель представления знаний нашла широкое применение в АСУТП. Имеется большое число программных средств, реализующих продукционный подход (например, языки высокого уровня CLIPS и OPS 5; «оболочки» или «пустые» ЭС – EXSYS Professional и Карра, инструментальные – КЕЕ, ARTS, PIES , а также промышленных ЭС на его основе).
Данный тип представления знаний удобен в небольших системах. Для разработки более сложных систем стоит использовать другие МПЗ.
Семантические сети.
Семантическая сеть - это граф, дуги которого есть отношения между вершинами (значениями). Семантические сети появились как модель СПЗ при решении задач разбора и понимания смысла естественного языка.
Достоинства семантических сетей:
универсальность, семантическая сеть позволяет представить любую существующую систему в виде схемы;
наглядность системы знаний, представленной графически;
близость структуры сети, представляющей систему знаний, семантической структуре фраз на естественном языке.
Недостатки семантических сетей:
формирование и модификация семантической модели затруднительны;
поиск решения в семантической сети сводится к задаче поиска фрагмента сети, соответствующего подсети, отражающей поставленный запрос;
чем больше отношений между понятий, тем сложнее использовать и модифицировать знания.
Семантические сети широко используются в экспертных системах в качестве языка представления знаний (например, в экспертной системе PROSPECTOR), в системах распознавания речи и понимания естественного языка. Непосредственное отношение к сетевым моделям имеют исследования по реляционным, сетевым и иерархическим БД. Кроме того, проводятся исследования, которые используют семантическую сеть для создания глобальной базы знаний на основе Интернета.
Несмотря на недостатки семантическая сеть, в связи со своей наглядностью и легкостью создания незаменима в обучении. Также модель необходима на начальных этапах создания проектов для рассмотрения его обобщенно.
Фреймовая модель.
Фрейм — это структура для представления знаний, которая при ее заполнении соответствующими значениями превращается в описание конкретного факта, события или ситуации.
Фреймовую модель можно считать более специализированной по отношению к сетевой. Она основана на принципе кластеризации (фрагментация) знаний.
Фреймы делятся на образцы (прототипы), хранящиеся в базе знаний, и фреймы - экземпляры, создающиеся для отображения реальных фактических ситуаций на основе поступающих знаний. Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире через [2]:
фреймы - структуры, использующиеся для обозначения объектов и понятий (заем, залог, вексель);
фреймы - роли (менеджер, кассир, клиент);
фреймы - сценарии (банкротство, собрание акционеров, празднование именин);
фреймы - ситуации (тревога, авария, рабочий режим устройства) и др.
Слоты – это незаполненные (нулевые) позиции фрейма. Если у фрейма все слоты заполнены – это описание конкретной ситуации. В переводе с английского слово «фрейм» означает «рамка», а слово «слот» – «щель». В отличие от моделей других типов во фреймовых моделях фиксируется жесткая структура информационных единиц, которая называется протофреймом. В общем виде структура информационных единиц выглядит следующим образом:
(Имя фрейма:
имя слота1 (значение слота1);
имя слота2 (значение слота2);
. . . . . . . . . . . . . . . . . . . . . . . . . .
имя слотаК (значение слотаК)).
К достоинствам фреймовой модели знаний относятся:
гибкость, т. е. структурное описание сложных объектов;
наглядность, т. е. данные о родовидовых связях хранятся явно;
механизм наследования свойств. Фреймы обладают способность наследовать значения характеристик своих родителей, находящихся на более высоком уровне иерархии, что обеспечивает широкое распространение языков такого типа в интеллектуальных системах;
значение может быть вычислено с помощью процедур или найдено эвристическими методами;
возможность использования предположений и ожиданий;
универсальность за счет существования не только фреймов для обозначения объектов и понятий, но и фреймов - событий, фреймов - ситуаций, фреймов - ролей, фреймов - сценариев и т.п.;
Возможность легкого перехода к сетевой модели.
Недостатками фреймовой системы являются:
высокая сложность систем в целом;
отсутствие строгой формализации;
трудно внести изменение в иерархию;
затруднена обработка исключений.
Широко известны такие фреймо-ориентированные экспертные системы, как ANALYST, МОДИС.
FRL (Frame Representation Language) — технология создана для проектирования интеллектуальных систем на основе фреймовой модели представления знаний. В основном применяется для проектирования вырождающихся в сеть фреймовой модели. Существуют и другие среды: KRL (Knowledge Representation Language), фреймовая оболочка Kappa, PILOT/2.
Фреймовую модель представления знаний можно заменить сетевой (семантической).
Логическая модель.
Логическая форма представления знаний – представляет собой несколько утверждений и фактов (формулы). Знания — это набор таких формул, а процесс вывода новых знаний — это реализация процедур логического вывода.
Достоинства логической модели:
независимо от количества формул и процедур, логическая форма будет иметь только один вывод;
благодаря тому, что логическая модель использует математические формулы, которые обширно изучены к настоящему времени, методы модели можно точно обосновать
благодаря строгому представлению формул в виде процедур, можно однозначно реализовать метод, используя логические языки программирования (например:Prologue, Planner,Visual Prologue, Oz и другие)
благодаря особенностям процесса вывода новых знаний, в базе знаний можно хранить только множество аксиом, что в свою очередь существенно облегчает базу данных будущего искусственного интеллекта.
Недостатки логической модели [3]:
из-за того, что факты(формулы) выглядят очень похоже, модель тяжело использовать для конкретных предметной области
из-за отсутствия определённости в некоторых сферах науки, в логическую модель тяжело добавить необходимое количество аксиом для корректной работы будущей системы;
вывод, полученный из верных аксиом может не иметь смысла со стороны человеческого разума. Программа может верно построить связи, но получить совершенно неверный вывод
каждая аксиома должна иметь строгий вывод, зачастую либо «да», либо «нет». Этого очень тяжело добиться в сфере гуманитарных наук, в связи с чем сложность разработки возрастает в геометрической прогрессии.
На данный момент данная модель используется в языке программирования Пролог, поэтому для того чтобы понять актуальность использования модели, в первую очередь надо выявить плюсы и минусы использования языка.
В Пролог сложно создавать практически полезные программы: отсутствие поддержки итеративного программирования и строгой типизации заставляет программиста использовать приёмы, заметно усложняющие создание и отладку программы. Предопределенный порядок обхода дерева решений делает почти невозможным автоматическое распараллеливание программ.
Один из возможных методов способных заменить логическую форму - нечеткая логика
Нечеткая логика инструмент для управления технологическими и индустриальными процессами, для интеллектуального домашнего хозяйства и электроники развлечения, в системах обнаружения ошибок и других экспертных системах. Разработаны специальные средства нечеткого вывода, например, инструментальное средство FuzzyCLIPS. Нечеткая логика была изобретена в Соединенных Штатах, и сейчас быстрый рост этой технологии начался в Японии, Европе и теперь снова достиг США.
На сегодняшний день существует огромное количество разнообразных моделей представления знаний. Каждая из них имеет свои особенности, достоинства и недостатки. Поэтому вопрос выбора оптимальной модели стоит как никогда остро. Правильная модель представления знаний поможет не только решить задачу максимально эффективным способом, но и облегчить функционирование созданной системы.
На данный момент процесс разработки модели представления знаний можно рассматривать, как процесс разработки базы знаний. В связи с этим очень важно, чтобы все свойства и характеристики знаний соответствовали не только свойствам баз знаний, но и моделям представления знаний
На этапе проектирования модели целесообразно сделать систему настолько простой, насколько это возможно. Этого можно достичь, представляя все элементы модели в едином виде. Единый вид элементов модели позволяет упростить управление как логическим выводом, так и знанием.
Единый вид означает, что система проста и интуитивна понятна обычному пользователю, который не является экспертом. Легче всего этого достигнуть, используя несколько видов моделей представления знаний в симбиозе.
Литература
Смагин А.А., Липатова С.В., Мельниченко А.С. Интеллектуальные информационные системы – Ульяновск: Издательский центр Ульяновского государственного университета, 2010г. – 50с.
Научная библиотека Сибирского федерального университета [http://files.lib.sfu-kras.ru/irbis/] // Конспект лекций Интеллектуальные информационные системы – Номера страниц 11-14. – Режим доступа: http://files.lib.sfu-kras.ru/ebibl/umkd/228/u_lectures.pdf.
Веденский Ю.Д. Представление знаний - СПб.: Питер, 2009
Давиденко С.В. Сайт Искусственный интеллект [www.airportal.ru] // Модели знаний - Режим доступа: http://airportal.ru/model.htm
Карасев Я.В. Модели представления знаний - М.: Аморфа, 2008
Кладонова Е.В. Сайт «Искусственный интеллект» [www.hz-portal.ru] // . Модели представления знаний – Режим доступа: http://hz-portal/intellekt.html