Возможности адаптации в системе пересказа текста на естественном языке

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

В последнее время появляется много систем для реферирования текста [1], а также публикаций по этим темам. В большинстве из них нет возможности изменить алгоритм работы системы без программиста. Это требуется для того, чтобы

1. Иметь возможность вносить эвристики экспертом предметной области, на основе которых получаем внутреннее представление на естественном языке (ЕЯ).

2. Унифицировано представлять метазнания и знания семантической сетью.

3. Получать возможность записи эвристик в виде продукций.

Следовательно, надо создать механизм, при котором эксперт предметной области смог работать с системой и изменять её работу без внесения изменений в программный код. С этой целью была проведена интеграция трех систем: систем пересказа текста на естественном языке (ТЕЯ) NLPRu, редактора семантической сети SemNetEditor и продукционной оболочки ProductShell. В данной системе применяется когнитивный подход, основанный на методах инженерии знаний, в частности, подход, позволяющий по результатам анализа ТЕЯ, на основе определенных эвристик получить внутреннее представление смысла ТЕЯ («извлечь из формы содержание»). На внутреннем уровне системы представление смысла ТЕЯ организовано в виде падежных рамок Филлмора [2], которые генерируются автоматически на основе эвристических правил.

На этом этапе развития системы будем применять интеграцию к механизму логического вывода, который используется для генерации пересказа текста. Исследуется упрощенный метод, который в дальнейшем будет усложнен и применен к построению семантической сети. Упрощение заключается в том, что пересказ будет строиться в виде ответов на вопросы. Таким образом, можно будет проверить жизнеспособность этого метода.

Одно из средств адаптации системы - использование метазнаний и метаправил. Метазнания описываются с помощью падежной рамки «объект-свойство-значение», объектом которой является системный объект. Свойствами объекта будут: «падеж» и «тип вопроса». Значения свойства «падеж»: «агент», «реципиент», «локатив», «действие». Значения свойства «тип вопроса»: «кто», «что», «чего», «где», «с кем», «кому», «о ком», «о чем», «что сделал», «что делал». При задании новой падежной рамки «объект-свойство-значение», объектом которого является системный объект, свойства и значения передаются в продукционную оболочку и свойство становится доменом, а значение - значением домена. При добавлении правил или редактировании их в продукционной оболочке они будут применяться при механизме логического вывода на семантической сети на основе метода пересечений.

В данном примере переменная «известен» и «ответ» типа «падеж» (домен). Переменная «известен» интерпретируется как известный падеж в заданном вопросе, а переменная «ответ» - тот падеж, который будет ответом на вопрос. Переменная «тип вопроса» имеет соответствующий домен и интерпретируется как тип вопроса, который был задан. Кроме того, порядок правил значим, что позволяет разрешить многозначность вопроса при генерации ответа, т.к. один вопрос тип вопроса может быть задан к разным «падежам» падежной рамки.

В данной задаче использование метазнаний упрощает процесс создания системы и повышает уровень адаптируемости системы. Интеграция трех систем позволяет использовать возможности каждой системы с максимуму. В дальнейшем планируется проведения интеграции систем и для описания правил построения семантической сети по результатам морфологического анализа.

Просмотров работы: 0

Код для цитирования:

III Международная студенческая научная конференция Студенческий научный форум - 2011

Возможности адаптации в системе пересказа текста на естественном языке

Студенческий научный форум - 2011
III Международная студенческая научная конференция