На сегодняшний день проблемы автоматизированного обучения высококвалифицированных специалистов, в том числе и в области медицины, достаточно актуальны.
При обучении студентов-медиков диагностированию заболеваний возникают следующие основные проблемы:
формирование правильной логики рассуждений при диагностировании заболеваний;
большие расходы времени, труда и ресурсов на обучение одного специалиста.
Создание автоматизированной обучающей системы (АОС) поможет в решении указанных проблем и позволит повысить эффективность обучения.
Создание медицинской АОС, как правило, ведётся на основе существующей медицинской диагностической системы (МДС или MDS – medical diagnostic system). Такой подход позволяет использовать существующую базу знаний (БЗ) МДС, а не создавать новую специально для АОС.
В качестве основы создаваемой обучающей системы будет использована МДС, разрабатываемая сейчас в ГК «ИВС», с рабочим названием e-Aesculapius. e-Aesculapius является научной разработкой группы учёных: Ясницкого Л.Н., Думлера А.А., Богданова К.В., Черепанова Ф.М., Полещука А.Н., часть которой описана в работах [1], [2], [3].
Данная система диагностирует основные заболевания из следующих нозологических групп:
1) болезни системы кровообращения;
2) болезни органов пищеварения;
3) болезни эндокринной системы, расстройства питания и нарушения обмена веществ.
Здесь и далее под нозологической группой будет пониматься группа болезней, связанных с одной из систем человеческого организма (см. медицинские нозологические классификаторы, такие как МКБ-10).
E-Aesculapius диагностирует заболевания по составленным медиками-экспертами анкетам, которые включают в себя данные осмотра пациента, результаты анализов и другие параметры. На основании собранных данных МДС выдаёт предполагаемый диагноз пациента. Постановка диагноза происходит с использованием искусственных нейронных сетей (ИНС).
Целью работы является создание автоматизированной обучающей системы диагностики заболеваний, относящихся к различным нозологическим группам. Создаваемой АОС дано название e-MDS, что можно расшифровать как: medical diagnostic system for education.
Создаваемая система, помимо обучения студентов, сможет продемонстрировать поэтапную работу ИНС во время диагностики заболевания. Данные о работе сети можно будет сопоставить с логикой рассуждений врачей-экспертов, что позволит увеличить эффективность e-Aesculapius.
Далее в статье описан подход применяемый в разработке e-MDS и особенности использования нейросетевой базы знаний (БЗ).
Концепция построения e-MDSОсновная цель e-MDS – обучение диагностике заболеваний. Для обучения диагностике заболеваний обучаемому необходимо предоставить исходные данные, диагноз и промежуточные рассуждения, которые привели от исходных данных пациента к поставленному ему диагнозу. Исходные данные пациента есть в базе анкет, диагноз пациента выдаёт нейросеть из нейросетевой БЗ e-Aesculapius, поэтому основной задачей при построении e-MDS является получение рассуждений, которые привели к поставленному диагнозу.
За постановку диагноза отвечают нейросети из нейросетевой БЗ, описание используемых нейросетей можно получить из работ [1], [2], [3]. В нейросети знания о решении задачи представлены неявно в виде структуры нейросети, весов связей и активационных функций. Для получения объяснения необходимо каким-либо образом представить ход получения нейросетью конечного результата в виде, понятном пользователю.
Знания, представленные в нейросети, необходимо трансформировать в вид, понятный для человека, или в вид, пригодный для последующего построения объяснения на естественном языке. Знания, представленные в нейросети, можно преобразовать в набор продукционных правил. Такое преобразования возможно путём применения методов извлечения символьных правил. Большинство таких методов позволяют извлечь набор продукционных правил из тренированной нейронной сети.
Применив метод извлечения правил на нейросетях из нейросетевой БЗ, получим набор продукционных правил для каждой нейросети. Для целей работы извлечённые правила должны как можно точнее повторять ход работы нейросети. Следуя критериям классификации методов извлечения правил, описанных Alan B. Tickle, Robert Andrews и др. в статье [4], необходимо выбрать метод с максимальной верностью (fidelity) извлечённых правил нейросети, из которой их извлекли.
Извлечённые правила являются продукционной системой, но в ней все переменные, обозначенные просто символами, и не несут никакой семантической нагрузки, поэтому получить объяснения на понятном пользователю языке из такой системы нельзя. Для генерации объяснений на естественном языке предлагается использовать онтологию, состоящую из трёх частей:
1) онтология по анкетам, содержащая все вопросы, ответы из анкет по трём группам заболеваний;
2) онтология диагнозов, содержащая диагностируемые заболевания, группы заболеваний;
3) онтология нейросетевой БЗ e-Aesculapius, которая содержит онтологическое описание нейросетей с привязкой их входов и выходов к онтологии анкет и диагнозов.
Привязав понятия из онтологии к продукциям, полученным на предыдущем этапе, можно будет сгенерировать объяснение получения диагноза на естественном языке.
Всё вышеописанное является концепцией разрабатываемой системы и ещё предстоит проверить предположения на практике. Далее описана архитектура системы, построенная на основе описанной выше концепции.
Архитектура e-MDSE-MDS строится на основе МДС e-Aesculapius, поэтому e-MDS использует её нейросетевую базу знаний, базу фактов и компонент приобретения фактов. Здесь под базой фактов понимается база с заполненными анкетами пациентов, на этих анкетах были обучены нейросети e-Aesculapius.
Общая архитектура e-MDS представлена на рис. 1.
Рис. 1. Архитектура e-MDS
Как уже отмечалось в описании концепции, компонент объяснения работает на базе правил продукционного типа, извлечённых из нейросетевой БЗ, и связывает эти правила с онтологией для генерации объяснения на ЕЯ. Компонент хода обучения контролирует весь процесс обучения постановке диагнозов.
ЗаключениеВ статье описан общий подход к разработке e-MDS и дана укрупнённая архитектура разрабатываемой системы.
Заметим что в статье не было описано какой метод извлечения правил будет использован, дано только требование предъявляемое к такому методу. В общих чертах описан способом генерация объяснения с использованием онтологии. Вопрос о выборе метода и методике его применения к нейросетевой БЗ, а так же генерация объяснения с использованием онтологии являются предметом дальнейшего исследования в создании e-MDS.
Библиографический списокЯсницкий Л.Н., Думлер А.А., Полещук А.Н., Богданов К.В., Черепанов Ф.М. Нейросетевая система экспресс-диагностики сердечно-сосудистых заболеваний // Пермский медицинский журнал. – 2011. – №4. – С. 77-86.
Думлер А.А., Полещук А.Н., Маматова А.Ю., Богданов К.В., ЧерепановФ.М., Ясницкий Л.Н. Нейросетевая система дифференциальной диагностики сердечно-сосудистых заболеваний. – XVII Зимняя школа по механике сплошных сред. – Пермь, 2011. – С.104.
Думлер А.А., Полещук А.Н., Богданов К.В., Черепанов Ф.М., Ясницкий Л.Н. Опыт создания нейросетевой системы для диагностики сердечно-сосудистых заболеваний // Вестник Пермского университета. Математика. Механика. Информатика. Вып.1(5). Пермь: Изд. Пермского ун-та, 2011. – С.95-101.
Tickle Alan B., Andrew R., Golea M., DiedrichJ. The truth is in there: directions and challenges in extracting rules from trained artificial neural networks // IEEE Trans. Neural Networks, November 1998. – vol. 9, pp. 1057-1968.
5