Актуальность данной работы заключается в возможности изучить структуру метода извлечения знаний «Мысли вслух», данную предметную область, попытаться ее структурировать, разработать приложение, автоматизирующее составленную формализованную методологию. Также данная работа актуальна, так как может быть использована в извлечении знаний эксперта по выбранной предметной области, позволяя определить каким образом эксперт пришел к тому или иному решению относительно поставленной задачи.
Практическая значимость полученных результатов заключается в возможности быстрого получения результатов вычислений метода извлечения знаний «Мысли вслух» и вывода по ним. Так как расчеты всех количественных значений метода извлечения знаний бывают затруднительными из-за большого количества математических операций, а выводы иногда трудно сделать из-за отсутствия наглядности результатов, пользователь часто может допускать ошибки, учитывая человеческий фактор. Учитывая вышеприведенное, имеет смысл реализовать программное средство, производящее все расчеты количественных значений и делающее выводы на основе результатов расчетов.
Объектом данной работы является анализ протоколов "мыслей вслух". Предметом данной работы является извлечение знаний методом анализа протоколов "мыслей вслух".
Для достижения поставленной цели необходимо знать предметную область, составить формализованную методику, реализовать по ней программное средство.
Протоколирование "мыслей вслух" заключается в том, что эксперта-специалиста просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, т.е. продемонстрировать всю цепочку рассуждений. Во время рассуждений специалиста все его слова, весь "поток сознания" протоколируется; при этом отмечаются даже паузы и междометия. Иногда этот метод называют "вербальные (словесные) отчеты".
Вопрос об использовании диктофонов является спорным, поскольку запись иногда действует на специалиста парализующе, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.
Основная трудность при протоколировании "мыслей вслух" состоит в том, что человеку принципиально сложно объяснить, как он думает. Существуют экспериментальные психологические доказательства того факта, что люди не всегда в состоянии достоверно описывать мыслительные процессы. Кроме того, некоторые знания, хранящиеся в невербальной форме, вообще слабо коррелируют с их словесным описанием.
Расшифровку полученных протоколов аналитик проводит самостоятельно с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное протоколирование "мыслей вслух" - один из наиболее эффективных методов, поскольку в нем эксперт может проявить себя максимально ярко, он ничем не скован, свободен в потоке собственных умозаключений и рассуждений.
Метод "мысли вслух" требует от аналитика тех же умений, что и метод наблюдений. Обычно "мысли вслух" дополняются потом одним из активных методов для реализации обратной связи.
Для извлечения знаний из эксперта в данной работе выбран метод анализа протоколов «мыслей вслух», так как данный метод позволяет понять каким образом эксперт пришел к данному решению, выстроить логическую цепочку его рассуждений.
В данной работе формализация происходит за счет выбора ключевых слов в высказываниях эксперта и построении на их основе логической цепочки, которая является основополагающей структурой образа мышления и состава методов принятия решений конкретного эксперта. Необходимо производить запрос данных от эксперта до тех пор, пока не будет получено достаточно ключевых слов на основе высказываний эксперта для составления удовлетворяющей принципу адекватности логической цепочки. Таким образом можно получить достаточно подробные алгоритмы работы в данной предметной области или достаточно подробное обоснование почему конкретный эксперт сформулировал имеющееся изначальное мнение по тому или иному вопросу или какой-либо задаче выбора, классификации или обозначенной проблеме.
В первую очередь происходит получение начальной гипотезы от эксперта, которая и будет являться его основным высказыванием, так как все дальнейшие его высказывания будут использоваться в качестве пояснения первоначального высказывания. Далее производится семантический анализ текста гипотезы, с его помощью оценивается текст, как набор семантических конструкций. После семантического анализа гипотезы представляется возможность выбрать ключевые слова и среди них выбрать главное слово относительно которого, эксперт должен дать пояснение своей гипотезе. Далее работает цикл до того момента как система не соберет достаточных сведений для построения логической цепочки. Данный цикл заключается в следующем: происходит запрос эксперту на пояснение выше сказанного, это может быть гипотеза или предыдущее пояснение, затем эксперт высказывает системе свое объяснение, после чего производится семантический анализ текста пояснения, после которого исполняется поиск ключевого слова методом аналогичным для первоначальной гипотезы.
Данное программное обеспечение было создано на языке программирования высокого уровня Python в качестве бота в мессенджере Telegram, в процессе разработки использовался фреймворк для распознавания речи Yandex SpeechKit, в качестве СУБД использовалась нереляционная СУБД MongoDB. Следует подробнее описать данный стек технологий.
Гипотезы, аргументы и логические цепочки экспертов хранятся в коллекциях в базе данных.
Рисунок 1 - База данных системы
Обработка голосовых сообщений, посылаемых боту происходит за счет слушателей событий, представленных в API. Получая такое голосовое сообщение программа передает его в соответствующий метод, где в первую очередь происходит преобразование аудиоданных в текстовые данные, затем с помощью семантического анализа происходит выбор ключевых слов, запись их в коллекции и на основании всех этих данных бот просит пользователя прокомментировать свои высказывания. Сохранение в базу данных происходит только в конце диалога, так как необходимо, чтобы записываемые высказывания были объединены в одну группу для построения отчета. Основной программный код приведен в приложении.
Полноценный набор из гипотезы и пояснений приведен ниже.
Капучино - лучший выбор.
Пояснения:
Этот напиток содержит молочные компоненты
А также сиропы
Например мятный или карамельный
Результат ввода гипотезы представлен на рисунке 2.
Рисунок 2 - Результат ввода гипотезы
Результат первого пояснения представлен на рисунке 3.
Рисунок 3 - Результат ввода первого пояснения
Результат ввода второго пояснения представлен на рисунке 4.
Рисунок 4 - Результат ввода второго пояснения
Результат ввода третьего пояснения и полученная логическая цепочка представлены на рисунке 5.
Рисунок 5 - Результат третьего пояснения и полученная логическая цепочка.
Получив несколько мнений экспертов можно сформировать полноценный отчет. Его можно получить отправив команду “/report” и ключевое слово, по которому необходим отчет. Пример отчета представлен на рисунке 6.
Рисунок 6 - Пример отчета
Результат обработки программой неразборчивого или не имеющего содержания сообщения представлен на рисунке 7.
Рисунок 7 - Результат обработки не имеющего смысла сообщения
Если было введено сообщение, которое невозможно распознать, то сеанс работы с экспертом однозначно завершается.
В данной работе были подробно описаны все этапы, которые необходимо реализовать на пути к получению программной системы – компьютерной реализации метода извлечения знаний «Мысли вслух». В дальнейшем данное приложение может быть использовано для оценки утверждений экспертов и их компетентности. В итоге было получено программное средство, выполняющее поставленные задачи, цель была достигнута.
Список использованных источников
Аверкин, А.Н. Толковый словарь по искусственному интеллекту / А.Н. Аверкин, М.Г. Гаазе-Рапопорт, Д.А. Поспелов - М.: Радио и связь, 1992.
Попов, Э.В. Искусственный интеллект: В 3 кн. Кн 1. Системы общения и экспертные системы: Справочник / Э.В. Попов - М.: Радио и связь, 2012.
Осипов, Г. С. Приобретение знаний интеллектуальными системами / Г.С. Осипов - М.: Наука, 1997.
Осуга, С. Обработка знаний: Пер. с яп / С. Осуга - М.: Мир, 1989.
Попов, Э.В. Экспертные системы / Э.В. Попов - М: Наука, 1987. - 288 с.
Хейес-Рот, Ф. Построение экспертных систем: Пер. с англ. / Под ред. Ф. Хейес-Рота, Д. Уотермена, Д. Лената. - М.: Мир, 2012.