ПРИМЕНЕНИЕ КОГНИТИВНОЙ ГРАФИКИ И МНОГОМЕРНЫХ МЕТОДОВ АНАЛИЗА МЕДИЦИНСКИХ ДАННЫХ - Студенческий научный форум

V Международная студенческая научная конференция Студенческий научный форум - 2013

ПРИМЕНЕНИЕ КОГНИТИВНОЙ ГРАФИКИ И МНОГОМЕРНЫХ МЕТОДОВ АНАЛИЗА МЕДИЦИНСКИХ ДАННЫХ

Осадчая И.А. 1
1Томский Политехнический Университет
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
СОДЕРЖАНИЕ

ВВЕДЕНИЕ 3

  1. ПОСТАНОВКА ЗАДАЧИ

    1. Содержательная постановка задачи 5

    2. Математическая постановка задачи 5

  2. ВИЗУАЛИЗАЦИЯ МНОГОМЕРНЫХ ДАННЫХ

    1. Проблемы визуализации многомерных данных 6

    2. Методы визуализации данных 6

      1. Традиционные методы визуализации 6

      2. Заполняющие пространство кривые 7

    3. Методы автоматического группирования 7

      1. Факторный анализ объектов 7

      2. Кластерный анализ 7

    4. Компьютерный анализ результатов психологических исследований 9

  3. ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИИ ВЫЧИСЛИТЕЛЬНОГО ЭКСПЕРИМЕНТА ПРИ РЕШЕНИИ ЗАДАЧИ

    1. Основные этапы технологии 10

    2. Технология визуализации экспериментальных количественных данных 10

  4. ОПИСАНИЕ ПРОГРАММНОЙ СРЕДЫ

    1. Краткое описание пакета «NovoSparkVisualizer» 12

    2. Методологические основы визуализации, применяемые в пакете «NovoSparkVisualizer» 13

    3. Функциональность пакета «NovoSparkVisualizer» 15

    4. Возможности пользовательского интерфейса 20

  5. РЕШЕНИЕ ЗАДАЧИ АНАЛИЗА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ С ПОМОЩЬЮ МЕТОДОВ ВИЗУАЛИЗАЦИИ

    1. Характеристика экспериментальных данных 22

    2. Технология визуализации на базе пакета «NovoSpark Visualizer» 24

  6. АНАЛИЗ РЕЗУЛЬТАТОВ

    1. Анализ структуры экспериментальных медицинских данных 27

    2. Анализ мотивационной сферы студентов 35

ЗАКЛЮЧЕНИЕ 40

СПИСОК ЛИТЕРАТУРЫ 41

ВВЕДЕНИЕ

Человеческая природа такова, что наше постижение мира, накопление знаний о нем, решение задач, возникающих перед человеком возможно двумя различными путями. Один из них позволяет работать с абстрактными цепочками символов, с текстами и т.п. Этот механизм мышления человеческого сознания обычно называют символическим, алгебраическим или логическим. Второй механизм мышления обеспечивает работу с чувственными образами и представлениями об этих образах. Его называют образным, геометрическим, интуитивным и т.п.

Стремление человека выразить мысль, передать идею в форме графического изображения можно отметить еще с самых ранних времен. Графические изображения (на камне, холсте, бумаге, металле и других средствах отображения информации) давно используются в обучении. Экран компьютера как средство пассивного отображения графики не обладает принципиальной новизной. Новой для сферы обучения является интерактивность компьютерной графики, благодаря которой в процессе анализа изображений существует возможность динамически управлять их содержанием, формой, размерами и цветом, рассматривать графические объекты с разных сторон, приближать и удалять их, менять характеристики освещенности и проделывать другие подобные манипуляции, добиваясь наибольшей наглядности. Таким образом, это возможность не только для пассивного созерцания графических иллюстраций, но и для активного исследования характеристик графических моделей изучаемых объектов или процессов.

Применение графики в исследовательских работах не только увеличивает скорость передачи информации и повышает уровень ее понимания, но и способствует развитию таких важных для специалиста любой отрасли качеств, как интуиция, образное мышление.

Воздействие интерактивной компьютерной графики (ИКГ) привело к возникновению нового направления в проблематике искусственного интеллекта, названного когнитивной (т.е. способствующей познанию) компьютерной графикой.

Когнитивная графика  это совокупность приемов и методов образного представления условий задачи, которое позволяет либо сразу увидеть решение, либо получить подсказку для его нахождения [1].

Использование когнитивной графики дает возможность пользователю, не анализируя большого количества информации сделать определенные выводы. Информация может быть представлена когнитивным образом: сектором, гистограммой, крестом, кругом и т.д., части, которых закрашены разными цветами и несут определенный смысл.

Отдельное направление когнитивная графика образует в слабоструктурированных проблемных областях, таких как социально-психологическая и медицинская. Визуализация текущего состояния и характерных особенностей позволяет обеспечить непрерывный контроль над состоянием групп лиц, либо отдельного человека.

В данной курсовой работе объектом исследования являются пациенты с различными типами бронхиальной астмы, а предметом - характерные особенности пациентов.

Целью данной работы является изучение возможностей применения методов когнитивной графики, при решении задачи исследования особенностей пациентов с четырьмя типами бронхиальной астмы.

  1. ПОСТАНОВКА ЗАДАЧИ

1.1. Содержательная постановка задачи

В результате работы исследователя возникает описание объекта. Каждый объект обладает некоторыми характеристиками. Такой объект можно описать в виде вектора n-порядка, где каждый его элемент есть некоторая числовая характеристика.

Обычно число объектов при описании системы измеряется сотнями, а число признаков десятками. Проанализировать данные, которые представлены числами очень трудно. Включение различных элементов визуализации, является хорошим способом представления информации.

Современные компьютерные технологии используют широкий спектр методов визуализации информации. Методы визуализации позволяют исследователю одним взглядом обнаружить особенности, выявить закономерности и аномалии в больших объемах информации.

Для достижения цели поставленной в курсовой работе необходимо применить различные методы визуализации для анализа структуры экспериментальных медицинских данных (на примере исследования физиологических особенностей пациентов с различными формами бронхиальной астмы).

1.2. Математическая постановка задачи

Имеется выборка Xi,j из n объектов, характеризующихся m переменными, где i  номер объекта, j  номер переменной (признака).

Задача заключается в анализе структуры экспериментальных многомерных медицинских данных на основе методов визуализации.

Для решения поставленной задачи необходимо проанализировать существующие подходы к анализу данных такого типа, выбрать способ его компьютерной реализации.

Вывод

Сформулирована содержательная и математическая постановка задачи для анализа структуры экспериментальных многомерных медицинских данных.

2. ВИЗУАЛИЗАЦИЯ МНОГОМЕРНЫХ ДАННЫХ

2.1. Проблемы визуализации многомерных данных

При анализе и прогнозировании социально-экономических явлений исследователь довольно часто сталкивается с многомерностью их описания. Это происходит при решении задачи сегментирования рынка, построении типологии стран по достаточно большому числу показателей, прогнозирования конъюнктуры рынка отдельных товаров, изучении и прогнозировании экономической депрессии и многих других проблем.

Традиционные инструменты в области визуализации (графики и диаграммы) плохо справляются со своей задачей, когда возникает необходимость изобразить более трех взаимосвязанных величин. Методы многомерного анализа  наиболее действенный количественный инструмент исследования социально-экономических процессов, описываемых большим числом характеристик [1]. К ним относятся кластерный анализ, таксономия, распознавание образов, факторный анализ.

2.2. Методы визуализации данных

2.2.1. Традиционные методы визуализации

Традиционными методами визуализации данных являются целенаправленное проецирование данных и многомерное шкалирование.

Один из способов поставить задачу представления данных в виде двумерной картинки заключается в следующем: найти такое отображение (способ проецирования) из исходного пространства на двумерную плоскость, которое бы оптимизировало заданный критерий качества – некоторый функционал от координат точек данных до и после процедуры проецирования. Такая постановка задачи лежит в основе совокупности подходов, объединяемых под названием целенаправленное проецирование (в зарубежной литературе – projecting pursuit) в пространство малой размерности.

Иногда исходная информация бывает изначально представлена не в виде таблицы типа «объект-признак», а в виде квадратной таблицы удаленностей объектов друг от друга. На пересечении i-ой строки и j-го столбца в такой таблице стоит оценка расстояний от i-го до j-го объекта. Такой вид представления информации характерен для психологических исследований, когда человеку предлагается оценивать сходство или различие в некоторой системе объектов или понятий.

Таким образом, изначально каждому объекту не сопоставляется никакой координаты в многомерном пространстве, и представить такую информацию в виде геометрической метафоры затруднительно. Задача многомерного шкалирования заключается в том, чтобы сконструировать распределение данных в пространстве таким образом, чтобы расстояния между объектами соответствовали исходно заданным в матрице удаленностей. Возникающие координатные оси могут быть интерпретированы как некоторые неявные факторы, значения которых определяют различия объектов между собой. Если попытаться сопоставить каждому объекту пару координат, то в результате мы получим способ визуализации данных [3].

2.2.2. Заполняющие пространство кривые

Суть данной группы методов состоит в заполнении пространства признаков гиперкривой таким образом, чтобы близкие в пространстве объекты оказались по возможности близкими и на этой кривой. Визуальному анализу подвергаются гистограммы распределений объектов на построенной гиперкривой. Весь процесс называется разверткой пространства признаков.

Главными свойствами отображений объектов на заполняющей пространство кривой (ЗПК) является взаимная однозначность, сходимость по разбиениям и квазинепрерывность.

2.3. Методы автоматического группирования

2.3.1. Факторный анализ объектов

При данном анализе объектов используется формальный аппарат факторного анализа, изначально предназначавшийся для агрегирования взаимосвязанных признаков. В факторном анализе объектов таблица экспериментальных данных поворачивается на 90º (транспонируется), то есть объекты и признаки меняются местами.

2.3.2. Кластерный анализ

Кластер (англ. cluster скопление)  объединение нескольких однородных элементов, которое может рассматриваться как самостоятельная единица, обладающая определёнными свойствами. Кластерный анализ наиболее ярко отражает черты многомерного анализа в классификации, факторный анализ в исследовании связи. Первое применение кластерный анализ нашел в социологии. Главное назначение кластерного анализа разбиение множества исследуемых объектов и признаков на однородные в соответствующем понимании группы или кластеры. Это означает, что решается задача классификации данных и выявления соответствующей структуры в ней. Методы кластерного анализа можно применять в самых различных случаях, даже в тех случаях, когда речь идет о простой группировке, в которой все сводится к образованию групп по количественному сходству [4]. Большое достоинство кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков.

Существует около 100 разных алгоритмов кластеризации, однако наиболее часто используемые: иерархический кластерный анализ и кластеризация методов k-средних.

Метод древовидной классификации  это пошаговый метод разбиения выборки на отдельные группы. Его принцип достаточно прост.

Шаг 1. Каждый объект признаётся единственным представителем своего кластера (типа). Количество типов равно объёму выборки.

Шаг 2. Находится несколько объектов, которые наиболее похожи на первого. Теперь эти объекты составляют один кластер. Количество кластеров уменьшается.

Шаг 3. Продолжаем искать кластеры, наиболее похожие друг на друга и объединять их. Теперь вся выборка разделена на некоторое количество групп, внутри которых объекты очень схожи по своим характеристикам. Это продолжается, пока объединение не закончится.

В отличие от древовидной классификации, метод k-средних разбивает всю выборку по заданным признакам на указанное количество кластеров. Таким образом, чтобы использовать этот метод нужно знать или предполагать сколько кластеров мы хотим иметь. Количество кластеров обычно определяется на основе анализа дендрограммы (рис.1).

Рис. 1. Древовидная диаграмма

2.4. Компьютерный анализ результатов психологических исследований

В настоящее время в исследованиях, связанных с изучением психологического состояния населения, широко используются различные математико-статистические методы обработки данных с применением современных информационных технологий.

Компьютерная обработка данных предполагает некоторое математическое преобразование данных с помощью определенных программных средств. Для этого необходимо иметь представление как о математических методах обработки данных, так и о соответствующих программных средствах [5].

На данный момент существует множество различных пакетов, предназначенных для анализа экспериментальных данных в различных областях человеческой деятельности. Наиболее известными являются компьютерные системы SAS, SPSS, SYSTAT, Minitab, Statgraphics (зарубежные). В России популярны пакеты Statistica/W и STADIA.

Использование компьютера для обработки данных делает достаточно сложные методы анализа данных более доступными и наглядными. Поэтому исследователю остается в основном творческая работа: постановка задач, выбор методов их решения, интерпретация полученных результатов, выработка предложений и управленческих решений.

В данной работе был использован пакет «NovoSparkVisualizer», основы работы с которым изложены в разделе 4.

  1. ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИИ ВЫЧИСЛИТЕЛЬНОГО ЭКСПЕРИМЕНТА ПРИ РЕШЕНИИ ЗАДАЧИ

    1. Основные этапы технологии

Вычислительный эксперимент состоит из 2 фаз и нескольких этапов.

Первая фаза: калибровка (настройка) модели.

1) Анализ изучаемых процессов, явлений, систем. Для данной задачи на этапе анализа произведен обзор литературных источников в изучаемой области, сформулирована содержательная постановка задачи.

2) Выбор и анализ выбранной модели. Выбранная математическая модель решения задачи не имеет явных ограничений.

3) Подготовка и загрузка экспериментальных данных.

4) Использование реализованных в пакете «NovoSpark Visualizer» методов визуализации данных.

5) Обработка, анализ данных, интерпретация результатов. Используя программу «NovoSpark Visualizer», можно визуализировать экспериментальные данные.

Вторая фаза – прогнозирование с помощью математической модели.

6) Прогнозное исследование математической модели в заданной области параметров.

  1.  
    1. Технология визуализации экспериментальных количественных данных

Информационная технология – это совокупность четко определенных действий целенаправленных на получение информации нового качества (информационного продукта). Под информацией в данном случае понимаются сведения об объектах, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Основной целью любой информационной технологии является получение адекватной информации для ее анализа исследователем и принятия на его основе какого-либо решения. Адекватность должна выражаться в трех формах: синтаксической, семантической, прагматической. На синтаксическом уровне учитывается способ представления информации. Семантический аспект предполагает учет смыслового содержания информации. Прагматическая адекватность отражает ценность (полезность) полученной информации при принятии того или иного решения.

Кроме того, со смысловым содержанием (семантикой) и прагматикой связано понятие полноты информации. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений [6].

Основные компоненты информационной технологии (ИТ) условно можно представить в виде схемы, состоящей из блоков:

  • подготовка и ввод данных;

  • анализ входной информации;

  • вывод итоговой информации для пользователей;

  • обратная связь – это информация, переработанная пользователем или специалистами для коррекции входной информации.

Освоение информационной технологии и дальнейшее ее использование сводится к тому, что пользователь должен сначала хорошо овладеть набором элементарных операций, число которых ограничено. Из этого ограниченного числа элементарных операций в разных комбинациях составляется действие, а из действий, также в разных комбинациях, составляются операции, которые определяют тот или иной технологический этап.

Для реализации этапов технологического процесса используется инструментарий ИТ, представленный разными программными продуктами.

Информационная технология, как и любая другая, должна отвечать следующим требованиям: обеспечивать высокую степень расчленения всего процесса обработки информации на этапы (фазы), операции, действия; включать весь набор элементов, необходимых для достижения поставленной цели; быть доступной для понимания специалиста некомпьютерной области [7].

4. ОПИСАНИЕ ПРОГРАММНОЙ СРЕДЫ

4.1. Краткое описание системы «NovoSparkVisualizer»

В настоящее время на рынке программных продуктов появился современный инструмент визуализации «NovoSparkVisualizer», позволяющий производить качественный анализ многомерных данных на графическом образе. Визуальный анализ может сыграть важную роль в любом научном эксперименте, особенно там, где необходима быстрая оценка главных аспектов набора данных.

Интуитивный пользовательский интерфейс пакета представляет собой удобную оболочку для работы со сложными наборами многомерных данных и изучения их свойств и взаимозависимостей. Продукт позволяет визуально сравнивать отдельные наблюдения или целые наборы данных. Данные могут быть созданы внутри аппликации, либо импортированы из множества источников, включая текстовые файлы со значениями, разделенными запятой или другими разделителями, а также текстовые файлы с фиксированной шириной столбцов, базы данных MicrosoftAccess. Инструментом поддерживаются все стандартные операции редактирования, позволяющие группировать исходные данные по нескольким критериям и изучать их поведение.

Пакет предназначен для визуализации многомерных данных, отображаемых из n-мерного пространства переменных в двумерные (2D) или трехмерные (3D) геометрические места точек (проекции), именуемые визуализированными графическими образами, которые образуют соответствующие им ментальные ассоциаты в мозгу человека, являющиеся, по свой сути, визуальными когнитивными образами.

Основной идеей визуализационного подхода, является представление каждого многомерного наблюдения в виде двумерной кривой. В этом случае, если два наблюдения близки по значениям, их кривые будут очень похожи друг на друга, в то время как если наблюдения отличаются сильно, то и кривые будут очень отличаться. Возможность представить образ в трехмерном пространстве позволяет смотреть на него с разных позиций [8].

4.2. Методологические основы визуализации, применяемые в пакете «NovoSparkVisualizer»

Основной идеей визуализационного подхода является линейное преобразование значений многомерного наблюдения А в двумерную кривую fA(t), т.е. AfA(t). В этом случае, если два наблюдения A и B близки по значениям, их образы-кривые fA(t), fB(t)будут очень похожи друг на друга, в то время как если наблюдения отличаются сильно, то и образы-кривые будут значительно отличаться [2].

Образы двух 7-ми мерных наблюдений A = {1, 2, 3, 4, 5, 6, 7} и B = {0, 3, 2, 5, 4, 7, 6} показаны на рис. 2 ниже:

     

Образ наблюдения AfA(t)

Образ наблюдения B↔ fB(t)

Образы наблюдений A и B: fA(t) и fB(t)

Рис. 2. Двумерные образы многомерных наблюдений

В пакете «NovoSparkVisualizer» реализован подход, предложенный Воловоденко В.А. [2].

Предполагаемый подход позволяет провести визуализацию основных линейных конструкций: отрезок, ломаная линия, симплекс в многомерных пространствах. В рассматриваемом случае наиболее общей формой представления данных является вектор конечномерного пространства Rn:

. (1)

Для перехода от данного вектора к визуальному образу будет использоваться базис ортонормированных функций . В качестве такого базиса можно использовать известные функции, в частности ортонормированные полиномы Лежандра на отрезке [0,1], множество которых мы обозначим через. В таком случае точке с координатами можно поставить в соответствие функцию

. (2)

Разница между формулами (1) и (2) заключается в том, что для вектора А из (1) возможно только аналитическое представление, в то время как для функции возможно представление в виде графика этой функции. График функции  это структура, которая допускает визуальное представление на отрезке [0,1]. Между (1) и (2) устанавливается однозначная связь в обе стороны, т.е. взаимнооднозначная связь [9]. Если ввести в рассмотрение второй вектор

.

то ему ставится в соответствие функция

.

Будем считать, что функции и являются визуальными образами точек А и В, принадлежащих пространству Rn(рис. 3).

Если с векторами А и В связать точки их концов, а начала векторов разместить в начале координат пространства Rn, то получается взаимнооднозначная связь между точками пространства Rn и функциями-образами и (рис. 4).

Рис. 3. Визуальные образы точек А и В, принадлежащих пространству Rn

Рис. 4. Условно представление прямой L, проходящей через точки А и В в пространстве Rn

Введем переменную Z и образуем линейное выражение

. (3)

Очевидно:

С(0) = А и С(1) = В.

Эта возможность дает право на рассмотрение функции С(z), как функции представляющей многомерную прямую линию, проходящую через точки А и В в пространстве Rn.

Следовательно, мы можем рассматривать выражение аналогичное (3) для представления отрезка АВ:

, . (4)

Из выражения (4) следует, что можно образовать функцию

. (5)

Обратим внимание, что эта функция будет зависеть от двух аргументов . Это очень важно, так как дает возможность получения графика функции , который является визуальным образом отрезка АВ (рис. 5). Таким образом, получается, что на квадрате [0,1]×[0,1] можно построить гладкую поверхность по формуле (5), которая будет однозначно соответствовать аналитическому выражению (4), представляющему многомерный отрезок АВ.

Рис. 5. Визуальное представление поверхности, соответствующей отрезку АВ.

4.3. Функциональность пакета «NovoSparkVisualizer»

Пакет «NovoSpark Vizualizer» имеет следующие способы использования:

- Визуализация данных.

- Идентификация кластеров данных.

- Сравнение наблюдений.

- Сравнение наборов данных.

- Поиск выбросов.

- Наблюдение за процессом.

Рассмотрим способы, использованные в работе:

Визуализация данных

Иногда, для быстрой оценки основных аспектов нового набора данных, достаточно только одного взгляда на его визуальное представление.

Рис. 6. Визуализация данных

Идентификация кластеров данных

Если определен критерий сортировки данных, то на основе этого можно визуализировать кластеры данных.

Следующие два образа демонстрируют, как кластеры могут выглядеть в трехмерном виде и двумерном горизонтальном виде сверху.

Рис. 7. Кластеры в трехмерном виде

Рис. 8. Кластеры в двумерном горизонтальном виде сверху

Сравнение наблюдений

Для сравнения индивидуальных наблюдений можно использовать их "спектральное" представление, которое подчеркивает отличительные характеристики каждой кривой и помогает более детально исследовать их визуальные свойства. Цветная палитра акцентирует уровни изменения значений кривых. Производя воображаемое растяжение кривых вдоль Z-оси и глядя сверху на результат этой операции, можно получить цветные полоски, представляющие собой спектр каждого наблюдения [2].

Рис. 9. «Спектры» многомерных наблюдений

Образ внизу представляет собой пример визуализации медицинских показателей пяти пациентов в спектральном виде.

Рис. 10. Спектральное сравнение наблюдений

Импорт данных из внешнего источника

Аппликация позволят импортировать табличные данные из текстового файла или базы данных, поддерживая разнообразные форматы данных.

Поскольку в нашем случае медицинские данные представлены в таблицах Microsoft Excel, преобразуем их в текстовые файлы (рис. 11-13).

Рис. 11. Фрагмент таблицы данных, отображающих динамику показателей функции легких

Рис. 12. Фрагмент таблицы фоновых значений показателей функции легких

Рис. 13. Фрагмент таблицы показателей функции легких после психотерапевтического воздействия

Программа предоставляет интуитивный интерфейс для выбора источника данных и предварительного просмотра результатов импорта. Несколько файлов или таблиц баз данных могут быть импортированы в один и тот же проект.

Создание нового набора данных

В качестве альтернативы можно ввести данные вручную, например, если внешний источник данных не существует или не доступен для чтения. Новый набор данных будет автоматически приведен к структуре таблиц, уже загруженных в тот же проект.

Редактирование данных

Продукт поддерживает все виды редактирования данных, предоставляя возможность экспериментировать с ними и смотреть, как изменения в данных влияют на их визуальное представление. Таким образом возможно не только построить любую выборку внутри аппликации, но и посмотреть, как образ этой выборки меняется в соответствии с изменениями, показывая поведение данных в различных сценариях.

Специализированный пакет прикладных программ «NovoSparkVisualizer» обладает рядом достоинств: сравнительно невысокой стоимостью, развитым интерактивным инструментарием динамической визуализации многомерных данных и удобным интерфейсом по обработке визуализированной информации. Исходя из выше сказанного, можно сделать вывод, что «NovoSparkVisualizer» оптимально подходит для решения функциональных задач [8].

4.4. Возможности пользовательского интерфейса

Пользовательский интерфейс пакета «NovoSparkVisualizer» состоит из следующих частей:

  1. Главное меню.

Содержит полный набор команд, которые могут вызываться внутри аппликации.

  1. Панель инструментов.

Обеспечивает быстрый доступ к наиболее часто используемым командам в окне проекта.

  1. Рабочая область.

Содержит визуальное представление наборов данных, загруженных в проект.

  1. Таблица данных.

Содержит исходные данные, а также параметры прорисовки для одного набора. В каждом проекте может быть одно и более окон данных.

  1. Строка состояния.

Показывает текущий статус главного окна и характеристики данных, загруженных в текущий проект.

  1. Область задач, панель «представления».

Включает элементы манипуляции установками образа и всего проекта.

Данные предметной области представляются в пакете «NovoSparkVisualizer» в виде таблицы.

Расположение любой из частей можно менять, изменяя размер, перемещая, пряча или состыковывая их к любому краю главного окна. Область образа при этом будет сжиматься или расширяться соответственно, занимая оставшуюся часть в пределах рамки окна.

Рис. 14. Интерфейс пакета «NovoSparkVisualizer»

5. РЕШЕНИЕ ЗАДАЧИ АНАЛИЗА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ С ПОМОЩЬЮ МЕТОДОВ ВИЗУАЛИЗАЦИИ

5.1. Характеристика экспериментальных данных

В качестве исходной информации имеем сведения о пациентах с четырьмя типами бронхиальной астмы:

BANP – Бронхиальная астма непсихогенная

BASP – Бронхиальная астма сомато-психогенная

BAPI – Бронхиальная астма психогенно индуцированная

PD – Психогенная одышка.

Бронхиальная астма (греч. asthma – удушье) – болезнь, при которой у больных наблюдается приступы экспираторного удушья различной тяжести [10]. Бронхиальная астма может возникать под воздействием целого ряда внешних и внутренних причин.

Основными факторами, провоцирующими приступы, являются: шерсть животных (в т.ч. кошек и собак), пыль в матрасах и подушках, пыль при подметании, пыльца деревьев и цветов, пищевые продукты (в т.ч. мандарины, шоколад и т.д.), сильные запахи (в т.ч. запахи духов, распыляющихся лаков), пыльца деревьев и цветов, сигаретный дым, переохлаждение и простуда.

Астма может начаться в любом возрасте. У подавляющего большинства больных можно выявить наследственную предрасположенность к астме.

Так как бронхиальная астма – хроническое заболевание, то требует долговременного лечения. При правильно подобранной терапии страдающие астмой люди могут вести нормальный активный образ жизни, работать и заниматься спортом, а женщины – рожать.

Большинство больных бронхиальной астмой страдают психогенными приступами удушья. Такие приступы возникают, как правило, при сильных эмоциях страха или гнева. Тяжелые стрессовые ситуации, скорее всего, могут вызвать непродолжительную ремиссию бронхиальной астмы. В свою очередь хронические психотравмы в большинстве случаев попросту ухудшают её течение [10].

Часто cоматические нарушения представляют собой психофизиологическое сопровождение имеющихся у больных эмоциональных нарушений с обнаружением содержательной связи расстройств функции той или иной соматической системы с психогенией. Учитывая возможность искажения профиля личности, определяемого ретроспективно, уже в процессе болезни, следует, вместе с тем, позитивно оценивать эти данные для лучшего понимания клинических проявлений болезни, особенностей ее течения, характера нервно-психических расстройств, сопутствующих соматическому страданию, установления прогноза, построения лечебно-реабилитационных программ.

Нельзя считать безупречными и данные, получаемые в проспективных исследованиях. Помимо трудностей выполнения исследований чисто технического порядка, в течение многих лет наблюдения личность испытуемого не остается неизменной — меняются система ее отношений, установки, потребности, мотивы, что следует иметь в виду при анализе результатов наблюдения.

Одной из причин возникновения различных соматических заболеваний могут быть психические факторы. Важной группой таких факторов являются негативные эмоции. Эмоции оказывают влияние на: иммунную систему; гормональное состояние; периферическую физиологическую активацию (например, частоту сердцебиений и артериальное давление) [11].

Мы будем исследовать физиологические реакции бронхолегочной системы в ответ на психофизиологическое воздействие (АВС). Технология получения экспериментальных данных подробно изложена в [12].

Индекс - условное обозначение динамики изменения (степени изменения) показателей до и после воздействия (1- до, 2- после воздействия АВС) по формуле: (V2-V1/V1).

Ниже даются индексы – динамика показателей функции легких (вентиляции легких и механики дыхания) до (1) и после (2) АВС (аудиовизуальной стимуляции мозга).

  1. И-МОД – индекс Минутного объема дыхания

  2. И-ЖЕЛ – индекс Жизненной Емкости Легких

  3. И-ФЖЕЛ – индекс Форсированной ЖЕЛ

  4. И-ОФВ1 – индекс Объема Форсированного Выдоха за 1 секунду

  5. И-ОФВ1/ЖЕЛ – индекс ОФВ1/ЖЕЛ

  6. И-МВЛ – индекс Максимальной Вентиляции Легких

  7. И-ПОС – индекс Пиковой Объемной Скорости выдоха

  8. И-МОС25 – индекс Максимальной Объемной Скорости выдоха на уровне 25% ФЖЕЛ

  9. И-МОС50 – индекс Максимальной Объемной Скорости выдоха на уровне 50% ФЖЕЛ

  10. И-МОС75 – индекс Максимальной Объемной Скорости выдоха на уровне 75% ФЖЕЛ

  11. И-Cdyn –индекс динамической растяжимости (С) легких

  12. И-Cstat – индекс статической растяжимости С) легких

  13. И-Rвд — индекс бронхиального сопротивления на вдохе

  14. И-Rвыд – индекс бронхиального сопротивления на выдохе

  15. И-Wобщ – индекс общей работы дыхания

  16. И-Wуд – индекс удельной работы дыхания

  17. И-Wн.эл – индекс неэластической фракции общей работы дыхания

  18. И-Wэл – индекс эластической фракции общей работы дыхания

  19. И-W МОД10 – индекс общей работы дыхания при МОД10

  20. И-W МОД15 – индекс общей работы дыхания при МОД15

  21. И-W МВЛобщ – индекс общей работы дыхания при МВЛ

  22. И-W МВЛуд – индекс общей работы дыхания при МВЛ

5.2. Технология визуализации на базе пакета

«NovoSparkVisualizer»

В технологии визуализации исходных данных по реальным объектам можно выделить несколько основных этапов:

  1. Сформируем функционально полную совокупность исходных данных.

Для загрузки данных настраиваем нужный формат источника:

Рис. 15. Импортирование данных

  1. Разобьем исходные данные на кластеры. Для этого воспользуемся методом k-средних.

Метод k-средних – наиболее популярный метод кластеризации. Он разбивает множество элементов векторного пространства на заранее известное число кластеров k. Действие алгоритма таково, что он стремится минимизировать дисперсию на точках каждого кластера:

,

где k – число кластеров, – полученные кластеры, i= 1,2,..,k и – центры масс векторов .

Основная идея заключается в том, что на каждой итерации перевычисляется центр масс для каждого кластера, полученного на предыдущем шаге, затем векторы разбиваются на кластеры вновь в соответствии с тем, какой из новых центров оказался ближе к выбранной метрике. Алгоритм завершается, когда на какой-то итерации не происходит изменения кластеров [4].

Рис. 16. Кластерная структура кластеризации методом k-средних

3) Сравним выборочные данные представителей всех 4-х форм заболевания по визуальной близости спектров наблюдений.

Рис. 17. Спектральное представление 5-ти пациентов с диагнозом BAPI

Рис. 18. Спектральное представление 5-ти пациентов с диагнозом BASP

Рис. 19. Спектральное представление 5-ти пациентов с диагнозом BANP

Рис. 20. Спектральное представление 5-ти пациентов с диагнозом PD

Каждая цветная полоска в спектральном виде соответствует показателям одного пациента. На каждом образе представлено по пять полосок, соответственно представляющих пять представителей из определенной группы . Цветовые схемы пациентов с диагнозом BAPI и пациентов с диагнозом PD схожи. Тоже можно сказать и о пациентах с диагнозом BASP и BANP.

Как видно из рисунков, наиболее близкие показатели имеют люди с BASP и PD. Наиболее выраженные различия можно заметить у пациентов с BAPI.

Таким образом, использование средств когнитивной графики позволило выявить некоторые неизвестные ранее закономерности физиологические реакции бронхолегочной системы в ответ на психофизиологическое воздействие.

6. АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ

6.1. Анализ структуры экспериментальных медицинских

данных

1. В результате кластерного анализа иерархическим методом было выделено 4 кластера.

Таблица 1- Распределение пациентов с различными формами бронхиальной астмы по выделенным кластерам

 

1кластер

2кластер

3кластер

4кластер

BANP

1

5

15

8

BASP

3

6

5

4

BAPI

8

14

2

0

PD

1

0

6

5

В 1-м кластере преимущественно оказались пациенты с диагнозом психогенно индуцированной бронхиальной астмой (БА), а также 3 человека с сомато-психогенной БА,1 с непсихогенной БА и 1 с психогенной отдышкой.

Во второй кластер преимущественно попали также больные психогенно индуцированной бронхиальной астмой, 6 человек с диагнозом сомато-психогенной бронхиальной астмы и 5 человек с непсихогенной астмой.

Третий кластер объединил преимущественно людей с диагнозом непсихогенной бронхиальной астмы. Также сюда попали 2 человека психогенно индуцированной астмой, 5 человек с сомато-психогенной астмой и 6 людей с психогенной отдышкой.

В четвертом кластере также преимущественно оказались люди с непсихогенной бронхиальной астмой. А также 4 с сомато-психогенной БА и пятеро с психогенной отдышкой.

Рис. 21. Структура полученных кластеров

Рис. 22. Диаграмма присутствия пациентов каждого типа БА

в 1-м кластере

Рис. 23. Диаграмма присутствия пациентов каждого типа БА

во 2-м кластере

Рис. 24. Диаграмма присутствия пациентов каждого типа БА

в 3-м кластере

Рис. 25. Диаграмма присутствия пациентов каждого типа БА

в 4-м кластере

В таблицах и на диаграммах представлены данные о структуре полученных кластеров.

В результате кластерного анализа методом k-средних было выделено также 4 кластера, центроиды которых представлены в табл. 2. В данной таблице желтым цветом выделены значения, соответствующие положительной динамике показателей вентиляции легких и механики дыхания.

Таблица 2 - Центроиды кластеров

Кластер

И-МОД

И-ЖЕЛ

И-ФЖЕЛ

И-ОФВ1

И-ОФВ1/ЖЕЛ

И-МВЛ

1

-0,0875

0,0111

0,11107

0,1429

0,1046

0,0757

2

-0,084

0,005

0,002

0,011

0,013

0,0015

3

-0,1008

0,1315

0,1738

0,2892

0,1469

0,2862

4

-0,045

0,045

0,305

0,445

0,4

0,12

Продолжение таблицы 2

Кластер

И-ПОС

И-МОС25

И-МОС50

И-МОС75

И-Cdyn

И-Cstat

1

0,1539

0,1346

0,1432

0,1114

0,0954

-0,0279

2

-0,0263

-0,005

0,0168

-0,0253

-0,0395

-0,033

3

0,3815

0,3846

0,3362

0,3308

0,2215

0,0831

4

0,275

0,35

0,355

0,44

0,335

0, 34

Продолжение таблицы 2

Кластер

И-Rвд

И-Rвыд

И-Wобщ

И-Wуд

И-Wн.эл

И-Wэл

1

-0,2754

-0,3207

-0,3739

-0,3032

-0,3418

-0,0929

2

0,003

-0,0248

0,022

0,084

0,04

0,0855

3

-0,3538

-0,3931

-0,3777

-0,3531

-0,3838

-0,3846

4

-0,455

-0,565

-0,09

-0,105

-0,18

-0,045

Окончание таблицы 2

Кластер

И-W МОД10

И-W МОД15

И-WМВЛобщ

И-WМВЛуд

1

-0,2721

-0,2893

0,2129

0,0696

2

0,0273

0,0313

0,185

0,2273

3

-0,4431

-0,4269

0,2631

-0,0169

4

-0,21

-0,11

0,92

1,065

Рис. 26. График центроидов кластеров

На основе анализа результатов, представленных в табл. 3 и на рис. 26 можно сделать вывод о том, что на пациентов 1, 3 и 4 кластеров аудивизуальная стимуляция мозга оказывает аналогичное воздействие – улучшаются значения показателей вентиляции легких и механики дыхания. При этом для первого кластера улучшение значений показателей вентиляции легких менее выражено, чем для третьего кластера. Улучшение статической растяжимости легких (показатель И-Cstat) характерно только для 4 кластера.

Для пациентов, попавших во 2 кластер аудивизуальная стимуляция практически не оказывает никакого воздействия на изменение показателейвентиляции легких и механики легких.

Таблица 3 - Распределение пациентов с различными формами бронхиальной астмы по выделенным кластерам

 

1кластер

2кластер

3кластер

4кластер

BANP

6

21

0

2

BASP

3

6

7

2

BAPI

14

1

7

2

PD

1

8

2

1

В первый кластер попали люди с психогенно индуцированной астмой и по несколько представителей каждого заболевания.

Во втором кластере при разделении методом к-средних преимущественно оказались пациенты с непсихогенной бронхиальной астмой и практически все пациенты с психогенной отдышкой.

В третьем кластере оказались люди с психогенно индуцированной и сомато-психогенной БА.

И, наконец, в четвертом оказалось поровну представителей каждого из заболеваний.

Таким образом, на основе проведенного анализа можно сделать вывод о том, что применение аудиовизуальной стимуляции мозга наименее эффективно для пациентов с диагнозами BANP и PD, наиболее эффективно - для пациентов с диагнозом BAPI. Для пациентов с диагнозом BASP – общей тенденции не выявлено.

Рис. 27. Структура полученных кластеров

Рис. 28. Диаграмма присутствия пациентов каждого типа БА

в 1-м кластере

Рис. 29. Диаграмма присутствия пациентов каждого типа БА

во 2-м кластере

Рис. 30. Диаграмма присутствия пациентов каждого типа БА

в 3-м кластере

Рис. 31. Диаграмма присутствия пациентов каждого типа БА

в 4-м кластере

6.2. Анализ мотивационной сферы студентов

Применение кластерного анализа довольно разнообразно. Данный метод многомерного анализа применим во многих слабоструктурированных сферах. В качестве примера проведем кластерный анализ мотивационной сферы студентов.

Рассмотрим мотивационные проявления на примере экспериментальной выборки, состоящей из трех групп студентов:

  1. студенты гуманитарного факультета ТПУ;

  2. бизнес-инкубатор ТПУ;

  3. студенты-психологи ТГПУ.

Показатели мотивационного профиля:

П  поддержание жизнеобеспечения; К  комфорт; С  социальный статус; О  общение; Д  общая активность; ДР  творческая активность; ОД  общественная полезность.

В результате кластерного анализа методом k-средних было вы-делено 4 кластера, характеристики которых представлены в таблице 4.

Таблица 4 - Центроиды кластеров

Кластер

П

К

С

О

Д

ДР

ОД

1

10,5311

14,1563

24,3438

21,3281

7,59375

17,7969

-0,75

2

17

20,4091

32,8182

28

17,5455

23,5455

13,8636

3

3,16129

4,29032

11,0161

11,7742

-0,83871

8,51613

-5,41935

4

25

41

55

42

30

38,5

25,5

Очевидно, что людей находящихся в том или ином кластере объединяют отличительные характеристики. Первый кластер объединил студентов, имеющих высокие мотивы общения и социального статуса, а также довольно низкий показатель общественной полезности. В эту группу вошли студенты гуманитарного факультета и студенты-психологи.

Второй кластер объединил творчески активных студентов, имеющих высокие показатели мотива поддержания жизнеобеспечения и социального статуса, а также студентов, стремящихся к общению. В эту группу вошли студенты бизнес-инкубатора ТПУ.

Третий кластер объединил студентов, имеющих самые низкие показатели общей активности и общественной полезности. В данную группу попали представители каждой из групп.

В четвертом кластере оказался студент из первой группы, имеющий высокие показатели по каждой характеристике.

Рис. 32. График центроидов кластеров

Таблица 5 -Количественное присутствие студентов группы в кластере

 

1кластер

2кластер

3кластер

4кластер

1группа

13

8

6

1

2группа

6

1

9

0

3группа

5

0

11

0

4группа

7

2

5

0

Студенты 2 и 3 групп попали преимущественно в 3 кластер, т.е. для них характерны отрицательные значения показателей общественной активности (Д) и общественной полезности (ОД), т.е. неспособность к планомерной учебной деятельности и нежелание принимать участие в общественной жизни.

Студенты 1 и 4 групп оказались преимущественно в 1-м кластере, что говорит о большом стремлении к общению и желании повысить свой социальный статус.

Рис. 33. Диаграмма присутствия каждой из групп в 1-м кластере

Рис. 34. Диаграмма присутствия каждой из групп во 2-м кластере

Рис. 35. Диаграмма присутствия каждой из групп в 3-м кластере

Рис. 36. Диаграмма присутствия каждой из групп в 4-м кластере

В таблицах и на диаграммах представлены данные о структуре полученных кластеров.

Анализ полученных результатов показал, что в первый кластер попали студенты из всех групп, т.е. его характеристики можно условно считать типичным мотивационным профилем для студентов 3 – 5 курсов.

В соответствии с методикой «Мотивационный профиль личности» существует 4 типа мотивационных профилей:

1 – прогрессивный

2 – регрессивный

3 – импульсивный

4 – уплощенный

Как видно из графика центроидов кластеров, в нашем случае наблюдается только импульсивный тип мотивационного профиля. При этом структура мотивов во всех кластерах одинакова – наиболее выраженными являются мотивы С и О, наименее выраженными – мотивы Д и ОД.

ЗАКЛЮЧЕНИЕ

В результате выполнения курсовой работы изучены методы анализа многомерных данных (кластерный анализ и методы визуализации). С использованием данных методов решена прикладная задача:

  • выявлена эффективность применения аудиовизуальной стимуляции мозга для пациентов с различными формами бронхиальной астмы.

Произведено сравнение результатов классификации объектов численно-аналитическим методом, процедурой сравнения по качественным хроматическим признакам и методами кластерного анализа.

Применение средств визуализации в процедурах принятия решений повышает уровень их понимания, делает результаты более наглядными и аргументированными.

В настоящее время авторами ведутся исследования по поиску других областей применения визуализации в данной системе.

Материалы работы обсуждались на IX Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии»; на VIII Международной конференции студентов и молодых ученых «Перспективы развития фундаментальных наук» и на VIII Всероссийской научно-практической конференции «Технологии Microsoft в теории и практике программирования».

Работа выполнена при финансовой поддержке РГНФ, проект № 12-06-12057в

СПИСОК ЛИТЕРАТУРЫ

1. Зенкин А.А. Когнитивная компьютерная графика/ Под ред. Д.А. Поспелова. – М.: Наука, 1991. – 187 с.

2. Воловоденко В.А. Визуализация и анализ многомерных данных с использованием пакета «NovoSpark Visualizer». [Электронный ресурс]. – Режим доступа: http://www.tsu.ru/storage/iro/k020410/s4/s4.doc

3. Зиновьев А.Ю. Визуализация многомерных данных / Издательство КГТУ, 2000. – 180 с.

4. Соловов А.В. Когнитивная компьютерная графика в инженерном образовании / Высшее образование в России, 1998. С. 90-96.

5. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика. – М.: Эдиториал УРСС, 2002. – 352 с.

6. Берестнева О.Г., Лебедев А.Н., Муратова Е.А. Компьютерная психодиагностика: Учебное пособие. – Томск: Издательство ТПУ, 2005. – 155 c.

7. Татур Ю.Г. Компетентность в структуре модели качества подготовки специалистов // Высшее образование сегодня. – 2004. – № 3. – С. 20–26.

8. Официальный сайт компании NovoSpark. [Электронный ресурс]. – Режим доступа: http://www.novospark.com

9. Шаропин К.А., Берестнева О.Г., Шкатова Г.И. Визуализация результатов экспериментальных исследований// Известия Томского политехнического университета. – 2010 – Т.316, - №5. – С. 172 – 176. (23970287)

10. Бронхиальная астма. [Электронный ресурс]. –

Режим доступа: http://www.candidoz.ru/allergologiya/astma.html

11. Медико-психологические аспекты психосоматических соотношений в исследованиях отечественных авторов последнего периода. [Электронный ресурс]. – Режим доступа: http://psibook.com/17/20.html

12. Немеров Е.В., Языков К.Г. К вопросу изучения личностных свойств в психофизиологической реактивности больных бронхиальной астмой на аудиовизуальную стимуляцию // Вестник ТГПУ. – 2011. – Вып. 6 (108). – С. 134 – 137.

Просмотров работы: 4382