ПРИМЕНЕНИЕ АЛГОРИТМА ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ ДЛЯ КЛАССИФИКАЦИИ СОСТОЯНИЯ СТРУКТУРЫ СЕНСОРНОЙ СЕТИ

Объедков Н.Ю. 1, Турута Е.Н. 1, Воронова Л.И. 1

1МТУСИ

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

В статье рассматривается вариант применения алгоритма машинного обучения для оценки состояния структуры сенсорной сети и приводится результат данного исследования на примере обучающего набора входных данных. Статья выполнена в рамках курсового проекта по дисциплине «Machine Learning. Обучающиеся технические системы».

Исследование функционирования сенсорной сети в сочетании с алгоритмами машинного обучения является одним из перспективных направлений в области информационных технологий.

Оценка состояния структуры сенсорной сети является важной задачей для формирования корректного представления о функционировании сенсорной сети на основе информации от датчиков. В условиях, когда возможны отказы узлов, данную задачу лучше всего исследовать алгоритмами бинарной классификации, одним из которых является алгоритм логистической регрессии.

Описание сенсорной сети

Сенсорная сеть – это распределенная сеть необслуживаемых электронных устройств (узлов сети), обменивающихся информацией по беспроводной связи и способных регистрировать данные о параметрах состояния окружающей среды (температура, влажность и т.д.) и передавать их на базовую станцию с помощью ретрансляции от узла к узлу[1]. Сенсорная сеть применяется в самых разных различных областях[2]:

мониторинг окружающей среды;
безопасность и оборона;
здравоохранение;
контроль грузопотоков;
мониторинг транспортных магистралей;

Узел сети, называемый сенсором, содержит датчик, воспринимающий данные от внешней среды, микроконтроллер, память, радиопередатчик, автономный источник питания. Под отказом узла понимается событие, приводящее к невозможности передачи через него информации с входящих каналов на исходящие.

Описание работы алгоритма логистической регрессии

Логистическая регрессия — это статистическая модель, используемая для предсказания вероятности возникновения того или иного события[3]. Последовательность работы данного алгоритма в упрощенном виде состоит из следующих этапов:

Инициализация переменных.
Вычисление функции стоимости.
Применение алгоритма градиентного спуска с использованием параметра регуляризации.
Построение границы решений.

Рассмотрим более подробно данный алгоритм машинного обучения[4]. Во всех задачах бинарной классификации переменная y, которую мы пытаемся предсказать, принимает два дискретных значения: 0 либо 1:

(1)

Функция гипотезы в данном случае должна удовлетворять следующему условию:

(2)

Этому условию соответствует функция сигмоиды, которая называется логистической функцией.

(3)

(4)

(5)

На рисунке 1 приведен график сигмоиды.

Рис. 1. График функции сигмоиды

Из графика видно, что функция отображает все вещественные числа в интервале (0, 1), что позволяет как нельзя лучше использовать эту функцию для решения задачи бинарной классификации.

Значение функции гипотезы h_θ при этом будет равно вероятности того, что результат равен единице.

(6)

Для того чтобы получить на выходе дискретные значения, а именно «0» или «1», функцию гипотезы необходимо интерпретировать следующим образом:

(7)

(8)

То есть при условии, что аргумент логистической функции больше или равен нулю, значение логистической функции будет больше или равно 0.5 (и наоборот):

(9)

А так как аргументом логистической функции будет являться произведение θ^Tx, то получается:

(10)

когда

Исходя из вышеописанного, можно утверждать, что:

(11)

(12)

Получаем, что границей решений называется линия, которая разделяет зоны, где y = 0 и где y = 1.

Функция стоимости для логистической регрессии имеет следующий вид:

(13)

(14)

(15)

На рис. 2. представлены графики функции стоимости логистической регрессии.

Рис. 2 Графики функции стоимости логистической регрессии

При реализации алгоритмов машинного обучения существует проблема переобучения, которая характеризуется высокой дисперсией. Одним из способов решения этой проблемы является применение регуляризации.

Функция стоимости с параметром регуляризации выглядит следующим образом:

(16)

Результат исследования

На рисунке 3 представлен пример обучающего набора для задачи классификации состояния части структуры сенсорной сети, которая содержит как исправные, так и неисправные узлы. По осям графика расположены характеристики, по которым определяется исправность/неисправность узла – это время датчика в активном состоянии (ось x, сек) и мощность радиопередатчика (ось y, Вт). Для математического моделирования была использована программа Octave (GUI)[5].

Рис. 3. Часть структуры сенсорной сети с исправными (0) и неисправными (1) узлами

Обладая таким набором входных данных, необходимо определить нелинейную границу решений, разделяющую исправные и неисправные узлы, для того, чтобы в дальнейшем оценить состояние структуры сенсорной сети в целом.

Рис. 4. Нелинейная граница решений для разделения исправных (y = 0) и неисправных (y = 1) узлов части структуры сенсорной сети

С помощью изменения значения параметра регуляризации можно добиться большей точности работы алгоритмы, как следствие, более точной границы решений между работающими и неработающими узлами. В таблице 1 приведены результаты выходного значения y при разных значениях элемента регуляризации λ.

Таблица 1

Результаты эксперимента точности работы алгоритма логистической регрессии при разных значениях λ

λ	y (P), %
0.001	92.631579
0.01	90.526316
0.1	91.578947
1	86.315789
10	67.368421

Заключение

В данной статье рассматривалось применение алгоритма логистической регрессии для классификации состояния сенсорной сети. Был проведен эксперимент в программе Octave (GUI) с примером обучающего набора, для которого была определена нелинейная граница решений для разделения исправных (0) и неисправных (1) узлов части структуры сенсорной сети. Кроме того, была исследована точность алгоритма при различных параметрах регуляризации λ.

Список использованных источников:

Турута Е.Н., Мочалов В.А. Проблемы проектирования отказоустойчивых сенсорных сетей.
Области применения сенсорных сетей

http://www.meshlogic.ru/application.html

Логистическая регрессия

https://ru.wikipedia.org/wiki/Логистическая_регрессия

Онлайн-курс по машинному обучению:

https://www.coursera.org/learn/machine-learning/

Официальный сайт программного обеспечения Octave (GUI): https://www.gnu.org/software/octave

Просмотров работы: 544

Код для цитирования:

IX Международная студенческая научная конференция Студенческий научный форум - 2017

ПРИМЕНЕНИЕ АЛГОРИТМА ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ ДЛЯ КЛАССИФИКАЦИИ СОСТОЯНИЯ СТРУКТУРЫ СЕНСОРНОЙ СЕТИ

Студенческий научный форум - 2017
IX Международная студенческая научная конференция