Исследование функционирования сенсорной сети в сочетании с алгоритмами машинного обучения является одним из перспективных направлений в области информационных технологий.
Оценка состояния структуры сенсорной сети является важной задачей для формирования корректного представления о функционировании сенсорной сети на основе информации от датчиков. В условиях, когда возможны отказы узлов, данную задачу лучше всего исследовать алгоритмами бинарной классификации, одним из которых является алгоритм логистической регрессии.
Описание сенсорной сети
Сенсорная сеть – это распределенная сеть необслуживаемых электронных устройств (узлов сети), обменивающихся информацией по беспроводной связи и способных регистрировать данные о параметрах состояния окружающей среды (температура, влажность и т.д.) и передавать их на базовую станцию с помощью ретрансляции от узла к узлу[1]. Сенсорная сеть применяется в самых разных различных областях[2]:
мониторинг окружающей среды;
безопасность и оборона;
здравоохранение;
контроль грузопотоков;
мониторинг транспортных магистралей;
Узел сети, называемый сенсором, содержит датчик, воспринимающий данные от внешней среды, микроконтроллер, память, радиопередатчик, автономный источник питания. Под отказом узла понимается событие, приводящее к невозможности передачи через него информации с входящих каналов на исходящие.
Описание работы алгоритма логистической регрессии
Логистическая регрессия — это статистическая модель, используемая для предсказания вероятности возникновения того или иного события[3]. Последовательность работы данного алгоритма в упрощенном виде состоит из следующих этапов:
Инициализация переменных.
Вычисление функции стоимости.
Применение алгоритма градиентного спуска с использованием параметра регуляризации.
Построение границы решений.
Рассмотрим более подробно данный алгоритм машинного обучения[4]. Во всех задачах бинарной классификации переменная y, которую мы пытаемся предсказать, принимает два дискретных значения: 0 либо 1:
|
(1) |
Функция гипотезы в данном случае должна удовлетворять следующему условию:
|
(2) |
Этому условию соответствует функция сигмоиды, которая называется логистической функцией.
|
(3) (4) (5) |
На рисунке 1 приведен график сигмоиды.
Рис. 1. График функции сигмоиды
Из графика видно, что функция отображает все вещественные числа в интервале (0, 1), что позволяет как нельзя лучше использовать эту функцию для решения задачи бинарной классификации.
Значение функции гипотезы hθ при этом будет равно вероятности того, что результат равен единице.
|
(6) |
Для того чтобы получить на выходе дискретные значения, а именно «0» или «1», функцию гипотезы необходимо интерпретировать следующим образом:
|
(7) (8) |
То есть при условии, что аргумент логистической функции больше или равен нулю, значение логистической функции будет больше или равно 0.5 (и наоборот):
|
(9) |
А так как аргументом логистической функции будет являться произведение θTx, то получается:
|
, |
(10) |
когда
Исходя из вышеописанного, можно утверждать, что:
|
(11) (12) |
Получаем, что границей решений называется линия, которая разделяет зоны, где y = 0 и где y = 1.
Функция стоимости для логистической регрессии имеет следующий вид:
|
(13) (14) (15) |
На рис. 2. представлены графики функции стоимости логистической регрессии.
Рис. 2 Графики функции стоимости логистической регрессии
При реализации алгоритмов машинного обучения существует проблема переобучения, которая характеризуется высокой дисперсией. Одним из способов решения этой проблемы является применение регуляризации.
Функция стоимости с параметром регуляризации выглядит следующим образом:
|
(16) |
Результат исследования
На рисунке 3 представлен пример обучающего набора для задачи классификации состояния части структуры сенсорной сети, которая содержит как исправные, так и неисправные узлы. По осям графика расположены характеристики, по которым определяется исправность/неисправность узла – это время датчика в активном состоянии (ось x, сек) и мощность радиопередатчика (ось y, Вт). Для математического моделирования была использована программа Octave (GUI)[5].
Рис. 3. Часть структуры сенсорной сети с исправными (0) и неисправными (1) узлами
Обладая таким набором входных данных, необходимо определить нелинейную границу решений, разделяющую исправные и неисправные узлы, для того, чтобы в дальнейшем оценить состояние структуры сенсорной сети в целом.
Рис. 4. Нелинейная граница решений для разделения исправных (y = 0) и неисправных (y = 1) узлов части структуры сенсорной сети
С помощью изменения значения параметра регуляризации можно добиться большей точности работы алгоритмы, как следствие, более точной границы решений между работающими и неработающими узлами. В таблице 1 приведены результаты выходного значения y при разных значениях элемента регуляризации λ.
Таблица 1
Результаты эксперимента точности работы алгоритма логистической регрессии при разных значениях λ
|
λ |
y (P), % |
|
0.001 |
92.631579 |
|
0.01 |
90.526316 |
|
0.1 |
91.578947 |
|
1 |
86.315789 |
|
10 |
67.368421 |
Заключение
В данной статье рассматривалось применение алгоритма логистической регрессии для классификации состояния сенсорной сети. Был проведен эксперимент в программе Octave (GUI) с примером обучающего набора, для которого была определена нелинейная граница решений для разделения исправных (0) и неисправных (1) узлов части структуры сенсорной сети. Кроме того, была исследована точность алгоритма при различных параметрах регуляризации λ.
Список использованных источников:
Турута Е.Н., Мочалов В.А. Проблемы проектирования отказоустойчивых сенсорных сетей.
Области применения сенсорных сетей
http://www.meshlogic.ru/application.html
Логистическая регрессия
https://ru.wikipedia.org/wiki/Логистическая_регрессия
Онлайн-курс по машинному обучению:
https://www.coursera.org/learn/machine-learning/
Официальный сайт программного обеспечения Octave (GUI): https://www.gnu.org/software/octave