МАШИННОЕ ОБУЧЕНИЕ И ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ: АЛГОРИТМЫ И ПРИМЕНЕНИЕ - Студенческий научный форум

XVI Международная студенческая научная конференция Студенческий научный форум - 2024

МАШИННОЕ ОБУЧЕНИЕ И ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ: АЛГОРИТМЫ И ПРИМЕНЕНИЕ

Сидоров А.В. 1
1Московский политехнический университет, Коломенский институт
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Машинное обучение

Машинное обучение — это наука, изучающая алгоритмы и модели, которые позволяют компьютеру извлекать знания из данных, а затем использовать эти знания для прогнозирования или принятия решений. Одним из основных инструментов машинного обучения являются алгоритмы, которые позволяют автоматически определить закономерности в данных и создать модель, которая может использоваться для предсказания будущих событий или классификации объектов.

В основе большинства алгоритмов машинного обучения лежат математические и статистические методы. Например:

Алгоритмы регрессии

Используются для прогнозирования числовых значений.

Рассмотрим линейную регрессию. Если у нас есть последовательность из чисел 100 – 200 – 300 – 400 – 500 – 600, то регрессия легко определит последующее число, а именно 700.

Пример реализации линейной регрессии на языке C++ приведен на рис. 1 и рис.2..

Рис. 1. Подпрограмма vector алгоритма линейной регрессии

В программе, приведенной на рис. 2, определяются три функции:

mean() - для вычисления среднего значения вектора;

covariance() - для вычисления ковариации между двумя векторами;

linear_regression() - для вычисления коэффициентов линейной регрессии.

Рис. 2. Алгоритм линейной регрессии

Затем, в функции main(), задаются тренировочные данные x и y;

Вызывается функция linear_regression() для вычисления коэффициентов линейной регрессии. Коэффициенты выводятся на экран с помощью std::cout.

Для вычисления используем стандартное уравнение регрессии:

f (x) = b + m⋅x, где m — это наклон линии, а b — ее сдвиг по оси Y.

Данная регрессия применяется в анализе линейных данных и трендов, в работе с переменными, зависящими друг от друга линейно.

Логическая регрессия

Логическая регрессия – это простейший алгоритм из области статистики. У всех объектов есть состояние, которое описывается и управляется с помощью параметров. Регрессия такого типа делит эти объекты на два класса.

Пример реализации логической регрессии на языке С++ приведен на рис. 3.

Регрессионные модели записаны в виде формулы:

y=F (x1, x2, …, xn).

Рис. 3. Алгоритм логической регрессии

Такой тип регрессии имеет свои недостатки, например, она классифицирует только относительно простые объекты. Для разделения объектов на несколько классов не подходит.

Алгоритмы классификации

Алгоритмы классификации позволяют разделить объекты на группы или классы, а алгоритмы кластеризации помогают объединять сходные объекты в группы.

Байесовский классификатор

Алгоритм используется для определения класса, к которому относиться объект. Расчет вероятности лежит в основе этого алгоритма, а именно рассчитывается вероятность, с которой объект относится к тому или иному классу. Относится к статистике.

Рис. 4. Алгоритм Байесовского классификатора

В данном примере программа вычисляет вероятность принадлежности объекта к двум классам ("ClassA" и "ClassB") с использованием байесовского классификатора. Программа принимает два значения признаков от пользователя, вычисляет вероятности для каждого класса на основе заданных априорных вероятностей и введенных значений признаков, и предсказывает класс объекта с наивысшей вероятностью.

В соответствии с теоремой Байеса, вывод такого алгоритма исходит из формулы:

где P(y) – априорная вероятность появления класса y. P(x|y) – условная плотность распределения образов X для класса Y. P(x) – априорная вероятность значения признака.

Заключение:

Применение машинного обучения и вычислительных методов огромно. В медицине они используются для диагностики болезней и прогнозирования исходов лечения. Например, с помощью машинного обучения можно создать модель, которая будет предсказывать вероятность развития сердечно-сосудистых заболеваний у пациента на основе его медицинских данных. В финансовой сфере машинное обучение применяется для анализа рынка и прогнозирования цен на акции или валюты. В транспортной отрасли оно помогает оптимизировать маршруты доставки и управлять потоками транспорта.

Списоклитературы

1. ТреворДж. Х., РобертТ., Джером A. Ф. Элементыстатистическогообучения. – 2017. – URL: The Elements of Statistical Learning Data Mining, Inference, and Prediction (2nd edition) (12print 2017) by Trevor Hastie, Ro.. (vk.com) (Датаобращения: 26.01.2024).

2. КевинП. М. Машинноеобучение: вероятностнаяперспектива. – 2012. – URL: Machine Learning- A Probabilistic Perspective.pdf (vk.com) (Датаобращения: 26.01.2024).

Просмотров работы: 26