Применение методов машинного обучения для анализа финансовых рынков

Солнцева Я.А. 1, Негребецкая В.И. 2

1Колледж коммерции, технологий и сервиса КГУ

2ФГБОУ ВО «Курский государственный университет», колледж коммерции, технологий и сервиса, ученая степень, звание

Работа в формате PDF

121.3 KB

Диплом участника Диплом победителя 3 степени за лучшую работу Диплом руководителя секции

Комментарии

Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Финансовые рынки являются одними из самых сложных и динамичных систем, характеризующихся высокой степенью неопределенности и нелинейности. Традиционные эконометрические и статистические методы анализа часто оказываются недостаточными для эффективного прогнозирования и принятия решений в таких условиях. В последние годы методы машинного обучения (МО) демонстрируют значительный потенциал в преобразовании подходов к анализу финансовых данных, предлагая новые возможности для прогнозирования цен, управления рисками, оптимизации портфелей и обнаружения аномалий. В настоящее время, несмотря на доступность традиционных методов технического и фундаментального анализа, большинство крупных финансовых институтов и хедж-фондов активно используют машинное обучение для принятия инвестиционных решений. Традиционные методы дополняют, но не заменяют полностью возможности ML-моделей.

Применение анализа временных рядов может быть полезно для многих областей, включая финансы, производство, социальные и экономические исследования, климатологию и другие. Конечно, важно понимать, что в процессе анализа временных рядов возможны некоторые трудности, поэтому следует уметь применять правильные методы и инструменты для получения корректных результатов [1].

Для прогнозирования финансовых кризисов используются различные методы машинного обучения, включая методы классификации [2].

Инвестирование на основе машинного обучения относится к использованию алгоритмов и статистических моделей для улучшения процесса принятия решений в управлении инвестициями. Оно использует силу данных для выявления закономерностей, прогнозирования рыночных тенденций и оптимизации распределения портфелей. Применяя методы машинного обучения, инвесторы могут анализировать огромные объемы данных гораздо быстрее, чем традиционные методы, что приводит к более обоснованным и стратегическим инвестиционным решениям [3].

Сегодня ни один крупный проект в области машинного обучения (ML) не обходится без фреймворков - готовых наборов библиотек, в которых базовые алгоритмы уже оптимизированы для различных архитектур. Выбор правильного фреймворка не только упрощает разработку, но и определяет успех проектов по внедрению искусственного интеллекта.

Рассмотрим наиболее актуальные фреймворки для машинного обучения.

Первые фреймворки используются для глубокого обучения. Они ориентированы на построение и обучение нейронных сетей, в том числе сложных архитектур, таких как свёрточные модели и трансформеры. Вторые фреймворки - применяются для классического машинного обучения. Они используются для работы с моделями, основанными на регрессии, решающих деревьях, методах ансамблирования (например, бустинг) и других алгоритмах без использования глубоких нейросетей.

Рисунок 1 - Архитектура web-приложений – Город

Представим краткую характеристику фреймворков для глубокого обучения.

1.Фреймворк PyTorch распространяется с открытым исходным кодом. Это фреймворк машинного обучения для языка Python, созданный на базе Torch.

Он известен своим интуитивно понятным API и императивным стилем программирования. В PyTorch используются динамические графы вычислений, что упрощает прототипирование и отладку моделей, что особенно важно в исследованиях.

В 2025 году PyTorch занимает первое место по популярности в России и второе в США и ЕС. Его динамический граф вычислений делает PyTorch любимцем исследователей, а поддержка облачных сервисов (например, Microsoft Azure) упрощает решение производственных задач. Недавние улучшения PyTorch включают в себя расширенные возможности распределённого обучения и интеграцию с облачными платформами.

PyTorch активно используется в задачах глубокого обучения, таких как компьютерное зрение, обработка естественного языка (NLP) и различные исследования в области ИИ. Его гибкость делает PyTorch идеальным для экспериментов с новыми архитектурами нейронных сетей.

Гибкость PyTorch делает его основой для мощных библиотек, таких как PyTorch Lightning и Fastai, которые упрощают разработку моделей глубокого обучения. Эти фреймворки созданы для ускорения рабочих процессов, минимизации рутинного кода и повышения доступности глубокого обучения как для исследователей, так и для бизнеса.

PyTorch Lightning - это обёртка над PyTorch, которая структурирует код и автоматизирует рутинные задачи, сохраняя гибкость базового фреймворка. Она стандартизирует процесс обучения моделей, разделяя исследовательскую логику (архитектура модели) от инженерной (циклы обучения, логирование, распределённое обучение). Это особенно полезно для команд, где исследователи хотят сосредоточиться на экспериментах, а инженеры — на масштабировании и других технических задачах.

PyTorch Lightning идеально подходит для R&D-команд, разрабатывающих сложные модели, например, для компьютерного зрения или NLP, где важна скорость выполнения экспериментов и воспроизводимость результатов.

2. Fastai - это высокоуровневая библиотека, построенная поверх PyTorch, ориентированная на простоту и быстрый старт. Она предлагает готовые решения для стандартных задач глубокого обучения, таких как классификация изображений или обработка текстов, с минимальным количеством кода. Fastai идеально подходит для молодых специалистов и бизнеса, которые хотят быстро внедрить ИИ без глубокого погружения в детали (рис. 2).

Рисунок 2 - Платформы глубокого обучения

Не каждая обученная модель будет работать правильно, например, предлагать вам действительно интересные посты в соцсетях. Для проверки используют кросс-валидацию в машинном обучении. Этот метод помогает оценить надежность модели и ее работу на новых данных.

Рассмотрим пример кросс-валидации. Представим, у нас есть данные о длине шерсти и хвостов у 50 кошек. Мы хотим научить ИИ определять породу животных по этим параметрам. Можно разделить данные на несколько частей, например на пять. Тогда первые 40 кошек будут использоваться для обучения (группы Train), а оставшиеся 10 — для контрольного теста (группа Test).

Этот процесс повторяется несколько раз, чтобы каждая из частей выступила и в роли и Train, и в роли Test. В конце выводится средняя оценка. Это помогает понять, как хорошо модель справляется с задачей, а также сравнить результаты нескольких моделей и выбрать лучшую.

Рисунок 3 - Деление данных на группы при кросс-валидации.

В настоящее время выделяют несколько типов перекрестной проверки.

1. Валидация на отложенных данных (Hold-Out Cross-Validation) - самый простой способ: данные делят на тренировочные и тестовые. Первые используются для обучения модели, а тестовые — для оценки K-блочная кросс-валидация (K-Fold Cross-Validation)

Данные делятся на несколько равных частей (К): одна используется для проверки, остальные — для обучения. Процесс повторяется столько раз, на сколько частей мы поделили данные. Каждый блок должен быть использован как тестовый набор.

После окончания обучения результаты тестов приводят к среднему значению. Это позволяет получить более надежную оценку производительности.

2. Стратифицированная K-блочная кросс-валидация (Stratified K-Fold Cross-Validation)

Проводится аналогично K-блочной кросс-валидации, но с учетом пропорции классов в каждом блоке. Используется, когда данные имеют несбалансированные классы. Например, 80% примеров относятся к классу A (кошки женского пола), а 20% — к классу B (коты мужского пола). Мы разбиваем данные на группы таким образом, чтобы каждый блок содержал одинаковое количество примеров каждого класса (8 кошек и 2 кота).

3. Оставить-P-выборок (Leave-P-Out Cross-Validation)

При этом типе валидации в каждой итерации из датасета удаляется P объектов для тестирования, например два, а остальные используются для обучения. Если P = 2, то 48 примеров мы используем для обучения, а 2 оставим для проверки. Процесс повторяется со всеми возможными комбинациями.

4. Кросс-валидация на временных рядах (Time Series Cross-Validation)

В отличие от обычной K-блочной кросс-валидации, где данные делятся случайным образом на обучающие и тестовые группы, здесь учитывается их временная структура. Например, график температуры в Москве с 1780 до 2025 года — на основе этих данных система может дать прогноз, какой будет погода в следующем году или через пять лет.

Главная сложность кросс-валидации на временных рядах в том, что данные не должны пересекаться по времени: тренировочные данные должны идти строго до тестовых. Например, чтобы оценить, как модель предскажет погоду на 2026 год, можно брать для обучения все данные с 1974 до 2025 год.

Таким образом, можно констатировать, что проблема переобучения и некорректной работы моделей на новых данных является одной из ключевых в машинном обучении. Представленный в статье метод кросс-валидации служит эффективным решением этой проблемы. Как было показано, он существует в различных формах — от простой валидации на отложенных данных до сложных методов, учитывающих временную структуру или дисбаланс классов. Объединяет их общая цель: не дать единичной «удачной» разбивке данных исказить реальную производительность алгоритма. Путем многократного обучения и тестирования на разных подмножествах с последующим усреднением результата кросс-валидация обеспечивает объективную и надежную оценку модели, что является критически важным шагом для выбора наилучшего алгоритма и его успешного практического применения.

Список литературы:

Анализ временных рядов [Электронный ресурс] URL: https://habr.com/ru/companies/otus/articles/732080/ (дата обращения: 19.11.2025).
Пантелеева А.И. Использование машинного обучения для прогнозирования финансовых кризисов и оценки системных рисков [Электронный ресурс] / URL: https://www.вестник-науки.рф/article/20741/ (дата обращения: 19.11.2025).
Инвестирование с использованием машинного обучения: стратегии ИИ, тенденции и рост портфеля [Электронный ресурс] / URL: https://docs.familiarize.com/ru/glossary/machine-learning-based-investing// (дата обращения: 19.11.2025).
Лучшие фреймворки для машинного обучения в 2025 году / Хабр [Электронный ресурс] / URL: https://habr.com/ru/companies/kryptonite/articles/950236/ (дата обращения: 19.11.2025).
Основы машинного обучения (machine learning) / Skillbox Media [Электронный ресурс] / URL: https://skillbox.ru/media/code/kak-ustroeno-mashinnoe-obuchenie-zadachi-algoritmy-i-vidy-machine-learning/ (дата обращения: 19.11.2025).
Что такое кросс-валидация: объясняем на примере котиков [Электронный ресурс] / URL: https://blog.skillfactory.ru/chto-takoe-kross-validatsiya/ (дата обращения: 19.11.2025).

Просмотров работы: 68

Код для цитирования:

XVIII Международная студенческая научная конференция Студенческий научный форум - 2026

Применение методов машинного обучения для анализа финансовых рынков

Студенческий научный форум - 2026
XVIII Международная студенческая научная конференция