Алгоритмы машинного обучения для прогнозирования пассажиропотока и динамической корректировки графика пригородных поездов - Студенческий научный форум

XVIII Международная студенческая научная конференция Студенческий научный форум - 2026

Алгоритмы машинного обучения для прогнозирования пассажиропотока и динамической корректировки графика пригородных поездов

 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF

Управление пригородными железнодорожными перевозками представляет собой уникальную задачу оперативного менеджмента, характеризующуюся экстремально высокой волатильностью спроса, жесткими ограничениями по пропускной способности инфраструктуры и высочайшими стандартами ожиданий пассажиров в отношении частоты и пунктуальности. Традиционные системы управления, основанные на статичном расписании, составленном по усредненным историческим данным, оказываются неспособны адекватно реагировать на ежедневные, почасовые и даже минутные колебания пассажиропотока, что приводит к известным проблемам: «поезда-переполнения» в часы пик и неоправданно низкая загрузка в межпиковое время, снижение комфорта и безопасности, неэффективное использование ресурсов перевозчика. Выход из этого положения лежит в переходе к адаптивной, data-driven модели управления, где решения о корректировке графика принимаются не по календарному плану, а на основе точного прогноза спроса. Именно здесь на первый план выходят алгоритмы машинного обучения, способные выявлять сложные, нелинейные зависимости в огромных массивах исторических и текущих данных.

Исходные данные для прогнозирования пассажиропотока в пригородном сообщении носят ярко выраженный пространственно-временной характер. Временной ряд — это объемы проходов через турникеты или посадок-высадок на каждой станции с детализацией до минуты. Эти ряды обладают множеством вложенных сезонностей: суточной (утренний/вечерний пик), недельной (будни/выходные), годовой (сезон отпусков, дачный сезон). Однако ключевой особенностью являются пространственные зависимости: поток на одной станции напрямую зависит от прибытия поезда с пассажирами, севших на предыдущих станциях, то есть формируются OD-матрицы (origin-destination). На эти базовые закономерности накладывается мощное влияние внешних факторов, которые и создают основную «шумную» составляющую, неподвластную классическим методам: погодные условия (дождь, снегопад, жара), календарные события (праздники, концерты, матчи), состояние городской транспортной сети (пробки на дорогах, сбои в метро), социально-экономические факторы. Таким образом, задача прогнозирования — это не экстраполяция одного временного ряда, а многомерная регрессия, где необходимо одновременно моделировать десятки и сотни взаимосвязанных рядов с учетом контекста.

Арсенал алгоритмов машинного обучения для решения этой задачи прошел значительную эволюцию. Начальной точкой служат классические статистические модели временных рядов, такие как SARIMAX (Seasonal AutoRegressive Integrated Moving Average with eXogenous factors), которые хорошо интерпретируемы и эффективны для рядов с четкой сезонностью, но часто не справляются с нелинейностью и большим количеством экзогенных переменных. Переломным моментом стало широкое применение алгоритмов градиентного бустинга над деревьями решений — XGBoost, LightGBM и особенно CatBoost, который эффективно работает с категориальными данными (названия станций, дни недели, тип события). Эти модели быстро обучаются, показывают высокую точность, способны ранжировать важность сотен признаков (например, выявляя, что температура воздуха или факт футбольного матча влияют на поток сильнее, чем день недели) и относительно устойчивы к выбросам. Однако их слабость — в ограниченной способности улавливать длинные последовательные зависимости во времени. Этот барьер преодолевают архитектуры глубокого обучения, в первую очередь рекуррентные нейронные сети (RNN), и их специализированные модификации — долгая краткосрочная память (LSTM) и управляемые рекуррентные блоки (GRU). Они спроектированы для работы с последовательностями, идеально подходят для временных рядов и могут «запоминать» долгосрочные паттерны. Наиболее перспективными являются гибридные и пространственно-временные модели. Например, конволюционные LSTM (ConvLSTM) объединяют способность сверточных сетей (CNN) выделять локальные пространственные паттерны (группу соседних станций) с возможностями LSTM работать со временем. Еще более мощный инструмент — графовые нейронные сети (GNN), которые представляют железнодорожную сеть в виде графа, где станции — узлы, а перегоны — ребра. GNN могут напрямую моделировать распространение пассажиропотока по сети, учитывая топологию и пропускную способность участков, что принципиально важно для точного прогнозирования нагрузки на конечные станции и пересадочные узлы.

Однако точный прогноз — это лишь половина решения. Его истинная ценность раскрывается при интеграции в систему динамической корректировки графика. Эта задача формулируется как задача оптимизации с ограничениями. Целевая функция, как правило, направлена на минимизацию суммарного времени ожидания пассажиров (или максимизацию соответствия предложения спросу) при соблюдении комплекса жестких ограничений: минимальные и максимальные интервалы между поездами (исходя из системы автоблокировки и безопасности), время оборота составов, доступность бригад и подвижного состава, пропускная способность станционных путей для отстоя и скрещения. Мягкие ограничения могут включать в себя плавность изменения расписания (чтобы избежать хаотичной отмены и добавления рейсов), энергоэффективность, равномерность нагрузки на инфраструктуру. Прогноз пассажиропотока от модели МО на горизонте 1-4 часа поступает на вход решателя (солвера) оптимизационной задачи. Современные подходы используют для этого как классические методы (линейное и целочисленное программирование), так и методы, основанные на машинном обучении, например, обучение с подкреплением (Reinforcement Learning, RL). Агент RL может быть обучен в симуляторе (цифровом двойнике пригородной сети) выбирать такие действия (добавить дополнительный рейс, отменить малонаполненный, изменить вместимость состава), которые максимизируют долгосрочное вознаграждение, учитывающее и удовлетворенность пассажиров, и эксплуатационные затраты.

Внедрение таких систем в реальный контур управления сопряжено с рядом критических проблем. Первая — latency (задержка). Весь цикл должен укладываться в считанные минуты, чтобы реакция была релевантной. Это требует edge-вычислений и высокопроизводительных солверов. Вторая — переобучение на редкие, но значимые события (например, внезапный ливень или крупная авария на дороге). Модель, обученная на «типичных» данных, может их игнорировать. Решение — использование аномалий в реальных данных как триггера для переключения на запасной, более консервативный сценарий управления. Третья, и, возможно, главная для диспетчера, — недостаток объяснимости (Explainable AI, XAI). Система не может просто выдать предписание «отменить рейс № 1234». Она должна показать, на основании какого прогноза низкой нагрузки (с визуализацией) и в угоду какой глобальной цели (например, высвобождение состава для усиления следующего переполненного рейса) это решение принято. Только так можно обеспечить доверие человека и сохранить за ним роль лица, принимающего окончательное решение.

Практические пилотные проекты внедрения подобных систем в метрополитенах и пригородных сетях мегаполисов показывают обнадеживающие результаты. Точность краткосрочных прогнозов пассажиропотока повышается на 20-30% по сравнению с традиционными методами. Это позволяет перейти от реактивного управления к упреждающему: не ждать, пока поезд переполнится, а за 30-40 минут до формирования пика выпустить на линию дополнительный состав или назначить остановку скорого поезда на ключевой станции. В итоге достигается синергетический эффект: пассажиры получают более комфортные условия и меньшее время ожидания, а перевозчик — более равномерную загрузку, снижение пиковых нагрузок на инфраструктуру и персонал, экономию энергоресурсов за счет сокращения «холостых» пробегов. Таким образом, алгоритмы машинного обучения трансформируют пригородные перевозки из системы, функционирующей по заранее заданному, жесткому шаблону, в адаптивную, живую и отзывчивую экосистему, способную подстраиваться под реальные потребности города и его жителей в режиме реального времени.

Список литературы

  1. Боков, А. С. Прогнозирование пассажиропотока на городском транспорте с использованием методов глубокого обучения / А. С. Боков, Д. И. Новиков // Транспортные системы и технологии. — 2022. — Т. 8, № 3. — С. 56–73.

  2. Грушин, В. В. Адаптивные системы управления движением поездов на основе данных / В. В. Грушин, М. К. Смирнов. — М.: Транспорт, 2021. — 311 с.

  3. Данные в логистике и управлении перевозками: от Big Data к Smart Data / Под ред. Л. А. Броневича. — СПб.: Питер, 2020. — 409 с.

  4. Капустин, Н. В. Применение графовых нейронных сетей для моделирования пассажиропотока в транспортных сетях / Н. В. Капустин // Искусственный интеллект и принятие решений. — 2023. — № 1. — С. 45–59.

  5. Методы машинного обучения для оптимизации расписания движения поездов / Отв. ред. П. С. Федоров. — М.: ИНФРА-М, 2022. — 267 с.

  6. Отраслевой стандарт. Методика сбора и обработки данных о пассажиропотоке на железнодорожном транспорте. — М.: ВНИИЖТ, 2021.

  7. Прохоров, С. А. Обучение с подкреплением в задачах оперативного управления транспортом / С. А. Прохоров // Информационные технологии в моделировании и управлении. — 2022. — № 4(15). — С. 112–125.

Просмотров работы: 0