Модель и метод оценки весовых коэффициентов ансамбля машинного обучения в задаче прогнозирования провозной платы железнодорожных грузовых перевозок
Работая с сайтом, я даю свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта обрабатывается системой Яндекс.Метрика
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Модель и метод оценки весовых коэффициентов ансамбля машинного обучения в задаче прогнозирования провозной платы железнодорожных грузовых перевозок

Бухарова К.А. 

УДК 004.852
DOI: 10.26102/2310-6018/2026.52.1.005

  • Аннотация
  • Список литературы
  • Об авторах

Настоящая статья посвящена вопросу оценки эффективности разработанной ансамблевой модели машинного обучения, применяемой для прогнозирования провозной платы на железнодорожном транспорте. В качестве эмпирической базы использованы данные ОАО «РЖД» за трехлетний период, включающие порядка 50 миллионов записей о грузовых перевозках. Такой массив обеспечивает репрезентативность выборки и позволяет учитывать отраслевое разнообразие данных. На основе алгоритмов Random Forest, XGBoost, LightGBM и CatBoost разработана ансамблевая модель, метауровень которой реализован в виде многомерной линейной регрессии. Для вычисления весовых коэффициентов применены метод наименьших квадратов и регуляризация Тихонова. Данный подход позволил стабилизировать решение и снизить влияние коррелированных выходов базовых моделей. Результаты вычислительных экспериментов показали, что объединение разнородных моделей в ансамбль обеспечивает повышение точности прогнозирования по сравнению с отдельными алгоритмами. Средняя абсолютная ошибка снизилась на 7–13 %, а средняя абсолютная процентная ошибка на 6–12 %, при этом коэффициент детерминации увеличился до 0,942. Дополнительно проведена оценка устойчивости ансамбля методом скользящего окна, что позволило определить горизонты прогнозирования, при которых сохраняется стабильность результатов. Расширенный анализ поведения ансамбля при варьировании входных признаков показал, что модель демонстрирует устойчивость к умеренным искажениям данных и сохраняет высокую воспроизводимость расчетов. Полученные результаты подтверждают практическую значимость предложенного подхода для задач транспортной аналитики, планирования перевозочного процесса и формирования экономически обоснованной тарифной политики.

1. Загидуллин Р.Р., Хайбуллин А.Н. Прогнозирование транспортной загруженности с использованием методов машинного обучения. Транспорт и информационные технологии. 2025;15(2):202–216. https://doi.org/10.12731/2227-930X-2025-15-2-347

2. Побирченко В.Р., Побирченко В.В. Теоретические аспекты моделирования социально-экономического развития региона. Ученые записки Крымского федерального университета имени В.И. Вернадского. Экономика и управление. 2025;11(2):170–182.

3. Вегера Ж.Г. Применение генеративного искусственного интеллекта (ИИ) для анализа образовательных данных и прогнозирования академической успеваемости студентов. Управление образованием: теория и практика. 2024;14(8-1):116–125. https://doi.org/10.25726/j2473-1350-7803-t

4. Zhou Zh.-H. Ensemble Methods: Foundations and Algorithms. New York: Chapman & Hall/CRC; 2012. 236 p. https://doi.org/10.1201/b12207

5. Hyndman R.J., Athanasopoulos G. Forecasting: Principles and Practice. Melbourne: OTexts; 2021. 442 p.

6. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. New York: Springer; 2009. 745 p. https://doi.org/10.1007/978-0-387-84858-7

7. Zhang Yu., Ma J., Liang Sh., Li X., Liu J. A Stacking Ensemble Algorithm for Improving the Biases of Forest Aboveground Biomass Estimations from Multiple Remotely Sensed Datasets. GIScience & Remote Sensing. 2022;59(1):234–249. https://doi.org/10.1080/15481603.2021.2023842

8. Рукомин М.А. Обзор ансамблевых моделей предиктивной аналитики и их сравнение с традиционными ML-подходами. Вестник науки. 2025;1(8):368–373.

9. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. Москва: Наука; 1979. 288 с.

10. Харитонова А.Е. Прогнозирование налоговой нагрузки сельскохозяйственных предприятий методами машинного обучения. Налоги и налогообложение. 2023;(4):28–38. https://doi.org/10.7256/2454-065X.2023.4.43917

Бухарова Ксения Алексеевна

Петербургский государственный университет путей сообщения Императора Александра I

Санкт-Петербург, Российская Федерация

Ключевые слова: машинное обучение, ансамблевые модели, регуляризация Тихонова, метод наименьших квадратов, точность модели, устойчивость модели, железнодорожный транспорт

Для цитирования: Бухарова К.А. Модель и метод оценки весовых коэффициентов ансамбля машинного обучения в задаче прогнозирования провозной платы железнодорожных грузовых перевозок. Моделирование, оптимизация и информационные технологии. 2026;14(1). URL: https://moitvivt.ru/ru/journal/pdf?id=2123 DOI: 10.26102/2310-6018/2026.52.1.005

5

Полный текст статьи в PDF

Поступила в редакцию 06.11.2025

Поступила после рецензирования 29.12.2025

Принята к публикации 13.01.2026