<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2026.52.1.005</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">2123</article-id>
      <title-group>
        <article-title xml:lang="ru">Модель и метод оценки весовых коэффициентов ансамбля машинного обучения в задаче прогнозирования провозной платы железнодорожных грузовых перевозок</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Model and method for evaluating the weighting coefficients of an ensemble machine learning model in the task of forecasting railway freight rates</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Бухарова</surname>
              <given-names>Ксения Алексеевна</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Bukharova</surname>
              <given-names>Ksenya Alekseevna</given-names>
            </name>
          </name-alternatives>
          <email>bukharova@pgups.ru</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Петербургский государственный университет путей сообщения Императора Александра I</aff>
        <aff xml:lang="en">Emperor Alexander I St. Petersburg State Transport University</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2026.52.1.005</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=2123"/>
      <abstract xml:lang="ru">
        <p>Настоящая статья посвящена вопросу оценки эффективности разработанной ансамблевой модели машинного обучения, применяемой для прогнозирования провозной платы на железнодорожном транспорте. В качестве эмпирической базы использованы данные ОАО «РЖД» за трехлетний период, включающие порядка 50 миллионов записей о грузовых перевозках. Такой массив обеспечивает репрезентативность выборки и позволяет учитывать отраслевое разнообразие данных. На основе алгоритмов Random Forest, XGBoost, LightGBM и CatBoost разработана ансамблевая модель, метауровень которой реализован в виде многомерной линейной регрессии. Для вычисления весовых коэффициентов применены метод наименьших квадратов и регуляризация Тихонова. Данный подход позволил стабилизировать решение и снизить влияние коррелированных выходов базовых моделей. Результаты вычислительных экспериментов показали, что объединение разнородных моделей в ансамбль обеспечивает повышение точности прогнозирования по сравнению с отдельными алгоритмами. Средняя абсолютная ошибка снизилась на 7–13 %, а средняя абсолютная процентная ошибка на 6–12 %, при этом коэффициент детерминации увеличился до 0,942. Дополнительно проведена оценка устойчивости ансамбля методом скользящего окна, что позволило определить горизонты прогнозирования, при которых сохраняется стабильность результатов. Расширенный анализ поведения ансамбля при варьировании входных признаков показал, что модель демонстрирует устойчивость к умеренным искажениям данных и сохраняет высокую воспроизводимость расчетов. Полученные результаты подтверждают практическую значимость предложенного подхода для задач транспортной аналитики, планирования перевозочного процесса и формирования экономически обоснованной тарифной политики.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>This article examines the effectiveness of a developed ensemble machine learning model for forecasting rail freight rates. Russian Railways data for a three-year period, comprising approximately 50 million freight shipment records, serves as the empirical base. This dataset ensures a representative sample and accounts for industry-specific data diversity. An ensemble model is developed using the Random Forest, XGBoost, LightGBM, and CatBoost algorithms, with a meta-level implemented as a multivariate linear regression. The ordinary least squares method and Tikhonov regularization are used to calculate the weighting coefficients. This approach stabilizes the solution and reduces the impact of correlated outputs from the base models. Results of computational experiments have shown that combining heterogeneous models into an ensemble improves forecasting accuracy compared to individual algorithms. The average absolute error decreased by 7–13 %, and the average absolute percentage error by 6–12 %, while the determination coefficient increased to 0.942. Additionally, the ensemble's stability was assessed using a sliding window method, which allowed us to determine forecasting horizons that maintain stable results. An extended analysis of the ensemble's behavior with varying input features showed that the model is robust to moderate data distortions and maintains high calculation reproducibility. The obtained results confirm the practical significance of the proposed approach for transport analytics, transportation planning, and the development of economically sound pricing policies.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>машинное обучение</kwd>
        <kwd>ансамблевые модели</kwd>
        <kwd>регуляризация Тихонова</kwd>
        <kwd>метод наименьших квадратов</kwd>
        <kwd>точность модели</kwd>
        <kwd>устойчивость модели</kwd>
        <kwd>железнодорожный транспорт</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>machine learning</kwd>
        <kwd>ensemble models</kwd>
        <kwd>Tikhonov regularization</kwd>
        <kwd>least squares method</kwd>
        <kwd>model accuracy</kwd>
        <kwd>model stability</kwd>
        <kwd>railway transport</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Загидуллин Р.Р., Хайбуллин А.Н. Прогнозирование транспортной загруженности с использованием методов машинного обучения. Транспорт и информационные технологии. 2025;15(2):202–216. https://doi.org/10.12731/2227-930X-2025-15-2-347</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Побирченко В.Р., Побирченко В.В. Теоретические аспекты моделирования социально-экономического развития региона. Ученые записки Крымского федерального университета имени В.И. Вернадского. Экономика и управление. 2025;11(2):170–182.</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Вегера Ж.Г. Применение генеративного искусственного интеллекта (ИИ) для анализа образовательных данных и прогнозирования академической успеваемости студентов. Управление образованием: теория и практика. 2024;14(8-1):116–125. https://doi.org/10.25726/j2473-1350-7803-t</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Zhou Zh.-H. Ensemble Methods: Foundations and Algorithms. New York: Chapman &amp; Hall/CRC; 2012. 236 p. https://doi.org/10.1201/b12207</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Hyndman R.J., Athanasopoulos G. Forecasting: Principles and Practice. Melbourne: OTexts; 2021. 442 p.</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. New York: Springer; 2009. 745 p. https://doi.org/10.1007/978-0-387-84858-7</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Zhang Yu., Ma J., Liang Sh., Li X., Liu J. A Stacking Ensemble Algorithm for Improving the Biases of Forest Aboveground Biomass Estimations from Multiple Remotely Sensed Datasets. GIScience &amp; Remote Sensing. 2022;59(1):234–249. https://doi.org/10.1080/15481603.2021.2023842</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Рукомин М.А. Обзор ансамблевых моделей предиктивной аналитики и их сравнение с традиционными ML-подходами. Вестник науки. 2025;1(8):368–373.</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. Москва: Наука; 1979. 288 с.</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Харитонова А.Е. Прогнозирование налоговой нагрузки сельскохозяйственных предприятий методами машинного обучения. Налоги и налогообложение. 2023;(4):28–38. https://doi.org/10.7256/2454-065X.2023.4.43917</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>