Ключевые слова: управление эксплуатацией, обучение с подкреплением, риск-ориентированный подход, кластеризация, энергоэффективность, живучесть объектов, розничные сети, цифровой двойник
Адаптивное риск-ориентированное управление эксплуатацией объектов розничной сети на основе кластеризации и обучения с подкреплением
УДК 658.87:519.876.5
DOI: 10.26102/2310-6018/2025.51.4.066
В условиях повышенных операционных и энергетических рисков, характерных для современных розничных сетей, предлагается инновационный двухуровневый подход к управлению эксплуатацией объектов. Исследование направлено на решение ключевой проблемы неоднородности риск-профилей объектов сети, требующей дифференцированных стратегий управления вместо унифицированных регламентов. На стратегическом уровне реализована интеллектуальная кластеризация объектов методом самоорганизующихся карт Кохонена (SOM) по комплексным факторам риска, включающим геопространственные параметры (удаленность от зон операционной напряженности), инфраструктурные показатели (близость к критической инфраструктуре, надежность энергосетей), операционные метрики (логистическая устойчивость, история инцидентов) и социально-экономические индикаторы. В результате кластерного анализа выявлены четыре четко дифференцированные категории объектов: критические, высокого риска, логистически уязвимые и стабильные. На тактическом уровне для каждого кластера разработаны специализированные модели обучения с подкреплением (Reinforcement Learning), адаптирующие эксплуатационные политики в реальном времени. Формализация задачи как марковского процесса принятия решений позволила оптимизировать управляющие воздействия (техническое обслуживание, энергоменеджмент, резервирование) с учетом специфических целей кластера. Ключевой особенностью методологии является кастомизация функций вознаграждения: для критических объектов приоритет отдается максимизации живучести, для стабильных – энергоэффективности, для промежуточных кластеров – сбалансированным стратегиям. Экспериментальная валидация проведена на синтезированном датасете из 100 объектов с использованием современных библиотек машинного обучения (Stable-Baselines3, Gymnasium, Scikit-learn) в контейнеризованной среде Docker WSL2.
1. Yu L., Qin Sh., Zhang M., Shen Ch., Jiang T., Guan X. A Review of Deep Reinforcement Learning for Smart Building Energy Management. IEEE Internet of Things Journal. 2021;8(15):12046–12063. https://doi.org/10.1109/JIOT.2021.3078462
2. Djenouri D., Laidi R., Djenouri Y., Balasingham I. Machine Learning for Smart Building Applications: Review and Taxonomy. ACM Computing Surveys. 2019;52(2). https://doi.org/10.1145/3311950
3. Pigott A., Crozier C., Baker K., Nagy Z. GridLearn: Multiagent Reinforcement Learning for Grid-Aware Building Energy Management. arXiv. URL: https://arxiv.org/pdf/2110.06396.pdf [Accessed 15th November 2025].
4. Mao R., Aggarwal V. NPSCS: Non-Preemptive Stochastic Coflow Scheduling with Time-Indexed LP Relaxation. IEEE Transactions on Network and Service Management. 2021;18(2):2377–2387. https://doi.org/10.1109/TNSM.2021.3051657
5. Al Sayed K., Boodi A., Broujeny R.S., Beddiar K. Reinforcement Learning for HVAC Control in Intelligent Buildings: A Technical and Conceptual Review. Journal of Building Engineering. 2024;95. https://doi.org/10.1016/j.jobe.2024.110085
6. Hillson D. Managing Risk in Projects. London: Routledge; 2016. 126 p.
7. Samunnisa K., Sunil Vijaya Kumar G., Madhavi K. Intrusion Detection System in Distributed Cloud Computing: Hybrid Clustering and Classification Methods. Measurement: Sensors. 2023;25. https://doi.org/10.1016/j.measen.2022.100612
8. Obasi I.Ch., Cheng P., Varianou-Mikellidou C., Dimopoulos Ch., Boustras G. Machine Learning for Occupational Accident Analysis: Applications, Challenges, and Future Directions. Journal of Safety Science and Resilience. 2026;7(1). https://doi.org/10.1016/j.jnlssr.2025.100250
9. Alhoniemi E., Hollmén J., Simula O., Vesanto J. Process Monitoring and Modeling Using the Self-Organizing Map. Integrated Computer Aided Engineering. 1998;6(1). https://doi.org/10.3233/ICA-1999-6102
10. Bouabdallaoui Y., Lafhaj Z., Yim P., Ducoulombier L., Bennadji B. Predictive Maintenance in Building Facilities: A Machine Learning-Based Approach. Sensors. 2021;21(4). https://doi.org/10.3390/s21041044
11. Schulman J., Wolski F., Dhariwal P., Radford A., Klimov O. Proximal Policy Optimization Algorithms. arXiv. URL: https://arxiv.org/abs/1707.06347 [Accessed 18th November 2025].
12. Mnih V., Kavukcuoglu K., Silver D., et al. Human-Level Control Through Deep Reinforcement Learning. Nature. 2015;518(7540):529–533. https://doi.org/10.1038/nature14236
13. Kohonen T. Self-Organizing Maps. Berlin, Heidelberg: Springer; 2001. 502 p. https://doi.org/10.1007/978-3-642-56927-2
Ключевые слова: управление эксплуатацией, обучение с подкреплением, риск-ориентированный подход, кластеризация, энергоэффективность, живучесть объектов, розничные сети, цифровой двойник
Для цитирования: Устимов М.Г., Прохорова О.К., Заложных Д.О. Адаптивное риск-ориентированное управление эксплуатацией объектов розничной сети на основе кластеризации и обучения с подкреплением. Моделирование, оптимизация и информационные технологии. 2025;13(4). URL: https://moitvivt.ru/ru/journal/pdf?id=2142 DOI: 10.26102/2310-6018/2025.51.4.066
Поступила в редакцию 27.11.2025
Поступила после рецензирования 22.12.2025
Принята к публикации 26.12.2025