Анализ поведения клиентов и выбор маркетинговых стратегий на основе обучения с подкреплением
Работая с сайтом, я даю свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта обрабатывается системой Яндекс.Метрика
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Анализ поведения клиентов и выбор маркетинговых стратегий на основе обучения с подкреплением

Прохорова О.К.,  Петрова Е.С. 

УДК 658.8; 004.9; 658.012
DOI: 10.26102/2310-6018/2025.49.2.035

  • Аннотация
  • Список литературы
  • Об авторах

В условиях современного конкурентного рынка компании сталкиваются с задачей выбора оптимальных маркетинговых стратегий, которые максимизируют вовлеченность клиентов, их удержание и доходы. Традиционные методы, такие как подходы на основе правил или A/B-тестирование, часто оказываются недостаточно гибкими для адаптации к динамичному поведению клиентов и долгосрочным трендам. Обучение с подкреплением (Reinforcement Learning, RL) предлагает перспективное решение, позволяя принимать адаптивные решения через непрерывное взаимодействие с окружающей средой. В статье исследуется применение RL в маркетинге, демонстрируется, как данные о клиентах – такие как история покупок, взаимодействие с кампаниями, демографические характеристики и показатели лояльности – могут быть использованы для обучения RL-агента. Агент учится выбирать персонализированные маркетинговые действия, например, отправку скидок или индивидуальных предложений с целью максимизировать такие показатели, как увеличение дохода или снижение оттока клиентов. Статья предоставляет пошаговое руководство по реализации маркетинговой стратегии на основе RL с использованием MATLAB. Рассматриваются создание пользовательской среды, проектирование RL-агента и процесс обучения, а также практические рекомендации по интерпретации решений агента. С помощью симуляции взаимодействий с клиентами и оценки производительности агента мы демонстрируем потенциал RL для трансформации маркетинговых стратегий. Цель работы – сократить разрыв между передовыми методами машинного обучения и их практическим применением в маркетинге, предложив дорожную карту для компаний, стремящихся использовать возможности RL для принятия решений.

1. Саттон Р.С., Барто Э.Дж. Обучение с подкреплением: введение. Москва: ДМК Пресс; 2020. 552 c.

2. Zhang Yu., Bai Yu, Jiang N. Offline Learning in Markov Games with General Function Approximation. arXiv. URL: https://arxiv.org/abs/2302.02571v1 [Accessed 12th March 2025].

3. Zhu Ch., Dastani M., Wang Sh. A Survey of Multi-Agent Deep Reinforcement Learning with Communication. Autonomous Agents and Multi-Agent Systems. 2024;38(1). https://doi.org/10.1007/s10458-023-09633-6

4. Garrabé É., Russo G. Probabilistic Design of Optimal Sequential Decision-Making Algorithms in Learning and Control. Annual Reviews in Control. 2022;54:81–102. https://doi.org/10.1016/j.arcontrol.2022.09.003

5. Albrecht S.V., Christianos F., Schäfer L. Multi-Agent Reinforcement Learning: Foundations and Modern Approaches. Cambridge: The MIT Press; 2024. 366 p.

6. Соколова Е.С. Мультиагентный подход к моделированию межмодульных взаимодействий в стохастических сетевых распределённых системах. Системы управления и информационные технологии. 2020;(1):67–71.

7. Hu J., Wellman M.P. Multiagent Reinforcement Learning in Stochastic Games. CiteSeerX. URL: https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=7ce14dbb9add4d9656746703babd00d8f765b22a [Accessed 18th March 2025].

8. Littman M.L., Szepesvári C. A Generalized Reinforcement-Learning Model: Convergence and Applications. In: Proceedings of the 13th International Conference on Machine Learning (ICML '96), 03–06 July 1996, Bari, Italy. Morgan Kaufmann; 1996. P. 310–318.

9. Hu J., Wellman M.P. Multiagent Reinforcement Learning: Theoretical Framework and an Algorithm. In: Proceedings of the Fifteenth International Conference on Machine Learning (ICML 1998), 24–27 July 1998, Madison, Wisconsin, USA. Morgan Kaufmann; 1998. P. 242–250.

10. Sychrovský D., Solinas Ch., MacQueen R., et al. Approximating Nash Equilibria in General-Sum Games via Meta-Learning. arXiv. URL: https://arxiv.org/abs/2504.18868 [Accessed 18th March 2025].

11. Schwartz H.M. Multi-Agent Machine Learning: A Reinforcement Approach. John Wiley & Sons, Inc.; 2014. 256 p.

Прохорова Ольга Константиновна
Кандидат экономических наук

Воронежский институт высоких технологий

Воронеж, Российская Федерация

Петрова Елена Сергеевна

Воронежский государственный технический университет

Воронеж, Российская Федерация

Ключевые слова: обучение с подкреплением, поведение клиентов, маркетинговые стратегии, состояние среды, действия агента, награда агента

Для цитирования: Прохорова О.К., Петрова Е.С. Анализ поведения клиентов и выбор маркетинговых стратегий на основе обучения с подкреплением. Моделирование, оптимизация и информационные технологии. 2025;13(2). URL: https://moitvivt.ru/ru/journal/pdf?id=1900 DOI: 10.26102/2310-6018/2025.49.2.035

17

Полный текст статьи в PDF

Поступила в редакцию 14.04.2025

Поступила после рецензирования 23.05.2025

Принята к публикации 03.06.2025