Ключевые слова: регрессионный анализ, интерпретируемость, сегментированная линейная регрессия, метод наименьших квадратов, мультиколлинеарность, значимость оценок
УДК 519.862.6
DOI: 10.26102/2310-6018/2026.54.3.018
Работа посвящена актуальному научному направлению – интерпретируемому машинному обучению. Ранее автором было введено понятие «вполне интерпретируемая линейная регрессия», построение которой осуществляется с помощью метода наименьших квадратов по всей выборке статистических данных. В статье это понятие обобщается на сегментированную линейную регрессию, при идентификации которой данные сначала разбиваются на сегменты, а затем на каждом из них строится своя линейная регрессия. Разработан алгоритм построения вполне интерпретируемых сегментированных линейных регрессий. Его особенность в том, что, во-первых, разбиение пространства предикторов на сегменты осуществляется с помощью логических функций активации аргументов бинарных операций min. Во-вторых, в каждом сегменте строится парная регрессия, что полностью решает проблему мультиколлинеарности. С помощью разработанного алгоритма по выборке объема 1030 наблюдений была построена сегментированная линейная регрессия прочности бетона на сжатие. Во всех ее восьми сегментах значения коэффициентов детерминации линейных регрессий не превосходят величины 0,8, что указывает на наличие неучтенных факторов, поэтому построенную модель нельзя отнести строго ко вполне интерпретируемым. Тем не менее, все остальные условия интерпретируемости выполнены. К тому же сегментированная модель по качеству аппроксимации в целом оказалась гораздо лучше простой линейной регрессии.
1. Molnar Ch. Interpretable Machine Learning. Lulu.com; 2020. 320 p.
2. Carter A., Imtiaz S., Naterer G.F. Review of Interpretable Machine Learning for Process Industries. Process Safety and Environmental Protection. 2023;170:647–659. https://doi.org/10.1016/j.psep.2022.12.018
3. Shrestha N. Detecting Multicollinearity in Regression Analysis. American Journal of Applied Mathematics and Statistics. 2020;8(2):39–42. https://doi.org/10.12691/ajams-8-2-1
4. Aslam M., Ahmad Sh. The Modified Liu-ridge-type Estimator: A New Class of Biased Estimators to Address Multicollinearity. Communications in Statistics – Simulation and Computation. 2022;51(11):6591–6609. https://doi.org/10.1080/03610918.2020.1806324
5. Базилевский М.П. О разрешимости оптимизационной задачи построения вполне интерпретируемых линейных регрессий. Учёные записки Казанского университета. Серия Физико-математические науки. 2025;167(4):627–640. https://doi.org/10.26907/2541-7746.2025.4.627-640
6. Голиков Р.Ю. Кусочно-линейная аппроксимация формы сильно зашумленного сигнала методом наименьших квадратов. Прикладная информатика. 2022;17(5):116–124. https://doi.org/10.37791/2687-0649-2022-17-5-116-124
7. Базилевский М.П. Метод построения вполне интерпретируемых линейных регрессий со статистически значимыми по критерию Стьюдента оценками и незначимыми коэффициентами интеркорреляции. Вычислительные методы и программирование. 2025;26(4):534–547. https://doi.org/10.26089/NumMet.v26r435
8. Лебедев И.С. Адаптивное построение регрессионных моделей на основе анализа функционала качества обработки сегментов последовательности. Информатика и автоматизация. 2025;24(2):363–394. https://doi.org/10.15622/ia.24.2.1
9. Шестаков Р.Б., Ловчикова Е.И. Инвестиционный акселератор сельскохозяйственного производства. Экономика региона. 2019;15(3):908–923. https://doi.org/10.17059/2019-3-21
10. Дубовиченко Д.М., Вальков М.Ю., Карпунов А.А., Панкратьева А.Ю. Популяционная оценка динамики заболеваемости и стадийной структуры рака прямой кишки в условиях реализации мероприятий Национального проекта «Здоровье» и диспансеризации определенных групп взрослого населения в Архангельской области (итоги предварительного исследования). Research'n Practical Medicine Journal. 2017;4(3):23–32. https://doi.org/10.17709/2409-2231-2017-4-3-3
11. Макарова М.В., Вальков М.Ю. Сегментированный анализ динамических рядов официальных статистических показателей остеоартрита в 1994–2018 гг. в России, Северо-Западном федеральном округе и Архангельской области. Научно-практическая ревматология. 2021;59(5):584–591. https://doi.org/10.47360/1995-4484-2021-584-591
12. Bornmann L., Haunschild R., Mutz R. Growth Rates of Modern Science: A Latent Piecewise Growth Curve Approach to Model Publication Numbers from Established and New Literature Databases. Humanities and Social Sciences Communications. 2021;8. https://doi.org/10.1057/s41599-021-00903-w
13. Al-Azzeh J., Mesleh A., Zaliskyi M., Odarchenko R., Kuzmin V. A Method of Accuracy Increment Using Segmented Regression. Algorithms. 2022;15(10). https://doi.org/10.3390/a15100378
14. Базилевский М.П. Построение двухфакторных неэлементарных линейных регрессий с логическими функциями. International Journal of Open Information Technologies. 2023;11(6):113–117.
15. Михайлова Н.А., Стефаненко И.В. Множественные регрессионные модели прочности бетона на сжатие. Вестник Волгоградского государственного архитектурно-строительного университета. Серия: Строительство и архитектура. 2017;(49):30–42.
Ключевые слова: регрессионный анализ, интерпретируемость, сегментированная линейная регрессия, метод наименьших квадратов, мультиколлинеарность, значимость оценок
Для цитирования: Базилевский М.П. Алгоритм построения вполне интерпретируемых сегментированных линейных регрессий. Моделирование, оптимизация и информационные технологии. 2026;14(3). URL: https://moitvivt.ru/ru/journal/pdf?id=2212 DOI: 10.26102/2310-6018/2026.54.3.018
Поступила в редакцию 02.02.2026
Поступила после рецензирования 19.03.2026
Принята к публикации 26.03.2026
Опубликована 31.03.2026