Ключевые слова: регрессионный анализ, многослойная модульная регрессия, метод наименьших модулей, задача частично-булевого линейного программирования, древесина
Оценивание неизвестных параметров многослойной модульной регрессии методом наименьших модулей
УДК 519.862.6
DOI: 10.26102/2310-6018/2024.45.2.039
Статья посвящена разработке и возможности применения в регрессионном анализе новой математической формы связи между выходной переменной и входными факторами. Для этого использованы ранее изученные более простые модели модульной линейной регрессии, в которых один или несколько входных факторов преобразуются единожды с помощью операции модуль. Предложен симбиоз линейной регрессии и модульной регрессии с мультиарной операцией модуль. На его основе сформулирована многослойная модульная регрессия, выстроенная по принципу «модуль в модуле», т. е. на каждом новом слое используется модуль от величины предыдущего слоя. Задача оценивания многослойной модульной регрессии с заданным числом слоев методом наименьших модулей сведена к задаче частично-булевого линейного программирования. С помощью предложенных регрессий решена задача моделирования запасов древесины в Иркутской области. При этом построены однослойная, двухслойная и трехслойная модульные регрессии. Новые модели по качеству оказались существенно лучше линейной регрессии, причем, с увеличением количества слоев наблюдалось снижение суммы модулей остатков. В трехслойной модели все остатки получились нулевыми. Разработанный математический аппарат может успешно применяться для решения многих задач анализа данных.
1. Chicco D., Warrens M.J., Jurman G. The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation. PeerJ Computer Science. 2021;7. https://doi.org/10.7717/peerj-cs.623
2. Westfall P.H., Arias A.L. Understanding Regression Analysis: A Conditional Distribution Approach. New York: Chapman and Hall/CRC; 2020. 514 p. https://doi.org/10.1201/9781003025764
3. Nguyen Ph.-M., Pham H.T. A rigorous framework for the mean field limit of multilayer neural networks. Mathematical Statistics and Learning. 2023;6(3):201–357. https://doi.org/10.4171/msl/42
4. Talaat M., Farahat M.A., Mansour N., Hatata A.Y. Load forecasting based on grasshopper optimization and a multilayer feed-forward neural network using regressive approach. Energy. 2020;196. https://doi.org/10.1016/j.energy.2020.117087
5. Ивахненко А.Г. Индуктивный метод самоорганизации моделей сложных систем. Киев: Наукова думка; 1982. 296 с.
6. Муравина О.М. Метод группового учёта аргументов при анализе геофизических данных. Геофизика. 2012;(6):16–20.
7. Базилевский М.П., Ойдопова А.Б. Оценивание модульных линейных регрессионных моделей с помощью метода наименьших модулей. Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. 2023;(45):130–146.
8. Базилевский М.П. Программное обеспечение для оценивания модульных линейных регрессий. Информационные и математические технологии в науке и управлении. 2023;(3):136–146. https://doi.org/10.25729/ESI.2023.31.3.013
9. Базилевский М.П. Совершенствование алгоритма точного оценивания модульных линейных регрессий с помощью метода наименьших модулей. Вестник Технологического университета. 2024;27(4):97–102.
10. Базилевский М.П. Оценивание регрессионных моделей с мультиарной операцией модуль методом наименьших модулей. Инженерный вестник Дона. 2024;(5). URL: http://www.ivdon.ru/ru/magazine/archive/n5y2024/9188
11. Thanoon F.H. Robust Regression by Least Absolute Deviations Method. International Journal of Statistics and Applications. 2015;5(3):109–112.
12. Liu Zh., Yang Y. Least absolute deviations estimation for uncertain regression with imprecise observations. Fuzzy Optimization and Decision Making. 2020;19(1):33–52. https://doi.org/10.1007/s10700-019-09312-w
13. Carrizosa E., Molero-Río C., Romero Morales D. Mathematical optimization in classification and regression trees. TOP. 2021;29(1):5–33. https://doi.org/10.1007/s11750-021-00594-1
14. Park Y.W., Klabjan D. Subset selection for multiple linear regression via optimization. Journal of Global Optimization. 2020;77(3):543–574. https://doi.org/10.1007/s10898-020-00876-1
15. Базилевский М.П. Алгоритм приближенного оценивания с помощью метода наименьших квадратов двухслойных неэлементарных линейных регрессий с двумя объясняющими переменными. Современные наукоемкие технологии. 2024;(4):10–14. https://doi.org/10.17513/snt.39966
16. Воронков П.Т., Воронков А.П., Белов А.Н., Дудина Е.А., Илюхина Л.А. Моделирование экономической доступности лесных ресурсов с использованием регрессионного анализа. Лесохозяйственная информация. 2009;(1-2):7–13.
17. Солдатов М.С., Малхазова С.М., Румянцев В.Ю., Леонова Н.Б. Прогноз изменений прироста древесины в лесах Европейской части России в связи с глобальным потеплением. Известия Российской академии наук. Серия географическая. 2014;(2):96–102. https://doi.org/10.15356/0373-2444-2014-2-96-102
Ключевые слова: регрессионный анализ, многослойная модульная регрессия, метод наименьших модулей, задача частично-булевого линейного программирования, древесина
Для цитирования: Базилевский М.П. Оценивание неизвестных параметров многослойной модульной регрессии методом наименьших модулей. Моделирование, оптимизация и информационные технологии. 2024;12(2). URL: https://moitvivt.ru/ru/journal/pdf?id=1581 DOI: 10.26102/2310-6018/2024.45.2.039
Поступила в редакцию 17.05.2024
Поступила после рецензирования 30.05.2024
Принята к публикации 14.06.2024
Опубликована 30.06.2024