References

moitvivt

Моделирование, оптимизация и информационные технологии

Modeling, Optimization and Information Technology

2310-6018

Издательство

10.26102/2310-6018/2026.57.6.017

2302

Ансамблевые методы машинного обучения для прогностической диагностики сердечно-сосудистых заболеваний: сравнительный анализ на многоцентровой выборке

Ensemble machine learning methods for predictive diagnostics of cardiovascular diseases: comparative analysis on a multi-center dataset

0009-0008-1548-9108

Лавьер

Кейси Маркович

Lavier

Casey Markovich

laviercasey@gmail.com aff-1

0009-0009-6567-2573

Веселов

Дмитрий Иванович

Veselov

Dmitriy Ivanovich

diveselov@fa.ru aff-2

0000-0003-0735-7697

Андриянов

Никита Андреевич

Andriyanov

Nikita Andreevich

naandriyanov@fa.ru aff-3

Московский университет имени С.Ю. Витте Moscow Witte University

Финансовый университет при Правительстве Российской Федерации Financial University under the Government of the Russian Federation

01 01 2026

1 1

10.26102/2310-6018/2026.57.6.017

2026

This work is licensed under a Creative Commons Attribution 4.0 International License

В работе проведено сравнение восьми алгоритмов машинного обучения для диагностики сердечно-сосудистых заболеваний на объединенной многоцентровой выборке из шести баз данных (n = 1 904). Предложены три клинически обоснованных производных признака: maxhrratio (отношение максимальной частоты сердечных сокращений к возрастному прогнозу), sthr index (отношение депрессии сегмента ST к максимальной частоте сердечных сокращений) и anginast flag (бинарный индикатор совместного присутствия типичной стенокардии и нисходящего уклона сегмента ST). Базовые алгоритмы – дерево решений, логистическая регрессия, случайный лес, XGBoost, CatBoost, LightGBM – обучались с байесовской оптимизацией гиперпараметров. Ансамблирование выполнено методами стекинга (предсказания на отложенных блоках, мета-ученик с калибровкой по методу Платта) и взвешенного мягкого голосования. Качество оценивалось по методу бутстрепа со смещением-коррекцией (10 000 итераций, 95 % доверительный интервал); попарное сравнение – тесты ДеЛонга и МакНемара с поправкой Бонферрони (28 пар, порог p < 0,00179). Лучший результат среди одиночных моделей показал CatBoost: площадь под кривой рабочих характеристик 0,948 [0,922-0,966], гармоническое среднее точности и полноты 0,884, оценка Brier 0,097. Стекинг достиг площади под кривой рабочих характеристик 0,931 при наилучшей среди ансамблей калибровке (Brier 0,102). Аблационное исследование показало, что семь признаков обеспечивают 97,5 % качества полной модели. Консенсусное ранжирование на основе значений Шепли по четырем моделям поставило производный признак sthr index на четвертое место из четырнадцати, опередив семь исходных клинических переменных. Валидация методом исключения одного источника выявила несовместимость кодировок в двух из шести источников, подчеркивая необходимость аудита данных перед межучрежденческим развертыванием.

Eight machine learning algorithms for cardiovascular disease diagnosis were compared on a combined multi-center dataset from six databases (n = 1.904). Three clinically motivated derived features were proposed: maxhrratio (ratio of maximum heart rate to age-predicted maximum), sthr index (ratio of ST-segment depression to maximum heart rate), and anginast flag (binary indicator of co-occurring typical angina and downsloping ST segment). Base algorithms – decision tree, logistic regression, random forest, XGBoost, CatBoost, LightGBM – were trained with Bayesian hyperparameter optimization (Optuna). Ensembling was performed via stacking (out-of-fold predictions, meta-learner with Platt calibration) and AUC-weighted soft voting. Performance was assessed using BCa bootstrap (10,000 iterations, 95 % CI); pairwise comparisons used DeLong and McNemar tests with Bonferroni correction (28 pairs, p < 0.00179). CatBoost achieved the best single-model ROC-AUC = 0.948 [0.922–0.966], F1 = 0.884, Brier = 0.097. Stacking reached ROC-AUC = 0.931 with the best ensemble calibration (Brier = 0.102). Ablation study showed that seven features retain 97.5 % of full-model performance. SHAP consensus across four models ranked sthr index fourth among 14 features, ahead of seven original clinical variables. Leave-one-source-out validation revealed encoding incompatibilities in two of six sources, underscoring the need for data auditing prior to cross-institutional deployment.

машинное обучение сердечно-сосудистые заболевания CatBoost стекинг SHAP BCa bootstrap NRI IDI многоцентровая выборка конструирование признаков

machine learning cardiovascular disease CatBoost stacking SHAP BCa bootstrap NRI IDI multi-center dataset feature engineering

Исследование выполнено без спонсорской поддержки.

The study was performed without external funding.

References 1

Гусев А.В. Перспективы нейронных сетей и глубокого машинного обучения в создании решений для здравоохранения. Врач и информационные технологии. 2017;(3):92–105.

Гусев А.В., Новицкий Р.Э., Ившин А.А., Алексеев А.А. Машинное обучение на лабораторных данных для прогнозирования заболеваний. ФАРМАКОЭКОНОМИКА. Современная фармакоэкономика и фармакоэпидемиология. 2021;14(4):581–592. https://doi.org/10.17749/2070-4909/farmakoekonomika.2021.115

Киселёв А.А. Разработка модели машинного обучения для прогнозирования сердечно-сосудистых заболеваний. Символ науки. 2023;(1-1):9–12.

Мамедов М.Н., Савчук Е.А., Каримов А.К. Искусственный интеллект в кардиологии. Международный журнал сердца и сосудистых заболеваний. 2024;12(43):5–11.

Беленков Ю.Н., Кожевникова М.В., Хабарова Н.В., Ильгисонис И.С., Коробкова Е.О. Роль искусственного интеллекта в кардиологии. Кардиология. 2025;65(2):3–16. https://doi.org/10.18087/cardio.2025.2.n2879

Гельцер Б.И., Циванюк М.М., Шахгельдян К.И., Рублев В.Ю. Методы машинного обучения как инструмент диагностических и прогностических исследований при ишемической болезни сердца. Российский кардиологический журнал. 2020;25(12). https://doi.org/10.15829/1560-4071-2020-3999

Гельцер Б.И., Рублев В.Ю., Циванюк М.М., Шахгельдян К.И. Машинное обучение в прогнозировании ближайших и отдалённых результатов реваскуляризации миокарда: систематический обзор. Российский кардиологический журнал. 2021;26(8). https://doi.org/10.15829/1560-4071-2021-4505

Каледина Е.А., Каледин О.Е., Кулягина Т.И. Применение методов машинного обучения для предсказания сердечно-сосудистых заболеваний на малых наборах данных. Проблемы информатики. 2022;(1):66–76. https://doi.org/10.24412/2073-0667-2022-1-66-76

Prokhorenkova L., Gusev G., Vorobev A., Dorogush A.V., Gulin A. CatBoost: unbiased boosting with categorical features. In: Advances in Neural Information Processing Systems 31: Annual Conference on Neural Information Processing Systems 2018 (NeurIPS 2018), 03–08 December 2018, Montréal, Canada. 2018. P. 6639–6649.

Dorogush A.V., Ershov V., Gulin A. CatBoost: gradient boosting with categorical features support. arXiv. URL: https://arxiv.org/abs/1810.11363 [Accessed 20th April 2026].

Chen T., Guestrin C. XGBoost: A scalable tree boosting system. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 13–17 August 2016, San Francisco, CA, USA. New York: ACM; 2016. P. 785–794. https://doi.org/10.1145/2939672.2939785

Ke G., Meng Q., Finley Th., et al. LightGBM: A highly efficient gradient boosting decision tree. In: Advances in Neural Information Processing Systems 30: Annual Conference on Neural Information Processing Systems 2017, 04–09 December 2017, Long Beach, CA, USA. 2017. P. 3146–3154.

Wolpert D.H. Stacked generalization. Neural Networks. 1992;5(2):241–259. https://doi.org/10.1016/S0893-6080(05)80023-1

Platt J.C. Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods. In: Advances in Large Margin Classifiers. Cambridge: MIT Press; 1999. P. 61–74.

DiCiccio Th.J., Efron B. Bootstrap confidence intervals. Statistical Science. 1996;11(3):189–228.

DeLong E.R., DeLong D.M., Clarke-Pearson D.L. Comparing the areas under two or more correlated receiver operating characteristic curves: A nonparametric approach. Biometrics. 1988;44(3):837–845.

Pencina M.J., D'Agostino R.B., D'Agostino R.B., Vasan R.S. Evaluating the added predictive ability of a new marker: From area under the ROC curve to reclassification and beyond. Statistics in Medicine. 2008;27(2):157–172. https://doi.org/10.1002/sim.2929

Lundberg S.M., Lee S.-I. A unified approach to interpreting model predictions. In: Advances in Neural Information Processing Systems 30: Annual Conference on Neural Information Processing Systems 2017, 04–09 December 2017, Long Beach, CA, USA. 2017. P. 4765–4774.

Ханов А.М., Гусев А.В., Тюрганов А.Г. Искусственный интеллект в здравоохранении России: сбор и подготовка данных для машинного обучения. Журнал телемедицины и электронного здравоохранения. 2023;9(4):7–13. https://doi.org/10.29188/2712-9217-2023-9-4-7-13

Гельцер Б.И., Шахгельдян К.И., Рублев В.Ю. и др. Фенотипирование факторов риска и прогнозирование внутригоспитальной летальности у больных ишемической болезнью сердца после коронарного шунтирования на основе методов объяснимого искусственного интеллекта. Российский кардиологический журнал. 2023;28(4). https://doi.org/10.15829/1560-4071-2023-5302

Соловьёв И.А., Курочкина О.Н. Приложения искусственного интеллекта в кардиологии: обзор. Российский кардиологический журнал. 2024;29(11S). https://doi.org/10.15829/1560-4071-2024-5673

The authors declare that there are no conflicts of interest present.