<?xml version="1.0" encoding="UTF-8"?>
<article article-type="research-article" dtd-version="1.3" xml:lang="ru" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="https://metafora.rcsi.science/xsd_files/journal3.xsd">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">moitvivt</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Моделирование, оптимизация и информационные технологии</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Modeling, Optimization and Information Technology</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2310-6018</issn>
      <publisher>
        <publisher-name>Издательство</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.26102/2310-6018/2026.57.6.017</article-id>
      <article-id pub-id-type="custom" custom-type="elpub">2302</article-id>
      <title-group>
        <article-title xml:lang="ru">Ансамблевые методы машинного обучения для прогностической диагностики сердечно-сосудистых заболеваний: сравнительный анализ на многоцентровой выборке</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>Ensemble machine learning methods for predictive diagnostics of cardiovascular diseases: comparative analysis on a multi-center dataset</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author" corresp="yes">
          <contrib-id contrib-id-type="orcid">0009-0008-1548-9108</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Лавьер</surname>
              <given-names>Кейси Маркович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Lavier</surname>
              <given-names>Casey Markovich</given-names>
            </name>
          </name-alternatives>
          <email>laviercasey@gmail.com</email>
          <xref ref-type="aff">aff-1</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0009-0009-6567-2573</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Веселов</surname>
              <given-names>Дмитрий Иванович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Veselov</surname>
              <given-names>Dmitriy Ivanovich</given-names>
            </name>
          </name-alternatives>
          <email>diveselov@fa.ru</email>
          <xref ref-type="aff">aff-2</xref>
        </contrib>
        <contrib contrib-type="author">
          <contrib-id contrib-id-type="orcid">0000-0003-0735-7697</contrib-id>
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Андриянов</surname>
              <given-names>Никита Андреевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Andriyanov</surname>
              <given-names>Nikita Andreevich</given-names>
            </name>
          </name-alternatives>
          <email>naandriyanov@fa.ru</email>
          <xref ref-type="aff">aff-3</xref>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">Московский университет имени С.Ю. Витте</aff>
        <aff xml:lang="en">Moscow Witte University</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-2">
        <aff xml:lang="ru">Финансовый университет при Правительстве Российской Федерации</aff>
        <aff xml:lang="en">Financial University under the Government of the Russian Federation</aff>
      </aff-alternatives>
      <aff-alternatives id="aff-3">
        <aff xml:lang="ru">Финансовый университет при Правительстве Российской Федерации</aff>
        <aff xml:lang="en">Financial University under the Government of the Russian Federation</aff>
      </aff-alternatives>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>01</month>
        <year>2026</year>
      </pub-date>
      <volume>1</volume>
      <issue>1</issue>
      <elocation-id>10.26102/2310-6018/2026.57.6.017</elocation-id>
      <permissions>
        <copyright-statement>Copyright © Авторы, 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This work is licensed under a Creative Commons Attribution 4.0 International License</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://moitvivt.ru/ru/journal/article?id=2302"/>
      <abstract xml:lang="ru">
        <p>В работе проведено сравнение восьми алгоритмов машинного обучения для диагностики сердечно-сосудистых заболеваний на объединенной многоцентровой выборке из шести баз данных (n = 1 904). Предложены три клинически обоснованных производных признака: maxhrratio (отношение максимальной частоты сердечных сокращений к возрастному прогнозу), sthr index (отношение депрессии сегмента ST к максимальной частоте сердечных сокращений) и anginast flag (бинарный индикатор совместного присутствия типичной стенокардии и нисходящего уклона сегмента ST). Базовые алгоритмы – дерево решений, логистическая регрессия, случайный лес, XGBoost, CatBoost, LightGBM – обучались с байесовской оптимизацией гиперпараметров. Ансамблирование выполнено методами стекинга (предсказания на отложенных блоках, мета-ученик с калибровкой по методу Платта) и взвешенного мягкого голосования. Качество оценивалось по методу бутстрепа со смещением-коррекцией (10 000 итераций, 95 % доверительный интервал); попарное сравнение – тесты ДеЛонга и МакНемара с поправкой Бонферрони (28 пар, порог p &lt; 0,00179). Лучший результат среди одиночных моделей показал CatBoost: площадь под кривой рабочих характеристик 0,948 [0,922-0,966], гармоническое среднее точности и полноты 0,884, оценка Brier 0,097. Стекинг достиг площади под кривой рабочих характеристик 0,931 при наилучшей среди ансамблей калибровке (Brier 0,102). Аблационное исследование показало, что семь признаков обеспечивают 97,5 % качества полной модели. Консенсусное ранжирование на основе значений Шепли по четырем моделям поставило производный признак sthr index на четвертое место из четырнадцати, опередив семь исходных клинических переменных. Валидация методом исключения одного источника выявила несовместимость кодировок в двух из шести источников, подчеркивая необходимость аудита данных перед межучрежденческим развертыванием.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>Eight machine learning algorithms for cardiovascular disease diagnosis were compared on a combined multi-center dataset from six databases (n = 1.904). Three clinically motivated derived features were proposed: maxhrratio (ratio of maximum heart rate to age-predicted maximum), sthr index (ratio of ST-segment depression to maximum heart rate), and anginast flag (binary indicator of co-occurring typical angina and downsloping ST segment). Base algorithms – decision tree, logistic regression, random forest, XGBoost, CatBoost, LightGBM – were trained with Bayesian hyperparameter optimization (Optuna). Ensembling was performed via stacking (out-of-fold predictions, meta-learner with Platt calibration) and AUC-weighted soft voting. Performance was assessed using BCa bootstrap (10,000 iterations, 95 % CI); pairwise comparisons used DeLong and McNemar tests with Bonferroni correction (28 pairs, p &lt; 0.00179). CatBoost achieved the best single-model ROC-AUC = 0.948 [0.922–0.966], F1 = 0.884, Brier = 0.097. Stacking reached ROC-AUC = 0.931 with the best ensemble calibration (Brier = 0.102). Ablation study showed that seven features retain 97.5 % of full-model performance. SHAP consensus across four models ranked sthr index fourth among 14 features, ahead of seven original clinical variables. Leave-one-source-out validation revealed encoding incompatibilities in two of six sources, underscoring the need for data auditing prior to cross-institutional deployment.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>машинное обучение</kwd>
        <kwd>сердечно-сосудистые заболевания</kwd>
        <kwd>CatBoost</kwd>
        <kwd>стекинг</kwd>
        <kwd>SHAP</kwd>
        <kwd>BCa bootstrap</kwd>
        <kwd>NRI</kwd>
        <kwd>IDI</kwd>
        <kwd>многоцентровая выборка</kwd>
        <kwd>конструирование признаков</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>machine learning</kwd>
        <kwd>cardiovascular disease</kwd>
        <kwd>CatBoost</kwd>
        <kwd>stacking</kwd>
        <kwd>SHAP</kwd>
        <kwd>BCa bootstrap</kwd>
        <kwd>NRI</kwd>
        <kwd>IDI</kwd>
        <kwd>multi-center dataset</kwd>
        <kwd>feature engineering</kwd>
      </kwd-group>
      <funding-group>
        <funding-statement xml:lang="ru">Исследование выполнено без спонсорской поддержки.</funding-statement>
        <funding-statement xml:lang="en">The study was performed without external funding.</funding-statement>
      </funding-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="cit1">
        <label>1</label>
        <mixed-citation xml:lang="ru">Гусев А.В. Перспективы нейронных сетей и глубокого машинного обучения в создании решений для здравоохранения. Врач и информационные технологии. 2017;(3):92–105.</mixed-citation>
      </ref>
      <ref id="cit2">
        <label>2</label>
        <mixed-citation xml:lang="ru">Гусев А.В., Новицкий Р.Э., Ившин А.А., Алексеев А.А. Машинное обучение на лабораторных данных для прогнозирования заболеваний. ФАРМАКОЭКОНОМИКА. Современная фармакоэкономика и фармакоэпидемиология. 2021;14(4):581–592. https://doi.org/10.17749/2070-4909/farmakoekonomika.2021.115</mixed-citation>
      </ref>
      <ref id="cit3">
        <label>3</label>
        <mixed-citation xml:lang="ru">Киселёв А.А. Разработка модели машинного обучения для прогнозирования сердечно-сосудистых заболеваний. Символ науки. 2023;(1-1):9–12.</mixed-citation>
      </ref>
      <ref id="cit4">
        <label>4</label>
        <mixed-citation xml:lang="ru">Мамедов М.Н., Савчук Е.А., Каримов А.К. Искусственный интеллект в кардиологии. Международный журнал сердца и сосудистых заболеваний. 2024;12(43):5–11.</mixed-citation>
      </ref>
      <ref id="cit5">
        <label>5</label>
        <mixed-citation xml:lang="ru">Беленков Ю.Н., Кожевникова М.В., Хабарова Н.В., Ильгисонис И.С., Коробкова Е.О. Роль искусственного интеллекта в кардиологии. Кардиология. 2025;65(2):3–16. https://doi.org/10.18087/cardio.2025.2.n2879</mixed-citation>
      </ref>
      <ref id="cit6">
        <label>6</label>
        <mixed-citation xml:lang="ru">Гельцер Б.И., Циванюк М.М., Шахгельдян К.И., Рублев В.Ю. Методы машинного обучения как инструмент диагностических и прогностических исследований при ишемической болезни сердца. Российский кардиологический журнал. 2020;25(12). https://doi.org/10.15829/1560-4071-2020-3999</mixed-citation>
      </ref>
      <ref id="cit7">
        <label>7</label>
        <mixed-citation xml:lang="ru">Гельцер Б.И., Рублев В.Ю., Циванюк М.М., Шахгельдян К.И. Машинное обучение в прогнозировании ближайших и отдалённых результатов реваскуляризации миокарда: систематический обзор. Российский кардиологический журнал. 2021;26(8). https://doi.org/10.15829/1560-4071-2021-4505</mixed-citation>
      </ref>
      <ref id="cit8">
        <label>8</label>
        <mixed-citation xml:lang="ru">Каледина Е.А., Каледин О.Е., Кулягина Т.И. Применение методов машинного обучения для предсказания сердечно-сосудистых заболеваний на малых наборах данных. Проблемы информатики. 2022;(1):66–76. https://doi.org/10.24412/2073-0667-2022-1-66-76</mixed-citation>
      </ref>
      <ref id="cit9">
        <label>9</label>
        <mixed-citation xml:lang="ru">Prokhorenkova L., Gusev G., Vorobev A., Dorogush A.V., Gulin A. CatBoost: unbiased boosting with categorical features. In: Advances in Neural Information Processing Systems 31: Annual Conference on Neural Information Processing Systems 2018 (NeurIPS 2018), 03–08 December 2018, Montréal, Canada. 2018. P. 6639–6649.</mixed-citation>
      </ref>
      <ref id="cit10">
        <label>10</label>
        <mixed-citation xml:lang="ru">Dorogush A.V., Ershov V., Gulin A. CatBoost: gradient boosting with categorical features support. arXiv. URL: https://arxiv.org/abs/1810.11363 [Accessed 20th April 2026].</mixed-citation>
      </ref>
      <ref id="cit11">
        <label>11</label>
        <mixed-citation xml:lang="ru">Chen T., Guestrin C. XGBoost: A scalable tree boosting system. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 13–17 August 2016, San Francisco, CA, USA. New York: ACM; 2016. P. 785–794. https://doi.org/10.1145/2939672.2939785</mixed-citation>
      </ref>
      <ref id="cit12">
        <label>12</label>
        <mixed-citation xml:lang="ru">Ke G., Meng Q., Finley Th., et al. LightGBM: A highly efficient gradient boosting decision tree. In: Advances in Neural Information Processing Systems 30: Annual Conference on Neural Information Processing Systems 2017, 04–09 December 2017, Long Beach, CA, USA. 2017. P. 3146–3154.</mixed-citation>
      </ref>
      <ref id="cit13">
        <label>13</label>
        <mixed-citation xml:lang="ru">Wolpert D.H. Stacked generalization. Neural Networks. 1992;5(2):241–259. https://doi.org/10.1016/S0893-6080(05)80023-1</mixed-citation>
      </ref>
      <ref id="cit14">
        <label>14</label>
        <mixed-citation xml:lang="ru">Platt J.C. Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods. In: Advances in Large Margin Classifiers. Cambridge: MIT Press; 1999. P. 61–74.</mixed-citation>
      </ref>
      <ref id="cit15">
        <label>15</label>
        <mixed-citation xml:lang="ru">DiCiccio Th.J., Efron B. Bootstrap confidence intervals. Statistical Science. 1996;11(3):189–228.</mixed-citation>
      </ref>
      <ref id="cit16">
        <label>16</label>
        <mixed-citation xml:lang="ru">DeLong E.R., DeLong D.M., Clarke-Pearson D.L. Comparing the areas under two or more correlated receiver operating characteristic curves: A nonparametric approach. Biometrics. 1988;44(3):837–845.</mixed-citation>
      </ref>
      <ref id="cit17">
        <label>17</label>
        <mixed-citation xml:lang="ru">Pencina M.J., D'Agostino R.B., D'Agostino R.B., Vasan R.S. Evaluating the added predictive ability of a new marker: From area under the ROC curve to reclassification and beyond. Statistics in Medicine. 2008;27(2):157–172. https://doi.org/10.1002/sim.2929</mixed-citation>
      </ref>
      <ref id="cit18">
        <label>18</label>
        <mixed-citation xml:lang="ru">Lundberg S.M., Lee S.-I. A unified approach to interpreting model predictions. In: Advances in Neural Information Processing Systems 30: Annual Conference on Neural Information Processing Systems 2017, 04–09 December 2017, Long Beach, CA, USA. 2017. P. 4765–4774.</mixed-citation>
      </ref>
      <ref id="cit19">
        <label>19</label>
        <mixed-citation xml:lang="ru">Ханов А.М., Гусев А.В., Тюрганов А.Г. Искусственный интеллект в здравоохранении России: сбор и подготовка данных для машинного обучения. Журнал телемедицины и электронного здравоохранения. 2023;9(4):7–13. https://doi.org/10.29188/2712-9217-2023-9-4-7-13</mixed-citation>
      </ref>
      <ref id="cit20">
        <label>20</label>
        <mixed-citation xml:lang="ru">Гельцер Б.И., Шахгельдян К.И., Рублев В.Ю. и др. Фенотипирование факторов риска и прогнозирование внутригоспитальной летальности у больных ишемической болезнью сердца после коронарного шунтирования на основе методов объяснимого искусственного интеллекта. Российский кардиологический журнал. 2023;28(4). https://doi.org/10.15829/1560-4071-2023-5302</mixed-citation>
      </ref>
      <ref id="cit21">
        <label>21</label>
        <mixed-citation xml:lang="ru">Соловьёв И.А., Курочкина О.Н. Приложения искусственного интеллекта в кардиологии: обзор. Российский кардиологический журнал. 2024;29(11S). https://doi.org/10.15829/1560-4071-2024-5673</mixed-citation>
      </ref>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p>The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>