Построение гендерно- и возрастзависимых моделей оценки биовозраста на основе функциональных данных организма пациента
Работая с нашим сайтом, вы даете свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта отправляется в «Яндекс» и «Google»
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Построение гендерно- и возрастзависимых моделей оценки биовозраста на основе функциональных данных организма пациента

idЛимановская О.В., idГаврилов И.В., idМещанинов В.Н., idЛисовенко А.С.

УДК 51-76
DOI: 10.26102/2310-6018/2024.45.2.012

  • Аннотация
  • Список литературы
  • Об авторах

Методы машинного обучения широко используются для построения медицинских прогностических моделей. В то же время, наряду с методами, основанными на классической статистике, применяются байесовские методы, которые наиболее эффективны при малых объемах выборки. В данной работе построен ряд моделей прогнозирования биовозраста пациента на основе его функциональных данных с использованием как классических методов машинного обучения, так и байесовского подхода. В качестве данных использовались результаты кластеризации, проведенной нами ранее в предыдущем исследовании на материале медицинских организаций "Свердловский областной клинический психоневрологический госпиталь для ветеранов войн" и «Институт медицинских клеточных технологий» за 1995–2022 гг. в объеме 6440 записи, где было получено 4 кластера, разделенных по полу и статусу пациента (стационарный и амбулаторный). Исходя из предположения, что пациенты в амбулаторном статусе имеют наименьшую разницу биологического и календарного возраста и, поэтому, вносят меньшую ошибку в точность модели, чем пациенты в стационарном статусе, принято решение строить модели только для пациентов в амбулаторном статусе. В работе построен набор моделей для 2 кластеров – кластера мужчин в амбулаторном статусе (объем выборки 344 записи) и кластера женщин в амбулаторном статусе (объем выборки 991 запись). Анализ распределения возраста в каждой группе показал двумодальное распределение с границей при значении 40 лет. Поэтому группы были разделены по возрасту на две части: до 40 лет и после. Для выбора классических моделей машинного обучения использовалась платформа lazypredict. Для каждой группы выбирались 4 метода, дающие наибольшую точность и строились модели на их основе, а также использовались ансамбли моделей – stacking и votinmg. Точность моделей на тестовых данных составила от 4,1 до 6,3 лет. В байесовском подходе построена линейная многофакторная модель регрессии с заданным априорным распределением коэффициентов регрессии. Точность моделей составила от 4,9 до 6,6 лет.

1. Sidey-Gibbons J.A.M., Sidey-Gibbons Ch.J. Machine learning in medicine: a practical introduction. BMC Medical Research Methodology. 2019;19(1). https://doi.org/10.1186/s12874-019-0681-4

2. Гусев А.В., Гаврилов Д.В., Корсаков И.Н., Серова Л.М., Новицкий Р.Э., Кузнецова Т.Ю. Перспективы использования методов машинного обучения для предсказания сердечно-сосудистых заболеваний. Врач и информационные технологии. 2019;(3):41–47.

3. Гарри Д.Д., Саакян С.В., Хорошилова-Маслова И.П., Цыганков А.Ю., Никитин О.И., Тарасов Г.Ю. Методы машинного обучения в офтальмологии. Обзор литературы. Офтальмология. 2020;17(1):20–31. https://doi.org/10.18008/1816-5095-2020-1-20-31

4. Синотова С.Л., Солодушкин С.И., Плаксина А.Н., Макутина В.А. Интеллектуальная система поддержки принятия врачебных решений для прогнозирования исхода протокола вспомогательных репродуктивных технологий на различных этапах его проведения. Моделирование, оптимизация и информационные технологии. 2022;10(2). https://doi.org/10.26102/2310-6018/2022.37.2.009

5. Синотова С.Л., Лимановская О.В., Плаксина А.Н., Макутина В.А. Программное приложение для предсказания здоровья ребенка, рожденного при помощи вспомогательных репродуктивных технологий, по анамнезу матери. Моделирование, оптимизация и информационные технологии. 2021;9(3). https://doi.org/10.26102/2310-6018/2021.34.3.008

6. Гусев А.В., Новицкий Р.Э., Ившин А.А., Алексеев А.А. Машинное обучение на лабораторных данных для прогнозирования заболеваний. ФАРМАКОЭКОНОМИКА. Современная фармакоэкономика и фармакоэпидемиология. 2021;14(4):581–592. https://doi.org/10.17749/2070-4909/farmakoekonomika.2021.115

7. Жмудяк М.Л., Повалихин А.Н., Стребуков А.В., Жмудяк А.Л., Устинов Г.Г. Автоматизированная система медицинской диагностики заболеваний с учетом их динамики. Ползуновский вестник. 2006;(1):95–106.

8. Лимановская О.В., Мещанинов В.Н., Гаврилов И.В. Кластеризация пациентов на основе их функциональных, клинических и антропометрических показателей для построения моделей оценки биовозраста. Моделирование, оптимизация и информационные технологии. 2023;11(2). https://doi.org/10.26102/2310-6018/2023.41.2.011

9. Вьюгин В.В. Математические основы машинного обучения и прогнозирования. Москва: МЦМНО; 2013. 304 с.

10. Кобзарь А.И. Прикладная математическая статистика. Москва: ФИЗМАТЛИТ; 2006. 816 с.

11. Littlestone N., Warmuth M.K. The Weighted Majority Algorithm. Information and Computation. 1994;108(2):212–261. https://doi.org/10.1006/inco.1994.1009

Лимановская Оксана Викторовна
кандидат химических наук
Email: limanovskaya@mail.ru

ORCID |

Институт медицинских клеточных технологий

Екатеринбург, Российская Федерация

Гаврилов Илья Валерьевич
кандидат биологических наук

ORCID |

Уральский государственный медицинский университет Минздрава РФ
Институт медицинских клеточных технологий

Екатеринбург, Российская Федерация

Мещанинов Виктор Николаевич
доктор медицинских наук, профессор

ORCID |

Уральский государственный медицинский университет Минздрава РФ
Институт медицинских клеточных технологий

Екатеринбург, Российская Федерация

Лисовенко Антон Сергеевич

ORCID |

Уральский федеральный университет имени первого Президента России Б.Н. Ельцина

Екатеринбург, Российская Федерация

Ключевые слова: байесовский подход, случайный лес, ансамбли моделей, voiting, stacking, геропрофилактическое воздействие, прогнозирование эффективности лечения, биовозраст

Для цитирования: Лимановская О.В., Гаврилов И.В., Мещанинов В.Н., Лисовенко А.С. Построение гендерно- и возрастзависимых моделей оценки биовозраста на основе функциональных данных организма пациента. Моделирование, оптимизация и информационные технологии. 2024;12(2). URL: https://moitvivt.ru/ru/journal/pdf?id=1583 DOI: 10.26102/2310-6018/2024.45.2.012

170

Полный текст статьи в PDF

Поступила в редакцию 24.05.2024

Поступила после рецензирования 10.06.2024

Принята к публикации 14.06.2024

Опубликована 30.06.2024