Ключевые слова: кластеризация с учителем, АВ анализ групп, геропрофилактическое воздействие, прогнозирование эффективности лечения, биовозраст
Кластеризация пациентов на основе их функциональных, клинических и антропометрических показателей для построения моделей оценки биовозраста
УДК 51-76
DOI: 10.26102/2310-6018/2023.41.2.011
Кластерный анализ получил широкое распространение как инструмент анализа медицинских данных для выделения групп пациентов. Но несмотря на широкое применение кластерного анализа довольно редко встречаются работы, где наравне с выделением групп пациентов, математически обосновываются признаки, по которым произошло разделение на группы. Для решения этой задачи может быть применен метод, получивший название кластеризация с учителем, суть которого заключается в применении методов многоклассовой классификации с использованием меток кластеров как целевой переменной. В данной работе этот метод применен для выделения показателей, по которым произойдет разделение групп пациентов базы данных медицинской организации ГАУЗ СО «СОКП Госпиталь для ветеранов войн» и ГАУЗ СО «Институт медицинских клеточных технологий» за 1995-2022 гг. в объеме 6440 записей данных пациентов. В качестве метода кластеризации использован метод HDBscan, в качестве метода верификации полученных кластеров пациентов использован метод CatBoost в режиме многоклассовой классификации. В результате получено 4 кластера, разделившиеся по гендерному признаку и по состоянию пациента. Для выявления статистических отличий полученных кластеров проведен АВ анализ данных кластеров с использованием критерия Крускала-Уолиса. Результаты АВ анализа показали, что полученные кластеры имеют статистически значимые отличия по всем включенным в анализ функциональным параметрам. Далее был проведен АВ анализ различий функциональных показателей пациентов в амбулаторном и стационарном статусе для женского и мужского кластера. Для АВ анализа использовался перестановочный критерий и бутстрап с построением доверительных интервалов средних из генерированных в бутстрапе выборок.
1. Криштоп В.В., Пахрова О.А. Применение кластерного и корреляционного анализа для оценки гемореологических показателей у больных эссенциальной артериальной гипертензией. Успехи современного естествознания. 2014;9:11–16.
2. Deckersbach T., Peters A.T., Sylvia L.G., Gold A.K., da Silva Magalhaes P.V., Henry D.B., Frank E., Otto M.W., Berk M., Dougherty D.D., Nierenberg A.A., Miklowitz D.J. A Cluster Analytic Approach to Identifying Predictors and Moderators of Psychosocial Treatment for Bipolar Depression: Results from STEP-BD. J Affect Disord. 2016;203:152–157. DOI: 10.1016/j.jad.2016.03.064.
3. O'Regan A., Hannigan A., Glynn L., Garcia Bengoechea E., Donnelly A., Hayes G., Murphy A.W., Clifford A.M., Gallagher S., Woods C.B. A cluster analysis of device-measured physical activity behaviours and the association with chronic conditions, multi-morbidity and healthcare utilisation in adults aged 45 years and older. Woods Preventive Medicine Reports.2021;24:101641–101651. DOI: 10.1016/j.pmedr.2021.101641.
4. Serpa Neto A., Bos L.D., Campos P.P.Z.A., Hemmes S.N.T., Bluth T., Calfee C.S., Ferner M., Güldner A., Hollmann M.W., India I., Kiss T., Laufenberg-Feldmann R., Sprung J., Sulemanji D., Unzueta C., Vidal Melo M.F., Weingarten T.N., Tuip-de Boer A.M., Pelosi P., Gama de Abreu M., Schultz M.J. Association between pre-operative biological phenotypes and postoperative pulmonary complications an unbiased cluster analysis. Eur J Anaesthesiol. 2018;35:702–709. DOI: 10.1097/EJA.0000000000000846.
5. Gagnon P., Casaburi R., Saey D., Porszasz J., Provencher S., Milot J., Bourbeau J., O'Donnell D.E., Maltais F. Cluster Analysis in Patients with GOLD 1 Chronic Obstructive Pulmonary Disease PLoS ONE. 2015;10(4):e0123626. DOI: 10.1371/journal.pone.0123626.
6. Sharma A., Zheng Y., Ezekowitz J.A., Westerhout C.M., Udell J.A., Goodman S.G., Armstrong P.W., Buse J.B., Green J.B., Josse R.G., Kaufman K.D., McGuire D.K., Ambrosio G., Chuang L.M., Lopes R.D., Peterson E.D., Holman R.R. Cluster Analysis of Cardiovascular Phenotypes in Patients With Type 2 Diabetes and Established Atherosclerotic Cardiovascular Disease: A Potential Approach to Precision Medicine. Diabetes Care. 2022;45:204–212. DOI: 10.2337/dc20-2806.
7. Демченко М.В., Каширина И.Л., Фирюлина М.А. Кластеризация состояний пациентов для модели назначения схем лечения атеросклероза. Вестник ВГУ, серия: системный анализ и информационные технологии. 2021;2:126–137. DOI: https://doi.org/10.17308/sait.2021.2/3509.
8. Konno S., Taniguchi N., Makita H., Nakamaru Yu., Shimizu K., Shijubo N., Fuke S., Takeyabu K., Oguri M., Kimura H., Maeda Yu., Suzuki M., Nagai K., Yo. M. Ito, Wenzel S.E., Nishimuka M.. Distinct phenotypes of Cigarette Smokers Identified by Cluster Analysis of Patients with Severe Asthma. AnnalsATS. 2015;12(12):1771–1780. DOI: 10.1513/AnnalsATS.201507-407OC.
9. O'Regan A., Hannigan A., Glynn L., Garcia Bengoechea E., Donnelly A., Hayes G., Murphy A.W., Clifford A.M., Gallagher S., Woods C.B. A cluster analysis of device-measured physical activity behaviours and the association with chronic conditions, multi-morbidity and healthcare utilisation in adults aged 45 years and older. Preventive Medicine Reports. 2021;24:101641. DOI: 10.1016/j.pmedr.2021.101641.
10. Al-Harbi S.H., Rayward-Smith V.J. Adapting k-means for supervised clustering. Journal of Applied Intelligence. 2006;24(3):219–226.
11. McInnes L., Healy J. Accelerated Hierarchical Density Based Clustering. IEEE International Conference on Data Mining Workshops (ICDMW), IEEE. 2017;1:33–42.
12. CatBoost. Доступно по: https://catboost.ai (дата обращения 21.01.2023).
13. Мещанинов В.Н., Гаврилов И.В., Мякотных В.С., Щербаков Д.Л. Гендерные демографические и статистические особенности старения человека. Новые информационные технологии в образовании и науке. 2022;2(6):65–72.
14. Кобзарь А.И. Прикладная математическая статистика. М.: Физматлит; 2006. 466–468 с.
15. Колядин В.Л. Пермутационные критерии как универсальный непараметрический подход к проверке статистических гипотез. Радиоэлектроника и информатика. 2002;3(20):7–14.
16. Лимановская О.В. Гаврилов И.В. Мещанинов В.Н. Щербаков Д.Л. Колос Е.Н. Моделирование биологического возраста пациентов на основе их функциональных показателей. Моделирование, оптимизация и информационные технологии. 2021;9(2). Доступно по: https://moitvivt.ru/ru/journal/pdf?id=966 DOI: 10.26102/2310-6018/2021.33.2.028
Ключевые слова: кластеризация с учителем, АВ анализ групп, геропрофилактическое воздействие, прогнозирование эффективности лечения, биовозраст
Для цитирования: Лимановская О.В., Мещанинов В.Н., Гаврилов И.В. Кластеризация пациентов на основе их функциональных, клинических и антропометрических показателей для построения моделей оценки биовозраста. Моделирование, оптимизация и информационные технологии. 2023;11(2). URL: https://moitvivt.ru/ru/journal/pdf?id=1335 DOI: 10.26102/2310-6018/2023.41.2.011
Поступила в редакцию 20.03.2023
Поступила после рецензирования 24.04.2023
Принята к публикации 26.05.2023
Опубликована 30.06.2023