Разработка моделей расчета риска атеросклероза c использованием методов машинного обучения
Работая с нашим сайтом, вы даете свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта отправляется в «Яндекс» и «Google»
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Разработка моделей расчета риска атеросклероза c использованием методов машинного обучения

idКаширина И.Л., idФирюлина М.А., idДемченко М.В.

УДК 004.8
DOI: 10.26102/2310-6018/2021.33.2.023

  • Аннотация
  • Список литературы
  • Об авторах

Атеросклероз является одним из наиболее распространенных и опасных для жизни заболеваний, которое может развиваться уже в раннем возрасте. На начальных стадиях атеросклероз сложно обнаружить, поэтому его диагностика требует использования своевременных подходов, в частности, с привлечением методов машинного обучения. В предлагаемом исследовании разрабатываются модели и алгоритмы расчета риска развития атеросклероза магистральных артерий в зависимости от исходных клинических характеристик пациентов. В качестве обучающего набора данных была использована выборка международной базы данных MIMIC-III, имеющая структуру последовательных временных рядов, для обработки которых применялись рекуррентные глубокие нейронные сети архитектуры LSTM. В ходе решения задачи предсказания атеросклероза с использованием моделей SHAP были выявлены основные значимые признаки, наиболее ассоциированные с риском развития данного заболевания. В завершении данного исследования был произведен сравнительный анализ нейросетевой модели, обученной на данных MIMIC-III, с моделью расчета риска атеросклероза, разработанной с использованием регионального набора данных, полученного в результате обследования пациентов Воронежской области в рамках программы всеобщей диспансеризации. Качество разработанных моделей оценивалось с помощью показателей чувствительности, специфичности и ROC-AUC. В ходе исследования были выявлены сходства и различия разработанных моделей, касающиеся как признаков, включенных в исходные наборы данных, так и предикторов, ассоциированных с высоким риском развития атеросклероза.

1. Johnson A., Pollard T, Shen L. MIMIC-III, a freely accessible critical care database. Sci Data. 2016;3:160035. DOI: 10.1038/sdata.2016.35.

2. Harutyunyan H., Khachatrian H., Kale D. C. et. al. Multitask learning and benchmarking with clinical time series data. Sci Data. 2019;6(96). DOI: 10.1038/s41597-019-0103-9.

3. Komorowski M., Celi L., Badawi O., Gordon A. and Faisal A. The Artificial Intelligence Clinician learns optimal treatment strategies for sepsis in intensive care. Nature Medicine. 2018; 24(11):1716-1720. DOI: 10.1038/s41591-018-0213-5.

4. Хохлов Р.А., Гайдашев А.Э., Ахмеджанов Н.М. Предикторы атеросклеротического поражения артерий конечностей по данным кардиоангиологического скрининга взрослого населения. Рациональная фармакотерапия в кардиологии. 2015;11(5):470-476. DOI: 10.20996/1819-6446-2015-11-5-470-476.

5. Хохлов Р.А., Остроушко Н.И., Гайдашев А.Э., Кирсанов Д.В., Ахмеджанов Н.М. Использование многоканальной объемной сфигмографии для кардиоангиологического скрининга взрослого населения. Рациональная фармакотерапия в кардиологии. 2015;11(4):371-379. DOI: 10.20996/1819-6446-2015-11-4-371-379.

6. Demchenko M., Kashirina I. The development of the atherosclerosis diagnostic models under conditions of unbalanced classes. Journal of Physics: Conference Series. 2020;1479:012026. DOI: 10.1088/1742-6596/1479/1/012026.

7. Hochreiter S., Schmidhuber J. Long short-term memory. Neural Computation. 1997;9(8):1735-1780. DOI:10.1162/neco.1997.9.8.1735.

8. Шолле Ф. Глубокое обучение на Python. СПб: Питер, 2018:400.

9. Geron О. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. CA 95472: O’Reilly Media, Inc, 2019.

10. Shapley L.S. Notes on the n-Person Game -- II: The Value of an n-Person Game. Santa Monica, CA: RAND Corporation, 1951.

11. Ferreira A. Interpreting recurrent neural networks on multivariate time series. Available at: https://towardsdatascience.com/interpreting-recurrent-neural-networks-on-multivariate-time-series-ebec0edb8f5a (дата обращения 04.04.2021).

12. Molnar C. Interpretable machine learning. A Guide for Making Black Box Models Explainable. Available at: https://christophm.github.io/interpretable-ml-book/ (дата обращения 04.04.2021).

Каширина Ирина Леонидовна
доктор технических наук, доцент

ORCID |

Воронежский государственный университет

Воронеж, Россия

Фирюлина Мария Андреевна

ORCID |

Воронежский государственный университет

Воронеж, Россия

Демченко Мария Владиславовна

ORCID |

Воронежский государственный университет

Воронеж, Россия

Ключевые слова: машинное обучение, медицинская диагностика, прогнозирование риска атеросклероза, рекуррентная нейронная сеть LSTM, модель SHAP

Для цитирования: Каширина И.Л., Фирюлина М.А., Демченко М.В. Разработка моделей расчета риска атеросклероза c использованием методов машинного обучения. Моделирование, оптимизация и информационные технологии. 2021;9(2). URL: https://moitvivt.ru/ru/journal/pdf?id=993 DOI: 10.26102/2310-6018/2021.33.2.023

745

Полный текст статьи в PDF

Принята к публикации 30.07.2021

Опубликована 30.06.2021