Ключевые слова: машинное обучение, вспомогательные репродуктивные технологии, экспертная система, программное приложение, предсказание здоровья ребенка
Программное приложение для предсказания здоровья ребенка, рожденного при помощи вспомогательных репродуктивных технологий, по анамнезу матери
УДК 519.683
DOI: 10.26102/2310-6018/2021.34.3.008
Вспомогательные репродуктивные технологии (ВРТ) много лет помогают обрести ребенка при невозможности зачатия естественным путем. Успешным протокол ВРТ можно считать не только при наступлении беременности, но и при успешном ее завершении – рождении здорового ребенка. В статье описано создание программного приложения для сотрудников центров ВРТ, помогающее сделать прогноз результата протокола, включающий в себя вероятность наступления беременности, прогноз возможных осложнений при ее течении, прогноз срока и способа родоразрешения, а также группы здоровья (1-5) рожденного ребенка. Для создания приложения использовались данные о 854 протоколах, осуществленных в 2016-2018 годах, в результате которых родилось 464 ребенка. Анализ их здоровья содержит информацию в возрасте от рождения до трех лет. Приложение использует шестнадцать бинарных классификаторов, девять из которых реализуют многоклассовые классификации срока родов, способа родоразрешения, группы здоровья ребенка. Для реализации мультиклассового вывода использовалась стратегия «один против всех». Для проверки качества использовалась кросс-валидация. Остальные 7 классификаторов предсказывают вероятность наступления беременности и возникновение ее осложнений: истмико-цервикальная недостаточность, гипертонические расстройства, предлежание плаценты, гестационный сахарный диабет, нарушения количества околоплодных вод и преждевременный разрыв плодных оболочек. Все модели построены на языке python на основе случайного леса. Интерфейс создан при помощи библиотек PyQT5 и QtDesigner.
1. David J McLernon, Ewout W Steyerberg, Egbert R te Velde, Amanda J Lee, Siladitya Bhattacharya. Predicting the chances of a live birth after one or more complete cycles of in vitro fertilisation: population based study of linked cycle data from 113 873 women. BMJ. 2016;355(8082) DOI: 10.1136/bmj.i5735
2. Porcu, G., Lehert, P., Colella, C, Giorgetti C. Predicting live birth chances for women with multiple consecutive failing IVF cycles: a simple and accurate prediction for routine medical practice. Reproductive Biology and Endocrinology. 2013;11(1) DOI: 10.1186/1477-7827-11-1
3. Katarina Kebbon Vaegter, Tatevik Ghukasyan Lakic, Matts Olovsson, Lars Berglund, Thomas Brodin, Jan Holte. Which factors are most predictive for live birth after in vitro fertilization and intracytoplasmic sperm injection (IVF/ICSI) treatments? Analysis of 100 prospectively recorded variables in 8,400 IVF/ICSI single-embryo transfers. Fertility and Sterility. 2017;107(3):641-648.e2 DOI: 10.1016/j.fertnstert.2016.12.005.
4. Dhillon R.K., McLernon D.J., Smith P.P., Fishel S., Dowell K., Deeks J.J., Bhattacharya S., Coomarasamy A. Predicting the chance of live birth for women undergoing IVF: a novel pretreatment counselling tool. Hum Reprod. 2016;31(1):84-92 DOI: 10.1093/humrep/dev268
5. Bergh C., Wennerholm U.B. Long-term health of children conceived after assisted reproductive technology. Ups J Med Sci. 2020;125(2):152-157 DOI: 10.1080/0300973 4.2020.1729904
6. Heijligers M., Peeters A., van Montfoort A., Nijsten J., Janssen E., Gunnewiek F.K., de Rooy R., van Golde R., Coonen E., Meijer-Hoogeveen M., Broekmans F., van der Hoeven M., Arens Y., de Die-Smulders C. Growth, health, and motor development of 5-year-old children born after preimplantation genetic diagnosis. Fertil Steril. 2019;111(6):1151-1158 DOI: 10.1016/j.fertnstert.2019.01.035
7. Qiu J., Li P., Dong M., Xin X., Tan J. Personalized prediction of live birth prior to the first in vitro fertilization treatment: a machine learning method. J Transl Med. 2019;17:317 DOI: 10.1186/s12967-019-2062-5
8. Zare S., Thomsen M.R., Nayga R.M., Goudie A. Use of Machine Learning to Determine the Information Value of a BMI Screening Program. American Journal of Preventive Medicine. 2021;60(3):425-433. DOI: 10.1016/j.amepre.2020.10.016
9. Bose S., Kenyon C.C., Masino A.J. Personalized prediction of early childhood asthma persistence: A machine learning approach. PLOS ONE. 2021;16(3):1-17 DOI: 10.1371/journal.pone.0247784
10. Pedregosa et al. Scikit-learn: Machine Learning in Python. JMLR. 2011;12:2825-2830
11. Breiman L. Random Forests. Machine Learning. 2001;45:5-32
12. Классификатор RandomForestClassifier из библиотеки Scikit-Learn. Доступно по: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClass ifier.html (дата обращения 15.07.2021)
13. Морфологический анализатор pymorphy2. Доступно по: https://pymorphy2.readthedocs.io/en/latest/ (дата обращения 15.07.2021)
14. CountVectorizer из библиотеки Scikit-Learn. Доступно по: https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html#sklearn.feature_extraction.text.CountVectorizer (дата обращения 15.07.2021)
15. TfidfVectorizer из библиотеки Scikit-Learn. Доступно по: https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html#sklearn.feature_extraction.text.TfidfVectorizer (дата обращения 15.07.2021)
16. Arthur D., Vassilvitskii S. K-means++: the advantages of careful seeding. Proc. of the Eighteenth Annu. ACM-SIAM Symp. on Discrete Algorithms, New Orleans, Louisiana, USA. 2007:1027-1035 DOI:10.1145/1283383.1283494
17. Кластеризация K-Means из библиотеки Scikit-Learn. Доступно по: https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html?highlight=k%20means#sklearn.cluster.KMeans (дата обращения 15.07.2021)
18. Kursa M.B., Rudnicki W.R. Feature Selection with the Boruta Package. Journal of Statistical Software. 2010;36(11):1-13 DOI: 10.18637/jss.v036.i11
19. Реализация алгоритма Boruta для Python. Доступно по: https://github.com/scikit-learncontrib/boruta_py (дата обращения 15.07.2021)
20. He, H.; Bai, Y.; Garcia, E.A.; Li, S. ADASYN: Adaptive synthetic sampling approach for imbalanced learning. Proceedings of the 2008 IEEE International Joint Conference on Neural Networks (IEEE World Congress on Computational Intelligence), Hong Kong, China. 2008; 1322–1328. DOI: 10.1109/IJCNN.2008.4633969
21. Lemaitre G., Nogueira F., Aridas C.K. Imbalanced-learn: Imbalanced-learn: A python toolbox to tackle the curse of imbalanced datasets in machine learning. JMLR. 2017;18(17):1-5
22. Kohavi R. A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection. Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, San Mateo, CA. 1995;2(12):1137-1143
23. Stone M. Cross-Validatory Choice and Assessment of Statistical Predictions. Journal of the Royal Statistical Society, Series B (Methodological). 1974;36(2):111-147
24. Реализация кросс-валидации StratifiedKFold в библиотеке Scikit-Learn. Доступно по: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.Stratified KFold.html (дата обращения 15.07.2021)
25. Набор библиотек Python для создания графического интерфейса на базе Qt5. Доступно по: https://pypi.org/project/PyQt5/ (дата обращения 15.07.2021)
26. Qt Designer. Доступно по: https://build-system.fman.io/qt-designer-download (дата обращения 15.07.2021)
27. Библиотека Pickle. Доступно по: https://docs.python.org/3.6/library/pickle.html (дата обращения 15.07.2021)
28. Rifkin R., Klautau A. In Defense of One-Vs-All Classification. JMLR. 2004;5:101-104
29. Приказ Минздрава РФ № 621 «О комплексной оценке состояния здоровья детей», 2003
Ключевые слова: машинное обучение, вспомогательные репродуктивные технологии, экспертная система, программное приложение, предсказание здоровья ребенка
Для цитирования: Синотова С.Л., Лимановская О.В., Плаксина А.Н., Макутина В.А. Программное приложение для предсказания здоровья ребенка, рожденного при помощи вспомогательных репродуктивных технологий, по анамнезу матери. Моделирование, оптимизация и информационные технологии. 2021;9(3). URL: https://moitvivt.ru/ru/journal/pdf?id=1021 DOI: 10.26102/2310-6018/2021.34.3.008
Поступила в редакцию 14.07.2021
Поступила после рецензирования 16.09.2021
Принята к публикации 27.09.2021
Опубликована 30.09.2021