Изучение аналитической обработки клинико-анамнестических и эмбриологических данных пациентов в программе вспомогательных репродуктивных технологий различными методами машинного обучения

Драпкина Ю.С., Макарова Н.П., Васильев Р.А., Амелин В.В., Франкевич В.Е., Калинина Е.А.

ФГБУ «Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии имени академика В.И. Кулакова» Министерства здравоохранения Российской Федерации, Москва, Россия

Анализ данных при помощи машинного обучения (МО) позволяет более точно и таргетно определить наиболее значимые корригируемые и некорригируемые предикторы наступления беременности в программах вспомогательных репродуктивных технологий (ВРТ) у пациенток разных возрастных групп. Прогнозирование результативности программы ВРТ при помощи МО может быть осуществлено с использованием различных алгоритмов в зависимости от типа данных и поставленной задачи.
Цель: Изучение аналитической обработки клинико-анамнестических и эмбриологических данных пациентов в программе ВРТ различными методами МО; определение точности прогнозирования результата ВРТ с использованием различных алгоритмов и выбор модели МО, имеющей максимальную практическую ценность в отношении наступления беременности.
Материалы и методы: В ретроспективное исследование были включены 854 супружеские пары. В исследовании были проанализированы данные клинико-лабораторных обследований и параметры стимулированного цикла в зависимости от эффективности программы ВРТ при помощи алгоритма градиентного бустинга над решающими деревьями (CatBoost).
Результаты: Среди факторов, оказывающих максимальное влияние на эффективность ВРТ, следует выделить наличие/отсутствие беременности в анамнезе, концентрацию сперматозоидов в эякуляте, а также количество эмбрионов, остановившихся в развитии. Создан программный продукт на основе алгоритма градиентного бустинга, прогнозирующий индивидуальную эффективность программы ВРТ. 
Заключение: Для улучшения прогнозирования эффективности программы ВРТ требуются более качественные математические модели с интегральным подходом к решению задачи, а также дополнительные маркеры, позволяющие улучшить точность программного продукта. Построение модели, включающей не только данные анамнеза супружеской пары, но и молекулярные маркеры, с использованием методов МО позволит не только определить наиболее точно максимально перспективные группы пациентов для проведения программы экстракорпорального оплодотворения, но и повысить эффективность программ ВРТ за счет селекции максимально качественного эмбриона для переноса. 

Вклад авторов: Драпкина Ю.С., Макарова Н.П., Франкевич В.Е., Калинина Е.А. – концепция и дизайн исследования; Драпкина Ю.С., Амелин В.В., Васильев Р.А. – сбор и обработка материала; Амелин В.В., Васильев Р.А. – статистическая обработка данных; Драпкина Ю.С., Амелин В.В., Васильев Р.А. – написание текста статьи; Калинина Е.А., Франкевич В.Е., Макарова Н.П. – редактирование.
Конфликт интересов: Авторы заявляют об отсутствии конфликта интересов.
Финансирование: Работа проведена без привлечения дополнительного финансирования со стороны третьих лиц.
Одобрение Этического комитета: Исследование было одобрено локальным Этическим комитетом ФГБУ «НМИЦ АГП им. академика В.И. Кулакова» Минздрава России.
Согласие пациентов на публикацию: Пациенты подписали информированное согласие на публикацию своих данных.
Обмен исследовательскими данными: Данные, подтверждающие выводы этого исследования, доступны по запросу у автора, ответственного за переписку, после одобрения ведущим исследователем.
Для цитирования: Драпкина Ю.С., Макарова Н.П., Васильев Р.А., Амелин В.В., Франкевич В.Е., Калинина Е.А. Изучение аналитической обработки клинико-анамнестических и эмбриологических данных пациентов в программе вспомогательных репродуктивных технологий различными методами машинного обучения.
Акушерство и гинекология. 2024; 3: 96-107
https://dx.doi.org/10.18565/aig.2023.281

Ключевые слова

искусственный интеллект
машинное обучение
программы ВРТ
прогнозирование эффективности
математические модели
клинико-анамнестические параметры
эмбриологические параметры

Список литературы

  1. Гусев А.В., Новицкий Р.Э., Ившин А.А., Алексеев А.А. Машинное обучение на лабораторных данных для прогнозирования заболеваний. ФАРМАКОЭКОНОМИКА. Современная фармакоэкономика и фармакоэпидемиология. 2021; 14(4): 581-92.
  2. Драпкина Ю.С., Калинина Е.А., Макарова Н.П., Мильчаков К.С., Франкевич В.Е. Искусственный интеллект в репродуктивной медицине: этические и клинические аспекты. Акушерство и гинекология. 2022; 11: 37-44.
  3. Сахибгареева М.В., Заозерский А.Ю. Разработка системы прогнозирования диагнозов заболеваний на основе искусственного интеллекта. Вестник РГМУ. 2017; 6: 42-6.
  4. Ившин А.А., Багаудин Т.З., Гусев А.В. Искусственный интеллект на страже репродуктивного здоровья. Акушерство и гинекология. 2021; 5: 17-24.
  5. Шелякин В.А., Губарева И.Д., Кокшарова Н.Г. О методике расчета дифференцированных подушевых нормативов финансового обеспечения обязательного медицинского страхования. Бюллетень Национального научно-исследовательского института общественного здоровья имени Н.А. Семашко. 2012; 5: 152-6.
  6. Raef B., Ferdousi R. A review of machine learning approaches in assisted reproductive technologies. Acta Inform. Med. 2019; 27(3): 205-11. https://dx.doi.org/10.5455/aim.2019.27.205-211.
  7. Elhazmi A., Al-Omari A., Sallam H., Mufti H.N., Rabie A.A., Alshahrani M. et al. Machine learning decision tree algorithm role for predicting mortality in critically ill adult COVID-19 patients admitted to the ICU. J. Infect. Public Health. 2022; 15(7): 826-34. https://dx.doi.org/10.1016/j.jiph.2022.06.008.
  8. Barberis E., Khoso S., Sica A., Falasca M., Gennari A., Dondero F. et al. Precision medicine approaches with metabolomics and artificial intelligence. Int. J. Mol. Sci. 2022; 23(19): 11269. https://dx.doi.org/10.3390/ijms231911269.
  9. Драпкина Ю.С., Макарова Н.П., Татаурова П.Д., Калинина Е.A. Поддержка врачебных решений с помощью глубокого машинного обучения при лечении бесплодия методами вспомогательных репродуктивных технологий. Медицинский Совет. 2023; 15: 27-37.
  10. Salditt M., Humberg S., Nestler S. Gradient tree boosting for hierarchical data. Multivariate Behav. Res. 2023; 58(5): 911-37. https://dx.doi.org/10.1080/00273171.2022.2146638.
  11. Wang C.W., Kuo C.Y., Chen C.H., Hsieh Y.H., Su E.C. Predicting clinical pregnancy using clinical features and machine learning algorithms in in vitro fertilization. PLOS One. 2022; 17(6): e0267554. https://dx.doi.org/10.1371/journal.pone.0267554.
  12. Al-Shehari T., Alsowail R.A. An insider data leakage detection using one-hot encoding, synthetic minority oversampling and machine learning techniques. Entropy (Basel). 2021; 23(10): 1258. https://dx.doi.org/10.3390/e23101258.
  13. Акжолов Р.К. Машинное обучение. Вестник науки. 2019; 3(6): 348-51.
  14. Hancock J.T., Khoshgoftaar T.M. CatBoost for big data: an interdisciplinary review. J. Big Data. 2020; 7(1): 94. https://dx.doi.org/10.1186/s40537-020-00369-8.
  15. Бучацкая В.В., Бучацкий П.Ю., Лобанов В.Е. Анализ алгоритмов прогнозирования. Вестник Адыгейского государственного университета. Серия 4: Естественно-математические и технические науки. 2020; 4: 49-52.
  16. XGBoost. Университет ИТМО. Электронные текстовые данные. Доступно по: https://neerc.ifmo.ru/wiki/index.php?title=XGBoost
  17. Ghosh D., Cabrera J. Enriched random forest for high dimensional genomic data. IEEE/ACM Trans. Comput. Biol. Bioinform. 2022; 19(5): 2817-28. https://dx.doi.org/10.1109/TCBB.2021.3089417.
  18. Hu J., Szymczak S. A review on longitudinal data analysis with random forest. Brief. Bioinform. 2023; 24(2): bbad002. https://dx.doi.org/10.1093/bib/bbad002.
  19. Ganaie M.A., Tanveer M., Suganthan P.N., Snasel V. Oblique and rotation double random forest. Neural Netw. 2022; 153: 496-517. https://dx.doi.org/10.1016/j.neunet.2022.06.012.
  20. Tikhaeva K., Nesterova N., Tomilov E., Sotkin S., Muhina A., Zavyalov P., Rosyuk E. Gradient boosting predictive model of ovarian response for hormonal therapy in infertility treatment. Russian Advances in Fuzzy Systems and Soft Computing: Selected Contributions to the 10th International Conference «Integrated Models and Soft Computing in Artificial Intelligence» (IMSC-2021), May 17-20, 2021, Kolomna, Russian Federation.
  21. Yiğit P., Bener A., Karabulut S. Comparison of machine learning classification techniques to predict implantation success in an IVF treatment cycle. Reprod. Biomed. Online. 2022; 45(5): 923-34. https://dx.doi.org/10.1016/j.rbmo.2022.06.022.
  22. Hansen K.R., He A.L., Styer A.K., Wild R.A., Butts S., Engmann L. et al. Predictors of pregnancy and live-birth in couples with unexplained infertility after ovarian stimulation-intrauterine insemination. Fertil. Steril. 2016; 105(6): 1575-83.e2. https://dx.doi.org/10.1016/j.fertnstert.2016.02.020.
  23. Meijerink A.M., Cissen M., Mochtar M.H., Fleischer K., Thoonen I., de Melker A.A. et al. Prediction model for live birth in ICSI using testicular extracted sperm. Hum. Reprod. 2016; 31(9): 1942-51. https://dx.doi. org/10.1093/humrep/dew146.
  24. Blank C., Wildeboer R.R., DeCroo I., Tilleman K., Weyers B., de Sutter P. et al. Prediction of implantation after blastocyst transfer in in vitro fertilization: a machine-learning perspective. Fertil. Steril, 2019; 111(2): 318-26. https://dx.doi.org/10.1016/j.fertnstert.2018.10.030.
  25. Qiu J., Li P., Dong M., Xin X., Tan J. Personalized prediction of live birth prior to the first in vitro fertilization treatment: a machine learning method. J. Transl. Med. 2019; 17(1): 317. https://dx.doi.org/10.1186/s12967-019-2062-5.
  26. Rodrigo L., Meseguer M., Mateu E., Mercader A., Peinado V., Bori L. et al. Sperm chromosomal abnormalities and their contribution to human embryo aneuploidy. Biol. Reprod. 2019; 101(6): 1091-101. https://dx.doi.org/10.1093/biolre/ioz125.
  27. Harris A.L., Vanegas J.C., Hariton E., Bortoletto P., Palmor M., Humphries L.A. et al. Semen parameters on the day of oocyte retrieval predict low fertilization during conventional insemination IVF cycles. J. Assist. Reprod. Genet. 2019; 36(2): 291-8. https://dx.doi.org/10.1007/s10815-018-1336-9.
  28. McCoy R.C., Summers M.C., McCollin A., Ottolini C.S., Ahuja K., Handyside A.H. Meiotic and mitotic aneuploidies drive arrest of in vitro fertilized human preimplantation embryos. Genome Med. 2023; 15(1): 77. https://dx.doi.org/10.1186/s13073-023-01231-1.
  29. Долудин Ю.В., Драпкина Ю.С., Сазонкина П.О., Киселев А.Р., Горбунов К.С. Виртуальная система хранения биологических образцов и ассоциированных данных. Свидетельство о государственной регистрации программы для ЭВМ. Номер свидетельства: RU 2023610092. Патентное ведомство: Россия. Год публикации: 2023. Номер заявки: 2022686282. Дата регистрации: 19.12.2022.

Поступила 06.12.2023

Принята в печать 26.02.2024

Об авторах / Для корреспонденции

Драпкина Юлия Сергеевна, к.м.н., н.с. отделения вспомогательных технологий в лечении бесплодия им. профессора Б.В. Леонова, Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии им. академика В.И. Кулакова МЗ РФ, 117997, Россия, Москва, ул. Академика Опарина, д. 4,
yu_drapkina@oparina4.ru, https://orcid.org/0000-0002-0545-1607
Макарова Наталья Петровна, д.б.н., в.н.с. отделения вспомогательных технологий в лечении бесплодия им. профессора Б.В. Леонова, Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии им. академика В.И. Кулакова МЗ РФ, 117997, Россия, Москва, ул. Академика Опарина, д. 4,
np_makarova@oparina4.ru, https://orcid.org/0000-0003-8922-2878
Васильев Роберт Андреевич, руководитель Лаборатории прикладного Искусственного Интеллекта Z-union, вице-президент Ассоциации Лабораторий по Развитию Искусственного Интеллекта, аспирант Московского физико-технического института (МФТИ), магистр кафедры прикладной физики и математики МФТИ,
магистр экономики (РАНХиГС при Президенте РФ), бакалавр Национального Исследовательского Университета «Московский институт электронной техники»
Амелин Владислав Владимирович, технический директор Лаборатории прикладного Искусственного Интеллекта Z-union, эксперт по машинному обучению, магистр Московского Государственного Университета (факультет вычислительной математики и кибернетики, кафедра математических методов прогнозирования),
бакалавр Национального Исследовательского Университета «Московский институт электронной техники».
Франкевич Владимир Евгеньевич, д.ф-м.н., заместитель директора института трансляционной медицины, Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии им. академика В.И. Кулакова МЗ РФ, 117997, Россия, Москва, ул. Академика Опарина, д. 4, v_vfrankevich@oparina4.ru,
https://orcid.org/0000-0002-9780-4579
Калинина Елена Анатольевна, д.м.н., профессор, заведующая отделением вспомогательных технологий в лечении бесплодия им. профессора Б.В. Леонова, Национальный медицинский исследовательский центр акушерства, гинекологии и перинатологии им. академика В.И. Кулакова МЗ РФ,
117997, Россия, Москва, ул. Академика Опарина, д. 4, e_kalinina@oparina4.ru, https://orcid.org/0000-0002-8922-2878

Также по теме

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.