В исследование была включена 1021 супружеская пара в возрасте от 21 до 44 лет, проходящая лечение бесплодия методом ВРТ. Критерии включения: наличие нормального кариотипа супругов, овариальная стимуляция по протоколу с антагонистом гонадотропин-рилизинг-гормона, селективный перенос эмбриона. Критерии исключения: аномалии строения матки, противопоказания к проведению программы ВРТ.
В качестве метода машинной обработки было использовано решающее дерево с применением языка Python в формате интерактивного ноутбука ipynb и анализом данных при помощи критерия Джини (Gini impurity). Были использованы следующие программные пакеты: scikit-learn, numpy, pandas, shap, matplotlib.
Были проанализированы следующие клинико-лабораторные характеристики пациентов: возраст женщины, возраст мужчины, уровень антимюллерова гормона (АМГ), фолликулостимулирующего гормона (ФСГ), индекс массы тела (ИМТ), наличие вредных привычек, возраст менархе, продолжительность кровотечений, длительность менструального цикла, начало половой жизни, количество беременностей, абортов, невынашиваний, внематочных беременностей в анамнезе, наличие инфекций, передающихся половым путем (ИППП), аднексита, эндометриоза, миомы матки, полипов, хронического эндометрита, синдрома поликистозных яичников (СПКЯ), кист яичников, резекции яичников, тубэктомии в анамнезе, продолжительность бесплодия, попытка ЭКО, фактор бесплодия.
Совместно с математиками и специалистами в области биоинформатики было построено 2 модели: линейной регрессии с оценкой значения р-value и модель МО с использованием решающего дерева, отражающая значимость анализируемых параметров и их «вес» в определении частоты вынашивания беременности. Согласно двум построенным моделям, показателями с максимальным значением в определении частоты невынашивания являются возраст, наличие беременностей от данного партнера в анамнезе, продолжительность стимуляции, качество эмбрионов, а также метод оплодотворения.
Исследования в данной области, в особенности с использованием МО в качестве инструмента обработки данных, позволяют создать программный продукт для более персонифицированного и интегрального прогноза частоты живорождения у каждой супружеской пары. Полученные результаты могут оптимизировать финансово-экономические затраты государства на проведение цикла ВРТ за счет средств обязательного медицинского страхования у разных групп пациентов. Более четкий и унифицированный алгоритм позволяет более таргетно воздействовать на наиболее вероятную причину невынашивания с учетом оптимизации временных затрат на подготовку при сохранении максимального эффекта для снижения частоты невынашивания после ВРТ.