Материалы и методы
При разработке и внутренней проверке прогностической модели использовались 272 712 показателей уровня глюкозы в крови 1148 женщин с ГСД, которые наблюдались в больницах Оксфордского университета с апреля 2018 года по май 2021 года.
При разработке использовались данные 672 беременностей, а при первоначальной проверке использовались данные еще 168 беременностей.
Для дальнейшей проверки использовались данные еще 186 беременностей, по поводу которых женщины наблюдались в другой больнице в Англии.
Все участницы использовали приложение для смартфонов GDm-Health для записи измерений уровня глюкозы в крови и передачи информации исследователям.
Участники должны были измерять и записывать уровень глюкозы от 4х до 6 раз в день не менее 3х раз в неделю.
Исследователи оценили модели регрессии, которые они разработали, на основе их среднеквадратичной ошибки (MSE), их значения R2 (мера качества подгонки модели) и их средней абсолютной ошибки (MAE).
Результаты
Показатели MSE, R2, MAE и коэффициент точности предполагали, что наиболее эффективная модель была умеренно точной для прогнозирования высоких значений уровня глюкозы в крови, но требует дальнейшего уточнения, чтобы быть пригодной для клинической практики.
Анализ также показал, что ансамблевые модели на основе деревьев значительно превосходят линейные модели.
Это может быть связано с тем, что древовидные модели учитывают нелинейные эффекты входных данных.
В целом, общая производительность моделей не претерпела существенных изменений при добавлении дополнительных показателей помимо уровня глюкозы крови.
Это может быть связано с размером набора данных: большее количество входных данных часто требует большего размера выборки для обучения модели.
Ограничения
Модель была умеренно точной для прогнозирования высоких значений уровня глюкозы в крови, но нуждается в дальнейшем уточнении с использованием более крупной выборки, чтобы повысить точность и определить, какие искажающие факторы необходимо включить, чтобы сделать ее пригодной для клинической практики.
Поскольку каждая участница отвечал за сбор и запись своих данных об уровне глюкозы крови, количество записей сильно варьировалось, при этом некоторые женщины вводили больше значений, чем другие, что могло привести к систематической ошибке.
Собранные данные не проясняют, когда пациентки начали или прекратили прием лекарств, связанных с ГСД.
У многих участниц исследования отсутствовали данные.
Число удаленных участников с отсутствующими значениями составило 70% когорты внутренней проверки и 25% когорты внешней проверки.
Будущая работа над алгоритмом должна использовать большее количество данных, а будущие модели могут рассмотреть возможность добавления дополнительных показателей, таких как индекс массы тела.
Авторы признали, что другие измерения, не включенные в их анализ, могут работать лучше, чем модель, основанная исключительно на глюкозе крови.
Заключение
Исследователи использовали машинное обучение для разработки алгоритма, который может идентифицировать женщин с ранее диагностированным ГСД, которые подвержены высокому риску надвигающегося острого эпизода гипергликемии.
Алгоритм, усовершенствованный с помощью машинного обучения, основан на показаниях уровня глюкозы, о которых сообщают сами пациентки за последние 3 дня, и дополняется системой GDm-Health, ранее разработанной некоторыми из тех же исследователей, которая дает женщинам с диагнозом ГСД возможность систематически записывать значения уровня глюкозы.
Надлежащая оценка, ведение и лечение ГСД могут уменьшить осложнения, связанные с ГСД как для матери, так и для плода.
Этот алгоритм может быть интеллектуальным дополнением к системе GDm-Health на базе смартфона для мониторинга женщин с ГСД или автономной системой для любой клиники при наличии доступа к ежедневным данным пациенток.
Это первая система стратификации на основе машинного обучения для количественной оценки риска гипергликемии у женщин с ГСД.
Источник: medscape.com/viewarticle/976755