banner

Новости

Oct 05, 2023

Использование клинических данных медицинских учреждений для постоянного изучения моделей прогнозирования риска

Научные отчеты, том 12, Номер статьи: 8380 (2022) Цитировать эту статью

Доступы за 2018 год

5 цитат

11 Альтметрика

Подробности о метриках

Природная гибкость клинических прогностических моделей на основе машинного обучения, позволяющая учиться на эпизодах ухода за пациентами в новом учреждении (обучение для конкретного учреждения), достигается за счет снижения производительности при применении к внешним когортам пациентов. Чтобы использовать весь потенциал межинституциональных клинических больших данных, системы машинного обучения должны получить возможность передавать свои знания через институциональные границы и учиться на новых эпизодах ухода за пациентами, не забывая ранее изученные закономерности. В этой работе мы разработали сохраняющий конфиденциальность алгоритм обучения под названием WUPERR (распространение неопределенности веса и воспроизведение эпизодического представления) и проверили этот алгоритм в контексте раннего прогнозирования сепсиса, используя данные более чем 104 000 пациентов из четырех различных систем здравоохранения. Мы проверили гипотезу о том, что предложенный алгоритм непрерывного обучения может поддерживать более высокую прогностическую эффективность, чем конкурирующие методы на предыдущих когортах, после того, как он был обучен на новой когорте пациентов. В задаче прогнозирования сепсиса после поэтапного обучения модели глубокого обучения в четырех больничных системах (а именно в больницах HA, HB, HC и HD) WUPERR сохранил самую высокую положительную прогностическую ценность в первых трех больницах по сравнению с базовым подходом с переносом обучения. (HA: 39,27% против 31,27%, HB: 25,34% против 22,34%, HC: 30,33% против 28,33%). Предлагаемый подход имеет потенциал для создания более обобщаемых моделей, которые могут учиться на межинституциональных клинических больших данных с сохранением конфиденциальности.

Замечательное возрождение искусственного интеллекта и его влияние на промышленную автоматизацию, оптимизацию удовлетворенности клиентов и доходов за последнее десятилетие привели к растущему интересу к применению связанных технологий в здравоохранении1,2,3. В частности, в клинической медицине повышенное внимание уделяется методам глубокого обучения, включая скрининг и сортировку, диагностику, прогнозирование, поддержку принятия решений и рекомендации по лечению4,5,6,7,8,9,10,11,12,13. Чтобы получить широкое клиническое применение, клинические модели, основанные на глубоком обучении, должны быть обобщаемыми и переносимыми, а также обеспечивать конфиденциальность пациентов, чьи данные используются для обучения и оценки моделей14,15. На практике модели, обученные на данных одной системы здравоохранения, часто страдают от недостатка обобщаемости из-за различий в местной демографии, лабораторном оборудовании и анализах, электронных медицинских записях (ЭМК), частоте измерения данных и различиях в клинической и административной практике, включая кодирование и определение различных клинических диагнозов16. Утверждалось, что клинические большие данные в сочетании с присущей моделям глубокого обучения гибкостью для обучения на новых данных/опыте теоретически могут устранить часть этой неоднородности. Однако данные о здравоохранении остаются разрозненными, а доступность данных и конфиденциальность пациентов представляют собой серьезную проблему для полного использования возможностей расширенной аналитики в сфере здравоохранения15,17. Таким образом, в настоящее время типичные клинические данные, используемые для разработки моделей, часто на несколько порядков меньше, чем те, которые используются в промышленных приложениях глубокого обучения18.

Недавняя независимая и внешняя проверка широко используемой оценки риска прогнозирования сепсиса на основе машинного обучения выявила проблему обобщаемости модели при наличии смещения распределения данных и изменений в структуре случаев заболевания19,20. Потенциальным решением для повышения внешней валидности систем глубокого обучения является точная настройка таких моделей в каждом новом учреждении ухода (так называемое трансферное обучение)21,22. Однако этот подход может привести к тому, что множество версий одного и того же алгоритма будут работать в разных учреждениях по оказанию медицинской помощи, что вызывает проблемы со стороны регулирующих органов в отношении управления изменениями и научные проблемы, связанные с получением обобщаемых знаний23. Поэтому желательно разработать алгоритмы и модели обучения, которые смогут использовать данные пациентов в различных группах пациентов с сохранением конфиденциальности и с четко определенными планами контроля изменений24, которые могут поддерживать приемлемую производительность, одновременно управляя потенциальным риском для пациентов.

ДЕЛИТЬСЯ