Первый зарегистрированный случай рака поджелудочной железы относится к 18 веку. С тех пор исследователи предприняли длительную и сложную одиссею, чтобы понять неуловимую и смертельную болезнь. На сегодняшний день нет лучшего лечения рака, чем раннее вмешательство. К сожалению, поджелудочная железа, расположенная глубоко в брюшной полости, особенно неуловима для раннего обнаружения.
Ученые Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) вместе с Лимором Аппельбаумом, научным сотрудником отделения радиационной онкологии Медицинского центра Бет Исраэль Диаконесса (BIDMC), стремились лучше выявлять потенциальных пациентов с высоким риском. Они намеревались разработать две модели машинного обучения для раннего выявления аденокарциномы протоков поджелудочной железы (PDAC), наиболее распространенной формы рака. Чтобы получить доступ к обширной и разнообразной базе данных, команда синхронизировалась с федеральной сетевой компанией, используя данные электронных медицинских карт из различных учреждений по всей территории Соединенных Штатов. Этот обширный пул данных помог обеспечить надежность и универсальность моделей, что сделало их применимыми к широкому кругу групп населения, географических мест и демографических групп.
«В этом отчете изложен мощный подход к использованию больших данных и алгоритмов искусственного интеллекта для совершенствования нашего подхода к выявлению профилей риска рака», — говорит Дэвид Авиган, профессор Гарвардской медицинской школы, директор онкологического центра и руководитель отделения гематологии и гематологических злокачественных новообразований в BIDMC. , который не принимал участия в исследовании. «Этот подход может привести к разработке новых стратегий выявления пациентов с высоким риском злокачественных новообразований, которым может быть полезен целенаправленный скрининг с возможностью раннего вмешательства».
Призматические перспективы
Путь к разработке PRISM начался более шести лет назад, чему способствовал непосредственный опыт ограничений современной диагностической практики. «Приблизительно 80-85 процентов пациентов с раком поджелудочной железы диагностируются на поздних стадиях, когда лечение уже невозможно», — говорит старший автор Аппельбаум, который также является преподавателем Гарвардской медицинской школы и онкологом-радиологом. «Это клиническое разочарование породило идею углубиться в богатство данных, доступных в электронных медицинских записях (ЭМК)».
Тесное сотрудничество группы CSAIL с Аппельбаумом позволило лучше понять совокупность медицинских аспектов проблемы и аспектов машинного обучения, что в конечном итоге привело к гораздо более точной и прозрачной модели. «Гипотеза заключалась в том, что эти записи содержали скрытые подсказки — тонкие признаки и симптомы, которые могли служить сигналами раннего предупреждения рака поджелудочной железы», — добавляет она. «Это послужило основой для использования федеративных сетей EHR при разработке этих моделей для масштабируемого подхода к развертыванию инструментов прогнозирования рисков в здравоохранении».
Модели PrismNN и PrismLR анализируют данные EHR, включая демографические данные пациентов, диагнозы, лекарства и результаты лабораторных исследований, чтобы оценить риск PDAC. PrismNN использует искусственные нейронные сети для обнаружения сложных закономерностей в таких характеристиках данных, как возраст, история болезни и результаты лабораторных исследований, что дает оценку риска для вероятности PDAC. PrismLR использует логистическую регрессию для более простого анализа, генерируя оценку вероятности PDAC на основе этих функций. Вместе модели предлагают тщательную оценку различных подходов к прогнозированию риска PDAC на основе одних и тех же данных EHR.
Команда отмечает, что одним из важнейших моментов для завоевания доверия врачей является лучшее понимание того, как работают модели, что в этой области называется интерпретируемостью. Ученые отметили, что, хотя модели логистической регрессии по своей сути легче интерпретировать, последние достижения сделали глубокие нейронные сети несколько более прозрачными. Это помогло команде уточнить тысячи потенциально прогностических характеристик, полученных из ЭМК одного пациента, примерно до 85 критических показателей. Эти показатели, в том числе возраст пациента, диагноз диабета и повышенная частота посещений врача, автоматически определяются моделью, но соответствуют пониманию врачей факторов риска, связанных с раком поджелудочной железы.
Путь вперед
Несмотря на многообещающие свойства моделей PRISM, как и во всех исследованиях, некоторые их части все еще находятся в стадии разработки. Только данные по США представляют собой текущую диету для моделей, требующую тестирования и адаптации для глобального использования. Команда отмечает, что путь вперед включает расширение применимости модели к международным наборам данных и интеграцию дополнительных биомаркеров для более точной оценки рисков.
«Нашей последующей целью является содействие внедрению моделей в обычных медицинских учреждениях. Идея состоит в том, чтобы эти модели бесперебойно функционировали на фоне систем здравоохранения, автоматически анализируя данные пациентов и предупреждая врачей о случаях высокого риска, не увеличивая при этом их рабочую нагрузку», — говорит Цзя. «Модель машинного обучения, интегрированная с системой EHR, может дать врачам возможность раннего оповещения пациентов из группы высокого риска, что потенциально позволит принять меры задолго до проявления симптомов. Мы стремимся применить наши методы в реальном мире, чтобы помочь всем людям наслаждаться более долгой и здоровой жизнью».
Цзя написал статью вместе с Эпплбаумом, профессором EECS Массачусетского технологического института и главным исследователем CSAIL Мартином Ринардом, которые оба являются старшими авторами статьи. Исследователей, работавших над этой статьей, во время их пребывания в MIT CSAIL поддерживали, в частности, Агентство перспективных исследовательских проектов Министерства обороны, компания Boeing, Национальный научный фонд и лаборатории Aarno Labs. TriNetX предоставила ресурсы для проекта, а Фонд профилактики рака также поддержал команду.