菁易科研

医疗科研新突破 | 菁易科研解读:多代理模型如何精准预测阿尔茨海默病?

CARE-AD: a multi-agent large language model framework for Alzheimer’s disease prediction using longitudinal clinical notes.

研究背景

阿尔茨海默病(AD)是常见痴呆症病因,给社会带来沉重负担。随着人口老龄化,患病率预计大幅上升,早期检测和管理策略需求迫切。但现有诊断方法成本高、侵入性强,不适用于大规模筛查。且AD风险早期指标常被忽视,利用电子健康记录(EHR)非结构化叙述识别早期指标,对AD早期预测和干预至关重要。

方法速览

  1. 数据来源:使用美国退伍军人事务部(VHA)企业数据仓库(CDW)2000 - 2022年的EHR数据库,获VA机构审查委员会批准。
  2. 队列设计:采用病例对照设计,AD病例基于特定ICD代码定义,对照组从无痴呆诊断代码的VHA患者中选取。
  3. 多代理框架:开发多代理系统,含数据提取代理和五个领域专家代理,数据提取代理识别和分类AD相关症状,专家代理提供领域特定评估。
  4. 基线比较:实现多种基线方法,验证多代理系统优越性。

主要发现

  1. 数据提取代理性能:通过两步分类识别AD相关迹象和症状,二元分类任务表现出色,多类分类任务中各类别性能较高。
  2. 多代理风险预测:多代理系统在多个时间点预测性能一致,10年前预测准确率达0.53,优于单模型基线方法。
  3. 与单模型基线方法比较:多代理系统CARE - AD在所有预测时间点均优于单模型基线方法。
  4. 结构化数据基线:基于LLM的CARE - AD框架在所有预测时间点优于结构化数据模型。

总结展望

本研究提出的CARE - AD多代理系统创新性强,模拟多学科团队合作,利用非结构化EHR笔记提取AD指标,资源效率高。但研究存在数据来源代表性不足、观察窗口可能导致选择偏差等局限性。该研究为AD早期预测提供了新方法,未来需进一步优化以提高模型泛化能力。