AI模型绘制终身疾病风险图谱,革新医疗规划未来

17次阅读
没有评论

共计 1860 个字符,预计需要花费 5 分钟才能阅读完成。

一种强大的新 AI 技术能够预测 1000 多种疾病在人的一生中可能的发展,为精准预防、政策规划和医疗创新开辟了新途径。

在最近发表在《自然》杂志上的一项研究中,研究人员开发了一种机器学习模型,利用大规模健康数据,根据患者过去的医疗历史预测 1256 种不同的 ICD-10 三级疾病的发展。该模型展示了与现有分析单一疾病的工具相当的预测准确性,并展示了模拟未来长达二十年健康轨迹的潜力,提供了关于个性化健康风险和共病性的见解。

AI 模型绘制终身疾病风险图谱,革新医疗规划未来

人类疾病的发展涉及健康期、急性病和慢性病,通常表现为由遗传、生活方式和社会经济因素影响的共病性集群。理解这些模式对于提供个性化医疗、生活方式指导和实施有效的早期筛查计划至关重要。然而,传统算法主要设计用于单一疾病,无法捕捉 1000 多种已识别健康状况的复杂性。

这一局限性在老龄化人口的背景下尤为重要,预计在未来几十年内,癌症、糖尿病、心血管疾病和痴呆等疾病的负担将显著增加。因此,准确建模疾病轨迹对于医疗规划和经济政策至关重要。人工智能,特别是大型语言模型(LLMs),提供了一个有前景的解决方案。这些模型擅长学习数据序列中的依赖关系,类似于基于先前健康事件预测疾病。

研究人员创建了 Delphi-2M,一个基于变压器的模型,用于预测终身疾病轨迹。与处理单词的语言模型不同,Delphi-2M 处理了来自国际疾病分类第十版(ICD-10)的诊断代码,以及死亡、性别、BMI 和生活方式因素,如吸烟和饮酒。为了解决医疗记录中的空白,团队插入了人工“无事件”标记。它包括性别和生活方式标记,词汇表涵盖疾病代码、生活方式水平、性别、无事件和填充标记(总共约 1270 个)。

训练基于来自英国生物银行的大规模健康记录,包括 402,799 名参与者用于训练,100,639 名用于验证,471,057 名用于纵向测试。为了测试通用性,模型还在 193 万丹麦人的数据上进行了验证。对基础模型进行了几项修改以适应健康数据:用连续年龄编码替换位置编码,添加输出头以预测下次事件的时间,并改变注意力掩码以防止同一时间点的标记相互影响。

Delphi-2M 可以估计 1000 多种疾病的风险,预测诊断时间,并模拟完整的健康轨迹。通过超参数调优优化了性能,结果是一个 220 万参数的模型,结合了预测准确性和生成能力,提供了一种新的建模共病性和长期健康进展的方法。

Delphi-2M 的性能使用来自英国生物银行 63,622 名参与者至 60 岁的健康数据进行了评估。模型生成了模拟的健康轨迹,并将其与真实结果进行了比较。对 70 岁和 75 岁疾病率的预测与观察到的模式密切匹配,证实了其捕捉人口水平发病趋势的能力。虽然预测准确性在更长时间范围内有所下降,从平均 AUC 约 0.76 降至 10 年后的约 0.70,但 Delphi-2M 仍然优于仅基于年龄和性别的模型。

该模型有效地区分了由生活方式或先前疾病定义的亚组的风险,支持其个性化风险分析的价值。重要的是,Delphi-2M 还可以生成反映真实世界疾病模式的合成健康轨迹,而无需复制个人记录。仅在此合成数据上训练的模型保留了大部分原始性能,AUC 仅下降三点。这突出了其在隐私保护研究中的潜在应用。

为了解释预测,研究人员检查了嵌入空间,揭示了与 ICD-10 章节一致的疾病集群,并展示了特定诊断如何影响结果,如胰腺癌对死亡率的强烈影响。在丹麦数据上的外部验证确认了通用性,平均 AUC 约为 0.67,尽管性能有所下降。最后,研究承认了其局限性,包括英国生物银行招募过程中的偏见和缺失数据的模式。

该研究介绍了 Delphi-2M,一种基于 GPT 的模型,能够预测和模拟多种疾病随时间的进展。与单一疾病或生物标志物模型相比,Delphi-2M 在预测 1000 多种健康状况的健康风险方面表现出色。然而,在糖尿病风险方面,其表现低于单一标志物 HbA1c 方法,尽管在丹麦数据上测试时性能仅略有下降。

其生成合成未来轨迹的能力允许估计长期疾病负担并创建隐私保护数据集。该模型还突出了共病性模式和疾病的时间影响,如癌症的持续死亡风险,并在预测死亡方面实现了约 0.97 的 AUC。然而,研究也指出了几个局限性。预测反映了英国生物银行数据中的偏见,包括健康志愿者效应、招募偏见和缺失数据模式。在不同祖先和社会经济群体之间也存在差异。重要的是,模型捕捉了统计关联而非因果关系,这限制了其直接临床应用。

总体而言,Delphi-2M 展示了基于变压器的模型在个性化风险预测、医疗规划和生物医学研究中的潜力。未来的改进可能包括整合多模态数据、支持临床决策和帮助老龄化人口的政策制定。

正文完
 0
admin-gah
版权声明:本文于2025-09-19转载自News-Medical,共计1860字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码