人工智能预测疾病风险:医疗保健的新革命

11次阅读
没有评论

共计 2311 个字符,预计需要花费 6 分钟才能阅读完成。

还记得上次看医生的经历吗?医生通常会询问患者的病史。这些信息对于许多疾病的诊断、治疗和预防都至关重要。如今,得益于人工智能技术,一系列算法可以根据医疗记录预测单一疾病的风险,例如心血管疾病和癌症。

然而,疾病并非孤立存在。某些疾病可能会增加其他疾病的风险。全面了解一个人的健康轨迹可以预测多种疾病的风险,这不仅有助于早期治疗,还能识别出需要筛查和其他预防措施的易感人群。此外,它还能发现那些不符合常规标准但存在某种疾病风险的人,例如高血压或乳腺癌。

 人工智能预测疾病风险:医疗保健的新革命

最近,德国癌症研究中心的一个团队与合作伙伴发布了一款名为 Delphi-2M 的人工智能“预言家”,可以预测一个人未来几十年内患上超过 1000 种常见疾病的风险。Delphi-2M 是一种大型语言模型,类似于为流行聊天机器人提供支持的算法。不过,团队并未用文本训练该人工智能,而是为其输入了来自英国生物银行的 40 多万份医疗记录。英国生物银行是一项大规模研究,追踪参与者随着年龄增长的健康状况。在添加了体重、吸烟和饮酒习惯等生活方式信息后,Delphi 可以预测任何参与者在至少 20 年内患上多种疾病的可能性。

尽管仅针对生物银行队列进行了训练,但该人工智能无需调整其设置,就能映射丹麦近 200 万人的健康轨迹,这表明它已经掌握了疾病风险和相互作用的本质。Delphi 还具有可解释性,因为它会阐述其评估的理由。

安格利亚鲁斯金大学的 Justin Stebbing 表示,该工具是一项“成就”,为医疗保健领域的“预测准确性和可解释性树立了新标准”。他并未参与这项研究。

医疗保健正从治疗转向预防。但个体指导可能会令人困惑。以乳房 X 光检查为例。关于开始检测年龄的建议从 40 岁变为 50 岁,又回到 40 岁。更广泛地说,随着世界人口老龄化,模拟癌症、痴呆症和其他疾病的负担,可以让医疗保健系统更好地为所谓的“银发海啸”做好准备。

这就是医疗人工智能的用武之地。早期工具旨在根据医学图像诊断疾病。但大型语言模型为预测开辟了一条全新的途径。这些算法与经典疾病建模有着共同的逻辑。人工智能将语言作为称为标记的词片段序列进行采样。然后,它根据从在线资源中学习到的文本逐字生成响应。有了足够的训练数据,人工智能就能从统计学角度了解标记之间的关系,并可以生成类似人类的响应。

预测疾病的进展有些类似。如果疾病进展的每一步都是一个标记,那么预测下一步意味着从统计学角度确定标记之间的联系。科学家们已经使用基于电子健康记录训练的大型语言模型类算法来预测包括癌症、中风和自残在内的单一疾病。但同时应对多种疾病则完全是另一回事。

今年早些时候,一款名为 Foresight 的人工智能将医疗预测向前推进了一步。Foresight 接受了来自英国国家医疗服务体系的 5700 万份匿名健康记录的训练,学会了预测住院、心脏病发作和数百种其他疾病,但由于隐私问题,该算法仅限于 Covid-19 研究。

德国团队设计 Delphi 将每种疾病的诊断代码识别为标记。这些代码在全球范围内是标准化的。然后,团队修改了大型语言模型,以纳入新信息(例如血液检测结果)来重新评估其预测。Delphi 接受了针对 1258 种疾病的 40 多万份全面健康记录以及性别、体重指数和其他自我报告的生活方式指标(包括吸烟和饮酒习惯)的训练。人工智能立即根据年龄和其他人口统计模式发现了人口层面的趋势。例如,水痘的发病率在婴儿期达到顶峰,而哮喘则往往持续存在。一个人的生理性别对糖尿病、抑郁症和心脏病发作的风险也有显著影响。

对于大多数疾病,Delphi 匹配或优于临床风险评分考试和针对单一疾病的医疗人工智能预测器。它还击败了其他分析生物标志物(通常是血液中的特定蛋白质或其他分子)的算法,提前最多 20 年预测某些疾病的风险。团队写道,Delphi 提供了“能够在任何给定时间同时评估 1000 多种疾病及其时间的巨大优势”。

该人工智能在分析心血管疾病和痴呆症方面特别有帮助,这两种疾病都遵循相对稳定的进展模式。然而,它在 2 型糖尿病方面遇到了困难,因为 2 型糖尿病的轨迹更具变化性,取决于生活方式的改变。接下来,他们用近 200 万份丹麦健康记录挑战 Delphi,而无需调整算法。该数据库——丹麦国家患者登记处——包含跨越近半个世纪的医疗记录。Delphi 的预测准确性几乎没有下降,这表明该人工智能可以推广到其训练之外的健康记录数据集。

Delphi 还有其他优势。首先,它可以生成并从合成医疗记录数据中学习,以减少侵犯参与者隐私的可能性。人工智能还可以“解释”自己。某些疾病,例如糖尿病,与额外的健康挑战有关,例如患者的视力问题或周围神经问题。Delphi 将这些症状归类,使其对探索这些联系背后的基因或细胞驱动因素的科学家有用。

团队强调 Delphi 仅揭示关联性,而非因果关系。但他们构建了人工智能,以便它可以轻松整合其他数据——例如基因组、诊断图像、生物标志物,甚至可穿戴设备的数据——以进一步提高其预测。他们现在正在其他国家和其他人群中测试该工具。

与其他人工智能算法一样,Delphi 从训练数据中学习进行预测——其中包括其中的偏见。英国生物银行健康记录通常偏向白人、中年和受过教育的人群。对于癌症患者,只有那些幸存者才会被纳入数据库,这也可能影响人工智能的预测。80 岁及以上人群的数据非常少,因此 Delphi 无法可靠地模拟他们的健康轨迹进入暮年。

即便如此,人工智能也可以帮助找到那些即使不符合常规标准,也能从诊断测试或筛查计划(例如乳腺癌)中受益的人。

伦敦国王学院的 Gustavo Sudre 表示:“这项研究似乎是朝着可扩展、可解释,最重要的是,在医学预测建模中道德负责的形式迈出的重要一步。”他并未参与这项研究。

正文完
 0
admin-gah
版权声明:本文于2025-09-23转载自SingularityHub,共计2311字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码