AI如何助力罕见病诊断?大语言模型在血液病中的应用

2次阅读
没有评论

共计 1429 个字符,预计需要花费 4 分钟才能阅读完成。

罕见病,亦称孤儿病,指的是发病率极低的疾病。由于其发病率和临床表现的多样性,罕见病的诊断面临巨大挑战。许多罕见病缺乏明显的临床特征,导致误诊或漏诊的情况频发。大多数临床医生在整个职业生涯中可能仅遇到少数几例罕见病,因此诊断经验有限。同样的问题也存在于罕见血液病中,尤其是那些在成年期发病的疾病;这类成人发病的疾病通常诊断周期较长,涉及多个器官系统,起病隐匿,且通常在晚期才被确诊。

随着人工智能(AI)的快速发展,特别是基于 Transformer 的大语言模型(LLMs),研究人员开始探索其在医疗诊断等临床场景中的应用。目前的研究表明,LLMs 在诊断常见疾病方面的表现与医生相当。鉴于罕见病在普通医生中的出现频率远低于常见病,LLMs 在罕见病诊断中可能具有独特优势。有趣的是,最近有新闻报道称,一名患者的家属通过使用 ChatGPT,并结合医生提供的临床数据,成功诊断出一种长期被误诊的罕见先天性神经系统疾病。这一案例表明,即使是未专门针对临床诊断进行优化的公开 LLMs,也已经展现出实际的医疗应用价值。其他由专业人士进行的研究也表明,广泛可用的 LLMs 可以帮助诊断罕见疾病,这表明 LLMs 在罕见病诊断中可能比常见病提供更大的临床益处。

AI 如何助力罕见病诊断?大语言模型在血液病中的应用

随着公开 LLMs 的快速发展,商业版本中引入了思维链(CoT)方法,使模型能够生成逐步的中间推理,而不是立即给出答案。这种方法有助于澄清复杂问题,并提高推理的准确性和可解释性。自 2025 年初以来,DeepSeek-R1 和 ChatGPT-o1 等模型已公开其 CoT 过程,使用户能够追踪和评估诊断逻辑。CoT 推理的公开在医疗诊断中具有显著优势。通过揭示中间步骤,CoT 不仅提供了最终诊断,还提供了透明的推理过程。这使得医疗专业人员能够追踪模型的决策过程,支持验证和临床审查。通过自洽性增强诊断的稳健性,CoT 减少了黑箱效应,降低了误诊风险,并提高了临床应用的安全性。

尽管取得了这些进展,但在使用 LLMs 诊断罕见病方面仍存在一些问题。大多数现有研究是回顾性的,且病例数量有限,且尚未有研究评估 LLMs 在罕见血液病中的应用。目前的评估主要依赖于公共数据集,而非未发布的真实世界临床记录,这引发了关于潜在训练数据泄露的担忧,并由于标准化语料库中的预处理而限制了普遍性。此外,大量文献集中于较旧的模型,如 ChatGPT-4,而很少有评估涉及新一代 LLMs,特别是那些结合了 CoT 推理的模型,这些模型可能会提高诊断的准确性和透明度。此外,即使回顾性分析表明 LLMs 具有较高的准确性,将其整合到常规临床工作流程中仍然具有挑战性。LLM 生成的诊断如何影响医生的决策,特别是在引入 CoT 推理后,仍然知之甚少。迄今为止,尚无前瞻性研究评估 LLMs 是否能够提高医生在罕见病中的诊断表现,更不用说在罕见血液病中的表现。

为了解决这些空白,我们进行了一项回顾性研究,使用了来自我们中心的去识别化的真实世界入院记录。这些记录被输入到未经微调的新一代公开可用的商业部署 LLMs 中,包括具有 CoT 功能的模型,以生成其前 10 个可能的诊断,然后评估其诊断表现。我们还前瞻性地将表现最佳的 LLM 生成的前 10 个可能诊断及其逐步推理和分析结果呈现给不同经验水平的医生,以评估这些信息是否能够提高他们诊断罕见血液病的能力。这一前瞻性部分模拟了真实世界中医生与 LLMs 的互动,以检验其实用性和安全性,为临床应用提供了潜在途径,并代表了将 LLMs 从研究工具转化为临床应用的关键一步。

正文完
 0
admin-gah
版权声明:本文于2025-10-10转载自Journal of Medical Internet Research,共计1429字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码