共计 1839 个字符,预计需要花费 5 分钟才能阅读完成。
一种通过分析血细胞形态与结构的新型人工智能系统,有望显著提升白血病等疾病的诊断水平。研究人员表示,该工具识别异常细胞的准确性和一致性优于人类专家,或可减少漏诊与诊断不确定的情况。
该系统名为 CytoDiffusion,采用了与 DALL-E 等图像生成器相同的生成式人工智能技术,能够对血细胞外观进行细致入微的分析。它不仅关注明显特征,更能捕捉显微镜下细胞形态的细微变异。
不止于模式识别
当前多数医疗人工智能工具的训练目标是将图像归类至预设类别。而 CytoDiffusion 的研究团队证明,他们的方法能识别正常血细胞的全部形态谱系,并可靠地标记出可能预示疾病的罕见或异常细胞。这项由剑桥大学、伦敦大学学院和伦敦玛丽女王大学的研究人员共同主导的研究,已发表于《自然·机器智能》期刊。
血细胞在大小、形状和结构上的微小差异,是诊断多种血液疾病的关键。然而,掌握这项技能往往需要多年经验,即使训练有素的医生在研判复杂病例时也可能出现分歧。
“我们体内有多种功能各异的血细胞,”该研究第一作者、剑桥大学应用数学和理论物理系的西蒙·德尔塔达尔解释道,“例如白细胞负责抵抗感染。而识别显微镜下异常或病变的血细胞形态,是诊断许多疾病的重要环节。”,
应对血液分析的数量挑战
一份标准血涂片可能包含数千个独立细胞,远超人工逐一检视的能力。“人类不可能看完涂片中的每一个细胞,”德尔塔达尔指出,“我们的模型可以自动化这一过程,对常规病例进行初筛,并标出异常样本供人工复核。”
临床医生对此深有体会。“我作为初级血液科医生时,常面临一天结束积压大量血涂片待分析的困境,”伦敦玛丽女王大学的共同资深作者苏泰什·西瓦帕拉拉塔纳姆博士说,“深夜工作时,我确信人工智能会比我表现得更出色。”,
基于超大规模数据集训练
为构建 CytoDiffusion,研究人员使用剑桥阿登布鲁克医院收集的超过 50 万张血涂片图像进行训练。该数据集被形容为同类中规模最大的,涵盖了常见血细胞类型、罕见样本以及常使自动化系统混淆的特征。
该系统并非简单学习将细胞归入固定类别,而是模拟血细胞可能呈现的全部形态范围。这使其对不同医院、显微镜及染色技术之间的差异更具适应力,同时提升了检测罕见或异常细胞的能力。,
更高置信度检测白血病
测试显示,CytoDiffusion 识别白血病相关异常细胞的灵敏度远高于现有系统。即使使用少得多的训练样本,其表现仍与当前领先模型相当或更优,且能量化自身预测的置信度。
“在准确性测试中,该系统略胜人类一筹,”德尔塔达尔说,“但它的突出之处在于知道何时不确定。我们的模型从不会在不确定时假装确定,而人类有时会。”
剑桥大学应用数学和理论物理系的共同资深作者迈克尔·罗伯茨教授表示,该系统是针对医疗人工智能面临的实际挑战进行评估的。“我们在评估中涵盖了现实世界人工智能常遇到的诸多问题,例如未见过的图像、不同设备采集的图像以及标签的不确定性,”他说明,“这一框架提供了模型性能的多维度视角,相信对研究人员具有参考价值。”,
人工智能图像“骗过”人类专家
研究团队还发现,CytoDiffusion 能生成与真实血细胞难以区分的合成图像。在一项有十位资深血液学家参与的“图灵测试”中,专家们区分真实图像与人工智能生成图像的能力并不比随机猜测更强。
“这令我十分惊讶,”德尔塔达尔坦言,“这些人整天都在观察血细胞,连他们都无法分辨。”,
向全球研究界开放数据
作为项目的一部分,研究人员将公开他们描述的全球最大外周血涂片图像集,包含超过 50 万个样本。
“通过开放这一资源,我们希望助力全球研究人员构建和测试新的人工智能模型,推动高质量医疗数据的普及访问,最终为改善患者护理贡献力量,”德尔塔达尔表示。,
辅助而非替代临床医生
尽管成果显著,研究人员强调 CytoDiffusion 并非旨在取代训练有素的医生,而是通过快速标记相关病例、自动处理常规样本来协助临床工作。
“医疗人工智能的真正价值不在于以更低成本模拟人类专业知识,而在于实现超越专家或简单统计模型的诊断、预后与处方能力,”伦敦大学学院的共同资深作者帕拉什克夫·纳切夫教授指出,“我们的研究表明,生成式人工智能将成为这一使命的核心,不仅改变临床支持系统的精准度,也提升其对自身知识局限的洞察。这种‘元认知’意识——知道自己不知道什么——对临床决策至关重要,而在此我们展示了机器可能比人类更擅长这一点。”
团队表示,仍需进一步研究以提升系统速度,并在更广泛的患者群体中验证其性能,确保准确性与公平性。