共计 780 个字符,预计需要花费 2 分钟才能阅读完成。
澳大利亚墨尔本大学的研究团队在《PLOS Medicine》期刊上发表的一项新研究表明,当前用于预测自杀行为的机器学习算法准确性不足,无法有效筛查或优先干预高风险个体。
过去半个世纪以来,医疗领域开发了多种风险评估量表来识别自杀或自残高风险患者。尽管这些量表的预测准确性普遍较低,但随着现代机器学习方法与电子健康记录数据的结合,研究者们重新将目光投向了开发新的预测算法。
该研究团队对 53 项使用机器学习算法预测自杀、自残及相关结果的研究进行了系统回顾和荟萃分析。这些研究共涉及超过 3500 万份医疗记录和近 25 万例自杀或自残治疗病例。
研究发现,这些算法在识别低风险个体方面表现良好,即能够准确识别出不会再次自残或自杀的人群。然而,在识别高风险个体方面,算法的表现却不尽如人意。具体而言,算法错误地将超过一半后来因自残或自杀而寻求医疗服务的人分类为低风险。在被分类为高风险的人中,只有 6% 后来死于自杀,不到 20% 因自残再次寻求医疗服务。
研究作者指出:“我们发现这些机器学习算法的预测性能并不优于传统的风险评估量表。该领域的研究整体质量较差,大多数研究存在高偏倚风险或偏倚风险不明确。没有足够的证据支持改变当前临床实践指南中的建议。”
作者补充道:“尽管人们对人工智能和机器学习在识别自杀和自残高风险患者方面的能力越来越感兴趣,但我们的研究表明,现有算法在预测自杀或自残再次发生方面表现不佳,且具有较高的假阳性率。”
此外,作者强调:“世界各地的许多临床实践指南强烈反对使用自杀和自残风险评估作为分配有效后续干预措施的基础。我们的研究表明,机器学习算法在预测未来自杀行为方面并不比这些指南所基于的传统风险评估工具更好。我们没有看到任何证据支持改变这些指南。”
这项研究提醒我们,尽管技术进步为医疗领域带来了新的可能性,但在涉及生死攸关的决策时,仍需谨慎评估技术的有效性和可靠性。