深度学习与机器学习在抑郁症语音检测中的对比研究

16次阅读
没有评论

共计 781 个字符,预计需要花费 2 分钟才能阅读完成。

抑郁症的诊断长期以来面临主观性强和延迟性高的挑战。语音特征作为一种潜在的客观生物标志物,为这一问题提供了新的解决思路。然而,传统机器学习(TML)与深度学习(DL)模型在语音特征分析中的系统性比较研究仍显不足。

本研究旨在评估和比较 TML 和 DL 模型在使用语音特征进行抑郁症检测中的诊断准确性,并进一步考察样本量、验证策略、语言和诊断标准等因素对诊断性能的影响。

研究遵循 PRISMA 指南,系统检索了包括 PubMed、Medline、Embase、PsycINFO、Scopus、IEEE、Cochrane、ACM 数字图书馆和 Web of Science 在内的 9 个数据库,时间范围为各数据库建库至 2025 年 4 月。纳入标准为使用基于语音的 TML 或 DL 模型评估临床诊断为抑郁症的患者与健康对照组的比较研究,且需报告敏感性、特异性或曲线下面积(AUC)。研究使用诊断准确性研究质量评估工具(QUADAS-2)评估偏倚风险,并通过随机效应双变量模型汇总诊断性能,同时进行异质性、子组和敏感性分析。

共纳入 25 项研究,其中 9 项使用 TML 模型,16 项使用 DL 模型。TML 模型的汇总敏感性为 0.82(95% CI:0.74–0.88),特异性为 0.83(95% CI:0.75–0.90),AUC 为 0.89(95% CI:0.86–0.92)。DL 模型的汇总敏感性为 0.83(95% CI:0.77–0.88),特异性为 0.86(95% CI:0.80–0.90),AUC 为 0.91(95% CI:0.89–0.93)。子组分析显示,诊断性能因样本量、验证策略、语言和诊断标准的不同而存在差异。

结论表明,TML 和 DL 模型在基于语音的抑郁症检测中均表现出良好的诊断准确性。DL 模型在诊断性能上具有边际但一致的优越性,支持其在二级医疗环境中用于确诊的潜在应用,而 TML 模型在初级保健筛查中仍具有重要价值。

正文完
 0
admin-gah
版权声明:本文于2025-11-25转载自BMC Psychiatry,共计781字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码