共计 577 个字符,预计需要花费 2 分钟才能阅读完成。
随着数字技术的普及,YouTube 已成为公众获取医疗信息的重要平台。然而,平台上健康相关内容的可靠性和质量仍备受关注。本研究通过结合人类专家评审、大型语言模型(ChatGPT-4)分析和转录文本可读性评估,系统评估了与扁桃体切除术相关的 YouTube 视频。
研究共评估了 76 个英文 YouTube 视频。两位耳鼻喉科医生使用 DISCERN 工具和 JAMA 基准独立评估视频质量。ChatGPT-4(2024 年 5 月版本)对修正后的转录文本进行了准确性和完整性的评估。视频还被分类为文本密集型和视觉丰富型,以检验视觉呈现的影响。
专业视频在质量指标上始终优于患者生成的内容。ChatGPT-4 的准确性评分与 JAMA 评分显示出强相关性(ρ = 0.56),而完整性与 DISCERN 评分也呈现强相关性(ρ = 0.72)。视觉丰富的视频在 AI 准确性上显著高于文本密集型视频(Cohen’s d = 0.600,_p_ = 0.030),表明视觉背景可能增强基于转录文本的解释。然而,平均转录文本可读性(FKGL = 8.38)超过了患者教育的推荐水平。
与扁桃体切除术相关的 YouTube 视频内容质量差异较大。人类与 AI 评估的一致性支持使用大型语言模型进行初步内容筛选。视觉丰富的内容可能提高 AI 的可解释性,而可读性问题则凸显了需要更易理解的教育资源。未来的数字健康内容应优先考虑多模态评估和设计。