共计 1841 个字符,预计需要花费 5 分钟才能阅读完成。
一项突破性的人工智能技术正在改变视障人士感知世界的方式,为他们提供了前所未有的工具,帮助他们探索、理解并体验陌生环境的美丽。
来自中国的研究团队开发了一种基于人工智能(AI)的系统,有望帮助视障人士独立探索并享受周围环境。这项研究发表在《自然·人工智能》期刊上。
背景:视障者面临的挑战
探索自然环境,如公园,对身心健康有着显著的积极影响。然而,低视力或失明人士往往无法享受这些益处,因为缺乏适当的辅助工具来帮助他们主动参与其中。
现有的辅助解决方案主要专注于提供功能性帮助,如导航和避障,使视障人士能够被动地接触自然。
视障人士在探索陌生环境时常常感到无助,通常依赖家人、朋友或志愿者提供帮助,这限制了其主动探索和理解陌生环境的能力,同时也影响了他们与其他视障人士分享和沟通旅行经历的能力。,
VIPTour 系统的创新之处
一个中国研究团队开发了一种名为 VIPTour 的人工智能驱动系统,旨在为视障人士在陌生环境中提供独立感。
VIPTour 是一种人工智能驱动系统,包含一组轻便、便携的消费级设备(摄像头和智能手机)以及一种名为 FocusFormer 的新型深度学习算法网络。该系统通过高效的多感官交互技术(如音频和分层触觉交互)驱动视障用户与 VIPTour 系统之间的互动。
FocusFormer 将美学、新鲜感(新颖性)和基本需求(包括导航和安全)作为主要因素,从复杂、陌生的环境中提取有意义的信息,并排除冗余的视觉细节。这降低了视障用户的认知负担。
FocusFormer 将大量信息转化为结构化、稀疏且分层的个性化图谱。基于这一结构良好的图谱,FocusFormer 通过智能手机应用程序与视障用户互动,理解其偏好,并通过适配器提供个性化帮助。
该系统通过自监督方式使用数千个视力正常游客的公共旅游视频进行训练,这有助于有效减少审美偏差。
VIPTour 系统还提供了记录、存储和分享体验的功能,促进视障人士之间的情感交流,并推动其社交网络内的知识和经验交换。,
用户反馈与系统效果
VIPTour 系统在 33 名失明或低视力个体中进行了测试,并收集了自我报告的情感体验进行分析。
在辅助性能方面,研究发现 VIPTour 系统有效帮助视障人士主动探索并深入理解陌生环境,赋予他们准确且持久的记忆能力,并使其能够与同伴交流。
通过广泛分析自我报告体验,研究发现使用 VIPTour 的参与者成功实现了 67.9% 的积极情感反应提升、94.7% 的唤醒度提升、772.73% 的认知地图准确性提升以及 200% 的长期记忆准确性提升。
在用户评估中,VIPTour 系统的可用性得分始终高于 80 分(满分 100 分),与其他视障辅助工具相当或更优。
生理指标(包括皮肤电活动和心率变异性)显示,使用 VIPTour 后显著改善,表明情感参与度增强。,
研究意义与未来展望
该研究强调了人工智能驱动的 VIPTour 系统在提供视障人士愉快且难忘体验方面的潜在用途,同时帮助其主动探索陌生环境。这些体验可以显著提升其情感状态并改善整体生活质量。
现有证据表明,呈现有组织且引人入胜的信息可以增强个体的愉悦感并促进更深的记忆保留。人类天生倾向于处理结构良好且有意义的信息,这使其体验更加愉快和难忘。
这种人类倾向可以用认知流畅性概念来解释,该概念表明清晰且有组织的信息呈现减少了个体的认知负担。随后,这有助于他们将心理资源用于理解和整合内容。这种改进的处理流畅性会引发积极反应,因为个体会更愉快地感知信息。
此外,新颖信息与熟悉信息之间的互动影响了有组织且有趣信息对记忆的效果。新颖信息激发好奇心并增强注意力,而熟悉信息则提供认知舒适性和连贯性。
以结构化和引人入胜的方式呈现信息可以平衡新颖性和熟悉性,从而帮助维持个体的兴趣和参与度。
FocusFormer 通过数千个未标记的公共旅游视频进行自监督训练,有效捕捉了认知流畅性,揭示了旅游场景中不同概念之间的统计关系。这种方法消除了旅游偏好标签中的潜在偏差,并训练模型仅提取相关的上下文信息。
FocusFormer 的这些个性化设计使 VIPTour 系统成功建模了所需的认知流畅性,从而改善了视障人士的旅游体验。
值得注意的是,VIPTour 的效果取决于底层人工智能技术(如目标检测和语义图生成)的质量。未来这些方法的改进可能会进一步提升系统性能。
期刊参考:
Lin H. 2025. AI 系统帮助失明和低视力人士解读和体验陌生环境。《自然·人工智能》。https://doi.org/10.1038/s44387-025-00006-w