AI视觉识别新突破：如何让AI像人类一样看世界

4次阅读

共计 717 个字符，预计需要花费 2 分钟才能阅读完成。

在人工智能（AI）领域，视觉识别一直是一个重要的研究方向。然而，瑞士洛桑联邦理工学院（EPFL）的一项最新研究揭示了 AI 在处理不完整视觉信息时的局限性，特别是在“轮廓整合”方面。这项研究不仅指出了 AI 与人类视觉的差距，还提出了解决方案。

人类大脑具备出色的“轮廓整合”能力，即使物体被部分遮挡或破碎成片段，也能轻松识别出完整物体。这种能力在日常生活中无处不在，比如在人群中认出朋友或识别熟悉的形状。然而，即使是最先进的 AI 系统，也难以从破碎的视觉信息中进行泛化。

AI 视觉识别新突破：如何让 AI 像人类一样看世界

EPFL 的 NeuroAI Lab 团队，由 Martin Schrimpf 领导，系统比较了人类和 AI 在处理视觉难题时的表现。研究团队开发了一系列识别测试，要求人类和 1,000 多个人工神经网络识别缺失或片段化的轮廓物体。结果显示，在轮廓整合方面，人类始终优于 AI。

实验结果表明，即使物体的大部分轮廓缺失，人类的准确率仍能达到 50%。相比之下，AI 模型在相同情况下往往会陷入随机猜测。只有经过数十亿张图像训练的模型才能接近人类的表现，即便如此，它们也必须专门针对研究中的图像进行调整。

研究还发现，当片段指向同一方向时，人类表现出一种自然的“整合偏差”。经过训练以发展类似偏差的 AI 模型在面对图像失真时表现更好。专门为整合轮廓设计的 AI 系统不仅提高了准确性，还使它们更关注物体的形状，而不是表面纹理。

这些发现表明，轮廓整合并非天生的能力，而是可以通过经验学习。对于依赖计算机视觉的行业，如自动驾驶汽车或医学成像，构建更像人类看世界的 AI 可能意味着更安全、更可靠的技术。研究团队建议，缩小 AI 与人类视觉差距的最佳方法是为机器提供更“类人”的视觉训练，包括多张物体常被部分遮挡的现实世界图像。

正文完

发表至： AI行业动态

2025-07-22 14:03

0

转载提示：此文章非本站原创文章，若需转载请联系原作者获得转载授权。

OpenAI 在国际数学竞赛中摘金：AI 推理能力的重大突破

《命运2》全新副本《沙漠永恒》战利品全解析：装备获取指南