共计 2312 个字符,预计需要花费 6 分钟才能阅读完成。
我们的眼睛常会欺骗自己,而科学家发现,某些人工智能也会陷入同样的视错觉陷阱。这一现象正在改变我们对大脑运作方式的理解。
当我们仰望月亮时,尽管月亮的大小和地月距离在夜晚基本不变,靠近地平线的月亮看起来总比高悬中天时更大。这类视错觉表明,我们并非总能准确感知现实。它们常被视作视觉系统的“失误”,但也揭示了大脑为提取环境中关键信息所采取的巧妙捷径。
实际上,大脑仅能接收周围世界的零碎信息——若要对复杂视觉场景中的每个细节都进行处理,它将不堪重负,因此大脑只筛选所需内容。但如果将视错觉呈现给合成智能,即由人工智能驱动的机器视觉系统,会发生什么?这些系统擅长处理细节,其设计初衷正是发现人眼难以察觉的模式与缺陷,因此在识别医学影像中的早期病症等领域表现出色。
然而,某些深度神经网络(DNNs)——当今许多先进人工智能算法的技术核心——竟与人类一样容易受到特定视觉错觉的迷惑。这为了解人脑工作机制提供了新的视角。
日本基础生物学研究所的神经生理学副教授渡边英治指出:“在错觉研究中使用深度神经网络,可以模拟并分析大脑如何处理信息并产生错觉。对人类大脑进行实验干预存在严重伦理限制,而人工模型则无此束缚。”
尽管关于人类为何感知不同视错觉的理论众多,但大多仍缺乏决定性解释。对不受视错觉影响者的研究提供了一些线索。例如,一位幼年失明、四十多岁重获视力的人士未受“卡尼萨方块”等形状错觉的迷惑——该错觉通过四个巧妙布置的圆弧段营造出虚幻的方形轮廓。但他仍能感知运动错觉,例如理发店旋转灯柱的条纹看起来向上移动,尽管灯柱只是绕轴旋转。
此类研究似乎表明,与理解形状相比,人类感知运动的能力对感官剥夺更具抵抗力。这可能是因为我们在婴儿期更早学会处理运动信息;也可能因为大脑处理形状的方式更具可塑性,更容易识别日常接触的图形。
通过功能性磁共振成像(fMRI)的脑部研究,科学家已识别出观察不同错觉时活跃的大脑区域及其互动方式。然而,视错觉感知具有主观性,个体之间存在差异——正如 2015 年风靡网络的“蓝黑还是白金”条纹连衣裙照片所引发的争论。这使客观研究变得困难,因为研究人员通常依赖受试者描述所见内容。
如今,人工智能为理解大脑在观察视错觉时的活动提供了新途径。当前许多人工智能算法(包括 ChatGPT 等聊天机器人)都由深度神经网络驱动。这些由人工神经元组成的模型试图模仿大脑处理信息的方式。
在近期研究中,渡边及其团队希望探究深度神经网络能否复现人类观察“旋转蛇”等运动错觉时的大脑活动。该错觉在静态图像中使用迷幻的彩色圆圈图案,凝视时却会产生旋转感。
研究团队采用了名为 PredNet 的深度神经网络,其设计基于视觉信息处理的“预测编码”主流理论。该理论认为,视觉系统并非被动处理特征,而是先根据过往经验预测预期所见,再比对来自眼睛的实际输入差异,从而加速视觉感知。
类似地,PredNet 根据已看到的视频帧来预测未来帧。渡边使用头戴式摄像机拍摄的自然场景视频训练该人工智能,这些视频模拟人类环顾四周时的视野。系统从未接触任何视错觉。通过展示未见过的特定帧,系统被训练使其预测尽可能接近实际画面。
渡边表示:“处理约百万帧图像后,PredNet 学会了视觉世界的某些规则。它提取并记住了基本规律,其中可能包括运动物体的特征。”随后,他向 AI 模型展示了旋转蛇错觉的几种变体,以及人类不会受骗、感知为静态的修改版本。他发现 AI 与人类被相同的图像所迷惑。渡边认为这支持了大脑使用预测编码的理论——图像中某些暗示运动物体的特征触发了大脑的预测系统,使其误以为彩色“蛇”在运动。
“我认为 PredNet 的感知与人类相似。”他表示。
但研究团队也发现了 AI 与人类感知错觉的差异。例如,当人类凝视旋转圆圈之一时,该圆圈似乎停止转动,而周边视野中的其他圆盘继续旋转;但 PredNet 始终感知所有圆圈同时运动。渡边指出:“这可能是因为 PredNet 缺乏注意力机制。”这意味着它无法聚焦于图像的特定位置,而是整体处理画面。
尽管 AI 系统和机器人可能模仿人类视觉系统的某些方面,但它们远未达到人类观察世界的水平。渡边表示,目前尚无深度神经网络能体验人类所有的视错觉。从某些角度看,这并不令人意外。
受此研究启发,澳大利亚查尔斯特大学人工智能与网络未来研究所的研究员伊万·马克西莫夫开发了一个结合量子物理学与 AI 的模型,以测试其能否模拟人类感知“内克尔立方体”及类似错觉(如“鲁宾花瓶”,可被看作花瓶或两张侧脸)的方式。他设计了一个利用量子隧穿现象处理信息的深度神经网络,并训练该系统识别这两种错觉。
当向系统输入其中一种错觉时,它会生成两种解读之一。马克西莫夫发现,AI 会随时间推移在两种解读间规律切换——这与人类行为相似,切换的时间间隔也相近。他表示:“这与人类测试中观察到的现象非常接近。”
马克西莫夫认为,这并不表明大脑具有量子特性(尽管这是活跃的研究领域),而是显示人类思维的某些方面(如决策方式)可通过量子理论更好地建模,这构成了“量子认知”领域的基础。例如面对错觉时,大脑正在不同解读版本间做出选择。
此类系统还可用于模拟不同重力条件下太空环境中的视觉感知变化。先前研究已探讨国际空间站宇航员对视错觉感知方式的变化。研究发现,在地球上宇航员更常以特定视角观察内克尔立方体等错觉;但在轨道停留三个月后,两种视角的出现频率趋于相等。科学家认为这可能源于人类对深度的部分判断依赖重力。在失重状态下,宇航员无法通过坐立时眼睛距地面高度来估算距离。
马克西莫夫强调:“尽管这是小众的研究领域,但至关重要,因为人类渴望探索太空。”面对宇宙的浩瀚奇观,太空旅行者必然希望确信自己能够相信双眼所见。