共计 564 个字符,预计需要花费 2 分钟才能阅读完成。
Google Lens 现在不仅可以通过图片,还可以通过视频进行搜索,甚至支持语音提问。这一新功能将根据视频内容和用户的问题提供 AI 生成的概述和搜索结果。该功能已在 Android 和 iOS 上的 Search Labs 中推出。
Google 在 5 月的 I / O 大会上首次预览了这一功能。例如,用户在参观水族馆时,可以举起手机对准展品,打开 Google Lens 应用,然后按住快门按钮开始录制视频。录制过程中,用户可以提问,如“它们为什么一起游泳?”Google Lens 随后会使用 Gemini AI 模型提供响应。
Google 工程副总裁 Rajan Patel 解释说,Google 正在“将视频捕捉为一系列图像帧,然后应用之前在 Lens 中使用的相同计算机视觉技术”。此外,Google 还进一步将信息传递给一个“定制”的 Gemini 模型,该模型旨在“理解多个帧的顺序 … 并提供基于网络的响应”。
目前,该功能尚不支持识别视频中的声音,但 Patel 表示,这是 Google 正在“试验”的内容。
此外,Google Lens 还通过语音提问功能更新了其照片搜索功能。用户只需将相机对准主题,按住快门按钮,然后提出问题即可。这一功能正在全球范围内的 Android 和 iOS 上推出,但目前仅支持英语。
这一新功能的推出,无疑将进一步提升用户的搜索体验,使得获取信息变得更加便捷和直观。