共计 3610 个字符,预计需要花费 10 分钟才能阅读完成。
在过去的一年中,谷歌在其面向消费者的应用程序中预览了许多以 Gemini 品牌和其他 AI 功能。以下是所有已宣布的内容以及它们可能的发布时间。
n
Pixel
n
在 2023 年 Made by Google 活动结束时,谷歌为 Pixel 8 Pro 预告了一个名为“Zoom Enhance”的功能,该功能可以“智能填补像素间的空白并预测细节”。利用设备上的“自定义生成 AI 图像模型”,谷歌将其定位为在忘记放大时的有用工具。
n
这是生成式 AI 的一个令人难以置信的应用,为构图和编辑图像开辟了多种可能性。过去在科幻电影中看到的缩放增强功能,现在就在你手中的手机里。
n
在 10 月,谷歌表示这一功能“将在稍后推出”。经过三次 Pixel 功能更新,该功能仍未到来。目前尚不清楚谷歌所指的模型是否是 Gemini Nano 与多模态。在这一点上,它或许会与 Pixel 9 Pro 一同亮相,作为该手机的[主打摄影功能](https://9to5google.com/2024/06/28/pixel-9-magic/)。
n
Google Home
n
在 Google Home 应用中,生成式 AI 将被用于将事件总结为“近期发生事件的简化视图”。这种“快速简便的总结”将使用项目符号,同时你还可以通过对话方式“询问家中情况”来查找视频历史片段并获取自动化信息。这些“实验性功能”将于 2024 年向 Nest Aware 订阅用户推出。
n
Fitbit
n
Fitbit Labs 将允许 Fitbit Premium 用户测试并提供关于实验性 AI 能力的反馈。其中一个功能是一个聊天机器人,让你以自然对话的方式询问 Fitbit 数据。这种“个性化指导”考虑到健身目标,旨在生成“可操作的信息和指导”,回复中可能包括自定义图表。
n
- n
- “例如,你可以深入了解你获得了多少活跃区域分钟(AZMs)以及这与你的睡眠恢复性有何关联。”
- “……该模型可能能够分析你的睡眠模式和睡眠质量的变化,然后根据这些洞察建议你如何调整锻炼强度。”
n
n
nn
幕后,这是由 Fitbit 和 Google Research 基于 Gemini 构建的新 [个人健康 LLM](https://9to5google.com/2024/03/19/fitbit-labs-personal-health-llm/) 驱动的。截至 3 月,它将在“今年晚些时候”为“参与 Fitbit Labs 计划的 Fitbit 移动应用中的有限数量的 Android 用户”推出。
n
Google Photos
n
[Ask Photos](https://9to5google.com/2024/05/25/google-photos-ask-photos-works/)将允许你询问关于你的图库中的图像和视频的问题。除了查找图片外,它还能提取信息并给你文本回答。由 Gemini 驱动,示例查询包括“显示我访问过的每个国家公园的最佳照片”和“我们为 Lena 的生日派对准备了哪些主题?”它可用于“建议最佳图片”并为它们创建标题。Ask Photos 是一个“实验性功能”,即将推出,谷歌已经预告了未来的更多能力。
nn
Gmail + Google Workspace
n
[在 Android 和 iOS 的 Gmail 中](https://9to5google.com/2024/05/14/gmail-qa/),你会在右上角找到一个 Gemini 按钮,让你调出移动端的侧边面板以输入完整提示。Gmail 还将获得上下文智能回复,提供更定制化、详细和微妙的建议。这将在 7 月推出到 Workspace Labs。
n
在 2024 年 4 月的 Cloud Next 大会上,谷歌 [还预览了](https://9to5google.com/2024/04/09/google-workspace-cloud-next-2024/) 移动 Gmail 中的语音提示功能,用于“帮我写”。同时,一个“即时润色”功能将“一键将粗糙的笔记转换为完整的电子邮件”。
n
在桌面网页上,侧边面板在 Gmail、Google Drive 和 Docs/Sheets/Slide 中可用。Gemini 接下来将进入 [Google Chat](https://9to5google.com/2024/04/09/google-workspace-cloud-next-2024/) 以总结对话和回答问题。
n
Google Maps
n
[早在 2 月](https://9to5google.com/2024/02/01/google-maps-generative-ai/),谷歌宣布 Maps 将使用 LLMs 来驱动一个“询问关于”聊天机器人。你可以用它来找到符合你提示的地方,并支持后续问题。它由 2.5 亿个地点的详细信息以及用户提交的照片、视频和评论驱动。
n
Chrome
n
Gemini Nano 将 [进入](https://9to5google.com/2024/05/14/gemini-nano-is-coming-to-chrome-starting-with-help-me-write/) 桌面 Chrome,以驱动浏览器功能如“帮我写”。它应该在大多数现代笔记本电脑和台式机上可用。
nn
Google Search
n
除了推出 AI 概览,谷歌还预览了许多[即将推出的功能](https://9to5google.com/2024/05/14/google-search-ai-features-labs/),这些功能首先将进入 Search Labs:
n
- n
- 你将能够将原始 AI 概览变为“更简单”(仅几句话)或“分解它”(更长的回答)。
- 多步骤推理能力将允许你一次性提出复杂问题,而不是分解为多个查询。
- 餐食和旅行规划
- AI 组织的搜索结果页面
- 视频搜索:录制一个视频并询问关于它的问题
n
n
n
n
n
n
Android
n
Gemini Nano 与多模态将在“今年晚些时候”在 Pixel 上推出,并驱动如设备上 / 离线 TalkBack 描述和实时诈骗警报等功能,这些功能会监听通话中的可疑模式。谷歌将在今年晚些时候分享更多细节。
n
在 I /O 2024 上,谷歌还预览了 Gemini 在 Android 上将很快以覆盖面板形式出现,而不是打开全屏 UI 来显示结果。除了保留上下文,这还允许你将生成的图像拖放到对话中。对于 Gemini Advanced 订阅用户,“询问此视频”和“询问此 PDF”按钮将让 Gemini 分别消化视频和文档。这将在“未来几个月”推出。此外,动态建议将使用 Gemini Nano 与多模态来理解屏幕上的内容:
n
例如,如果你在谈论匹克球的对话中激活 Gemini,建议可能包括“找到我附近的匹克球俱乐部”和“初学者的匹克球规则”。
n
另一个特别适用于移动设备的补充是 Google Calendar、Tasks 和 Keep 的 Gemini 扩展。这将允许你拍摄一张包含多个即将日期页面的照片,Gemini 将能够将其转换为 Calendar 事件。在未来几个月,一个“实用工具”将允许移动 Gemini 访问 Android 的时钟应用。
n
我们还在等待移动 Gemini 在今年夏天 [这个夏天](https://9to5google.com/2024/05/10/pixel-tablet-circle-to-search/) 在 Pixel 平板电脑上推出。
n
Gemini
n
Live 将允许你与 Gemini 进行[双向对话](https://9to5google.com/2024/05/14/gemini-live/)。为了使体验更自然,Gemini 将返回简明的回答,你可以打断以添加新信息或请求澄清。你可以从 10 种不同的声音中选择,谷歌设想 Gemini Live 在面试准备或排练演讲时会有所帮助。它将在“未来几个月”为 Gemini Advanced 成员提供。
n
“今年晚些时候”,Gemini Live 将允许你启动实时摄像头模式。只需指向现实世界中的某个物体并询问关于它的问题。这是由 Project Astra 驱动的。
nn
[Gems](https://9to5google.com/2024/05/14/gemini-advanced-1-5-pro/)是 Gemini 的定制版本,让你可以拥有一个“健身伙伴、副厨、编程伙伴或创意写作指导”。Gemini Advanced 成员将能够创建自定义的 Gems,而所有用户将能够访问预制的 Gems,如学习教练。
n
只需描述你希望你的 Gem 做什么以及你希望它如何回应——比如“你是我的跑步教练,给我一个日常跑步计划,并保持积极、乐观和激励。”Gemini 将接受这些指令,并通过一次点击,增强它们以创建一个满足你特定需求的 Gem。
n
Gemini Advanced 用户还将获得一个“沉浸式规划器”,它不仅建议活动,还实际考虑旅行时间和停留,以及人们的兴趣,以创建详细的行程。Gemini 将使用 Gmail 中的航班 / 旅行详情,Google Maps 推荐酒店附近的食物和博物馆,以及搜索其他活动。