共计 2347 个字符,预计需要花费 6 分钟才能阅读完成。
人工智能已成为今年的热门技术。但由于它来自许多不同公司,形式多样,因此可能非常令人困惑。你不仅拥有由 OpenAI 创建的 ChatGPT 机器人,还有三大巨头——Google、Apple 和 Microsoft——正在开发自己的版本。
Google 的最新尝试名为 Gemini,它在功能和应用上与其他版本一样复杂。
当我第一次开始研究 Gemini 时,我在 Google 上搜索了“Google 的 Gemini 技术版本”。搜索结果顶部出现了一个 AI 生成的摘要,开头写道:
“Google Gemini 有三个版本:Ultra、Pro 和 Nano。Ultra 是最大的模型,设计用于复杂任务,而 Pro 是最佳的模型,适用于广泛的任务,Nano 是最有效的模型,适用于设备上的任务。”
好吧,这已经足够好了。但这并不是完整的故事。
Gemini 是 Google 创建的一个聊天机器人,它取代了之前的聊天机器人 Bard。它基于一个名为大型语言模型(或 LLM)的东西,也称为 Gemini,该模型由 Google 的一部分 DeepMind 开发。
令人困惑的是,Gemini 既是聊天框也是一个 LLM。
那么 Gemini 既是聊天框也是一个 LLM?有多少种 Gemini?
最初,在 2023 年 12 月推出时,Gemini 提供了三个不同版本(称为模型):Nano 作为轻量级 Android 版本,Pro 用于日常使用,Ultra 用于重型商业 / 企业使用。
然后在 2024 年 5 月 14 日,Google 推出了 Gemini 1.5 Pro,这是公司所谓的“中型多模态模型”的第一个版本。据 Google 称,新的 Pro 版本与之前的 Ultra 版本一样强大,旨在增强现有应用程序并为日常使用创建新应用程序。
换句话说,它可以接受文本、图像、音频和视频等各种通信模式的提示。
嗯,不尽然。还有 Gemini 1.5 Flash,这是 Gemini 的更快版本,供开发人员在特定应用程序中使用。换句话说,除非你是开发人员,否则这不是你会使用的东西。
所以,只是为了重申,我们现在有四个 Gemini 模型供开发人员使用:Ultra、Pro、Flash 和 Nano。(我们稍后会告诉你如何自己尝试。)
令牌是用于训练 AI 模型(如 Gemini)的单词元素。AI 模型能够处理的令牌越多,你可以向 AI 提供的信息就越多,它就能更好地理解你的需求和它能提供什么。
嗯,如果你是开发人员,你可以使用它来添加或创建大量新应用程序。否则,Google 正在将其添加到许多现有应用程序中并创建新应用程序。
比如,让我们从 Google Photos 开始。预计今年夏天推出的一个新功能,称为 Ask Photos,将允许你使用更复杂的查询进行搜索。例如,你不仅可以找到所有祖母的照片,还应该能够要求它“找到多年来显示祖母从事木工项目的所有照片”。
还有现有的 Lens 应用程序,它使用文本和照片帮助你识别和研究东西。现在,Lens 将能够使用视频查找信息。Google 通过拍摄一个行为不端的唱片播放器的视频并使用视频找出唱臂为何没有接触唱片来演示这一点。
你知道 Google Docs、Sheets、Slides、Drive 和 Gmail 中的那个侧边栏吗?你现在可以在其中访问各种其他 Google 应用程序的那个?嗯,它将被 Gemini 接管,将用于统一——或者至少连接——各种 Google 应用程序,以便你可以轻松地在电子邮件中引用 Google 文档,反之亦然。它应该在下个月向订阅者推出。
甚至 Google 的基本搜索也受到了影响:AI 概览现在引领你的搜索结果,为你提供 Google 认为你正在寻找的 AI 生成摘要。(尽管对此有很多反对意见,并且有不少用户试图摆脱它。)
很多。目前,一些包括:
Project Astra,它本质上是 Google Assistant,增加了通过手机摄像头看到、响应和使用口语的能力。这还处于早期阶段,所以你可能暂时看不到它。
LearnLM,它将帮助学生使用教育资源找到问题的答案;据该公司称,它已经内置于一些产品中,并正在向教育工作者推出。
Veo,一个“生成 AI 视频模型”。生成意味着它将根据你的要求生成 1080p 视频。你想要一个穿着睡袍和礼帽的猫跳过月亮的视频吗?Veo 是你想要使用的。嗯,当你可以的时候——像 Project Astra 一样,它仍在测试中,不会很快向公众开放。
你可以现在就在这里开始使用 Gemini 1.0 聊天机器人。但是,如果你想使用 Gemini 1.5 Pro——它更快,给你更多功能——你需要订阅 Gemini Advanced,在两个月的试用期后,每月费用为 20 美元。(Gemini Advanced 被认为是 Google One 订阅的一部分,因此你还将获得 2TB 的数据存储和其他 Google One 福利。)
如果你是使用 Google Workspace 的企业,并且你想尝试更复杂的 AI 级别(也以每月 20 美元起),你可以在这里找到更多信息。
只是通常的警告。像所有 AI 应用程序一样,Gemini 的答案可能有问题——换句话说,完全错误。这项技术肯定处于早期阶段,因此虽然它可以是一个有用的工具,但你也应该检查你获得的数据。错误信息由 AI 引擎生成的情况已经变得如此普遍,以至于它有了自己的名字:幻觉,因为通过访问错误信息,AI 正在创造自己的现实。所以,买家小心。
话虽如此,看起来 AI 将会与我们共存很长时间。亲自动手以熟悉它们及其工作原理并不是一个坏主意。除了 ChatGPT 和 Gemini 之外,还有 Microsoft 即将推出的 CoPilot Plus PC,它们将配备内置 AI 硬件,更不用说 Apple 刚刚宣布并即将推出的一系列功能,称为 Apple Intelligence。因此,根据你最喜欢的操作系统,以及你的好奇程度,你可以尝试各种 AI 聊天机器人、增强应用程序和其他功能。