共计 1099 个字符,预计需要花费 3 分钟才能阅读完成。
谷歌近日发布了最新 AI 模型 Gemma 3,这款基于 Gemini 2.0 的开源模型虽然在创意写作领域表现亮眼,但在其他任务上仍显不足。作为谷歌“最先进、最便携且负责任开发的开源模型”,Gemma 3 在单个 GPU 上即可运行,其性能足以与需要更多计算能力的更大模型竞争。,
创意写作的佼佼者
Gemma 3 在创意写作方面的表现尤为突出。尽管只有 270 亿参数,它却超越了 Claude 3.7 Sonnet 等更大模型,生成了测试中最长的故事之一。其写作质量也令人印象深刻,故事引人入胜且原创,避免了大多数 AI 模型常见的公式化开头。Gemma 3 在创建沉浸式世界和保持叙事连贯性方面表现出色,角色名称、地点和描述都自然地融入故事背景。对于需要处理长篇虚构项目的创意作家来说,Gemma 3 无疑是一个强大的助手。
文档分析与推理的短板
然而,Gemma 3 在文档分析和推理任务中的表现却不尽如人意。在测试中,模型未能成功分析和总结一份 47 页的国际货币基金组织(IMF)文档,任务中途停滞。尽管这一限制可能与谷歌 AI Studio 的实现有关,但依赖官方界面的用户可能会面临类似问题。此外,Gemma 3 在处理需要复杂逻辑推理的问题时也表现出明显的局限性,未能从提供的信息中得出正确的结论。,
多模态能力的局限
Gemma 3 本质上是多模态的,能够处理文本、图像甚至短视频。然而,在测试中,谷歌 AI Studio 不允许直接处理图像,而通过 Hugging Face 界面测试的较小版本在详细视觉分析方面表现有限。例如,模型未能正确解释一张金融图表,错误地认为 2024 年比特币的价格约为 68,618 美元。虽然 Gemma 3 的多模态功能有效,但其精度仍无法与更大的专业视觉模型相媲美。,
内容审查的严格性
谷歌 AI Studio 的内容过滤器非常严格,模型坚决拒绝生成涉及不道德或敏感话题的内容。即使关闭所有限制,模型仍然拒绝参与包含争议、暴力或攻击性元素的对话。对于需要在合法创作背景下处理敏感话题的用户来说,这可能是一个令人沮丧的限制。,
适用场景与局限性
Gemma 3 的适用性取决于用户的具体需求。对于创意作家、开发者和拥有有限计算资源的小型企业来说,Gemma 3 提供了卓越的性能和灵活性。然而,需要分析长篇文档、处理敏感话题或进行复杂推理的用户可能会遇到限制。总体而言,Gemma 3 不会取代最先进的专有或开源推理模型,但其性能、效率和可定制性使其成为 AI 爱好者和开源粉丝的一个有趣选择。
谷歌 Gemma 3 的发布标志着 AI 技术在创意写作领域的又一次突破,尽管其在其他任务上仍有待改进。对于寻求高效、便携且可定制的 AI 解决方案的用户来说,Gemma 3 无疑是一个值得关注的选择。