IBM发布Granite 3.1:企业AI领域的重大突破

56次阅读
没有评论

共计 985 个字符,预计需要花费 3 分钟才能阅读完成。

IBM 最近发布了一款名为 Granite 3.1 的大型语言模型,这可能是企业 AI 领域的一个重大突破。说实话,我一直在关注 IBM 在 AI 方面的进展,他们似乎每隔几个月就会推出一个新的开源模型,这种速度真是让人印象深刻。Granite 3.1 是基于之前的 Granite 3.0 版本构建的,不仅在性能上有所提升,还针对企业应用进行了优化。

最让我惊讶的是,这个模型居然有一个 128K 的令牌上下文窗口。这意味着它能够处理和理解大约 85,000 个英语单词的文本量,这简直是一个巨大的飞跃。相比之下,OpenAI 的 ChatGPT 3 只能处理 2,000 个令牌,差距显而易见。这种能力对于需要处理大量文本的企业来说,无疑是一个福音。

IBM 发布 Granite 3.1:企业 AI 领域的重大突破

IBM 还声称,他们的 Granite 8B Instruct 模型在 HuggingFace 的 OpenLLM Leaderboard 基准测试中,表现优于 Google 的 Gemma 2、Meta 的 Llama 3.1 和 Qwen 2.5 等竞争对手。这听起来有点夸张,但考虑到 IBM 在 AI 领域的长期积累,我倒也不觉得完全不可信。

Granite 3.1 系列包括了密集模型和专家混合(MoE)变体。密集模型主要用于支持基于工具的使用案例,比如代码生成、翻译和错误修复。而 MoE 模型则更适合部署在需要低延迟的设备应用中。IBM 还特别提到,这些模型训练的数据量超过了 10 万亿个令牌,这让我对它们的性能有了更高的期待。

另一个值得一提的改进是,Granite 3.1 现在不仅能处理文本,还能处理图像输入并生成文本输出。这对于那些需要处理图形业务的企业来说,无疑是一个巨大的优势。此外,这个模型现在还能处理十几种语言,包括德语、西班牙语、法语、日语等,这对于有国际业务的企业来说,绝对是一个加分项。

IBM 还保持了他们对开源的承诺,Granite 3.1 是基于 Apache 2 开源许可证发布的。他们还公开了训练数据集,并提供了详细的文档,这对于那些担心知识产权问题的企业来说,无疑是一个好消息。IBM 甚至为第三方知识产权索赔提供了无上限的赔偿,这让我觉得他们在这一点上做得非常到位。

总的来说,Granite 3.1 的发布无疑会加速 AI 在企业环境中的应用。通过将这些模型与专有数据结合使用,企业可以以较低的成本实现与更大模型相媲美的任务特定性能。IBM 的这一步,无疑为企业在 AI 领域的创新和解决复杂业务挑战提供了强大的工具。

正文完
 0
admin-gah
版权声明:本文于2024-12-19转载自Zdnet,共计985字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码