IBM发布Granite 3.1：企业AI领域的重大突破

187次阅读

共计 985 个字符，预计需要花费 3 分钟才能阅读完成。

IBM 最近发布了一款名为 Granite 3.1 的大型语言模型，这可能是企业 AI 领域的一个重大突破。说实话，我一直在关注 IBM 在 AI 方面的进展，他们似乎每隔几个月就会推出一个新的开源模型，这种速度真是让人印象深刻。Granite 3.1 是基于之前的 Granite 3.0 版本构建的，不仅在性能上有所提升，还针对企业应用进行了优化。

最让我惊讶的是，这个模型居然有一个 128K 的令牌上下文窗口。这意味着它能够处理和理解大约 85,000 个英语单词的文本量，这简直是一个巨大的飞跃。相比之下，OpenAI 的 ChatGPT 3 只能处理 2,000 个令牌，差距显而易见。这种能力对于需要处理大量文本的企业来说，无疑是一个福音。

IBM 发布 Granite 3.1：企业 AI 领域的重大突破

IBM 还声称，他们的 Granite 8B Instruct 模型在 HuggingFace 的 OpenLLM Leaderboard 基准测试中，表现优于 Google 的 Gemma 2、Meta 的 Llama 3.1 和 Qwen 2.5 等竞争对手。这听起来有点夸张，但考虑到 IBM 在 AI 领域的长期积累，我倒也不觉得完全不可信。

Granite 3.1 系列包括了密集模型和专家混合（MoE）变体。密集模型主要用于支持基于工具的使用案例，比如代码生成、翻译和错误修复。而 MoE 模型则更适合部署在需要低延迟的设备应用中。IBM 还特别提到，这些模型训练的数据量超过了 10 万亿个令牌，这让我对它们的性能有了更高的期待。

另一个值得一提的改进是，Granite 3.1 现在不仅能处理文本，还能处理图像输入并生成文本输出。这对于那些需要处理图形业务的企业来说，无疑是一个巨大的优势。此外，这个模型现在还能处理十几种语言，包括德语、西班牙语、法语、日语等，这对于有国际业务的企业来说，绝对是一个加分项。

IBM 还保持了他们对开源的承诺，Granite 3.1 是基于 Apache 2 开源许可证发布的。他们还公开了训练数据集，并提供了详细的文档，这对于那些担心知识产权问题的企业来说，无疑是一个好消息。IBM 甚至为第三方知识产权索赔提供了无上限的赔偿，这让我觉得他们在这一点上做得非常到位。

总的来说，Granite 3.1 的发布无疑会加速 AI 在企业环境中的应用。通过将这些模型与专有数据结合使用，企业可以以较低的成本实现与更大模型相媲美的任务特定性能。IBM 的这一步，无疑为企业在 AI 领域的创新和解决复杂业务挑战提供了强大的工具。

正文完