IBM Granite 3.2 增强推理能力,为企业提供高效 AI 解决方案

50次阅读
没有评论

共计 1177 个字符,预计需要花费 3 分钟才能阅读完成。

IBM 近日发布了其 Granite 系列大型语言模型(LLMs)的最新版本——Granite 3.2。此次更新旨在为企业提供更小型、高效且实用的人工智能(AI)解决方案,特别是在增强推理能力方面取得了显著进展。

Granite 3.2 引入了实验性的链式思维(CoT)推理能力,这是一种先进的 AI 技术,能够将复杂问题分解为逻辑步骤,从而模仿人类的推理过程。这一技术显著提升了 LLM 在处理需要多步推理、计算和决策的任务时的能力。

IBM Granite 3.2 增强推理能力,为企业提供高效 AI 解决方案

IBM 的 CoT 技术采用了思维偏好优化(TPO)框架,该框架在不牺牲一般任务效果的情况下,显著增强了在广泛指令跟随任务中的推理性能。这一方法有效缓解了其他专注于推理的模型中常见的性能权衡问题。

对于用户而言,CoT 技术的应用意味着 AI 聊天机器人能够通过“提示链”提供更具体的答案。例如,当询问“天空是什么颜色?”时,AI 会直接回答“蓝色”。但如果使用 CoT 提示询问“为什么天空是蓝色的?”,AI 会首先定义“蓝色”的含义,然后推断出天空由于大气吸收其他颜色而呈现蓝色。这一过程展示了 AI 构建逻辑论证的能力。

CoT 技术在 Granite 8B 和 2B 版本中均可使用,开发者可以通过编程方式开启或关闭推理功能。这一灵活性使企业能够根据任务复杂性优化计算资源。IBM 声称,这种方法使 8B 模型在复杂数学推理任务上的性能能够与更大的模型(如 Claude 3.5 Sonnet 和 GPT-4o)相媲美。

此外,IBM 还推出了一款新的 20 亿参数视觉语言模型(VLM),专门设计用于文档理解任务。通过使用其开源的 Docling 工具包处理了 8500 万份 PDF,并生成了 2600 万对合成问答对,IBM 显著增强了 VLM 处理复杂文档密集型工作流的能力。

在安全方面,IBM 依然保持领先。Granite Guardian 3.2 是 IBM AI 安全模型套件中的最新版本,提供了增强的提示和响应风险检测功能。这一更新版本在保持性能的同时将模型大小减少了 30%,并引入了新的“口头化置信度”功能,以进行更细致的风险评估。

对于企业用户,Granite 的高级预测能力也值得关注。新的 TinyTimeMixers(TTM)模型具有不到 1000 万的参数,可以进行长达两年的长期预测。这些模型在金融、经济和供应链管理中的趋势分析中非常有用。

与以往一样,IBM 继续秉持开源精神。所有 Granite 3.2 模型都在 Hugging Face 上以 Apache 2.0 许可证提供,部分模型还在 IBM WatsonX.ai、Ollama、Replicate 和 LM Studio 等平台上可用。这种开放方法与 IBM 的战略一致,旨在使 AI 对企业更易获取且更具成本效益。

正如 IBM AI 研究副总裁 Sriram Raghavan 所强调的:“AI 的下一个时代是关于效率、集成和现实世界的影响——企业可以在不过度花费计算资源的情况下实现强大的成果。”

正文完
 0
admin-gah
版权声明:本文于2025-03-01转载自Zdnet,共计1177字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码