Kubernetes如何为AI加速:云原生计算的未来

49次阅读
没有评论

共计 836 个字符,预计需要花费 3 分钟才能阅读完成。

Kubernetes 如何为 AI 加速:云原生计算的未来

Kubernetes,作为云原生计算的引擎,正在为 AI 加速。在 2025 年亚特兰大举行的 KubeCon 北美峰会上,云原生计算基金会(CNCF)推出了 Kubernetes AI 一致性认证计划(CKACP),旨在为 AI 工作负载提供一个安全、通用的平台。

CKACP 的目标是创建社区定义的开放标准,以确保 AI 工作负载在不同 Kubernetes 环境中一致且可靠地运行。CNCF 首席技术官 Chris Aniszczyk 表示,该计划将确保 AI 工作负载在不同环境中表现出可预测性,并支持 AI 的规模化采用。

具体而言,CKACP 旨在:

  • 确保 AI 和机器学习(ML)工作负载在公有云、私有基础设施和混合环境中的可移植性和互操作性,避免供应商锁定。
  • 通过设置平台必须支持的共享能力和配置基线来减少碎片化,使企业能够更自信地采用和扩展 Kubernetes 上的 AI。
  • 为供应商和开源贡献者提供明确的合规目标,确保他们的技术能够协同工作并支持生产就绪的 AI 部署。
  • 使最终用户能够快速创新,并确保认证平台已实施资源管理、GPU 集成和关键 AI 基础设施需求的最佳实践。
  • 培育一个可信赖的 AI 开发开放生态系统,标准使得随着各行业使用量的增加,能够高效扩展、优化和管理 AI 工作负载。

目前已有 58% 的组织在 Kubernetes 上运行 AI 工作负载,CNCF 的新计划预计将显著简化团队在 AI 中的部署、管理和创新。通过提供通用的测试标准、参考架构以及经过验证的 GPU 和加速器支持集成,该计划旨在使 AI 基础设施在多供应商、多云环境中更加稳健和安全。

此外,Kubernetes 正在重新架构以原生支持 AI 工作负载需求,包括回滚支持、跳过更新的能力以及针对 GPU 和其他 AI 专用硬件的新低级控制。这些改进将大大降低采用关键新功能或紧急安全补丁的风险,并为管理员提供更大的灵活性和控制力。

Kubernetes 的第一个十年是将 IT 从裸金属和虚拟机(VM)迁移到容器。它的下一个十年将由其管理全球规模 AI 的能力定义,为新型工作负载提供安全、速度和灵活性。

正文完
 0
admin-gah
版权声明:本文于2025-11-15转载自Zdnet,共计836字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码