共计 878 个字符,预计需要花费 3 分钟才能阅读完成。
在上周的 re:Invent 大会上,亚马逊的 AWS 云计算部门再次震撼了科技界。他们不仅推出了新一代的 Trainium3 芯片,还揭开了 Project Rainier 的神秘面纱。这个项目听起来就像科幻小说里的东西——一个“UltraCluster”,将集结数十万块 Trainium 芯片,形成一个超级计算集群。
Trainium3 芯片的发布无疑是这次大会的重头戏。这款芯片不仅在速度上比前一代 Trainium2 快了两倍,而且在能效方面也提升了 40%。更令人兴奋的是,这是 AWS 首次采用三纳米半导体制造工艺技术,这无疑为未来的芯片设计开辟了新的可能性。
与此同时,一年前发布的 Trainium2 芯片现在已经全面投入使用。这些芯片的速度是上一代的四倍,特别在处理大型语言模型(LLM)时表现尤为出色。AWS 首席执行官 Matt Garman 在主题演讲中特别提到了这些芯片在 Meta 的 Llama 模型上的优异表现,这无疑为 AWS 在 AI 领域的竞争力增添了砝码。
除了硬件的升级,AWS 还推出了 UltraServers,这是一种通过 NeuronLink 互连技术将 64 块 Trainium2 芯片连接在一起的巨型服务器。这些服务器现在已经可以在 EC2 上使用,旨在处理那些具有数万亿参数的 LLM。为了更好地支持这些硬件,AWS 还推出了一款名为 Neuron 的软件开发工具包,它支持 AI 中的流行框架,如 JAX 和 PyTorch,以及 Hugging Face 模型中心的超过 10 万个模型。
Garman 还透露了一些未来的计划。他们正在开发 Project Rainier,这将是一个“UltraCluster”,集合众多 UltraServers,以访问“数十万块 Trainium2 芯片”。这个项目的开发与 Gen AI 初创公司 Anthropic 合作进行,预示着 AWS 在 AI 领域的野心和布局。
总的来说,这次 re:Invent 大会不仅展示了 AWS 在硬件和软件方面的最新进展,也揭示了他们在 AI 领域的长远规划。随着 Trainium3 芯片和 Project Rainier 的推出,AWS 无疑将继续在云计算和 AI 领域保持其领先地位。