共计 986 个字符,预计需要花费 3 分钟才能阅读完成。
今年四月,Meta 宣布正在开发一项创新技术,即一个性能可与 OpenAI 等公司开发的顶尖私有模型相媲美的开源模型。如今,这一模型已经正式发布,名为 Llama 3.1,它是迄今为止最大的开源 AI 模型。Meta 声称,Llama 3.1 在多个基准测试中超越了 GPT-4o 和 Anthropic 的 Claude 3.5 Sonnet。此外,Meta 正在将基于 Llama 的 AI 助手推广至更多国家和语言,并新增了根据特定人物形象生成图像的功能。CEO 马克·扎克伯格预测,到今年年底,Meta AI 将成为使用最广泛的助手,超越 ChatGPT。
Llama 3.1 比之前的版本复杂得多,拥有 4050 亿参数,并使用了超过 16000 块 Nvidia 的 H100 GPU 进行训练。尽管 Meta 未透露具体成本,但仅 GPU 的成本就推测达数亿美元。扎克伯格在 Meta 公司博客上发表的一封信中表示,开源 AI 模型将超越并已经在比专有模型更快地改进,类似于 Linux 成为当今驱动大多数手机、服务器和设备的开放源代码操作系统的方式。
为了推广 Llama 3.1,Meta 与微软、亚马逊、谷歌、Nvidia 和 Databricks 等二十多家公司合作,帮助开发者部署自己的版本。Meta 声称 Llama 3.1 的生产运行成本约为 OpenAI 的 GPT-4o 的一半。此外,Meta 使用了合成数据来改进较小版本的 Llama 3.1,包括 70 亿和 8 亿参数版本。Meta 生成式 AI 副总裁 Ahmad Al-Dahle 预测,Llama 3.1 将受到开发者的欢迎,因为它可以作为“部署更小模型并以更经济高效方式”的教师。
Meta 对 Llama 3.1 的红队测试,即对抗性测试,包括寻找潜在的网络安全和生物化学用例。Al-Dahle 提到,Llama 3.1 能够与搜索引擎 API 集成,根据复杂查询从互联网检索信息,并连续调用多个工具以完成任务。此外,Meta AI 的新“想象我”功能通过手机摄像头扫描你的面部,然后让你将自己的形象插入生成的图像中。Meta AI 也将在未来几周内登陆 Quest 头显,取代其语音命令界面。
尽管 Llama 3.1 的最先进 405 亿参数模型在 Meta AI 中免费使用,但助手将在超过每周未指定数量的提示后切换到更简化的 70 亿模型。这表明 405 亿模型对于 Meta 来说运行成本过高。发言人 Jon Carvill 表示,公司将在评估早期使用情况后提供更多关于提示阈值的信息。