Meta发布Llama 3.1:开源AI模型的新里程碑

95次阅读
没有评论

共计 986 个字符,预计需要花费 3 分钟才能阅读完成。

今年四月,Meta 宣布正在开发一项创新技术,即一个性能可与 OpenAI 等公司开发的顶尖私有模型相媲美的开源模型。如今,这一模型已经正式发布,名为 Llama 3.1,它是迄今为止最大的开源 AI 模型。Meta 声称,Llama 3.1 在多个基准测试中超越了 GPT-4o 和 Anthropic 的 Claude 3.5 Sonnet。此外,Meta 正在将基于 Llama 的 AI 助手推广至更多国家和语言,并新增了根据特定人物形象生成图像的功能。CEO 马克·扎克伯格预测,到今年年底,Meta AI 将成为使用最广泛的助手,超越 ChatGPT。

Meta 发布 Llama 3.1:开源 AI 模型的新里程碑

Llama 3.1 比之前的版本复杂得多,拥有 4050 亿参数,并使用了超过 16000 块 Nvidia 的 H100 GPU 进行训练。尽管 Meta 未透露具体成本,但仅 GPU 的成本就推测达数亿美元。扎克伯格在 Meta 公司博客上发表的一封信中表示,开源 AI 模型将超越并已经在比专有模型更快地改进,类似于 Linux 成为当今驱动大多数手机、服务器和设备的开放源代码操作系统的方式。

为了推广 Llama 3.1,Meta 与微软、亚马逊、谷歌、Nvidia 和 Databricks 等二十多家公司合作,帮助开发者部署自己的版本。Meta 声称 Llama 3.1 的生产运行成本约为 OpenAI 的 GPT-4o 的一半。此外,Meta 使用了合成数据来改进较小版本的 Llama 3.1,包括 70 亿和 8 亿参数版本。Meta 生成式 AI 副总裁 Ahmad Al-Dahle 预测,Llama 3.1 将受到开发者的欢迎,因为它可以作为“部署更小模型并以更经济高效方式”的教师。

Meta 对 Llama 3.1 的红队测试,即对抗性测试,包括寻找潜在的网络安全和生物化学用例。Al-Dahle 提到,Llama 3.1 能够与搜索引擎 API 集成,根据复杂查询从互联网检索信息,并连续调用多个工具以完成任务。此外,Meta AI 的新“想象我”功能通过手机摄像头扫描你的面部,然后让你将自己的形象插入生成的图像中。Meta AI 也将在未来几周内登陆 Quest 头显,取代其语音命令界面。

尽管 Llama 3.1 的最先进 405 亿参数模型在 Meta AI 中免费使用,但助手将在超过每周未指定数量的提示后切换到更简化的 70 亿模型。这表明 405 亿模型对于 Meta 来说运行成本过高。发言人 Jon Carvill 表示,公司将在评估早期使用情况后提供更多关于提示阈值的信息。

正文完
 0
admin-gah
版权声明:本文于2024-07-23转载自TheVerge,共计986字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码