共计 1136 个字符,预计需要花费 3 分钟才能阅读完成。
AI 生成的视频曾经是互联网上的笑柄——还记得那个 AI 生成的威尔·史密斯狼吞虎咽意大利面的噩梦视频吗?如今,这项技术已经取得了显著进步。科技初创公司正竞相推出生成式 AI 工具,试图以极低的成本媲美好莱坞制作工作室的质量。在这场竞争中,AI 初创公司 Luma AI 于周四宣布推出其最新的视频生成模型 Ray3。该模型现已通过其另一款产品 Luma Dream Machine 提供,用户可以通过照片创建视频。此外,Adobe 的 Firefly 和 Creative Cloud Pro 的付费用户也可以在 10 月 1 日之前使用该模型生成无限量的视频。
你可能听说过像 OpenAI 的 GPT-3 这样的推理模型,它们被认为比标准的生成式 AI 模型花费更多时间来处理复杂查询,以返回更有帮助和全面的答案。然而,这些模型此前并未具备视频生成能力。Luma AI 表示,Ray3 与谷歌、Runway、Meta 和 OpenAI 等公司的竞争工具不同,主要在于它能够在生成视频片段时进行“推理”。
“推理”是一个定义模糊且在本体论上存在争议的术语,在 AI 系统的营销中被广泛使用,类似于“理解”、“创造力”和“代理”。简而言之,它指的是模型将问题分解为多个步骤、反思其输出的质量并逐步改进的能力。Ray3 不仅仅是根据文本提示生成视频,而是将制作过程分解为多个步骤,就像创意团队所做的那样。它具有多模态推理能力,这意味着它可以生成文本以及视觉资产,以帮助用户为最终视频勾勒出概念。
例如,电影制作人可以提示系统为图像添加注释或为一系列镜头建议摄像机角度。Luma AI 还声称,Ray3 是同类产品中第一个能够以 4K 高动态范围提供视频输出的模型,这意味着它提供了更广泛的光影视觉范围。Luma AI 在一份新闻稿中写道:“结果是视频感觉更加连贯,角色看起来一致,场景随着时间的推移自然展开,物理效果表现得当。”
目前,Luma AI 尚未公开披露 Ray3 可以生成的视频长度的限制,也未立即回应 ZDNET 对此的评论请求。
Luma AI 将 Ray3 定位为电影制作人、视频游戏设计师和广告商的自动化创意合作伙伴。例如,新的“草稿模式”使 Ray3 能够快速生成各种测试片段,每个片段都有细微的变化,为创意团队提供一系列选项,并节省他们在构思过程中的时间。Luma AI 写道:“这让创作者进入一种流畅的状态,可以自由地进行实验,而不用担心时间或计算成本。”
其他 AI 开发者也一直在推广他们的工具,声称它们可以作为自动化的创意合作伙伴,帮助人类将耗时的常规任务卸载给 AI,从而节省成本。例如,本周早些时候,亚马逊推出了一款 AI 代理,可以帮助品牌完成创建短视频广告的几乎每一步。
Luma AI 的 Ray3 无疑为 AI 视频生成领域带来了新的可能性,但其实际效果和应用范围仍需进一步观察和验证。