共计 1387 个字符,预计需要花费 4 分钟才能阅读完成。
AI 视频初创公司 Runway 近日宣布推出其最新的视频合成模型 Gen-4,该模型声称解决了 AI 视频生成中的几个关键问题,特别是跨镜头的一致角色和物体问题。这一突破性进展为电影制作人和创意专业人士提供了更强大的工具。
在 AI 生成的视频中,角色和物体在不同镜头之间的不一致性一直是一个难题。Runway 声称,只要在 Runway 界面中为项目提供角色或物体的单一参考图像,Gen- 4 就能保持角色和物体的一致性。该公司发布的示例视频展示了在不同场景中出现的同一女性,以及在不同环境中出现的同一雕像,这些角色和物体在各种环境和光照条件下看起来基本一致。
此外,Gen- 4 还旨在让使用该工具的电影制作人能够在同一序列的多个镜头中从不同角度拍摄同一环境或主题。在之前的 Gen- 2 和 Gen- 3 模型中,这几乎是不可能的。虽然 Gen- 2 和 Gen- 3 在保持风格完整性方面表现出色,但在同一场景中生成多个角度方面表现不佳。
Runway 于 2023 年 2 月向用户发布了其视频合成产品的第一个公开版本。虽然 Gen- 1 的创作更多是奇观而非对创意人员有用的东西,但随后的优化使得该工具能够在实际项目中以有限的方式使用。例如,它被用于制作电影《瞬息全宇宙》中的场景,以及《The Late Show with Stephen Colbert》的视觉笑料。
Runway 于 2018 年由纽约大学 Tisch 艺术学院的艺术家学生创立,是首批向公众发布可用视频生成工具的公司之一。其团队还在 Stable Diffusion 模型的基础方面做出了贡献。尽管在资金上远不及 OpenAI 等竞争对手,Runway 专注于向设计师和电影制作人等创意专业人士营销,并实施了旨在使 Runway 成为现有创意工作流程支持工具的工具。
尽管 Runway 在技术上有显著进步,但它也面临着法律和伦理挑战。Runway 与 Midjourney 等公司一样,是艺术家提起的广泛宣传的知识产权案件的被告之一。艺术家声称这些公司非法在其作品上训练模型,因此并非所有创意人员都支持。
此外,Runway 从未公开分享过用于训练其模型的数据。然而,404 Media 的一份报告似乎揭示,至少部分训练数据包括从流行影响者、电影工作室等的 YouTube 频道抓取的视频。
Gen- 4 声称的改进针对使用这些工具的创意人员的抱怨,即这些视频合成工具的有用性有限,因为它们的一致性或对场景的理解有限。像 OpenAI 的 Sora 这样的竞争工具也试图改进这些限制,但效果有限。
Runway 的公告称,Gen- 4 今天向“所有付费计划和企业客户”推出。然而,当登录付费账户时,Gen- 4 在模型选择器中列出,但旁边有“即将推出”字样,目前尚不可选择。Runway 可能正在缓慢地向账户推出模型,以避免服务器负载问题。
无论何时向所有用户推出,Gen- 4 都仅适用于付费计划。个人非企业计划起价为每月 15 美元,最高可达每月 95 美元,但如果选择年度计划,则可享受 20% 的折扣。企业账户每年收费 1,500 美元。这些计划每月为用户提供最多 2,250 个积分,但由于生成可用的 AI 视频是一种策划行为,可能无法用该积分生成太多可用的视频。在每月 95 美元的个人计划中,有一个“探索模式”,允许以较慢的速度无限生成,旨在逐步找到想要投入的输出。
Runway 的 Gen- 4 模型标志着 AI 视频合成技术的一个重要里程碑,尽管其未来的应用和接受程度尚待观察。