Viggle:人工智能如何改变视频生成游戏

379次阅读
没有评论

共计 1651 个字符,预计需要花费 5 分钟才能阅读完成。

在视频中,人群在一场拥挤的夏季音乐节上欢呼雀跃。随着音响中响起的节拍,表演者终于走上舞台:那就是小丑。小丑穿着红色西装,头发是绿色的,并且脸上有标志性的彩绘。他挥舞着拳头,在舞台上跳舞,沿着台子向前走,以便更靠近他的一群粉丝。当开始说唱时,小丑弯曲膝盖,用力推开地面,上下弹跳,然后单脚做出一个 360 度的转身。看起来毫不费力,但如果你尝试这个动作,你会摔个狗啃泥。小丑从未如此酷。

然后是另一个视频,NBA 全明星乔尔·恩比德从后台走出来,向观众致意,然后完成同样的舞蹈动作。接着,是《情景喜剧大师》明星拉里·大卫。然而,在这些场景中,无论是小丑、乔尔·恩比德还是拉里·大卫,他们的身体都有些颤抖,但他们的面部表情始终保持不变。

当然,这一切都是由名为 Viggle 的公司生成的人工智能。

原始视频显示了说唱歌手 Lil Yachty 在 2021 年的夏季音乐节上登台表演——根据一个 YouTube 视频的标题,该视频的观看次数超过 650 万次,这个入场是“有史以来最困难的走出”。这在 4 月成为了一个流行的模因格式,人们将他们喜欢的名人——或者他们喜欢的反派,比如山姆·班克曼 - 弗里德——插入到 Lil Yachty 登台的视频中。

文本到视频的人工智能产品变得异常出色,但你不能只输入“2021 年夏季音乐节山姆·班克曼 - 弗里德扮演 Lil Yachty”就指望 Sora 准确理解你的意思。Viggle 的工作方式不同。

在 Viggle 的 Discord 服务器上,用户上传一个某人做某种动作的视频——通常是 TikTok 的舞蹈视频——和一个人的照片。然后,Viggle 创建一个视频,其中的人复制了视频中的动作。显然,这些视频并不真实,尽管它们仍然很有趣。但在 Lil Yachty 的模因走红之后,Viggle 变得炙手可热,热情未减。

Chu 表示,Viggle 的主要用户可以分为两类:一些人用它来制作模因,而另一些人将其用作游戏设计和视觉效果制作过程中的工具。例如,一个动画工程团队可以拿一些概念设计,快速将它们转变成粗糙但快速的动画资产,整个目的是看看它们在最终计划的草图中是什么样子的。他们通常需要花费几天,甚至几周的时间来手动设置这些,但使用 Viggle,这基本上可以立即自动完成。这节省了大量繁琐、重复的建模工作。

3 月份,Viggle 的 Discord 拥有几千名成员。到 5 月中旬,会员人数已经达到了 180 万,而 6 月即将到来之际,Viggle 的服务器会员已经增至 300 万以上。这使其比《Valorant》和《原神》等游戏的服务器总和还要庞大。

Viggle 的增长势头没有放缓的迹象,除了对视频生成的高需求使得等待时间对于急切的用户来说有些太长。但由于 Viggle 的重心在于 Discord,Discord 的开发团队直接与 Viggle 合作,指导这家成立两年的初创公司应对其快速增长。

对于 Viggle 来说,Discord 的支持至关重要,因为 Viggle 只有 15 名员工。

在 Viggle 之前,Chu 曾是 3D 工具巨头 Autodesk 的人工智能研究员。他还为 Facebook、Nvidia 和 Google 等公司进行过研究。

对于 Discord 来说,作为人工智能初创公司的意外 SaaS 公司可能会带来成本。一方面,这些应用程序将新的受众引入 Discord,对用户指标可能有好处。但在技术方面,承载如此多的视频可能会很困难和昂贵,特别是当平台上的其他用户正在直播视频游戏、视频聊天和语音通话时。然而,如果没有像 Discord 这样的平台,这些初创公司可能无法以同样的速度增长。

尽管这些公司可以采用 Discord 自己的内容准则,并使用其内容管理应用程序,但确保 300 万人的行为始终是一个挑战。即使那些 Lil Yachty 走出舞台的模因在技术上违反了 Viggle 的规则,该规则鼓励用户避免未经许可生成真实人物的图像,包括名人。

目前,Viggle 的救命稻草可能在于,它的输出还不是 100% 逼真。这项技术确实令人印象深刻,但我们知道得更清楚。那个笨拙的小丑动画绝对不是真的,但确实很有趣。

正文完
 0
admin-gah
版权声明:本文于2024-05-31转载自Techcrunch,共计1651字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码