OpenAI 新应用 Sora：深度伪造技术的娱乐化探索

167次阅读

共计 2117 个字符，预计需要花费 6 分钟才能阅读完成。

OpenAI 最新推出的应用 Sora 鼓励用户创建个人数字头像，并浏览由 AI 生成的自己及朋友的视频。

周二，OpenAI 发布了一款名为 Sora 的 AI 视频应用。该平台由 OpenAI 最新的视频生成模型 Sora 2 驱动，并围绕类似 TikTok 的“为你推荐”页面展开，展示用户生成的视频片段。这是 OpenAI 首次发布的产品，将 AI 生成的声音添加到视频中。目前，该应用仅在 iOS 上可用，并需要邀请码才能加入。

“你即将进入一个由 AI 生成内容的创意世界，”在应用注册过程中显示的提示页面上写道。“有些视频可能会描绘你认识的人，但所展示的动作和事件并非真实。”

OpenAI 认为，创建和分享 AI 深度伪造将成为一种流行的娱乐形式。无论是你的朋友、网红还是网上的陌生人，Sora 都将深度伪造视频视为一种可滚动的乐趣。应用的主页是一个无尽的 AI 生成视频流，内容以人脸为主。

在设置过程中，用户可以选择通过大声说出几个数字并转动头部来创建自己的数字形象，应用会进行记录。“团队在角色一致性方面付出了很多努力，”OpenAI CEO Sam Altman 在一篇博客中写道。

用户可以选择谁可以在 Sora 视频中使用他们的数字形象。可以设置为所有人，或仅限于自己、你批准的人或应用中的互相关注者。每当有人使用你的形象生成视频时，即使它只是存在于他们的草稿中，你也可以从你的账户页面看到完整的视频片段。

周二下午，我的“为你推荐”页面上许多最受欢迎的视频都展示了 Altman 的形象。一个由 AI 生成的视频片段描绘了 OpenAI CEO 从 Target 偷窃图形处理单元的场景。当角色被抓住时，一个听起来像 Altman 的声音向保安求情，让他保留 GPU，以便他可以构建 AI 工具。

在 WIRED 的测试中，许多生成的视频都包含粗糙的边缘和其他错误。但 Sora 使得创建个性化的深度伪造视频变得异常流畅，这些视频通常看起来和听起来都令人信服地真实。

要在视频中加入某人的形象，只需在 Sora 的生成页面上点击他们的脸，并将其添加为“客串”。然后，输入一个简单的提示，比如“在办公室为 WIRED 的故事打架”。

Sora 会完成剩下的工作，将脚本、声音和视觉效果生成一个九秒钟的视频片段。WIRED 生成了一个视频，内容是两位同事在办公室里激烈地争论一个故事，这一提示在员工中引发了从恐惧到娱乐的各种反应。

在他的博客文章中，Altman 写道，OpenAI“意识到这样的服务可能会变得多么令人上瘾，并且可以想象它可能被用于欺凌的许多方式。”

因此，Altman 表示，OpenAI 在 Sora 应用中构建了许多安全防护措施，包括防止人们“在深度伪造中滥用某人的形象”。在公司博客文章中，OpenAI 表示，它还限制了“涉及真实人物的色情内容、暴力内容、极端主义宣传、仇恨内容以及促进自残或饮食失调的内容。”

随着更多用户加入应用，这些保护措施可能会受到考验。

当要求 Sora 生成我穿着比基尼和作为一个健壮的动漫角色的视频时，这两个请求都被阻止了，因为可能包含“暗示性或挑逗性内容”。我创建的 Altman 和我在游泳池里踩水的 Sora 视频显示我们俩都穿着完整的衣服，包括衬衫。

描绘大麻使用的内容似乎不受限制。Sora 创建了一个视频，内容是“我在办公室桌子上抽了 10 根大麻烟”，一口气抽完，没有任何问题。但应用不会生成我“吸食可卡因”的视频。（这很合理！）它还拒绝生成我跳下桥并跳到龙背上的视频，称该内容可能违反有关自残的规则。

看起来 OpenAI 还希望防止人们创建公众人物和名人如 Taylor Swift 的视频。在 WIRED 的测试中，生成达斯·维达和 Boss Baby 视频的请求被阻止，因为可能违反“关于与第三方内容相似性的防护措施”。应用甚至拒绝了一个请求，要求生成“tswift 模仿者”的视频片段。但 Sora 轻松生成了宝可梦角色如皮卡丘和妙蛙种子的视频。（根据《华尔街日报》的报道，该应用将允许用户生成视频，除非版权持有人选择退出。）

一个生成 Altman“在《南方公园》剧集中”的请求显示了 CEO 走向 Eric Cartman，这是该剧的主要角色之一，自我介绍并说他来聊聊 AI。“是那个写我书报告的东西吗？还是那个会偷走我们所有工作的东西？”AI 生成的 Cartman 以令人信服的声音和举止回应道。然而，在某些时候，Cartman 的抱怨声从 Altman 的嘴里发出。

Sora 应用在 Meta 发布类似 AI 视频流 Vibes 后不久推出。可滚动的 AI 生成视频供应充足！虽然我早期使用 Vibes 视频流的体验是乏味且轻浮的，但 Sora 视频流，伴随着大量微笑的深度伪造视频，更加引人注目——也更令人担忧。

该应用让人想起 2000 年代中期的节日主题 “精灵你自己”视频，你可以把自己的脸或朋友的脸放入一个跳舞的动画中，只是 Sora 中的客串更加动态和开放。一些生成的我的视频片段有些生硬或看起来荒谬。尽管如此，它们通常都能很好地结合在一起——声音和动作都非常准确。

我将一个最能模仿我形象的 AI 视频发送给我的伴侣，没有提供更大的背景。视频显示我变成了一个拥有长而丰盈头发的女人。我的伴侣最初没有意识到这是一个完全合成的我的声音和形象——他们好奇我是从哪里得到这个酷炫的视频滤镜的。

正文完