OpenAI上周四(2月15日)发布了Sora,这一工具能够将口头命令转化为极为逼真的电影片段,这一消息在科技和媒体界引起了轩然大波。
为何重要?
其他公司也有自己的文本转视频工具,但OpenAI提高了惊叹度。
每个人都知道这一天会到来 —— 但没想到来得这么快。 正在发生的事情:人工智能作为执行人类意图的工具似乎又迈出了一大步,Sora能够从用户提供的几句话中产生出长达一分钟的令人信服的视频。
不仅是图像看起来真实 —— 还有它们感觉像电影,就像ChatGPT的对话有时会像人类的语言一样。 Sora拥有《连线》的史蒂文·莱维所说的“对电影语法的一种新兴掌握”。
他们在做什么?
OpenAI发布Sora的文章宣称,“我们正在教会AI理解和模拟物理世界的运动”。
整体来看:
正如Dall-E引起了视觉艺术家的不满,ChatGPT引发了作者和写作者的深思(以及诉讼),Sora正在给电影制作人带来兴奋和恐惧。
它似乎为昂贵特效的提供了捷径,并可能颠覆许多建立好莱坞的技艺。 它还提出了关于人类对艺术创作的独特贡献、人类演员和讲故事者在视觉媒体中的地位,以及未来观众将会寻找乐趣和惊喜的深刻问题。
是的,但:大多数人目前还不能使用Sora。
该公司表示,正在向选择的“视觉艺术家、设计师和电影制作人”提供该工具,以获得有关如何推进模型对创意专业人士最有帮助的反馈,同时还向“红队”研究人员提供该工具,他们将评估“危害和风险”。
怀疑者认为,OpenAI在演示示例上进行了精心挑选,并且Sora的输出似乎与Midjourney和类似工具的输出没有实质性区别。 与之前的生成式AI突破一样,Sora引发了三大问题:它可能侵犯了创作者的权利;它可能会在互联网上泛滥虚假信息和仇恨言论;以及它会“产生”错误。
“训练数据来自我们许可的内容以及公开可用的内容。”一位OpenAI研究人员告诉《连线》杂志 —— 但知识产权持有者已经在质疑AI构建者能够使用多少“公开可用的内容”来训练其程序。