ChatGPT的创造者OpenAI公布了一种新的人工智能形式,它可以根据文本提示创建逼真的视频,这在网上引起了震惊的反应。
OpenAI2月15日在一篇博客文章中表示,这个名为Sora的文本到视频模型“对语言有深刻的理解”,可以生成“表达充满活力的情感的引人注目的角色”。
这家微软支持的初创公司表示:“Sora能够生成具有多个角色、特定运动类型以及准确的主题和背景细节的复杂场景。”
“这个模型不仅能理解用户在提示中提出的要求,还能理解这些东西在现实世界中的存在方式。”
OpenAI首席执行官萨姆·奥特曼在X上邀请用户为Sora提供提示,然后发布结果,包括两只金毛寻回犬(golden retriever)在山顶上做播客、一位祖母做汤圆和海洋动物在海洋上参加自行车比赛的现实视频。
这些超现实的视频在社交媒体上引发了震惊的反应,用户称这些结果“超出了这个世界”,“改变了游戏规则”。
OpenAI在其博客文章中表示,他们将在向公众发布Sora之前采取几项重要的安全措施。
公司表示:“我们正在与红队成员合作 – 这些成员是针对误导信息、仇恨内容和偏见等领域的专家,他们将对模型进行对抗性测试。”
OpenAI还承认Sora存在一些弱点,包括连贯性和区分左右的困难。
这家总部位于旧金山的初创公司表示:“例如,一个人可能咬了一口饼干,但之后,饼干上可能没有咬痕。”
OpenAI的竞争对手Meta和谷歌也展示了文本到视频的人工智能技术,但他们的模型并没有像Sora那样产生逼真的结果。