首先,OpenAI 提供了一种工具,让人们只需描述他们想要看到的内容即可创建数字图像。然后,它建立了类似的技术,可以生成像好莱坞电影一样的全动态视频。
现在,它推出了可以重新创造某人声音的技术。
这家备受瞩目的人工智能初创公司3月29日表示,一小群企业正在测试新的 OpenAI 系统 Voice Engine,该系统可以从 15 秒的录音中重新创建一个人的声音。如果您上传自己的录音和一段文本,它可以合成语音听起来像您亲口读出。
并且,文本不必是您的母语。例如,如果您说英语,它可以用西班牙语、法语、中文或许多其他语言重新创建您的声音。
OpenAI 并未更广泛地分享该技术,因为它仍在尝试了解其潜在危险。与图像和视频生成器一样,语音生成器可以帮助在社交媒体上传播虚假信息。它还可能允许犯罪分子在网上或打电话期间冒充他人。
该公司表示,他们特别担心这种技术可能会被用来破坏控制网上银行账户和其他个人应用程序访问的语音验证器。
“这是一件敏感的事情,正确处理很重要。”OpenAI 产品经理杰夫·哈里斯 (Jeff Harris) 在接受采访时表示。
该公司正在探索对合成声音加水印或添加控制措施的方法,以防止人们使用带有政治家或其他知名人物声音。
今年 2 月,OpenAI 推出了视频生成器 Sora,采取了类似的方法。他们展示了这项技术,但没有公开发布。
OpenAI 是开发新型人工智能技术的众多公司之一,该技术可以快速轻松地生成合成声音。包括谷歌等科技巨头以及总部位于纽约的 ElevenLabs 等初创公司,也在研发这一技术。
企业可以使用这些技术生成有声读物、为在线聊天机器人提供语音,甚至构建自动广播电台 DJ。自去年以来,OpenAI 已使用其技术为能够说话的 ChatGPT 版本提供支持。长期以来,它一直为企业提供一系列可用于类似应用程序的声音。所有这些都是根据配音演员提供的剪辑构建的。
但该公司尚未提供一种公共工具,允许个人和企业像语音引擎那样从短片中重新创建声音。哈里斯说,以这种方式重新创造任何声音的能力使得这项技术变得危险。他说,这项技术在选举年可能特别危险。
一月份,新罕布什尔州居民收到了机器人电话信息,劝阻他们不要在州初选中投票,其声音很可能是人为生成的,听起来像总统乔·拜登。联邦通信委员会后来宣布此类电话为非法。
哈里斯表示,OpenAI 没有立即计划从该技术中赚钱。他说,该工具对于因疾病或事故而失声的人特别有用。
他展示了如何利用该技术在脑癌损伤后重建女性的声音。他说,在提供了她高中时一次演讲的简短录音后,她现在可以说话了。