疾病夺走了她的声音,人工智能凭借15秒视频帮她原声重现

据美联社报道,就在去年夏天,亚历克西斯·“莱西”·博根(Alexis “Lexi” Bogan)的声音还充满活力。

她喜欢在车里高唱泰勒·斯威夫特和扎克·布莱恩的民谣。她总是笑——即使是在把行为不端的学龄前儿童围起来,或者在后院的火坑上与朋友辩论政治时。高中时,她是合唱团的女高音。

然后那个声音就消失了。

去年8月,医生切除了她大脑后部附近危及生命的肿瘤。一个月后,当呼吸管拔出时,博根出现吞咽困难,费力地向父母打招呼。经过几个月的康复,她的言语仍然有障碍。朋友、陌生人和她自己的家人都很难理解她想表达的事情。

今年4月,21岁的她恢复了昔日的声音。不是真正的声音,而是人工智能生成的语音克隆,她可以从手机应用程序中召唤它。经过对她青少年声音的 15 秒时间胶囊进行训练(来自她为高中项目录制的烹饪演示视频),经过合成但听起来非常真实的人工智能声音,现在几乎可以说出她想说的任何内容。

她在手机中输入几个单词或句子,应用程序会立即大声朗读。

“嗨,能给我一杯特级冰红糖燕麦奶昔浓缩咖啡吗?”博根在一家星巴克得来速餐厅将手机伸出车窗外时,人工智能的声音说道。

“随着技术的发展,我们希望博根成为开拓者。”布朗大学医学院和罗德岛医院的神经外科住院医师 Rohaid Ali 博士说。他说,数百万患有中风、咽喉癌或神经系统疾病的人可能会受益。

“我们应该意识到风险,但我们不能忘记患者和社会利益。”参与该试点项目的另一位住院医生法蒂玛·米尔扎 (Fatima Mirza) 博士说。 “我们能够帮助博根找回她真实的声音,她能够用最真实的方式说话。”

博根的疾病始于去年夏天,伴有头痛、视力模糊和面部下垂,这让普罗维登斯孩之宝儿童医院的医生感到震惊。他们发现一个高尔夫球大小的血管肿瘤压在她的脑干上,并与血管和脑神经纠缠在一起。

“这是一场控制出血并取出肿瘤的战斗。”儿科神经外科医生康斯坦蒂娜·斯沃科斯博士说。

斯沃科斯说,肿瘤的位置和严重程度,加上长达 10 小时的手术的复杂性,损害了博根对舌头肌肉和声带的控制,阻碍了她进食和说话的能力。

“当我失去声音时,就好像我的身份的一部分被夺走了。”博根说。

饲管是今年问世的,言语治疗仍在继续,使她能够在安静的房间里清晰地说话,但没有迹象表明她会完全恢复自然声音的清晰度。

“在某些时候,我开始忘记我的声音是什么样的。”博根说,“我已经习惯了我现在的声音。”

每当电话铃在北史密斯菲尔德普罗维登斯郊区的家里响起时,她就会把电话交给母亲接听电话。每当朋友们去吵闹的餐厅时,她都觉得自己给他们带来了负担。她的父亲患有听力损失,很难理解她的意思。

回到医院,医生正在寻找一名试点患者来试验 OpenAI 的技术。这个人非博根莫属。

博根找到几年前解释如何制作意大利面沙拉的视频。医生向人工智能系统输入 15 秒的片段。第一次测试时,所有人都被语音的品质惊呆了。偶尔出现的小故障——单词发音错误、语调缺失——大多是难以察觉的。四月,医生为博根配备了一款只有她可以使用的定制手机应用程序。

“每次听到她的声音,我都会非常激动。”她的母亲眼含泪水说道。

“我认为我能再次听到那种声音真是太棒了。”博根说,这有助于“将我的信心提升到这一切发生之前的水平。”

她现在每天使用该应用程序约 40 次,并发送反馈,希望能够帮助未来的患者。她的第一个实验是与她担任助教的幼儿园的孩子们交谈。她输入“哈哈哈哈”,期待着机器人的回应。令她惊讶的是,这听起来像是她以前的笑声。

她在 Target 和 Marshall’s 都用它来询问在哪里可以找到物品。这帮助她与父亲重新建立了联系。这让她更容易点快餐。

博根的医生已经开始克隆罗德岛州其他自愿患者的声音,并希望将这项技术带到世界各地的医院。

虽然目前博根必须摆弄手机才能让语音引擎说话,但她设想了一种人工智能语音引擎,可以改进旧有的语言恢复疗法——例如机器人发声的电喉或语音假肢——与人体融合或实时翻译单词。

随着年龄的增长,她不太确定会发生什么,而且她的人工智能声音听起来仍然像她十几岁的时候一样。她说,也许这项技术可以让她的人工智能声音“老化”。

Leave a Comment

您的邮箱地址不会被公开。 必填项已用 * 标注