【华e生活巴德编译】由杜克大学神经科学家、神经外科医生和工程师组成的合作团队开发的“语音假肢”可以将一个人的大脑信号翻译成他们想说的话。
这项新技术发表在11月6日的《自然通讯》杂志上,有一天可能会帮助那些因神经系统疾病而无法说话的人重新获得通过脑机接口进行交流的能力。
杜克大学医学院神经学教授格雷戈里·科根( Gregory Cogan)博士是该项目的主要研究人员之一,他说:“有许多患者患有使人衰弱的运动障碍,比如肌萎缩性侧索硬化症(ALS)或闭锁综合征,这些疾病会损害他们的说话能力。”“但目前可供他们交流的工具通常非常缓慢和繁琐。”
想象一下,用半速听有声书。这是目前可用的最佳语音解码速率,每分钟可解码约78个单词。然而,人每分钟大约说150个单词。
解码速率跟不上说话速率的原因,是由于相对较少的大脑活动传感器。这些传感器可以融合到大脑表面上薄薄的一块材料上。较少的传感器提供较少的可解码信息。
为了改进过去的局限性,科根与杜克大学脑科学研究所的教授乔纳森·维文蒂(Jonathan Viventi)博士合作,他的生物医学工程实验室专门制造高密度、超薄和柔性的大脑传感器。
在这个项目中,维文蒂和他的团队将256个令人印象深刻的微型大脑传感器装在一张邮票大小的柔性医用级塑料上。只有一粒沙子大小的神经元在协调语言时可能有截然不同的活动模式,因此有必要区分来自邻近脑细胞的信号,以帮助准确预测预期的语言。
在制造出新的植入物后,科根和维文蒂与杜克大学医院的几位神经外科医生合作,招募了4名患者来测试植入物。该实验要求研究人员将该装置暂时放置在因其他疾病(如治疗帕金森病或切除肿瘤)而接受脑部手术的患者身上。
在实验室中,博士候选人库马尔·杜赖维尔( Kumar Duraivel)分析了一组丰富多彩的脑电波数据。每种独特的色调和线条代表来自256个传感器之一的活动,这些传感器在手术室中实时记录了患者大脑的活动(照片由杜克大学的丹·瓦哈巴摄)。
在只占用15分钟的测试中,他们获取的90秒口语数据,解码器的准确率为40%。考虑到类似的从人脑解码成语音的技术通常需要数小时或数天的时间处理数据,这一成就已经相当令人印象深刻。
博士候选人库马尔·杜赖维尔( Kumar Duraivel)和他的导师们对该设备的无线版本感到兴奋,他们最近获得了国家卫生研究院提供的240万美元的拨款。
“我们现在正在开发相同类型的记录设备,但没有任何电线。”科根说,“使用者可以四处移动,而不必受束缚于电源插座,这真的很令人兴奋。”
尽管他们的工作令人鼓舞,但要让维文蒂和科根的“语音假肢”上市还有很长的路要走。
小贴士
什么是语音假肢技术?
语音假肢是一种技术,旨在帮助那些失去了语音能力的人通过脑机接口还原语音。虽然不同的语音假肢系统可能有不同的工作原理,但通常它们包括以下关键组件和步骤:
- 脑电图(EEG)或脑电图仪器:这些设备用于监测患者的大脑活动。通常,患者需要佩戴一种与他们的头皮相连的脑电图设备,以记录脑电信号。
- 脑机接口(BMI):这是一个连接脑电图仪器和计算机的界面,用于捕捉和处理来自大脑的电信号。BMI将脑电信号转化为计算机可以理解的数据。
- 语音解码算法:这是计算机程序,用于分析脑电信号并尝试还原患者的语音。这些算法基于大脑活动的模式,试图将这些模式与特定的语音单元(音节、词汇等)相关联。
- 文字合成或音频生成:一旦语音解码算法识别出语音单元,计算机将生成相应的文本或音频输出。这可以是合成的文字,也可以是通过音频合成技术生成的模拟语音。
- 用户反馈:一些系统允许用户通过脑机接口提供反馈信号,以控制生成的语音或修改其语言输出。
总的来说,语音假肢的工作原理是监测患者的大脑活动,使用脑机接口将脑电信号传输到计算机,通过语音解码算法将这些信号翻译成可理解的语音或文本输出。这有望帮助那些由于疾病、伤害或其他原因失去语音能力的人重新获得沟通的能力。然而,目前这项技术仍在研究和发展阶段,需要更多的工作来提高准确性和实用性。