打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
脑机接口让失语者“开口说话”
userphoto

2023.08.29 上海

关注

编译 | 徐锐


脑机接口将大脑信号转换为语音和面部动作,并在动画人物身上表现出来。图片来源:Noah Berger

在实验室里,67岁的Pat Bennett正在尝试用包含12.5万个单词的词汇表和包含50个单词的词汇表说出各种短语;与此同时,深度学习算法则会识别大脑中的独特信号以解码单词。对Bennett来说,这带来了希望,因为她患有肌萎缩侧索硬化症,也叫运动神经元病,这种疾病会使肌肉逐渐失去控制,从而导致行动和说话困难。

在8月23日发表于《自然》的一项研究中,美国斯坦福大学神经科学家Francis Willett及其同事开发了一种脑机接口,可以在细胞水平解析神经活动并将其翻译成文本。

该脑机接口能够将神经信号转换为合成语音说出的文本或单词。脑机接口可以分别以每分钟62个单词和每分钟78个单词的速度解码语音。尽管自然对话的速度约为每分钟160个单词,但新技术的速度已比之前的任何尝试都要快。

研究人员与Bennett合作,通过手术,将小型硅基电极阵列植入其大脑皮层下几毫米处与语言能力有关的区域,然后Bennett试着说出各种短语,并训练深度学习算法识别大脑中的独特信号。人工智能则通过最小的语音单位——音素解码单词。

对于包含50个单词的词汇表的解析,新的脑机接口的工作速度是该团队早期开发的脑机接口的3.4倍,单词错误率为9.1%,而对于包含12.5个单词的大词汇集的解析,错误率则上升到23.8%。

“这相当于每4个单词中有3个被正确破译。”Willett说,“我们可以想象在未来同中风患者进行流畅对话的场景。”

在同期发表于《自然》的另一项研究中,美国加利福尼亚大学旧金山分校神经外科医生Edward Chang团队则采用与Willett团队不同的方法,帮助失去语言能力的患者。

47岁的Ann在18年前因脑卒中失去了说话能力。Chang团队在Ann的大脑皮层表面放置了一个包含253个电极的薄如纸张的矩形植入物。这种被称为脑皮层电图(ECoG)的技术侵入性较小,可以同时记录数千个神经元的联合活动。

团队让Ann尝试使用包含1024个单词的词汇集说出249个句子,以训练人工智能算法识别大脑活动模式,从而破译单词。该设备每分钟可破译78个单词,平均错误率为25.5%。

法国格勒诺布尔神经科学研究所研究员Blaise Yvert说,尽管Willett团队使用的植入物能更准确捕捉神经活动,在更多的词汇集破译中表现更优,但“我很高兴看到ECoG能够实现较低的单词识别错误率”。

此外,Chang团队还创建了自定义算法,将Ann的大脑信号转换为合成语音和模仿其面部表情的动画。他们利用Ann的婚礼视频对人工智能算法进行训练,将合成语音个性化,使其听起来更像Ann生病前的声音。

在研究结束后的一次反馈会议上,Ann向研究人员表示,听到与自己相似的声音十分激动。

“声音是我们身份的一个非常重要的组成部分。它不仅关乎交流,还关乎我们是谁。”Chang说。

尽管上述两项研究利用人工智能增强的大脑阅读植入物使两名瘫痪患者能够以前所未有的准确性和速度进行交流,但在脑机接口应用于临床前,还有许多地方需要改进。比如,适合日常使用的脑机接口必须采用完全植入式的系统,不能有可见的连接器或电缆。此外,两个团队都希望通过更强大的解码算法继续提高设备的速度和准确性。


《中国科学报》 (2023-08-29 第2版 国际)

编辑 | 赵路
排版 | 志海
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
脑机接口里程碑!一天2篇Nature!
每分钟62个词,这个脑机接口成功帮助中风、渐冻症患者「开口说话」
脑机接口新研究:超准“脑活动翻译器”,错误率不到3%
NEJM:全球首例,AI+脑机接口技术让“失语”瘫痪患者实现沟通自由
陈根:丧失语言能力的人,如何用意念沟通?
最强读心术?将脑活动实时转换成文字的脑机接口
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服