科学前沿观天下 笃学明理洞寰宇
有没有可能不说话,通过意念就能把自己大脑中的想法与人分享呢?近日,来自美国哥伦比亚大学的科学家取得突破,研发了一套将脑电波转化为语音的装置系统。利用AI解码人类脑电波似乎充满着科幻性,但这真真切切地成为了现实…
已有研究发现,在人类说话时(甚至在想要说话时)我们大脑的神经网络会做出反应,调换出并形成各种表达模式。在此基础上,科学家通过核心AI算法来解码大脑的反应来将其波形转化为语音,能够将脑电波形与人类主体想要表达的思想相关联起来,并将其转化为有直接受众的语音。
研究团队使用的AI算法被称为“语音编码器”(vocoder)。顾名思义,这是一种经过人类语言训练后,能够合成语音的算法。实际上,语音编码器在我们身边无处不在。当你和Siri、小艺或亚马逊的Alexa聊天时,实际上就是语音编码器在发挥作用。换句话说,苹果、华为或亚马逊公司不需要将所有的语音包都加装在Siri、小艺或Alexa中,它们内置的语音编码器会根据文本来创建一个听起来十分真实的声音。
而该研究团队的语音编码器与手机公司的略有不同。这里的语音编码器读取的不是人类的声音,而是我们大脑听觉皮层的神经活动。听觉皮层(auditory cortex)神经活动的数据是通过脑部手术得到的。具体方法是在当病人进行脑部手术时,对他们大声说话,同时记录他们听觉皮层的神经活动。
实验证明,与之前的一项通过计算机模型对声谱图图像(声音频率的视觉表示)进行处理的技术相比,这项研究要高效的多。Mesgarani说:“我们发现在这些由语音编码器解码出的语音中,有75%左右能够被人们能听懂并做出思考,这一比例远远超过以往的任何一项类似技术。”
将智能的的语音编码器与强大的脑神经网络相结合,以惊人的准确度还原了原始的声音。尽管这一技术还远远不到完美的地步,但它展示出的潜力无疑是巨大的。同样需要强调的是,目前这一系统并没有将实际思想转化为口头语言,但科学家已经将其视为下一个挑战目标,最终有可能实现。
不过,后续研究还需要大量的工作。尤其是考虑到我们每个人大脑的运行方式略有不同,这就需要收集大量人的脑数据加以分析。
声音是人类与他人、社会、世界交流的重要桥梁。因此,对于那些因疾病或天生失去说话能力的人而言,这项技术是拯救性的希望。来自哥伦比亚大学的Nima Mesgarani表示,这项研究表明我们有机会去帮助那些失去语言功能的人重获表达自己的能力。只要技术足够成熟,那么那些需要帮助的人就可以同正常人一样自由的表达。
尽管目前还不能大脑思想转化为精确的语言,但其发展前景不容置疑!或许在未来,你可以只用眼睛盯着屏幕就可以写出电子邮件,或用一个脑电波指令来控制家里的智能家电,更可以直接和斯蒂芬.霍金这类伟大物理学家直接“对话”。我们可以从这项技术中一窥“未来电脑”的发展趋势。
作者/朱张航宇
参考文献:Towards reconstructing intelligible speech from the human auditory cortex, Scientific Reports, volume 9, Article number: 874 (2019)
联系客服