科技日?qǐng)?bào)北京2月10日電 (記者劉霞)據(jù)美國(guó)每日科學(xué)網(wǎng)站近日?qǐng)?bào)道,有史以來(lái)第一次,美國(guó)科學(xué)家研制出的一套新系統(tǒng),借助語(yǔ)音合成器和人工智能,通過(guò)監(jiān)控某人的大腦活動(dòng),將其想法直接轉(zhuǎn)化成了可理解、可識(shí)別的語(yǔ)音。研究人員稱,最新研究為那些言語(yǔ)能力有限或無(wú)法說(shuō)話的人重新獲得與外界溝通的能力奠定了基礎(chǔ),也有望為計(jì)算機(jī)直接與大腦通信開(kāi)辟新途徑。
幾十年的研究表明,當(dāng)人們說(shuō)話(甚至想象說(shuō)話)時(shí),大腦中會(huì)出現(xiàn)明顯的活動(dòng)模式。當(dāng)我們傾聽(tīng)某人說(shuō)話或想象聆聽(tīng)時(shí),大腦也會(huì)出現(xiàn)可識(shí)別的信號(hào)模式。專家們?cè)噲D記錄和解碼這些模式,希望將人們的想法翻譯成口頭語(yǔ)言。
但實(shí)現(xiàn)這一壯舉極具挑戰(zhàn)性。以前科學(xué)家進(jìn)行的腦部信號(hào)解碼工作主要集中于構(gòu)建一些用于分析頻譜圖(聲音頻率的視覺(jué)表示)的簡(jiǎn)單計(jì)算機(jī)模型,但這種方法不能產(chǎn)生任何類似于可理解的語(yǔ)音的東西。哥倫比亞大學(xué)莫蒂默·B.祖克曼心腦行為研究所的莫斯尕拉尼團(tuán)隊(duì)因此求諸聲碼器,這是一種計(jì)算機(jī)算法,可在接受人們說(shuō)話的錄音訓(xùn)練后合成語(yǔ)音。
為了教聲碼器解釋大腦活動(dòng),莫斯尕拉尼與神經(jīng)外科醫(yī)生阿希什·迪勒希-梅塔合作。在研究中,他們要求接受過(guò)腦部手術(shù)的癲癇患者聽(tīng)取不同人說(shuō)的句子,同時(shí)測(cè)量他們大腦的活動(dòng)模式,這也是對(duì)聲碼器進(jìn)行訓(xùn)練。
接下來(lái),他們要求這些患者聽(tīng)說(shuō)話者復(fù)述0到9之間的數(shù)字,同時(shí)記錄可以通過(guò)聲碼器運(yùn)行的大腦信號(hào)。然后,再借助模仿生物大腦中神經(jīng)元結(jié)構(gòu)的人工智能——神經(jīng)網(wǎng)絡(luò),對(duì)聲碼器響應(yīng)這些信號(hào)所產(chǎn)生的聲音進(jìn)行分析。
莫斯尕拉尼說(shuō):“我們發(fā)現(xiàn),這些人可以理解并重復(fù)75%的聲音,遠(yuǎn)超以往任何嘗試。”
研究人員計(jì)劃接下來(lái)測(cè)試更復(fù)雜的單詞和句子。他們希望該系統(tǒng)可以成為植入物的一部分,將穿戴者的思想直接轉(zhuǎn)化為文字。
莫斯尕拉尼說(shuō):“這將改變游戲規(guī)則。它有望讓任何失去講話能力的人,重新?lián)碛信c周圍世界聯(lián)系的機(jī)會(huì)?!?/p>
(責(zé)編:何淼、熊旭)