紐約哥倫比亞大學的神經工程師說:他們已經創建了一個系統,可以將人類的思想轉化為可識別的語音,這不僅會改變醫學,而且還將徹底改變交流。該成果已經發表在《Scientific Reports》上。
大腦思維行為研究所的研究人員通過監視受試者的大腦活動,能夠訓練人工智慧,將思維模式轉化為可理解的句子。研究員將患有疾病或外傷的言語患者視為最早採用這項技術的使用者。
將思想轉換為可理解的,可識別的語音。通過監視某人的大腦活動,該技術可以以前所未有的清晰度重建一個人聽到的單詞。利用語音合成器和人工智慧的力量的這一突破,可能會導致計算機與大腦直接通信的新方式。它還為幫助無法說話的人(例如患有肌萎縮性側索硬化症(ALS)或中風後康復的人)恢復與外界交流的能力奠定了基礎。
「與Mehta博士合作,我們要求已經接受腦部手術的癲癇患者聽不同人所說的句子,同時我們測量大腦活動的方式,」 Mesgarani博士說。「這些神經模式訓練了聲碼器。」接下來,研究人員要求這些患者聆聽說話者背誦0到9之間的數字,同時記錄可通過聲碼器運行的大腦信號。由聲碼器響應這些信號而產生的聲音,通過神經網絡進行了分析和清理,神經網絡是一種模擬生物大腦中神經元結構的人工智慧。
最終的結果是朗讀一系列數字的機器人聲音。為了測試錄音的準確性,Mesgarani博士及其團隊要求聆聽錄音並報告所聽到的內容。
Mesgarani博士說:「我們發現人們可以在大約75%的時間內理解並重複聲音,這遠遠超出了以往的任何嘗試。」 將新錄音與基於頻譜圖的較早嘗試進行比較時,清晰度的提高尤其明顯。「靈敏的解碼器和強大的神經網絡以驚人的準確度代表患者最初聽的聲音。」
Mesgarani博士和他的團隊計劃接下來測試更複雜的單詞和句子,他們希望對當一個人講話或想像中講話時發出的腦信號進行相同的測試。最終,他們希望他們的系統可以成為植入物的一部分,類似於某些癲癇患者所佩戴的植入物,從而將佩戴者的思想直接轉化為文字。
Mesgarani博士說:「在這種情況下,如果佩戴者認為&39;,我們的系統可以吸收由該想法產生的大腦信號,並將其轉變為合成的口頭言語。」 「這將改變遊戲規則。這將給任何因說話或受傷而失去發言能力的人提供重新與周圍世界聯繫的機會。」
期待這項研究的步伐加快,迅速進入臨床階段,未來造福更多人群,消滅交流障礙!
(一起了解科技前沿,關注:南湖動力)