意念實時轉語音!Facebook的非植入式腦機接口,解碼準確率達76%

2020-12-17 量子位

銅靈 發自 凹非寺量子位 出品 | 公眾號 QbitAI

今天,加州大學舊金山分校(UCSF)和Facebook在Nature Commuications上發表的一項研究顯示:

他們在「非植入式」的穿戴設備上取得了最新進展,構建出了一個大腦-計算機系統,能準確解碼佩戴設備的人聽到和說出詞語和對話,實時從大腦信號中解碼。

也就是說,在這種腦機接口面前,你的所思所想已無處遁形,Facebook已經讓意念打字成為了現實。

此前,馬斯克的腦機接口公司Neuralink也發布過腦機接口系統,但這種植入式的設備需要向大腦中植入3000多個電極,以此來檢測神經元的活動,但非植入式的設備就免去了複雜的植入步驟。

研究人員表示,目前對生成和感知的兩部分語言進行解碼,準確率超出了他們的想像,分別能達到61%和76%的準確率。

這項項目對於正常人和殘疾人來說,都具有實用意義。

比如,你可以將思維直連到語音助手siri,查詢天氣、搜索信息不用直接喊出來了。

研究人員之一、加州大學舊金山分校神經外科醫生Edward Chang表示,這是向神經植入物邁出的重要一步,因為中風,脊髓損傷或其他疾病而失去說話能力的患者,有望因此獲得自然交流的能力 。

如何意念轉語音

這項成果來自Facebook Reality Labs,一直與加州大學舊金山分校合作開展這項腦機接口的研究。

Facebook的設想是,設計一種可以將大腦信號轉換成語言的裝置,不需要勞動任何一塊肌肉,深度學習就能直接讀懂大腦,解碼腦中所想,實現流暢交流。

為了進行試驗,研究人員此前還招募了五名在醫院接受癲癇治療的志願者。

他們先是從高密度皮層活動中提取相關信號特徵。志願者們說了上百句話,而通過植入性大腦皮層電圖(ECoG),研究人員可以跟蹤控制語言和發音的大腦區域的活動,並將這些活動與志願者說話時嘴唇、舌頭、喉部和下顎的微妙運動聯繫起來,然後將這些運動學特徵翻譯成口語句子。

研究人員採用bLSTM(bidi-rectional long short-term memory)循環神經網絡來破譯ECoG信號表達的運動學表徵。

接著用另外一個bLSTM解碼先前破譯的運動學特徵中的聲學特徵。

在這個過程中,兩個神經網絡都會被投餵訓練數據,以提高它們的解碼性能。

在今年的四月份,利用這樣的方法,Facebook已經實現了以每分鐘150詞的速度幫你說出所思所想。

而在這篇最新的論文Real-time decoding of question-and-answer speech dialogue using human cortical activity中,他們在此前研究基礎上,研究人員想進一步提高精度。

大多數語音解碼的工作原理是對一個人在想什麼聲音做出最佳猜測,在解碼過程中可能會被「synthesizer」和「fertilizer」這類發音相似的單詞混淆。

但Facebook的新系統增加了上下文信息來幫助區分這些單詞。

首先,這個算法預測從一組已知問題中聽到的問題,比如「你在一塊土地上撒了什麼?」然後,這些信息作為上下文來幫助預測答案:「肥料」(fertilizer)。

Edward Chang表示,通過添加上下文,這個系統能夠用的指定問題和答案解碼感知(聽到)的語音準確率達到76%,解碼產生(口頭)的語音準確率達到了61%。

Facebook表示,未來將擴大系統的詞彙量,讓其能適用在更廣泛的領域。

緣起兩年前

Facebook早在兩年前,就開始著手這個項目了。

2017年4月,Facebook旗下的前沿產品研發團隊Building 8負責人Regina Dugan宣布,這家社交網絡公司將在未來兩年內,開發出一個能以每分鐘100字的速度從人腦向外傳輸語句的「帽子」。

Facebook設想中的「帽子」,是用來分享你的思維的。此前清華大學也做過類似概念的研究,頭戴一個小巧的電極帽,控制屏幕軟鍵盤上的26個字母就能打出任何語句。

Facebook最終計劃,是想打造一款AR眼鏡。

Facebook AR/VR業務副總裁Andrew 「Boz」 Bosworth表示,這個項目的初衷,是想構建一個非侵入式可穿戴設備,讓人們只想通過想像他們想說什麼來打字,展示未來對AR眼鏡的投入和互動成為現實的潛力。

傳送門

Facebook官方博客:

https://tech.fb.com/imagining-a-new-interface-hands-free-communication-without-saying-a-word/

論文Real-time decoding of question-and-answer speech dialogue using human cortical activity

地址:

https://www.nature.com/articles/s41467-019-10994-4

論文Speech synthesis from neural decoding of spoken sentences:

https://www.gwern.net/docs/ai/2019-anumanchipalli.pdf

相關焦點

  • 卡耐基梅隆大學教授談馬斯克腦機接口:沒體現神經解碼進展
    「從記錄和信號傳輸的角度看,縮小植入式腦機接口設備是重要的,但是最終人們需要證明這套系統能做什麼來解碼大腦信號並正確解釋大腦的狀態和意圖。」基於此,不少專家認為馬斯克展示的腦機接口系統是「腦外科手術的突破但沒有對大腦信號進行解釋」。對此,賀斌表示認同。
  • 卡耐基梅隆大學教授談馬斯克腦機接口:沒有體現神經解碼進展
    它在兩個月前被植入腦機接口設備,目前狀態良好。新一代Neuralink機器人直播中,當小豬的口鼻碰觸到物體時,腦機接口設備會獲取神經元發射的信號,在顯示屏上呈現點狀圖像並發出聲音,這顯示它的大腦信號可實時被採集。
  • CTRL-labs非侵入式腦機接口揭秘:用意念就能玩遊戲?
    在今年OC 6前夕時,Facebook曾正式宣布在收購EMG手勢識別和神經接口公司CTRL-labs,傳收購規模在5億到10億美元之間。後來,還有消息稱Facebook在7月時就曾透露在探索非侵入式腦機接口方案,該方案將與手勢操作、語言操控等技術集成,作為AR/VR交互的一部分。
  • 腦機接口+全息AR,Facebook/微美全息/特斯拉等迎來新的成長機會
    在今年CES上,穿戴式腦機接口廠商NextMind展示了其最新的開發者套件,據悉這款產品可用於控制電腦、行動裝置還有VR/AR頭顯等。NextMind稱這款產品能夠實時讀取視覺皮層信號,你只需要將它佩戴在後腦勺就可以直接控制電子設備。
  • 專訪清華鄧志東:Neuralink「腦機接口」背後,我們離科幻場景還有...
    在鄧志東看來,目前「腦機接口」技術依然面臨著一些關鍵節點的突破,特別是生物神經信息的解碼方面,還有很遠的路要走。「這次還不是最重要的,關鍵要看明年針對人腦的實驗進展」,鄧志東對經濟觀察網表示。A:1)技術路徑的演進:腦機接口(BCI)包括植入式與非植入式兩種。最初的概念早在上個世紀70年代就已提出。
  • 除了不用開顱,Facebook 的腦機接口和馬斯克有什麼不同?
    埃隆·馬斯克的Neuralink 公布「腦後插管」技術還不到半個月,Facebook 也迅速透露了他們在腦機接口(BCI)項目上的新進展。不同的是,Facebook 最終想實現的是一種無需在人腦中植入電極的非侵入式BCI 解決方案。
  • 科學家開發「腦機語音文本界面」:大腦寫皮膚聽
    原標題:科學家開發「腦機語音文本界面」:大腦寫皮膚聽   近期,臉書(Facebook)在F8全球開發者大會上透露,該公司一個60人的工程師團隊,正在開發一個名為「腦機語音文本界面」,即用戶無需說話,也無需手動輸入,就能把用戶大腦中的想法,直接展示在計算機屏幕中。
  • 他用意念喝可樂!
    1月16日,浙江大學對外宣布「雙腦計劃」重要科研成果,求是高等研究院「腦機接口」團隊與浙江大學醫學院附屬第二醫院神經外科合作完成國內第一例植入式腦機接口臨床研究,患者可以完全利用大腦運動皮層信號精準控制外部機械臂與機械手實現三維空間的運動,同時首次證明高齡患者利用植入式腦機接口進行複雜而有效的運動控制是可行的
  • 浙大發布國內首例「雙腦計劃」成果:高位截癱可用意念打麻將
    1月16日,浙江大學對外宣布「雙腦計劃」重要科研成果,求是高等研究院「腦機接口」團隊與浙江大學醫學院附屬第二醫院神經外科合作完成國內第一例植入式腦機接口臨床研究,患者可以完全利用大腦運動皮層信號精準控制外部機械臂與機械手實現三維空間的運動,同時首次證明高齡患者利用植入式腦機接口進行複雜而有效的運動控制是可行的。
  • 機器學習實現了腦機語言翻譯,那距離「意念交流」還有多遠?
    一方面目前這種程度的「腦機接口」技術的實現還遙遙無期;另一方面,一旦人類動了「意念交流」的念頭,只要技術有任何可能的突破,好奇心都會驅使那些最聰明的人去實現它。至於技術出來是否「洪水滔天」,那就事後再說了。當前來看,腦機接口技術正在取得一些顯著的進展。最近一項可以稱之為腦機語言翻譯的技術,又實現了新的突破。
  • 不用「意念」移動,直接手拿咖啡杯,全球首個通過腦機接口恢復觸覺...
    本論文第一作者,Battelle首席科學家派屈克·甘澤(Patrick Ganzer)通過郵件方式對鈦媒體表示,這是全球首個利用腦機接口直接恢復觸覺的人體實驗研究。新的研究成果表明,腦機接口技術可以幫助患有嚴重脊髓損傷的人(參與者)恢復運動和觸覺功能。
  • 靠「意念」就能行動,腦機接口是怎麼做到的?
    美國《細胞》雜誌近日也刊登了重磅論文,宣告腦機接口領域的重大突破——使癱瘓者成功恢復運動能力,觸覺準確率高達90%。腦機接口正在成為全世界腦科學的熱點,國際科學界和產業界近年來都對這一領域加大了投入。未來,它有望帶給人們越來越多的驚喜。本文,我們將為你呈現人類在腦機接口領域的不懈探索,以及其未來的發展方向。
  • Facebook腦機新成果:迅速讀取大腦構思單詞,進一步解碼AR/VR全新交互
    來源:映維網 作者 廣州客在一群由Facebook Reality Labs提供支持的科學家的幫助下,Facebook更新了他們的未來派腦機項目。加利福尼亞大學舊金山分校的研究人員剛剛公布利用植入性電極解碼人類思維的實驗的結果。
  • Facebook Ctrl-labs分享腦機技術:五年實現意念控制商用
    然而,他渴望向大家進一步介紹神經接口技術,而我們可以從中理解為何Facebook(及整個科技行業)會對這個領域感興趣。簡而言之,Ctrl-labs希望我們不再是通過滑鼠,鍵盤,觸控屏,語音或當前的任何其他輸入來與技術交互。雷爾登及團隊期望在未來數年內允許我們通過大腦意念直接控制技術。1.
  • 腦機接口技術誕生「腦活動翻譯機」
    【來源:科技日報】據英國《自然·神經科學》雜誌30日發表的一項腦機接口最新研究,美國科學家報告了一種能夠以較高準確率解碼神經活動,並將其翻譯為句子的機器翻譯算法。通過該算法,可。當人類思考時,大腦皮層中的神經元會產生微小的電流,不同的思考活動,激活的神經元也不同——這就是腦機接口技術所依靠的原理。但一直以來,腦機接口在解碼神經活動方面只取得了有限的成功,其準確率依然遠遠低於解碼自然言語——過去的腦機接口只能解碼口頭詞語的片段或口頭詞組中不到40%的詞語。
  • 葫蘆謅報51【腦機接口】
    緊箍咒:非侵入式腦機4. 葫謅:當血肉之軀變成數字大家是不是都有這種感受:明明心裡有很多想表達的內容,卻難以名狀。如今的腦機仍停留在試圖獲取人類的運動意圖上,比如拿杯飲料等簡單動作。我們所說的腦機其實是腦機接口(BCI, Brain Computer Interface),實現腦神經信號的提取、解析。侵入式,需要開個腦洞,將電極、晶片等放入腦中,採集神經元的衝動,再將這些信息利用有線或者無線(如藍牙)的方式傳遞給電腦。
  • 中美首份8000字長文解析:可實現意識打字、心靈控制的腦機接口到底...
    腦機接口技術知識:實現步驟與其分析   腦機接口基本的實現步驟可以分為四步:採集信號>>信息解碼處理>>再編碼>>反饋。 VR方向:  現階段VR/AR的交互體驗還有待提高,目前的解決方案是通過語音識別和手勢識別,但如果使用腦機接口,就可以用意念來控制vr界面的菜單導航和選項控制,極大的提升使用體驗。目前,在這塊做得比較超前的公司是MindMaze,其融資總額已超1億美元。 教育科技:  這個方向其實和醫療方向中的「恢復」方向會有些接近。
  • 【經濟學人】腦機接口,用意念完成人類躍遷
    ——Sir Arthur Charles Clarke亞瑟·查理斯·克拉克爵士腦機接口,用意念完成人類躍遷譯者:武守晗校對:倪凌暉策劃:劉 璠Using thought to control machines用意念控制機器Brain-computer interfaces
  • 人工智慧解讀唇語 不止能解碼語音和語言翻譯
    據外媒報導,一種新型的語音合成器可以跳過語音記錄,而直接將說話者嘴部動作轉換為語句。研究人員表示,該設備將能幫助聲帶麻痺患者發聲,向腦機接口又邁進一步。描述該裝置的研究發表在《PLOS計算生物學》期刊上。
  • 意念控制成真?特斯拉創始人馬克斯發明「腦機接口」引爭議
    說到意念控制,喜歡看科幻電影的朋友應該不會陌生,也就是利用人的意念來操控各種設備。其實科幻電影大多是科學家們對未來事物的一種設想,是有一定科學依據的,就像以前誰能想到汽車無人駕駛能實現呢!而如今意念控制也將成真。