谷歌人工智慧讀懂唇語:準確率比人都高

2021-01-11 中關村在線

   據外媒報導,近日谷歌的人工智慧部門DeepMind工作室正式對外宣布,他們正在與牛津大學的研究人員進行合作,開發出一款先進的能讀懂唇語的軟體。他們預計這種唇語軟體能夠比專業的唇語翻譯人員準確率還要高,這也是讓人非常興奮的。

谷歌人工智慧讀懂唇語:準確率比人都高(圖片來自於TheNext Web)

   為了訓練AI,研究人員選取了大量的BBC電視短片。運用谷歌的神經網絡,人工智慧可以根據主播嘴部運動來識別其播報內容。目前的研發成功來看,這款軟體的唇讀準確率高達46.8%。相比之下,同樣的測試內容人類唇讀的準確率只有12.4%。

   谷歌的DeepMind工作室負責人認為,這款軟體能夠幫助聽力受損害的人,其他的一些應用也會和這個軟體進行聯動。不過這款軟體的局限性在於,他對於唇語的解讀僅限於單字,而無法將這些詞彙組成一個整體的句子,所以還需要進行一步的研發。 

相關焦點

  • 準確率比人都高 谷歌人工智慧讀懂唇語
    據外媒報導,近日谷歌的人工智慧部門DeepMind工作室正式對外宣布,他們正在與牛津大學的研究人員進行合作,開發出一款先進的能讀懂唇語的軟體。
  • 人工智慧軟體唇語解讀對電視嘉賓 準確率約為唇語專家4倍
    在這個情景之內,你或許感覺這是一個遊戲,但「唇讀」已伴隨人工智慧越來越精準。據BBC報導,谷歌最近與英國牛津大學合作開發了一套唇讀軟體,通過收看數千小時BBC的電視節目來開啟唇讀功能。令人震驚的是,該軟體不僅掌握了唇語,還比唇讀專家做得好。
  • AI人工智慧設備向腦機接口又邁進一步 已能讀懂唇語
    AI人工智慧設備向腦機接口又邁進一步 已能讀懂唇語網易科技訊11月29日消息,據外媒報導,一種新型的語音合成器可以跳過語音記錄,而直接將說話者嘴部動作轉換為語句。該設備能「觀看」嘴唇的動作,並利用人工智慧網絡將它們轉換成聲音。
  • DeepMind最近做了個新軟體 它能讀懂唇語
    【AI世代編者按】專業唇語閱讀者識別唇語的準確率只有20%到60%。人類在日常說話過程中嘴唇的微小移動很難被可靠地解讀,尤其是在有一定距離,或畫面不清晰的情況下。不過,唇語並不只是美劇《海軍罪案調查科》中的噱頭,對全球的失聰者來說,這是一項有用的工具。如果能可靠地解讀,那麼將給數百萬人帶來幫助。
  • 牛津大學聯合 DeepMind 發布 LipNet :用深度學習讀懂你的唇語
    新的調查顯示 AI 能夠輕鬆戰勝人類,但還有很多工作要做。如何讀懂唇語對人類來說是一個難題,據數據顯示,大多數人平均只能讀對一句唇語的十分之一。唇讀很困難,不僅是因為你要觀察對方嘴唇、舌頭和牙齒的輕微運動,而且大多數唇語信號十分隱晦,難以在沒有語境的情況下分辨。現在,研究人員表示人工智慧技術,比如深度學習或許能夠解決這個難題。人工智慧側重於大數據運算,已經幫助改善了機器語音識別,甚至能達到人類的水平。那麼機器學習技術是不是也能運用到讀懂人類的唇語上?
  • 唇語識別!AI 領域的下一個萬億市場?
    但隨著科技的發展,人工智慧在各領域漸次開放,在唇語識別上,機器已經做的比人類好了。從技術路徑上,唇語識別是一項集機器視覺與自然語言處理於一體的複合型技術。要理解這個「唇語識別」,需要注意這幾個關鍵詞:運用機器視覺技術從圖像中識別出說話人的人臉,提取此人連續說話時口型變化的特徵。
  • 唇語識別的未來擁有無限可能
    可以想像對於唇語專家C羅應該提不起什麼好感,但令C羅遺憾的是,當人工智慧在各領域漸次開放,在唇語識別上,機器也已經做的比人類好了。人類費盡心力開發AI,當然不是為了滿足自身的窺私慾。事實上,讓機器習得「讀唇術」,在公共安全,軍事情報,身份識別和社會公益等領域,都藏匿著頗為重要的應用場景。而國內一家專注大數據可視分析的公司給我們帶來了驚喜。
  • 人工智慧解讀唇語 不止能解碼語音和語言翻譯
    【科技訊】11月30日消息,使用人工智慧來解碼語音和語言已有先例,而現在人們又能夠根據人工智慧來解讀唇語。說話者的發言,以及嘴部各個部位的位置會被同時記錄,然後通過人工智慧網絡算法進行分析。人工智慧解讀唇語 不止能解碼語音和語言翻譯2[/page]
  • 唇語識別會是AI領域的下一個萬億市場嗎?
    早在2003年,Intel就開發了唇語識別軟體Audio Visual Speech Recognition(AVSR),開發者得以能夠研發可以進行唇語識別的計算機;2016年Google DeepMind的唇語識別技術就已經可以支持17500個詞,新聞測試集識別準確率首次達到了50%以上。
  • 搜狗發布唇語識別技術,「讀唇」這事的商業價值是什麼?
    12月初的世界網際網路大會上,搜狗發布了一項「唇語識別」技術。唇語識別,簡單說就是通過圖像識別你的口型,轉寫出你說的內容。在國外的技術界,2016年穀歌和牛津大學的深度學習項目組曾經共同研發唇語識別技術,在那一年的視頻節目測試中,機器唇語識別的準確率達到46.8%,高於人類唇語專家12.4%的識別率。
  • 人工智慧學會讀唇語,AI深度學習後,越來越像人類一樣思考問題
    深度學習(Deep Learning)是機器學習領域中一個新的研究方向,它被引入機器學習使其更接近於最初的目標——人工智慧(AI)。和人一樣,機器也是需要學習的,雖然機器是執行編寫進去的程序進行工作,但是真正的人工智慧是具有自己的學習能力和依據學到的東西進行服務工作的,今天我們就來看看有哪一些深度學習是機器正在做的。給照片添加顏色從過去到現在,我們給黑白照片添加顏色都是人工來完成的,一方面是人工對於顏色的把控是比較準準確的,知道天是藍的,花是紅的。
  • 人工智慧新應用:「唇語」識別技術揭秘
    據悉,這是唇語識別技術在國內的首次業務場景落地,利用該項技術能夠解決大量無聲視頻資料的偵查信息,或將使公共安全領域的視頻處理業務得到較大提升。   唇語識別,這一被業內評為「十大黑科技之一」的領先技術,已經實現與公共安全業務場景的應用對接。
  • 每周AI應用方案精選:唇語識別技術;阿茨海默症預測技術
    方案1:唇語識別技術解決方案簡介:在非特定人開放口語測試集上,搜狗唇語識別系統已經達到60%以上的準確率,超過Google發布的英文唇語系統50%以上的準確率。在垂直場景如車載、智能家居等場景下,搜狗唇語識別系統甚至已經達到90%的準確率。
  • 科學網—「唇語識別系統」等16項目獲選「人工智慧創新之星」
    「唇語識別系統」等16項目獲選「人工智慧創新之星」   本報訊 8月9日,中國人工智慧峰會暨多媒體信息識別技術競賽成果發布會在廈門國際會議中心召開。
  • 唇語識別《隱秘的角落》被改臺詞,比想像中更黑暗
    目前的唇語識別大體分為四步:通過圖像識別找到視頻中的說話人,提取連續的口型變化特徵。端到端也好,基於單詞也罷,不同語言的唇語識別模型準確率一般在 40% 左右。在圖像識別準確率動輒 90% 以上的今天,唇語識別的準確率為什麼這麼低?
  • 不只有阿爾法狗,谷歌的人工智慧已經非常非常可怕了!
    然而圍棋和讀唇術,僅僅只是谷歌人工智慧的冰山一角,它們現在已經琴棋書畫樣樣精通。據說谷歌人工智慧畫出的這副畫拍出了8000美元。。自主寫詩,同樣也可以完成▼而這些還不是全部!而比上面這些技術更讓創哥震驚的是創造這些技術的人。要知道,近乎涉及我們生活方方面面的谷歌人工智慧僅僅是一家140人的小公司創造的。而這家公司的員工,一個比一個牛逼。
  • 唇語識別、挑戰齊白石畫作、PK資深環衛工……這些人工智慧,有點牛~
    今晚21:20《機智過人》將帶來三位人工智慧機器人下面小編就來一一為大家介紹一下語言是溝通的橋梁,但是,如果有一天,我們處在無聲世界,該如何與外界溝通呢?下面介紹的這項人工智慧就是能在聽不到聲音的情況下,通過視覺觀察說話人的唇形變化,來讀懂每一句話的。為了檢驗這項技術,節目組出了一道難題,邀請到資深唇語教學專家邱新會作為行業檢驗官,親自對陣唇語識別機器人。導演組提前採錄了特殊教育學校聽障兒童的語言,現場視頻播放,雙方通過觀看大屏幕,識別出聽障兒童的說話內容,究竟哪一方能獲勝呢?
  • 指紋識別不稀奇 唇語密碼系統才難「解
    指紋識別不稀奇 唇語密碼系統才難「解」  唇語驗證靠不靠譜?沒有語言限制,講任何語言或方言的人都能使用「唇碼」。所以,綜上所述,唇語密碼用於身份驗證還是很靠譜的。  唇語密碼+安防=?  一項技術的特性在很大程度上決定著其將要面臨的應用途徑與市場領域,優勢決定應用價值和應用市場,短板決定應用市場的範圍大小。
  • 電腦再贏人機大戰 谷歌人工智慧擊敗歐洲圍棋冠軍
    谷歌人工智慧擊敗歐洲圍棋冠軍  昨天谷歌宣布,其人工智慧研究團隊近期取得了一項重要突破:谷歌團隊構建的AlphaGo系統通過計算機學習掌握了圍棋這項古老的技藝,近期AlphaGo挑戰了三度問鼎歐洲圍棋桂冠的職業棋手樊麾二段,成績是5比0。
  • 谷歌的人工智慧越來越可怕了
    谷歌的人工智慧在徵服人類的道路上,遠不是學會走路這麼簡單。谷歌的程式設計師們在下一盤大棋。在過去的幾年時間裡,谷歌一直在嘗試人工智慧在不同領域的應用和創新。最被大家熟知的就是,之前在圍棋大戰中戰勝柯潔的「阿爾法狗」了。在最新的人工智慧實驗中,谷歌的「Deepmind」再次像世人展示它強大的學習能力——它學會了走路,甚至跑酷。