谷歌DeepMind「唇語識別」能力已經超越人類

2021-01-07 網易科技

2016-11-25 08:37:37 來源: 網易科技報導

舉報

網易科技訊11月25日消息 據外媒(Gadgets)報導,人工智慧技術近年來突飛猛進,微軟等矽谷巨頭甚至宣稱其語音識別系統已經能媲美人類。現在谷歌的AI在語言理解能力上更上一層樓,不僅可以通過更好的唇語識別來幫助聽力障礙人士,多語言神經機器翻譯(Multilingual Neural Machine Translation)也將顯著提高翻譯質量。

谷歌母公司Alphabet下屬的DeepMind部門和牛津大學的研究者使用新聞視頻對其AI系統進行訓練。用於訓練的視頻總長超過5000小時,語句超過118,000句。視頻取材自BBC電視臺自2010年至2015年間播出的節目。訓練完畢後,研究人員使用該系統對今年3月~9月間播出的口語節目進行測試。測試結果發現,系統通過「觀看」說話者嘴部動作便可以準確識別出整個句子。比如「我們知道這裡也會有數百位記者」。(We know there will be hundreds of journalists here as well)

給予相同的視頻素材,專業的唇語識別專家能夠達到12.4%的正確率。而AI系統識別正確率是46.8%。

前不久谷歌開始在「谷歌翻譯」中運用神經機器翻譯技術,能夠識別準確地識別句子而不再僅僅是單詞翻譯。現在谷歌宣稱使用多語言神經機器翻譯技術後,谷歌翻譯的翻譯效果將再上一層樓。

谷歌在博客中稱:「我們提出的結構無需改變基本的GNMT系統,而是在開頭使用一個額外的『token』來指定所需的目標語言翻譯。」除了能夠提高翻譯質量,新的方法還支持「Zero-Shot Translation」,即在沒有已知數據的情況下,能夠對沒有見過的語言進行翻譯。

雖然這些研究成果產生實際影響還有待時日,但不得不說這些技術創舉讓人十分印象深刻。

AI新時代-產業新動能,【點擊報名】參加2016中國人工智慧產業大會,搶佔通往未來的年票!(如無法點擊請打開網址 dwz.cn/4BYwdQ)

本文來源:網易科技報導 責任編輯: 張彬彬_NT5025

相關焦點

  • 人類一敗塗地?DeepMind推出Agent57,在所有雅達利遊戲上超越人類
    去年,DeepMind 推出的 MuZero 在 51 款雅達利遊戲中實現了超越人類的表現。時隔數月,DeepMind 在這一方向上更進一步,在 57 款雅達利遊戲中全面超越人類,在這一領域尚屬首次。DeepMind 在最新發布的預印本論文和博客中介紹了這一進展。
  • 唇語識別《隱秘的角落》被改臺詞,比想像中更黑暗
    日前神秘網友利用唇語識別,解讀《隱秘的角落》中被改掉的臺詞,原始內容比想像中更加黑暗。其實讓計算機讀唇並不是什麼新鮮事,早在 2003 年,Intel 就推出過能讀唇的語音識別軟體。目前的唇語識別大體分為四步:通過圖像識別找到視頻中的說話人,提取連續的口型變化特徵。
  • 谷歌人工智慧讀懂唇語:準確率比人都高
    據外媒報導,近日谷歌的人工智慧部門DeepMind工作室正式對外宣布,他們正在與牛津大學的研究人員進行合作,開發出一款先進的能讀懂唇語的軟體。他們預計這種唇語軟體能夠比專業的唇語翻譯人員準確率還要高,這也是讓人非常興奮的。
  • 深度揭秘 AI 巨頭之谷歌 DeepMind
    ,並完成了只有人類才能完成的各種任務。其中一位創始人提到,他們相信,當一個程序可以玩各種不同的遊戲時,就可以達到人類水平的人工智慧。 他們的策略得到科學研究的支持,這些科學研究證明,像象棋這樣的遊戲可以提高戰略思維能力。通過學習如何玩這些複雜的遊戲,機器將獲得思考和採取戰略行動的能力。DeepMind的通用學習算法讓機器可以通過遊戲化學習,嘗試獲得類人的智力和行為。
  • DeepMind AI 關係推理超越人類:深度神經網絡模塊即插即用
    新智元編譯來源:deepmind.com;arXiv.org譯者:文強   【新智元導讀】DeepMind 今天發表官博介紹了他們的兩篇最新論文,稱其都在理解「關係推理」這一挑戰方面展示出了令人可喜的結果。
  • 搜狗發布唇語識別技術,「讀唇」這事的商業價值是什麼?
    12月初的世界網際網路大會上,搜狗發布了一項「唇語識別」技術。唇語識別,簡單說就是通過圖像識別你的口型,轉寫出你說的內容。在國外的技術界,2016年穀歌和牛津大學的深度學習項目組曾經共同研發唇語識別技術,在那一年的視頻節目測試中,機器唇語識別的準確率達到46.8%,高於人類唇語專家12.4%的識別率。
  • 哈佛X DeepMind最新成果:用AI破譯古希臘文字,超越人類水平
    大數據文摘出品來源:newscientist編譯:趙吉克、武帥、錢天培AI又學會了一項新技能——破譯殘缺的古希臘金石文字,在這項任務上,AI甚至超越了人類水準。該研究的代碼也已經被公開。Github連結如下:https://github.com/sommerschield/ancient-text-restoration金石,也就是雕刻在耐用器具,如石器、陶瓷或金屬的表面上的文字,是古代歷史的主要來源之一。
  • 微軟和谷歌的人工智慧,在SuperGLUE基準測試中超越了人類
    當SuperGLUE剛被推出時,排行榜上表現最佳的模式和人類表現之間有近20個百分點的差距。但截至1月初,有兩個模型:微軟的DeBERTa和谷歌的T5 + Meena——已經成為第一個超越人類基線的模型。
  • 再創新高:DeepMind一年燒掉6.5億美元,谷歌卻揮手免除15億債務
    DeepMind 以在圍棋領域戰勝最強人類的 AlphaGo 開始廣為人們所知,2017 年 5 月,當時的世界第一選手柯潔在人機大戰中 0 比 3 落敗。然而,DeepMind 同樣被人記住的還有「燒錢」。
  • DeepMind 第四代:不學規則就能下棋玩遊戲
    近日,谷歌 DeepMind 人工智慧已進化到第四代,名為 MuZero,最突出的能力是無需提前學習規則就可以下棋玩遊戲。
  • 谷歌發布萬億參數語言模型,語言模型何時超越人類語言能力?
    在短短幾年時間裡,深度學習算法經過了飛速的進化,已經具有了可以打敗世界最頂尖棋手的水平,並能以不低於人類識別的準確度來精確地識別人臉。 但事實證明,掌握獨特而複雜的人類語言,是人工智慧面臨的最艱巨挑戰之一。 這種現狀會被改變嗎?
  • 百度、微軟的漢語英語識別準確率已分別超越人類
    近日, 微軟宣布英語的語音識別轉錄詞錯率僅 5.9%,達到了專業速錄員水平超越了人類。百度首席科學家吳恩達(Andrew Ng)發推特對此表示恭賀:「在 2015 年我們就超越了人類水平的漢語識別;很高興看到微軟在不到一年之後讓英語也達到了這一步。」
  • DeepMind如何助谷歌成為最強AI公司?
    文| 五矩 近幾年來Google DeepMind的AlphaGo可謂是AI界的一枝獨秀,曾在2006年以4:1擊敗韓國圍棋九段的李世石,接著次年打敗了中國排名第一的職業棋手柯潔,重要的是在此次比賽中,不僅贏得了掌聲,而且對手竟也親切的讚譽它是「已經接近於圍棋上帝的AlphaGo」。
  • 海雲數據唇語識別技術:看嘴型識發音
    馮一村介紹,自2016年12月以來,海雲研究院經過多項技術攻關,結合海雲數據業務形態、唇語識別的核心技術及應用進行了深度探索,打破了原先只能識別英文的技術局限,開創了中文唇語識別模型的研究先河,並取得了一定的成果。經過實踐評估,中文識別模型準確率已達到70%。
  • 谷歌DeepMind 的可微分神經計算機 DNC 怎麼樣?看 Facebook AI...
    田淵棟,卡耐基梅隆大學機器人系博士學位、上海交通大學碩士學位和學士學位,前谷歌無人車項目組成員,現任 Facebook 人工智慧組研究員,主要負責 Facebook 的智能圍棋項目 Dark Forest。
  • 在語音識別這件事上,漢語比英語早一年超越人類水平
    語音識別一直是國內外許多科技公司發展的重要技術之一,微軟的此次突破是識別能力在英語水平上第一次超越人類。在消息公開之後,百度首席科學家吳恩達就發推恭賀微軟在英語語音識別上的突破,同時也讓我們回憶起一年前百度在漢語語音識別上的突破。
  • 【DeepMind重大突破】DNN具有人類行為,認知心理學破解黑箱
  • 谷歌推出開源工具DeepVariant,用深度學習識別基因變異
    Root 李林 編譯整理量子位 出品 | 公眾號 QbitAIGoogle今天推出了一個名叫DeepVariant的開源工具,用深度神經網絡來從DNA測序數據中快速精確識別鹼基變異位點。學科研究的革命性進展,特別是基因學上,需要依賴於新技術的出現。比如桑格發明了測序法之後,才實現了人類基因組的測序。
  • 【智博會】馬上金融推出「唇語識別」技術 「打啞謎」也能辦理金融...
    華龍網8月21日16時40分訊(記者 周曉雪 實習生 邱小雅)如今,人臉識別在金融上已經有了廣泛應用,比如銀行的遠程開戶、遠程身份認證、遠程支付等。但若遇到光線差、戶主面部發生變化時,存在「失靈」風險。不過,這樣的擔憂或將迎刃而解。
  • 人工智慧解讀唇語 不止能解碼語音和語言翻譯
    【科技訊】11月30日消息,使用人工智慧來解碼語音和語言已有先例,而現在人們又能夠根據人工智慧來解讀唇語。  此處使用的人工智慧算法是基於人類大腦建模的深層神經網絡(DNN)。算法設計針對偏複雜的模式識別。