谷歌DeepMind「唇語識別」能力已經超越人類

2021-01-07 網易科技

2016-11-25 08:37:37　來源: 網易科技報導

舉報

網易科技訊11月25日消息據外媒（Gadgets）報導，人工智慧技術近年來突飛猛進，微軟等矽谷巨頭甚至宣稱其語音識別系統已經能媲美人類。現在谷歌的AI在語言理解能力上更上一層樓，不僅可以通過更好的唇語識別來幫助聽力障礙人士，多語言神經機器翻譯（Multilingual Neural Machine Translation）也將顯著提高翻譯質量。

谷歌母公司Alphabet下屬的DeepMind部門和牛津大學的研究者使用新聞視頻對其AI系統進行訓練。用於訓練的視頻總長超過5000小時，語句超過118,000句。視頻取材自BBC電視臺自2010年至2015年間播出的節目。訓練完畢後，研究人員使用該系統對今年3月～9月間播出的口語節目進行測試。測試結果發現，系統通過「觀看」說話者嘴部動作便可以準確識別出整個句子。比如「我們知道這裡也會有數百位記者」。（We know there will be hundreds of journalists here as well）

給予相同的視頻素材，專業的唇語識別專家能夠達到12.4%的正確率。而AI系統識別正確率是46.8%。

前不久谷歌開始在「谷歌翻譯」中運用神經機器翻譯技術，能夠識別準確地識別句子而不再僅僅是單詞翻譯。現在谷歌宣稱使用多語言神經機器翻譯技術後，谷歌翻譯的翻譯效果將再上一層樓。

谷歌在博客中稱：「我們提出的結構無需改變基本的GNMT系統，而是在開頭使用一個額外的『token』來指定所需的目標語言翻譯。」除了能夠提高翻譯質量，新的方法還支持「Zero-Shot Translation」，即在沒有已知數據的情況下，能夠對沒有見過的語言進行翻譯。

雖然這些研究成果產生實際影響還有待時日，但不得不說這些技術創舉讓人十分印象深刻。

AI新時代-產業新動能，【點擊報名】參加2016中國人工智慧產業大會，搶佔通往未來的年票！（如無法點擊請打開網址 dwz.cn/4BYwdQ）

本文來源：網易科技報導責任編輯：張彬彬_NT5025

相關焦點

人類一敗塗地?DeepMind推出Agent57,在所有雅達利遊戲上超越人類

去年，DeepMind 推出的 MuZero 在 51 款雅達利遊戲中實現了超越人類的表現。時隔數月，DeepMind 在這一方向上更進一步，在 57 款雅達利遊戲中全面超越人類，在這一領域尚屬首次。DeepMind 在最新發布的預印本論文和博客中介紹了這一進展。
唇語識別《隱秘的角落》被改臺詞,比想像中更黑暗

日前神秘網友利用唇語識別，解讀《隱秘的角落》中被改掉的臺詞，原始內容比想像中更加黑暗。其實讓計算機讀唇並不是什麼新鮮事，早在 2003 年，Intel 就推出過能讀唇的語音識別軟體。目前的唇語識別大體分為四步：通過圖像識別找到視頻中的說話人，提取連續的口型變化特徵。
谷歌人工智慧讀懂唇語:準確率比人都高

據外媒報導，近日谷歌的人工智慧部門DeepMind工作室正式對外宣布，他們正在與牛津大學的研究人員進行合作，開發出一款先進的能讀懂唇語的軟體。他們預計這種唇語軟體能夠比專業的唇語翻譯人員準確率還要高，這也是讓人非常興奮的。
深度揭秘 AI 巨頭之谷歌 DeepMind

，並完成了只有人類才能完成的各種任務。其中一位創始人提到，他們相信，當一個程序可以玩各種不同的遊戲時，就可以達到人類水平的人工智慧。他們的策略得到科學研究的支持，這些科學研究證明，像象棋這樣的遊戲可以提高戰略思維能力。通過學習如何玩這些複雜的遊戲，機器將獲得思考和採取戰略行動的能力。DeepMind的通用學習算法讓機器可以通過遊戲化學習，嘗試獲得類人的智力和行為。
DeepMind AI 關係推理超越人類:深度神經網絡模塊即插即用

新智元編譯來源：deepmind.com；arXiv.org譯者：文強　　【新智元導讀】DeepMind 今天發表官博介紹了他們的兩篇最新論文，稱其都在理解「關係推理」這一挑戰方面展示出了令人可喜的結果。
搜狗發布唇語識別技術,「讀唇」這事的商業價值是什麼?

12月初的世界網際網路大會上，搜狗發布了一項「唇語識別」技術。唇語識別，簡單說就是通過圖像識別你的口型，轉寫出你說的內容。在國外的技術界，2016年穀歌和牛津大學的深度學習項目組曾經共同研發唇語識別技術，在那一年的視頻節目測試中，機器唇語識別的準確率達到46.8%，高於人類唇語專家12.4%的識別率。
哈佛X DeepMind最新成果:用AI破譯古希臘文字,超越人類水平

大數據文摘出品來源：newscientist編譯：趙吉克、武帥、錢天培AI又學會了一項新技能——破譯殘缺的古希臘金石文字，在這項任務上，AI甚至超越了人類水準。該研究的代碼也已經被公開。Github連結如下：https://github.com/sommerschield/ancient-text-restoration金石，也就是雕刻在耐用器具，如石器、陶瓷或金屬的表面上的文字，是古代歷史的主要來源之一。
微軟和谷歌的人工智慧,在SuperGLUE基準測試中超越了人類

當SuperGLUE剛被推出時，排行榜上表現最佳的模式和人類表現之間有近20個百分點的差距。但截至1月初，有兩個模型：微軟的DeBERTa和谷歌的T5 + Meena——已經成為第一個超越人類基線的模型。
再創新高:DeepMind一年燒掉6.5億美元,谷歌卻揮手免除15億債務

DeepMind 以在圍棋領域戰勝最強人類的 AlphaGo 開始廣為人們所知，2017 年 5 月，當時的世界第一選手柯潔在人機大戰中 0 比 3 落敗。然而，DeepMind 同樣被人記住的還有「燒錢」。
DeepMind 第四代:不學規則就能下棋玩遊戲

近日，谷歌 DeepMind 人工智慧已進化到第四代，名為 MuZero，最突出的能力是無需提前學習規則就可以下棋玩遊戲。
谷歌發布萬億參數語言模型,語言模型何時超越人類語言能力?

在短短幾年時間裡，深度學習算法經過了飛速的進化，已經具有了可以打敗世界最頂尖棋手的水平，並能以不低於人類識別的準確度來精確地識別人臉。但事實證明，掌握獨特而複雜的人類語言，是人工智慧面臨的最艱巨挑戰之一。這種現狀會被改變嗎?
百度、微軟的漢語英語識別準確率已分別超越人類

近日，微軟宣布英語的語音識別轉錄詞錯率僅 5.9%，達到了專業速錄員水平超越了人類。百度首席科學家吳恩達（Andrew Ng）發推特對此表示恭賀：「在 2015 年我們就超越了人類水平的漢語識別；很高興看到微軟在不到一年之後讓英語也達到了這一步。」
DeepMind如何助谷歌成為最強AI公司?

文| 五矩近幾年來Google DeepMind的AlphaGo可謂是AI界的一枝獨秀，曾在2006年以4:1擊敗韓國圍棋九段的李世石，接著次年打敗了中國排名第一的職業棋手柯潔，重要的是在此次比賽中，不僅贏得了掌聲，而且對手竟也親切的讚譽它是「已經接近於圍棋上帝的AlphaGo」。
海雲數據唇語識別技術:看嘴型識發音

馮一村介紹，自2016年12月以來，海雲研究院經過多項技術攻關，結合海雲數據業務形態、唇語識別的核心技術及應用進行了深度探索，打破了原先只能識別英文的技術局限，開創了中文唇語識別模型的研究先河，並取得了一定的成果。經過實踐評估，中文識別模型準確率已達到70%。
谷歌DeepMind 的可微分神經計算機 DNC 怎麼樣?看 Facebook AI...

田淵棟，卡耐基梅隆大學機器人系博士學位、上海交通大學碩士學位和學士學位，前谷歌無人車項目組成員，現任 Facebook 人工智慧組研究員，主要負責 Facebook 的智能圍棋項目 Dark Forest。
在語音識別這件事上,漢語比英語早一年超越人類水平

語音識別一直是國內外許多科技公司發展的重要技術之一，微軟的此次突破是識別能力在英語水平上第一次超越人類。在消息公開之後，百度首席科學家吳恩達就發推恭賀微軟在英語語音識別上的突破，同時也讓我們回憶起一年前百度在漢語語音識別上的突破。
【DeepMind重大突破】DNN具有人類行為,認知心理學破解黑箱
谷歌推出開源工具DeepVariant,用深度學習識別基因變異

Root 李林編譯整理量子位出品 | 公眾號 QbitAIGoogle今天推出了一個名叫DeepVariant的開源工具，用深度神經網絡來從DNA測序數據中快速精確識別鹼基變異位點。學科研究的革命性進展，特別是基因學上，需要依賴於新技術的出現。比如桑格發明了測序法之後，才實現了人類基因組的測序。
【智博會】馬上金融推出「唇語識別」技術「打啞謎」也能辦理金融...

華龍網8月21日16時40分訊（記者周曉雪實習生邱小雅）如今，人臉識別在金融上已經有了廣泛應用，比如銀行的遠程開戶、遠程身份認證、遠程支付等。但若遇到光線差、戶主面部發生變化時，存在「失靈」風險。不過，這樣的擔憂或將迎刃而解。
人工智慧解讀唇語不止能解碼語音和語言翻譯

【科技訊】11月30日消息，使用人工智慧來解碼語音和語言已有先例，而現在人們又能夠根據人工智慧來解讀唇語。　　此處使用的人工智慧算法是基於人類大腦建模的深層神經網絡(DNN)。算法設計針對偏複雜的模式識別。

谷歌DeepMind「唇語識別」能力已經超越人類

相關焦點

人類一敗塗地?DeepMind推出Agent57,在所有雅達利遊戲上超越人類

唇語識別《隱秘的角落》被改臺詞,比想像中更黑暗

谷歌人工智慧讀懂唇語:準確率比人都高

深度揭秘 AI 巨頭之谷歌 DeepMind

DeepMind AI 關係推理超越人類:深度神經網絡模塊即插即用

搜狗發布唇語識別技術,「讀唇」這事的商業價值是什麼?

哈佛X DeepMind最新成果:用AI破譯古希臘文字,超越人類水平

微軟和谷歌的人工智慧,在SuperGLUE基準測試中超越了人類

再創新高:DeepMind一年燒掉6.5億美元,谷歌卻揮手免除15億債務

DeepMind 第四代:不學規則就能下棋玩遊戲

谷歌發布萬億參數語言模型,語言模型何時超越人類語言能力?

百度、微軟的漢語英語識別準確率已分別超越人類

DeepMind如何助谷歌成為最強AI公司?

海雲數據唇語識別技術:看嘴型識發音

谷歌DeepMind 的可微分神經計算機 DNC 怎麼樣?看 Facebook AI...

在語音識別這件事上,漢語比英語早一年超越人類水平

【DeepMind重大突破】DNN具有人類行為,認知心理學破解黑箱

谷歌推出開源工具DeepVariant,用深度學習識別基因變異

【智博會】馬上金融推出「唇語識別」技術 「打啞謎」也能辦理金融...

人工智慧解讀唇語 不止能解碼語音和語言翻譯

【智博會】馬上金融推出「唇語識別」技術「打啞謎」也能辦理金融...

人工智慧解讀唇語不止能解碼語音和語言翻譯