據外媒報導,近日谷歌的人工智慧部門DeepMind工作室正式對外宣布,他們正在與牛津大學的研究人員進行合作,開發出一款先進的能讀懂唇語的軟體。他們預計這種唇語軟體能夠比專業的唇語翻譯人員準確率還要高,這也是讓人非常興奮的。
谷歌人工智慧讀懂唇語:準確率比人都高(圖片來自於TheNext Web)
為了訓練AI,研究人員選取了大量的BBC電視短片。運用谷歌的神經網絡,人工智慧可以根據主播嘴部運動來識別其播報內容。目前的研發成功來看,這款軟體的唇讀準確率高達46.8%。相比之下,同樣的測試內容人類唇讀的準確率只有12.4%。
谷歌的DeepMind工作室負責人認為,這款軟體能夠幫助聽力受損害的人,其他的一些應用也會和這個軟體進行聯動。不過這款軟體的局限性在於,他對於唇語的解讀僅限於單字,而無法將這些詞彙組成一個整體的句子,所以還需要進行一步的研發。