谷歌語義理解框架SyntaxNet升級開啟無數可能性

2020-12-06 雷鋒網

在 AI 語義理解領域,谷歌一直不遺餘力地進行研發投入。

對於普通用戶而言,2015 年發布的基於深度神經網絡的谷歌智能郵件回復,2016 年上線的神經機器翻譯系統(GNMT),便源自於谷歌在該領域的研究成果。在消費級產品之外,谷歌還持續為 AI 開發者提供技術支持,不斷推出新的開源工具。

去年夏天,針對語句的語法結構分析,谷歌開源了 SyntaxNet 神經網絡框架,以及與之搭配英語分析預訓練模型 Parsey McParseface。緊隨其後,谷歌發布了針對其他 40 門語言的語法分析模型。並將它們命名為 Parsey's Cousins(即 「Parsey 的表兄妹們」)。對英語國家開發者而言,為英語之外的語言開發機器學習系統是一件相當不容易的事。現在,經過將近一年的努力,谷歌推出了 SyntaxNet 框架以及 Parsey 相關模型的升級版。

SyntaxNet 升級

就雷鋒網所知,這是 SyntaxNet 自誕生以來的最重大升級。這建立在谷歌對各語言的語義理解研究基礎之上。此次升級的核心是一項新技術:能對輸入語句的多層表示進行很好的學習。具體來講,它延伸了 TensorFlow,能對多層語言結構進行合成建模,還能夠在語句或文件處理過程中,動態地生成神經網絡架構。

舉個例子,該升級使創建基於字母的模型(能學習把單獨字母組合成詞語),變得更加簡單。該模型還能夠學習到,不同詞語在共同組成部分(共享的字母)方面存在聯繫。在另一方面,Parsey 和 Parsey’s Cousins 通過詞語排序而運行。因此它們必須要對訓練中的詞語進行記憶,並依賴語境來決定「生詞」(此前未記憶過的詞語)的語法函數。

ParseySaurus

為了展示新版本 SyntaxNet 的強大之處,谷歌同時發布了新的預訓練過的模型 ParseySaurus。ParseySaurus 模型,使用了上文提到的基於字母的輸入表示。因此,它極大提升了預測新詞語含義的能力。這是基於兩個方面來實現:詞彙的拼寫和在語境中的使用方式。雷鋒網了解到,ParseySaurus 的準確率遠遠超出 Parsey’s Cousins,錯誤率降低了 25%。由於語言的形態特性和其他屬性,新模型在俄語、土耳其語、匈牙利語上的效果尤其好——這些語言中,同一個詞彙有多種不同形態,其中許多形態從未在訓練階段出現過(即便是大型語料庫)。

競賽

你或許會對「基於字母的模型是不是語義識別的最佳選擇」感到好奇。或者,是否有其他更好的技術。谷歌表示,新版本的谷歌 SyntaxNet 提供了許多全新可能性,比如 beam search 和不同的訓練目標;但新 SyntaxNet 的能力不止於此。雷鋒網消息,谷歌與布拉格大學(Charles University)合作,將在今年的 CoNLL 大會上舉辦多語言分解競賽(multilingual parsing competition)。競賽目標是為 45 種語言,開發出在現實環境下有良好表現的語義分解系統。

via google

相關焦點

  • 深度解讀谷歌SyntaxNet:全新TensorFlow自然語言處理模型
    本文中,Hobbibal深度解讀了谷歌的自然語言處理模型。上周,谷歌開源了其基於人工智慧系統Tensorflow的自然語言解析模型分析庫SyntaxNet。在過去的兩年時間裡,谷歌研究人員利用這個分析庫發布了一系列神經網絡分析模型。自從SyntaxNet發布以來,筆者就一直關注它,當然也一直也期待這個軟體能夠開源。
  • 看一遍人類動作就能模仿,能理解語義的谷歌機器人登上無監督學習的...
    相比之下,人類可以通過觀察別人的做法來理解任務的目標,或者只是被告知目標是什麼,就可以完成任務。目前,谷歌期望通過教會機器人理解語義概念,以使得機器人能夠從人類的示範中學習動作,以及理解物體的語義概念,完成抓取動作。以下為雷鋒網 AI 科技評論編譯的這篇谷歌博客的部分內容。
  • 百度ERNIE語義理解開源套件重磅升級 零基礎也能秒變NLP達人
    話不多說直接上才藝:如此簡潔易用,得益於本次ERNIE語義理解開源開發套件的全新升級。藉助國產深度學習框架飛槳動態圖優勢,本次升級實現了「動態圖」與「靜態圖」的完美結合,即「一套代碼,兩種運行方式」,使得開發者更加高效、方便的使用ERNIE解決工業生產中的各類NLP問題,達到簡單幾行代碼即可實現基於ERNIE的文本分類、情感分析等經典NLP任務。
  • 谷歌服務框架是什麼 谷歌服務框架有什麼用
    本文小編為您帶來谷歌服務框架是什麼 谷歌服務框架有什麼用。 谷歌服務框架有什麼用? 谷歌服務框架 (GMS)顯性程序如GMAIL、谷歌地圖等同一般的程序性質一樣,如果你覺得不適合你的話完全可以用另外的軟體替代,但是底層的谷歌服務框架才是最關鍵的東西,它能夠讓你同步首發郵件、備份聯繫人、下載自己的日程安排等,另外如果要在谷歌電子市場GOOGLE PLAY中購買APP或者雜誌音樂等那麼也必須要安裝谷歌服務框架,因為其中不僅涉及到付款還有驗證機制,這也是為什麼許多遊戲在缺少谷歌服務框架的情況下出現閃退黑屏等狀況的原因之一
  • 王海峰出席CCHI2018 深度解析「多模態深度語義理解」
    百度大腦是百度AI技術多年積累和業務實踐的集大成,包括視覺、語音、自然語言處理、知識圖譜、深度學習等AI核心技術和AI開放平臺,對內支持百度所有業務,對外全方位開放,助力合作夥伴和開發者,加速AI技術落地應用,賦能各行各業轉型升級。
  • 谷歌開源語義圖像分割模型:該領域當前最優模型
    剛剛,谷歌開源了語義圖像分割模型 DeepLab-v3+,DeepLab-v3+結合了空間金字塔池化模塊和編碼器-解碼器結構的優勢,是自三年前的 DeepLab 以來的最新、性能最優的版本。分配這些語義標籤的時候需要精準定位目標的輪廓,因此相比其他的視覺實體識別任務(如圖像級分類或邊界框級檢測等),該任務需要更高的定位準確率。今天,谷歌開源了其最新、性能最優的語義圖像分割模型 DeepLab-v3+ [1],該模型使用 TensorFlow 實現。
  • 谷歌剛發布的深度學習動態計算圖工具TensorFlow Fold是什麼?
    7 日,谷歌通過博客正式發布了 TensorFlow Fold,該庫針對 TensorFlow 1.0 框架量身打造,可以幫助深度學習開發者根據不同結構的輸入數據建立動態的計算圖(Dynamic Computation Graphs),簡化了模型訓練階段對輸入數據的預處理過程,提升了系統的運行效率。
  • 前沿|通用句子語義編碼器,谷歌在語義文本相似性上的探索
    近年來,基於神經網絡的自然語言理解研究取得了快速發展(尤其是學習語義文本表示),這些深度方法給人們帶來了全新的應用,且還可以幫助提高各種小數據集自然語言任務的性能。本文討論了兩篇關於谷歌語義表示最新進展的論文,以及兩種可在 TensorFlow Hub 上下載的新模型。
  • 谷歌通過深度度量學習,提出新的語義實例分割方法
    雷鋒網了解到,谷歌研究院近日與UCLA合作,提出了一種新的語義實例分割方法:首先計算兩個像素屬於同一對象的可能性,然後將相似的像素分組在一起。其中,相似性度量是基於深度,完全卷積的嵌入模型,而分組方法是基於選擇所有與一組「種籽點」足夠相似的點,這個選擇模型是一個深度的、完全卷積的評分模型。
  • MMSegmentation:標準統一的語義分割框架
    語義分割作為計算機視覺中一項基礎任務,同時在自動駕駛/視頻編輯等領域中有重要的應用,因此一直受到學術界和工業界的廣泛關注。在近幾年的會議中,語義分割的論文層出不窮,但是市面上一直缺乏一款能夠相對公平比較各種方法的框架。為了方便研究員和工程師們,OpenMMLab開源了一套基於 PyTorch 實現的標準統一的語義分割框架:MMSegmentation。
  • 標準統一的語義分割框架
    在近幾年的會議中,語義分割的論文層出不窮,但是市面上一直缺乏一款能夠相對公平比較各種方法的框架。為了方便研究員和工程師們,我們開源了一套基於 PyTorch 實現的標準統一的語義分割框架:MMSegmentation。
  • 從語音、視覺、語義到算法,百度大腦 5.0 全方位升級
    百度大腦 5.0 在算法突破、計算架構升級的基礎上,實現AI算法、計算架構和應用場景的融合創新,成為軟硬一體AI大生產平臺。下午百度大腦分論壇上,相關業務負責人分別詳細介紹百度大腦各能力具體的進展。視覺語義化平臺升級 2.0,機器人應用成新亮點百度視覺技術部、增強現實技術部總監吳中勤介紹,5G時代,越來越多物理設備將連接到高可靠、低延時的網絡空間,這將徹底改變人們與環境及設備的交互方式。本次全新發布視覺語義化平臺2.0,正在推進視覺技術由「看清看懂」向「交互」進行升級。視覺語義化平臺2.0在交互升級和軟硬體結合兩大方面實現突破。
  • 隱喻研究:從語義走向認知
    關鍵詞:哲學;語義;認知;語言;語法隱喻;詞彙;句子;隱喻研究;視域;人類認識 作者簡介:   傳統修辭學開啟了對於隱喻的研究。他對語義學問題的研究堅持語義與話語是互相聯繫的原則,注重研究實際應用中的語言,認為隱喻是在特定的語境中生成的,因此,隱喻的理解必須在話語的層面上才能得到正確的解釋。理查茲對隱喻的定位已經超出了修辭學的範圍,認為隱喻是語言發揮作用的途徑,而不能看作是對語言既有規則的一種違背,「隱喻的唯一判別標準是一個詞同時代表兩種思想」。
  • 谷歌地圖再次迎來升級
    北京時間9月29日消息,在蘋果CEO Tim Cook就糟糕的地圖表現向客戶致歉的時候,谷歌再次悄然對谷歌地圖進行升級,它在其地圖官方博客上宣布穀歌地圖將加入更多的高清晰圖像和45°的3D視圖。現在用戶可以在谷歌地圖上看到地球上17個城市、112個國家和地區的高解析度航空和衛星圖像。
  • Web經典B/S快速開發框架,強大後臺+簡潔UI一體化開發工具
    本框架旨在為.NET開發人員提供一個Web後臺快速開發框架,採用本框架,能夠極大的提高項目開發效率。整個框架包括三個版本:.net,.net core,java(開發中)以上三個版本中,.NET為初始版本,開發時間最長,是目前老客戶使用的主要產品;.net core為.net的升級版本,為新客戶使用及老客戶升級的主要產品;.net core能夠跨平臺,並且涉及Linux、Docker、Nginx、微服務等概念,將是未來的主流。
  • 搜狗網頁評級功能升級有似谷歌PR
    在各大搜尋引擎中,每家搜尋引擎都有自己專門的網頁評級標準,評級比較直接的要數谷歌的PR值和搜狗的rank值,細心的站長可能這兩天可能會發現搜狗的搜索網頁評級(sogou rank)功能升級了,它由原來100分制變成10分制
  • 「金猿技術展」文心ERNIE——基於知識增強的語義理解技術
    文心(ERNIE)是一個取得世界級突破的語義理解技術與平臺,依託百度的深度學習平臺飛槳打造,將機器理解語言的水平提升到新的高度,全面刷新了各項NLP任務的世界最好效果,取得了諸多權威語義評測比賽的世界冠軍。除語言理解外,提出的基於多流機制生成完整語義片段語言生成技術ERNIE-GEN、知識增強跨模態語義理解技術ERNIE-ViL等,均達到世界領先水平。
  • 地圖中的語義理解 | 雷鋒網公開課
    同時負責搜狗智能語音交互技術,帶領語音和語義技術團隊實現了業內頂尖的語音交互能力,並致力於智能語音技術的產品化創新。個人主要研究領域為:自然語言處理、機器學習、推薦系統、語義理解、機器智能等。語義理解簡述所謂語義理解簡而言之就是讓機器懂得人的話語,理解人的意圖,並且返回給用戶相應的答案或者內容,來解決用戶需求。如果我們把語音識別作為機器的耳朵,那麼語義理解就是機器的大腦。
  • AI晶片、框架、語言與知識、量子計算……百度大腦6.0發布
    百度大腦分論壇帶來這些「黑科技」的全面揭秘,展示了百度大腦的技術升級與演進。百度CTO王海峰發布了百度大腦6.0,升級為「AI新型基礎設施」。「知識增強的跨模態深度語義理解」讓百度大腦的理解能力更加強大,飛槳深度學習平臺與百度崑崙晶片的升級則為開發者提供了更優的算法開發平臺和更強大的算力。
  • 谷歌地圖重大升級 街景居然能實時更新
    因此,谷歌地面實況團隊(Ground Truth team)的目標之一,就是從地理位置圖像自動提取信息來升級谷歌地圖。重要的是,谷歌的系統在提取其他類型信息也是很容易擴展的。比如現在幫助谷歌自動提取商店前面的商戶名稱。目前該模型已經開源。