谷歌推出了基於注意機制的全新翻譯框架!

2020-12-14 太平洋電腦網資訊中心

谷歌最近與多倫多大學等高校合作發表論文,提出了一種新的網絡框架——Transformer。Transformer是完全基於注意力機制(attention  mechanism )的網絡框架,放棄了RNN和CNN模型。

眾所周知,在編碼-解碼框架中,主流的序列傳導模型都是基於RNN或者CNN的,其中能完美連接編碼器和解碼器的是注意力機制。而谷歌提出的這一新框架Transformer,則是完全基於注意力機制的。

Transformer用於執行翻譯任務,實驗表明,這一模型表現極好,可並行化,並且大大減少訓練時間。Transformer在WMT 2014英德翻譯任務上實現了28.4 BLEU,改善了現有的最佳成績(包括超過2個BLEU的集合模型),在WMT 2014英法翻譯任務中,建立了一個新的單一模式,在八個GPU上訓練了3.5天後,最好的BLEU得分為41.0,這在訓練成本最小的情況下達到了最佳性能。由Transformer泛化的模型成功應用於其他任務,例如在大量數據集和有限數據集中訓練英語成分句法解析的任務。

注意力機制是序列模型和傳導模型的結合,在不考慮輸入輸出序列距離的前提下允許模型相互依賴,有時(但是很少的情況),注意力機制會和RNN結合。

模型結構如下:

編碼器:編碼器有6個完全的層堆棧而成,每一層都有兩個子層。第一個子層是多頭的self-attention機制,第二層是一層簡單的前饋網絡全連接層。在每一層子層都有residual和歸一化。

解碼器:解碼器也是有6個完全相同的層堆棧而成,每一層有三個子層,在編碼棧的輸出處作為多頭的attention機制。

注意(attention):功能是將Query和一組鍵-值對映射到輸出,那麼包括query、鍵、值及輸出就都成為了向量。輸出是值的權重加和,而權重則是由值對應的query和鍵計算而得。

source:arxiv

雷鋒網了解到,谷歌這一模型在眾多翻譯任務中都取得了最佳成績,其泛化模型也在其他識別任務中表現優異。谷歌對這一基於注意力機制的Transformer表示樂觀,研究人員很高興看到模型在其他任務中表現良好,谷歌計劃研究Transformer的更廣泛應用——其他形式的輸入輸出,包括圖像、音頻及視頻等。

相關焦點

  • 谷歌推出基於注意機制的全新翻譯框架,Attention is All You Need!
    Transformer是完全基於注意力機制(attention mechanism)的網絡框架,放棄了RNN和CNN模型。眾所周知,在編碼-解碼框架中,主流的序列傳導模型都是基於RNN或者CNN的,其中能完美連接編碼器和解碼器的是注意力機制。而谷歌提出的這一新框架Transformer,則是完全基於注意力機制的。
  • 學界| 機器翻譯新突破:谷歌實現完全基於attention的翻譯架構
    機器之心編譯參與:吳攀、黃小天、李亞洲近兩年來,機器翻譯的突破讓人目不暇接,從去年穀歌的顛覆性突破開始到一個月前 Facebook 的全新 CNN 翻譯技術,人工智慧的巴別塔正越建越高。近日,谷歌再次宣布又在機器翻譯上更進了一步,實現了完全基於 attention 的 Transformer 機器翻譯網絡架構,並且還在 WMT 2014 的多種語言對的翻譯任務上超越了之前 Facebook 的成績,實現了新的最佳水平。機器之心對這篇研究論文進行了摘要介紹。
  • 谷歌開源神經機器翻譯技術,推出tf-seq2seq框架
    陳樺 編譯自 Google官方博客量子位 報導 | 公眾號 QbitAI谷歌研究軟體工程師、谷歌大腦團隊成員Anna Goldie和Denny Britz今天撰文,宣布在「谷歌神經機器翻譯」的基礎上推出開源框架tf-seq2seq,給外部研究人員提供幫助。
  • 谷歌推出首款基於機器學習的古埃及象形文字翻譯工具 Fabricius
    首頁 > 快訊 > 關鍵詞 > 谷歌最新資訊 > 正文 谷歌推出首款基於機器學習的古埃及象形文字翻譯工具 Fabricius
  • 谷歌服務框架是什麼 谷歌服務框架有什麼用
    本文小編為您帶來谷歌服務框架是什麼 谷歌服務框架有什麼用。而大部分的Google推出的Apps在設備上的運行都會檢測是否存在GMS,如果設備不存在這項服務,那麼就會發生要麼無法安裝要麼則會閃退的情況。 谷歌服務框架有什麼用?
  • 谷歌推出首款基於機器學習的古埃及象形文字翻譯工具Fabricius
    【TechWeb】7月15日消息,今天,谷歌藝術與文化今天推出了全球首個基於機器學習的埃及象形文字的數字翻譯工具Fabricius。不管是普通人還是學者都能利用這個工具體驗象形文字,或者助力學術 研究。
  • 谷歌推出一款全新UWP Flutter應用程式 通過Unsplash API帶來全新...
    和微軟一樣,谷歌也在積極地開發跨平臺 UI 解決方案--Flutter。它是適用於桌面端、移動端和網頁端的開源 UI 框架。基於 Flutter 打造的應用程式目前已實現在網頁端和移動端是運行,而谷歌正積極添加對 Windows 10 平臺的支持。
  • 谷歌金山詞霸1.8正式推出 整合谷歌翻譯引擎
    摘要:       9月28日消息,金山今日發布了全新的谷歌金山詞霸1.8版本,其中整合進谷歌翻譯引擎實現劃詞翻譯,但在盈利模式上並未進行明顯的探索。
  • 谷歌推出首款基於機器學習的埃及象形文字的數字翻譯工具Fabricius
    谷歌推出首款基於機器學習的埃及象形文字的數字翻譯工具Fabricius 來源:TechWeb • 2020-07-16 09:07:54
  • 加州大學聖地牙哥分校將推出基於蘋果-谷歌框架的COVID-19應用
    據外媒AppleInsider報導,加州大學聖地牙哥分校將推出一款使用蘋果-谷歌框架設計的新冠病毒暴露通知應用程式,在9月底前廣泛提供。這項自願性計劃將提供給學生、教職員工,其工作原理與今年開發的許多其他追蹤應用程式相同。
  • 谷歌語義理解框架SyntaxNet升級 開啟無數可能性
    在 AI 語義理解領域,谷歌一直不遺餘力地進行研發投入。對於普通用戶而言,2015 年發布的基於深度神經網絡的谷歌智能郵件回復,2016 年上線的神經機器翻譯系統(GNMT),便源自於谷歌在該領域的研究成果。
  • 谷歌推出神經網絡翻譯 中譯英水平匹敵真人?
    據澎湃新聞9月29日報導,27日,谷歌推出了新的翻譯系統,聲稱該套翻譯系統基於對人類神經思考的模仿,能夠與真人翻譯競相匹敵。  據悉,谷歌神經翻譯克服了之前神經機器翻譯在準確性和速度上的缺陷,帶有8個編碼層和8個解碼層的長短時記憶(LSTM)網絡用來增強注意以及記錄瞬間感覺殘留。注意力機制則連接下層解碼層和上層編碼層,以此來提高並行度從而降低耗時,推理計算中的低精度的算法則提升了最終的翻譯速度。  第一步,網絡將中文單詞編碼為一系列向量,每個向量代表整句話所有單詞的含義。
  • 圖解谷歌神經機器翻譯核心部分:注意力機制
    最近,有一篇文章用圖解的方式,完整地介紹了「注意力機制」的原理邏輯,並以谷歌神經翻譯為例,解釋了它的運作機制。作者說,寫這篇文章的目的,是為了讓大家在不去看數學公式的情況下,掌握注意力的概念。他也會以人類譯者為例,將相關的概念形象化。神經機器翻譯為何需要注意力機制?
  • 亞馬遜將為開發者推出翻譯服務 挑戰谷歌
    據一位知情人士透露,如今亞馬遜正準備通過自己的AWS來進一步推廣機器翻譯服務,以便更多的第三方開發者也能使用這一服務。據稱,亞馬遜可能會在今年11月於拉斯維加斯召開的年度「re:Invent(再發明)」大會上宣布這一服務。Safaba的聯合創始人阿儂-拉維亞馬遜此番即將為開發者推出機器翻譯服務,正值該公司收購翻譯初創企業Safaba的兩年之後。
  • 谷歌翻譯網頁版更新:全新材料設計界面
    谷歌翻譯網頁版更新:全新材料設計界面 在近幾個月的時間裡,谷歌全新的材料設計(Material Design)語言已經面向全線產品推出,覆蓋網頁端和安卓應用端。今日,這一更新又來到了谷歌翻譯的網頁版上。
  • ...谷歌推出首款基於機器學習的古埃及象形文字翻譯工具
    但是今天,藉助谷歌藝術與文化推出的新工具Fabricius,任何人都能以三種不同的方式體驗這門迷人的語言。首先,你可以通過六個簡單步驟來「學習」古埃及語言;其次,Fabricius將邀你「趣玩」文字,將你自己的語言和信息翻譯成象形文字,還可以分享給你的朋友和家人。
  • Facebook提出全新CNN機器翻譯:準確度超越谷歌而且還快九倍(已開源)
    去年穀歌在機器翻譯上取得了連續不斷的突破,參閱《重磅 | 谷歌翻譯整合神經網絡:機器翻譯實現顛覆性突破》和《重磅 | 谷歌神經機器翻譯再突破:實現高質量多語言翻譯和 zero-shot 翻譯》。谷歌的方法用到了文本處理慣用的循環神經網絡。近日,Facebook 也宣布在神經機器翻譯上取得了重大進展,在超過了去年穀歌研究的水平的同時還實現了顯著的速度提升。
  • 谷歌再次放出大招!想要截胡華為鴻蒙系統:發布全新系統替換安卓
    推出了獨具特色的UI系統,在很多功能、界面UI設計、底層代碼上都極具特色; 月16日正式發布,對此很多媒體以及機構都一致認為,在首個華為鴻蒙OS系統Bate版本發布前夕,谷歌肯定會有很大的反應,畢竟華為HMS服務已經在全球範圍內擁有超過5億用戶,所以在近日,谷歌正式公布了自研的全新作業系統Fuchsia OS新動態,意味著谷歌也將會放棄Android系統,通過推出全新作業系統來截胡華為,其實在華為鴻蒙OS系統、HMS生態服務正式發布以來,谷歌就曾多次想方設法的狙擊華為鴻蒙OS
  • 重磅| Facebook提出全新CNN機器翻譯:準確度超越谷歌而且還快九倍...
    Dauphin機器之心編譯參與:吳攀、微胖、蔣思源去年穀歌在機器翻譯上取得了連續不斷的突破,谷歌的方法用到了文本處理慣用的循環神經網絡。近日,Facebook 也宣布在神經機器翻譯上取得了重大進展,在超過了去年穀歌研究的水平的同時還實現了顯著的速度提升。而和谷歌的方法不一樣,Facebook 的方法採用了一種完全基於卷積神經網絡的架構。
  • 谷歌翻譯是如何藉助多項新興AI技術提高翻譯質量的
    在一篇即將正式發表的博客文章中,該公司詳細介紹了助力提升谷歌翻譯(Google Translate)所支持的108種語言翻譯質量的新創新技術(特別是缺乏語料數據的約魯巴語和馬拉雅拉姆語)。谷歌翻譯服務平均每天翻譯1500億個單詞。自谷歌翻譯首次亮相以來的13年裡,神經機器翻譯、基於重寫的範式和設備端處理等技術的出現和改進,助力該平臺的翻譯準確性取得不小的飛躍。