翻譯界的重大突破!作為一個翻譯,此刻我理解了18世紀紡織工人看到蒸汽機時的憂慮和恐懼!

2021-01-17 GMAT備考


美國研究生留學(ID:meiguoduyan)

機器之心(ID:almosthuman2014)


谷歌翻譯實現重大突破!


你們來感受下!


上面圖片看不清的請看下面兩張截圖,大家對比一下

對此,網友們都炸了,特別是學翻譯的小夥伴們:




@猞猁與兔猻

作為一個翻譯,看到這個新聞的此時此刻,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼…… 


@李某正在潛逃

換言之···做翻譯的人現在開始要被第三次工業革命淘汰了? 


@咖喱枝葉

外語系大學還沒畢業的開始害怕 


@帥_路

畢業論文英文版有救了! 




谷歌翻譯的重大突破是什麼?這一切是如何發生的?其實昨天谷歌就已經發表了相關論文,介紹了自己最新的神經機器翻譯系統(GNMT),以及新系統的工作原理。


前天(9月27日),谷歌在 ArXiv.org 上發表論文《Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》,介紹谷歌的神經機器翻譯系統(GNMT)。


昨天(9月28日),谷歌 Research Blog 發布文章對該研究進行了介紹,還宣布將 GNMT 投入到了非常困難的漢語-英語語言的翻譯生產中,引起了業內的極大的關注。


以下文章轉載自機器之心微信公眾號(ID:almosthuman2014)

原文作者:Quoc V. Le、Mike Schuster,機器之心編譯,參與:吳攀。


以下為谷歌發出的介紹文章


十年前,我們發布了 Google Translate(谷歌翻譯),這項服務背後的核心算法是基於短語的機器翻譯(PBMT:Phrase-Based Machine Translation)。


自那時起,機器智能的快速發展已經給我們的語音識別和圖像識別能力帶來了巨大的提升,但改進機器翻譯仍然是一個高難度的目標。


今天,我們宣布發布穀歌神經機器翻譯(GNMT:Google Neural Machine Translation)系統,該系統使用了當前最先進的訓練技術,能夠實現到目前為止機器翻譯質量的最大提升。我們的全部研究結果詳情請參閱我們的論文《Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》。


幾年前,我們開始使用循環神經網絡(RNN:Recurrent Neural Networks)來直接學習一個輸入序列(如一種語言的一個句子)到一個輸出序列(另一種語言的同一個句子)的映射。其中基於短語的機器學習(PBMT)將輸入句子分解成詞和短語,然後在很大程度上對它們進行獨立的翻譯,而神經機器翻譯(NMT)則將輸入的整個句子視作翻譯的基本單元。


這種方法的優點是:相比於之前的基於短語的翻譯系統,這種方法所需的工程設計更少。當其首次被提出時,NMT 在中等規模的公共基準數據集上的準確度,就達到了可與基於短語的翻譯系統媲美的程度。


自那以後,研究者已經提出了很多改進 NMT 的技術,其中包括模擬外部對準模型(external alignment model)來處理罕見詞,使用注意(attention)來對準輸入詞和輸出詞 ,以及將詞分解成更小的單元應對罕見詞。儘管有這些進步,但 NMT 的速度和準確度還沒能達到成為 Google Translate 這樣的生產系統的要求。


我們的新論文描述了怎樣克服讓 NMT 在非常大型的數據集上工作的許多挑戰、如何打造一個在速度和準確度上都足夠能為谷歌 用戶和服務帶來更好的翻譯體驗的系統。



來自對比評估的數據,其中人類評估者對給定源句子的翻譯質量進行比較評分。得分範圍是 0 到 6,其中 0 表示「完全沒有意義的翻譯」,6 表示「完美的翻譯」。


下面的可視化圖展示了 GNMT 將一個漢語句子翻譯成英語句子的過程。


該網絡將該漢語句子的詞編碼成一個向量列表,其中每個向量都表徵了到目前為止所有被讀取到的詞的含義(編碼器(Encoder))。一旦讀取完整個句子,解碼器就開始工作——一次生成英語句子的一個詞(解碼器(Decoder))。


為了在每一步都生成翻譯正確的詞,解碼器重點注意了與生成英語詞最相關的編碼的漢語向量的權重分布(「注意(Attention)),藍色連結的透明度表示解碼器對一個被編碼的詞的注意程度)。




使用人類評估的並排比較作為一項標準,GNMT 系統得出的翻譯相比於之前基於短語的生產系統有了極大提升。


在雙語人類評估者的幫助下,我們在來自維基百科和新聞網站的樣本句子上測定發現:GNMT 在多個主要語言對的翻譯中將翻譯誤差降低了 55%-85% 甚至更多。


今天除了發布這份研究論文之外,我們還宣布將 GNMT 投入到了一個非常困難的語言(漢語-英語)的翻譯的生產中。


現在,移動版和網頁版的 Google Translate 的漢英翻譯已經在 100% 使用 GNMT 機器翻譯了——每天大約 1800 萬條翻譯。GNMT 的生產部署是使用我們公開開放的機器學習工具套件 TensorFlow 和我們的張量處理單元(TPU:Tensor Processing Units),它們為部署這些強大的 GNMT 模型提供了足夠的計算算力,同時也滿足了 Google Translate 產品的嚴格的延遲要求。

漢語到英語的翻譯是 Google Translate 所支持的超過 10000 種語言對中的一種,在未來幾個月,我們還將繼續將我們的 GNMT 擴展到遠遠更多的語言對上。

機器翻譯還遠未得到完全解決。GNMT 仍然會做出一些人類翻譯者永遠不出做出的重大錯誤,例如漏詞和錯誤翻譯專有名詞或罕見術語,以及將句子單獨進行翻譯而不考慮其段落或頁面的上下文。為了給我們的用戶帶來更好的服務,我們還有更多的工作要做。


但是,GNMT 代表著一個重大的裡程碑。我們希望與過去幾年在這個研究方向上有所貢獻的許多研究者和工程師一起慶祝它——不管是來自谷歌還是更廣泛的社區。


對於谷歌的神經機器翻譯系統,有人歡喜有人憂,你怎麼看?


更多留學資訊,英語學習乾貨,GMAT備考資料及心得

相關焦點

  • BAT、谷歌、Facebook都在搞的神經機器翻譯,真的就地表最強了嗎?
    回想去年,谷歌在中英翻譯系統上部署了GNWT——谷歌神經機器翻譯之後,當時網上有一句廣為流傳的話:「作為翻譯,看到這個新聞的時候,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。」怎麼樣?是不是感受到了深深的絕望?但是先讓咱們的小情緒平靜一下。
  • 如何評價Google神經機器翻譯(GNMT)系統?
    有從事翻譯職業的網友甚至這樣形容:作為翻譯,看到這個新聞的時候,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。真有這麼可怕嗎?讓我們先來回顧下Google Translate的發展歷程。幾年前,Google開始使用循環神經網絡來直接學習一個輸入序列(如一種語言的一個句子)到一個輸出序列(另一種語言的同一個句子)的映射。其中基於短語的機器學習(PBMT)將輸入句子分解成詞和短語,然後對它們的大部分進行獨立翻譯,而神經網絡機器翻譯(NMT)則將整個輸入句子視作翻譯的基本單元。
  • 翻譯家的寂寞與翻譯界的清冷
    楊憲益之後,又一位翻譯家去世了,《安娜·卡列尼娜》的譯者謝素臺7月18日在北京朝陽醫院逝世,享年85歲。然而,直到7月26日作家楊葵在微博上傳遞出這一信息,不少媒體才聞風而動,在核實信息準確性後進行了報導,此時已是謝素臺去世一周多之後。
  • 人工智慧翻譯 OR 人工翻譯?
    21世紀,機器翻譯的開發呈現多元化和多種模式,包括翻譯軟體、在線翻譯網絡平臺(如谷歌、百度和有道在線翻譯)等 2006年,谷歌翻譯作為一個免費服務正式發布,並帶來了統計機器翻譯研究的一大波熱潮。
  • 何為翻譯過程中的理解?
    翻譯過程中的理解,同我們平時閱讀過程中的理解是有區別的。首先,翻譯中的理解帶有明確的目的性,即以忠實地再現原作為目標;因此,對原作的理解要儘可能全面、細緻和深入;一般閱讀過程中常見的「不求甚解」,在翻譯理解中是不允許的。
  • 外國人如何翻譯鴨屎香?翻譯被茶界術語逼瘋了
    中國的茶文化博大精深、源遠流長是公認的,單單一個描述茶滋味的詞彙,就能翻譯界的大神們嘔血身亡,無力回天。誇張了?不不不!「只要你不讓我翻譯,我願意陪你回家接受七大姑八大姨的拷問……」當然,這些詞彙正楊君搜索了各大有關茶的國外網站,也沒有找到這些詞彙的蹤影。只找到了下面這些!大家先隨意感受一下!
  • 季羨林:中國翻譯界的一面旗幟
    驚悉噩耗,我久望著早已準備好的、幾年裡累次為先生拍攝的照片——原計劃8月6日與中國翻譯協會同仁一起為先生祝壽時帶去的,心中竟悵然無措,握筆籤發以中國翻譯協會名義為季先生所寫唁電的手,微顫不止。  中國翻譯界的一個老兵  季先生是畢生致力於中外文化交流、推動中華文化傳播的著名文學家、教育家、翻譯家和社會活動家。
  • 專訪|譯者姜乙:我如何翻譯茨威格和黑塞
    作為翻譯,我想,應該對書裡的每個人物感同身受。作為一個熱愛巴洛克音樂或者說亨德爾音樂,和對他這個人略知一二的譯者,可能對這一章更有好感,更親切。如果說影響:某些時候,我試圖做個勇敢的人,在翻譯時試著打破某種母語中人們習慣的節奏或說話方式,打破我自己習慣的節奏和說話方式。這非常難。比如完全直譯,一對一,試圖造成某種讓人心動的陌生效果……但這些不過是給人自大印象的泛泛而談。
  • 人工智慧領域突破百度發布在線翻譯系統
    日前,百度在機器翻譯技術上取得重大突破,發布了融合統計和深度學習方法的在線翻譯系統。該系統藉助海量計算機模擬的神經元,模仿人腦「理解語言,生成譯文」,同時結合百度已有的統計機器翻譯技術,使得機器翻譯質量實現了質的飛躍。百度,再一次站到網際網路前沿技術的領先位置。  機器翻譯一直被公認為是人工智慧領域最難的課題之一。
  • 中國翻譯事業的成就
    林紓翻譯的法國小仲馬《巴黎茶花女遺事》在1899年就以木刻本出版了,魯迅作為另一個標誌性人物在引入近代外國文學方面亦功不可沒。「五四」時期,《新青年》、創造社、文學研究會等先進刊物、文學團體、出版社大量介紹了外國優秀文學作品,對我國新文學的發展起了極大的鼓舞和借鑑作用。 在艱難的革命鬥爭歲月,外國文學的翻譯介紹使我們逐漸了解了世界各國人民的歷史傳統和生活鬥爭。
  • 突破10億的「哪吒」金句,英語能怎麼翻譯?
    我是小妖怪,逍遙又自在,殺人不眨眼,吃人不放鹽 哪吒剛開頭作為一個街頭小惡霸,吊兒郎當,開頭的這句自製打油詩相信很多人都非常喜歡。(1)happy-go-luvky逍遙自在,無憂無慮。我的命我自己扛,不連累別人相信很多人看到這句都會深有感觸吧,畢竟我們的生活中也有很多時候只能自己扛住。(1)live on one's own獨自生活。很多時候表示一個人獨自生活的意思,但這裡延申」依靠自己「的意思。
  • 網絡翻譯:撐起翻譯界的另一片天空
    2007年7月21日,作為資深「哈迷」的他參與了中國網絡上最張揚的一次民間翻譯行動,在《哈利·波特與死亡聖器》(簡稱「哈7」)英文版全球同步發行後的9天內,他所在的「霍格沃茨翻譯學校」就將700多頁的「哈7」翻譯成了中文,而人民文學出版社的官方中文版在3個月後才推出。
  • 回憶我為周總理當翻譯的日子
    20世紀50年代初,我作為新中國首批赴阿爾巴尼亞的留學生,到地拉那大學學習,1957年畢業回國,同年進入外交部工作。隨著中阿兩國關係的持續發展,以至形成「特殊友好」的歲月,我有幸於50年代後期至70年代初期,逾百次為周總理做阿語翻譯。周總理的言傳身教、入微關懷,使我倍感親切,受益終生。
  • 劉宇昆:翻譯的靈魂是理解作者的「聲音」
    2015年,由他翻譯的劉慈欣小說《三體》獲得雨果獎最佳長篇小說獎。對於科幻界來說,劉宇昆不僅是譯者,也是一名科幻小說家,他的作品《手中紙,心中愛》和《物哀》接連獲得國際科幻大獎雨果獎。在談及為何將一部分精力放在翻譯工作中時,劉宇昆表示,這與美國科幻文化的歷史相關。美國的科幻迷總是希望給大家一些回饋,有些科幻迷會為大家舉辦科幻大會,有些科幻迷作家會選擇辦寫作班來壯大科幻隊伍。
  • 嚴復的翻譯及世紀之交的語言困境
    這也是嚴復譯科學書和林紓譯小說的重大區別。今天我們讀《天演論》,感到譯文和原文有很大的差距。這種差距是究竟是嚴復取捨的結果,還是一種語言上的無奈?思想史的研究對前者討論的多,我是研究語言的,對後者更為敏感。我想指出我們對世紀之交漢語局限性的認識是不夠的,其實嚴復在很多時候是勉為其難的。當時我們的語言還沒有為翻譯西方的人文科學做好準備。嚴復在1902年說用漢語講授科學還為時尚早,需要二十年。
  • 《我和我的祖國》七個短片英文名,《護航》的翻譯有點妙
    由陳凱歌擔任總導演、黃建新擔任總製片的《我和我的祖國》正在院線熱映,18日會有兩部大片登陸內地院線,或許到那時候才會真正影響《我的祖國》和連續多日拿下票冠的《中國機長》。截止上映第14天下午18點左右,《我和我的祖國》票房已經突破25億元,目前累計25.55億元。
  • 中到英新聞翻譯媲美人類,微軟機器翻譯新突破
    微軟亞洲與美國實驗室的研究者稱,其中英新聞機器翻譯系統在常用的新聞報導測試集 newstest 2017 上達到了人類水平。該測試集由來自業界和學界的團隊共同開發,去年秋季在 WMT17 會議上發布。為了保證結果既準確又能達到人類水平,該團隊聘請了外部雙語評估員,他們對比了微軟的結果與兩組獨立翻譯的人類譯文。
  • 黃忠廉:翻譯思想≠翻譯理論
    更多的傅譯研究主要是宏觀的、外圍的和掠影式的。對其翻譯文本的深入研究不多,原因有二:其一,國內法語學者不多, 法漢翻譯研究者更少, 鍾情於傅譯者屈指可數;其二,不懂法語如我者研究傅譯,只能是隔靴搔癢,以至於譯學界人人皆知「神似」說,人人引用,卻不能產出系統的研究成果。傅譯研究是理論行為,那麼傅雷本人對翻譯的思考是思想還是理論? 推而廣之, 翻譯家嚴復又如何呢? 翻譯思想與翻譯理論有無界限?
  • 百度發布即時翻譯「神器」 突破自然語言處理重大難關
    這是自然語言處理方面的重大技術突破,將對機器即時筆譯和口譯的發展起到極大地推動作用。機器同傳利用語音識別技術自動識別演講者的講話內容,將語音轉化為文字,然後調用機器翻譯引擎,將文字翻譯為目標語言,顯示在大屏幕或者通過語音合成播放出來。
  • 瓦特發明蒸汽機、開始進行工業革命
    探索歷史前沿,改變人生觀念,大家好我是老賴,昨天為大家講解了資本主義列強在全球的擴張與資本主義世界市場的初步形成!今天為大家講解瓦特發明蒸汽機、開始進行工業革命!瓦特自籌資金,租了一一間地下室,買了必要的設備,反覆試驗,經歷了無數次挫折和失敗。在工人的幫助下,解決了製造精密汽缸、活塞的工藝問題,同時採用潤滑活塞,既可向前又可向後。為了保持蒸汽機的勾速運轉,他把一個離心調速器連接在進氣活門上,使其自動調節進氣量。這種裝置是最早在技術上使用的自動控制器。使得主要汽缸能保持定溫度。嚴密,被各工業部門迅速採用。