重築巴別塔:機器翻譯的夢想與現實

2020-12-05 中關村在線

  引言:技術的新進展使人們對機器翻譯的關注與熱望達到前所未有的高度。本報記者採訪一線專家,為你全面解讀關於機器翻譯的那些事兒

  宇宙翻譯器:究竟要多久才能出現?

  美國有一部熱播了40年的科幻電視劇《星際迷航》,劇中有一個非常「打眼」的工具——宇宙翻譯器。星際艦隊成員把它別在胸前,它能將所有的已知語言翻譯為聽者所懂的語言,對其餘的未知語言也可通過對簡短幾句話的分析而進行轉換。不過按照劇中的設定,這種宇宙翻譯器要到22世紀才能發明。

  然而,微軟公司前不久的一項技術展示卻讓人們覺得似乎不需要等那麼久。

  10月底,微軟首席研究官、微軟研究院院長裡克·雷斯特博士(見右圖)在天津舉辦的「21世紀計算大會」上展示了微軟最新的研究成果——同聲傳譯軟體,向世人描繪了一幅「跨越語言、溝通無礙」的美好藍圖。


圖片說明
 

  在這個10分鐘左右的演示中,雷斯特一直用中等速度講英文,他背後有兩個大屏幕。現場觀眾看到其中一個屏幕把他講的話以英文文本的形式展示出來,速度大概只比他的聲音慢小半秒。而在另一個屏幕上,上半部把英文文本中的單詞提取出來,並對應中文單詞,而下半部則按照中文語序排列成中文句子。隨後,最令人激動的時刻到來了,翻譯完的中文句子以普通話的形式「說」了出來,聲音聽起來還與雷斯特本人挺像,速度基本上是他一說完英語,機器就「說」出仿真聲音的中文翻譯,聽起來就像雷斯特在給自己做同聲傳譯。

  在演示過程中,發言人的英語單詞幾乎全部被識別(識別率維持在80%-90%之間)。更奇妙的是,微軟研究院的這一系統還可以模擬發言人的口音,在經過大約1個小時的機器磨合之後,就可以完成這一功能。也就是說,如果是英國人來使用,那麼系統的漢語發音將帶有「倫敦腔」。此外,雷斯特表示,微軟的同聲傳譯軟體不僅能英譯漢,還能翻譯西班牙語等26種語言。雖然目前還沒有走出實驗室,未來卻可能做成同聲傳譯器。

  微軟的技術展示讓機器翻譯成為近來的大熱門,人們紛紛猜測,這是否意味著發展了幾十年的機器翻譯如今真正走到了前臺?是否意味著我們距離「語言大同」的世界正式邁進了?

  

cio.zol.com.cn true http://cio.zol.com.cn/343/3435364.html report 1732   引言:技術的新進展使人們對機器翻譯的關注與熱望達到前所未有的高度。本報記者採訪一線專家,為你全面解讀關於機器翻譯的那些事兒:  宇宙翻譯器:究竟要多久才能出現?  美國有一部熱播了40年的科幻電視劇《星際迷航》,劇中有一個非常「打眼」的工具——宇宙...

相關焦點

  • 將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」
    機器之心作者:iCombinator機器翻譯之夢今天,當我們很自然的拿出手機,選擇一個谷歌、百度或微軟的翻譯 app ,輕而易舉的完成文字翻譯、拍照翻譯和實時語音翻譯時,我們可能不會意識到由於深度學習的出現和數據量的積累,研究數十年的機器翻譯問題已經變得可用並走入了我們的生活,給我們帶來了極大便利。
  • 機器翻譯三大核心技術原理 | AI知識科普
    機器翻譯技術發展了80多年,巴別塔的傳說已經成為過去,上天是不可能上天的了,但是讓你優雅地和全世界討論世界盃,不再手舞足蹈、雞同鴨講,這一點機器翻譯還是可以做到的!01機器翻譯和巴別塔的傳說《聖經》中記載了這樣一個故事:人類曾經聯合起來興建能通往天堂的高塔——巴別塔,為了阻止人類的計劃,上帝讓人類說不同的語言,使人類相互之間不能溝通,計劃因此失敗,人類自此各散東西。實現不同語種之間的無障礙溝通,一直都是人類終極夢想之一。
  • 機器翻譯正走入現實生活 未來還需要人工翻譯嗎?
    參考消息網2月21日報導 英國《泰晤士報》網站2月16日刊登了題為《科幻作品中的翻譯機器現在成為現實》的文章,作者為本·麥金太爾,文章摘編如下:本周,我讀了一本250頁的俄文書,儘管我連一個俄語單詞都不會說也看不懂。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    神經機器翻譯在大規模翻譯任務上第一次獲得超越統計機器翻譯(SMT)的效果不過是 2014 年的事情(著名的 RNN encoder-decoder 結構就發表在 2014 年的 EMNLP 上),如今三年過去了,機器翻譯頂級論文中已經幾乎難以見到統計機器翻譯的身影,神經機器翻譯已經成為了機器翻譯領域的主流。
  • 美媒:翻譯是藝術還是數學問題?
    這是一個可以追溯至創世之初的夢想——一種可以向世界完美地呈現思想的共同語言。美國《紐約時報》網站6月4日報導,在《聖經》中,這種共同語言讓人類可以極其良好地溝通協調,擁有十分類似的思想,以至於全世界的分包商們一度可以商定共同興建通天塔。然而自從建造巴別塔的努力失敗之後,即便是最小的建築工程也會受到可怕延遲的困擾。
  • AI 如何成為百度翻譯 DAU 高速增長的引擎?
    在「巴別塔倒下」的日子裡,人類社會一直沒有放棄不同語言之間的翻譯。特別是在 2020 年剛剛過去的這個春天,當人類社會意義需要緊密聯繫在一起的時候,語言翻譯,更是承載著各個國家團結一致、共同抗疫的訴求。也是在剛剛過去的這個季度,百度旗下的翻譯產品百度翻譯獲得眾多關注。
  • 《戰雙帕彌什》遊樂園巴別塔攻略 216打法技巧分享
    下面小編就為各位玩家整理出了遊樂園巴別塔216打法攻略,感興趣的玩家千萬不要錯過哦~ 戰雙帕彌什遊樂園巴別塔216... 《戰雙帕彌什》遊樂園216怎麼打?這個關卡該怎麼拿分?什麼樣的陣容最容易用來上分呢?
  • 吳青峰《巴別塔慶典》MV
    v.cen.ce.cn/video_info/2019-8-16/1565932040259.json,553,450  《巴別塔慶典》歌名來自古老的傳說,遠古時候人們說著同種語言,但他們想要建造一座直達雲端的塔
  • 百度機器翻譯團隊獲得WMT2019中英翻譯冠軍
    8月1日,WMT2019國際機器翻譯大賽研討會在義大利佛羅倫斯召開。本屆大賽,百度機器翻譯團隊在中文-英文翻譯任務上獲得冠軍。,其中中文-英文翻譯任務是歷年參賽隊伍最多、競爭最為激烈的機器翻譯任務之一。
  • 未來的世界:機器翻譯VS人工翻譯
    蔡基剛:在特定領域的機器翻譯替代人工翻譯是技術發展的必然趨勢,而且在醫學、生物、法律、航天、海事等專業領域裡的機器翻譯取代大部分人工翻譯將是最近幾年的事情。這個語料加工的技術層面工作,可以讓專業人員(懂英漢兩種語言的法律專業人員)和語言服務專家完成,包括對機器翻譯的譯文進行與原文的比較和校對,然後修改後輸回機器,再讓其進行再學習翻譯,再修改和完善語料庫文本。這樣,隨著機器翻譯實踐的不斷增加,這款專業翻譯機器的準確率達到90%甚至以上不是不可以做到的。翻譯內容越專業,場景或任務越固定,標準越統一,翻譯準確率就越高,替代人工翻譯不是不可能。
  • 重建技術工種的巴別塔,是有可能的嗎?
    不一致甚至是混亂的翻譯,這可以說是造物主阻止我們通往天堂的一個方面。另一個方面在於,哪怕都是英文手冊,不同工種對同一個東西也常常有不同的名字。例如下面這個。A320機身右側,分明寫著VENT AIR OUTLET VALVE,你猜猜它在飛行員和機務的手冊裡都叫什麼?
  • 《戰雙帕彌什》巴別塔暴動怎麼打 巴別塔暴動打法心得分享
    導 讀 關於戰雙帕彌什這一期的巴別塔,很多小夥伴都說難度增加了,很不好打,特別是關於巴別塔暴動那裡的討論最多
  • 翻譯行業的發展方向:機器翻譯VS人工翻譯
    近年來,機器翻譯技術有了很多新的突破,在實際的語言服務實踐中,機器翻譯有了很多成功的案例。機器翻譯必將深刻影響翻譯服務行業,將給人工翻譯帶來實際的威脅。另一方面,機器翻譯以其人工翻譯難以比擬的速度,將提高人類對於海量信息的處理能力,彌補人工翻譯在速度和成本方面的不足。不管你喜不喜歡,你都無法迴避機器翻譯的發展。如何利用機器翻譯技術成了翻譯服務行業的重要課題。
  • Facebook放了個大招,基於CNN的語言翻譯模型快9倍,同傳壓力山大了...
    以AI為代表的新興技術會將重建人類文明的「巴別塔」,還是加速其崩塌?不過,FAIR團隊意識到了這一技術的潛力,他們通過搭建翻譯模型驗證了CNN極佳的翻譯表現,如果在未來這一能力可以得到釋放的話,那麼精準、高效翻譯全球6900餘種語言將不再是夢想,人類文化的「巴別塔」將在技術的基石之上重建。  Facebook的全新翻譯系統到底表現如何?
  • 機器翻譯的最新進展與瓶頸所在
    你想過和異國人說話不需要再有翻譯,只需隨身攜帶一個輕巧的數碼機器嗎?目前來看這仍是奢望。不過,或許某一天,我們終於可以不再學習頭疼的外語就能實現和外國人的無縫交流。  機器翻譯是一個充滿挑戰的研究領域,正因為難度很大,它被列為21世紀世界十大科技難題之首。一路走來,機譯經歷了艱難而曲折的發展歷程,既有成功和興奮,也有挫折和困惑。  然而,需求永遠走在應用的前方。由於近年來全球化進程的加速以及國際交流的日趨頻繁,人們對於翻譯的需求空前增長。
  • 中到英新聞翻譯媲美人類,微軟機器翻譯新突破
    今日,微軟研究團隊表示,微軟和微軟亞研創造了首個在質量與準確率上匹配人類水平的中英新聞機器翻譯系統。黃學東告訴機器之心,他們採用專業人類標註與盲測評分代替 BLEU 分值而具有更高的準確性,且新系統相比於現存的機器翻譯系統有非常大的提升。因此,根據人類盲測評分,微軟機器翻譯取得了至少和專業翻譯人員相媲美的效果。
  • 劉慶峰的人工智慧機器模仿川普講話_機器漢英翻譯已達6級
    從現實來看,雲知聲對人工智慧的探索還處在感知的階段,希望透過傳感器收集更多的數據,未來結合更強大的算法和更多的運算能力,讓設備變得更加智能;透過數據也能發展出更多服務。 憑藉強大技術實力,雲知聲自成立以來就備受人工智慧行業及資本市場的廣泛關注,目前合作夥伴超過2萬家,並連續兩年入選福布斯中國最快科技成長公司50強企業,也是目前中國人工智慧行業成長最快的創業公司之一。
  • B站「不靠譜」翻譯大賽:機器翻譯,還遠不能取代人工翻譯
    我們都期待著有一天,能有最理性的人工智慧翻譯軟體幫助我們解決語言的障礙,從而做到無礙的全球化交流。不過機器翻譯究竟能做到什麼地步,永遠是讓人質疑的。起碼就今天的技術水平來看,機翻幾乎是最不靠譜的選項。 除了單詞和語法,我們如何理解某句話在字面意義背後的情景?機器翻譯有可能達到理解文化背景的程度嗎?
  • 微信翻譯軟體頻出Bug,為什麼迄今為止一直沒有準確的語言翻譯?
    翻譯軟體頻出Bug 這不是微信翻譯第一次「胡亂自主」翻譯了,之前曾出現過「ohh」的翻譯Bug。用戶在微信輸入「ohh」三個字母,點擊翻譯,其結果為:留在我身邊。 這是翻譯嗎?感覺是在通暗號呢?是不是覺得這機器翻譯訓練來訓練去,都快成精了!不僅會撩妹,還會吐預言! 幸好後來谷歌公司回應道,「這只是將無意義的話放進系統,再產生無意義的話的一種功能。」 潛臺詞是大家別那麼無聊,都散了吧。 機器翻譯的不足與未來 大家還記得幾年前的機器翻譯是如何嗎?生硬、語句不通、無法使用。
  • 王維、楊絳與機器翻譯的本質
    沃倫·韋弗認為翻譯是一個解碼的過程,這個解碼的過程,有一個正確的答案。同時他認為機器翻譯能夠「理解」這個密碼所代表的意思。 從1947年到現在,又發生了什麼?其中有一篇文章就是1959年由Yehoshua寫的文章,他雖然對機器翻譯有多年研究,但最終對機器翻譯持批評的態度,不過他對於機器翻譯的可能性卻持有比較曖昧的態度。