【人工智慧】重建巴別塔 --- 縱觀日本的人工智慧自動翻譯

2021-02-08 客觀日本

學習外語是現代人的必修課目,也是一件費力的事。


日本有統計說,中高六年花在英語學習的時間是840小時。中國在英語學習上貌似花費了更多的時間。有一位人大代表做了一個調查發現,中部省會城市中小學生每天在學英語上付出的時間大約為:小學生1小時,初中生1.5小時,高中生2小時。從小學三年級到高三畢業,每個學生至少要在學英語上花費5,292.5個小時。如果按照每天8個小時的學習時間來計算,在一個孩子最美好的10年時光裡,竟然將近五分之一(18.13%)的時間都花在了英語上。


然而,外語學習並非走出校門就能了結,有的人似乎要貫穿生涯。日本是一個學習風氣很濃的國家。面向成年人的語言學校隨處可見。有人對成年人學英語的動機作了問卷調查。發現最主要的五個理由是


1.懂英語對就職、升遷、轉職有利
2.海外旅行會更愉快
3.希望跟外國人交流、交朋友
4.會說外語已經是現代的常識
5.看電影或電視劇時不再藉助字幕或配音


從中可以看出,學習外語既有為升遷工作的功利主義因素,也有為興趣所致的精神的因素。這只是對一般人的問卷調查。如果考慮到學術的需要,更能發現外語(英語)的重要性。哈佛大學公眾衛生學院的研究員巴拉貝尼調查了2014年出版的《歐洲分子生物學機構會刊》,發現95.4%是英文,而世界人口裡以英語為母語的不過5%。在論文數排名前20的國家裡,英語為第一語言的只有四個國家。所以,學外語尤其是英語,變得愈發重要。筆者有時甚至幻想著,如果世界語言統一的話,豈不是可以騰出學外語的時間,作其它更重要的研究。


或許世界本來只有一種語言。


《舊約聖經》「創世紀」11章講了這樣一個故事:大洪水以後,繁衍生息的人們來到巴比倫平原,在那裡定居。「他們說,來吧,我們要建造一座城和一座塔,塔頂通天,為要傳揚我們的名,免得我們分散在全地上(創世紀11章4節)」。上主下來,要看看這群人建造的城和塔。主看他們是同一個名族,講同一種語言,生怕他們齊心合力,為所欲為,便攪亂了他們的語言,使他們無法造塔,把他們分散到世界各地。


由此佐證了語言的力量,也是我們孜孜不倦學習外語的動力。所以,如何更有效地利用時間,減輕學習外語的負擔也是科學界追求的一個目標。因此,自動翻譯成為一個攻堅的課題。如果自動翻譯實現了,等於重建一座巴別塔,可以綜合全球的力量,攻克科學難關。


文本翻譯 ---日本


日本作為一個科技發達國家,在自動翻譯方面起步很早,文本翻譯早在90年代已經出現過兩次高潮。其特徵和概況如下表所示。


時間

系統概況

評價

90年代初

・用途:面向翻譯公司或者企業的翻譯系統

・系統配置:軟體+工作站+印表機+掃描器

・價格:600-800萬日元

翻譯精度:
日英50%
英日60%

93年前後

・用途:面向翻譯公司或者企業的翻譯系統

・系統配置:軟體+工作站

・價格:300萬日元

96年前後

・系統配置:軟體降

・價格:10萬日元左右

翻譯精度:
80%左右。


這個時期的翻譯精度的提高基本上是靠提高構造處理能力和詞彙選擇能力來解決的。科研攻堅的目標,主要瞄準對多義性的解決,以及使語法更精緻,使字典更充實。利用統計技術自動抽取語言信息,通過用例模式,提高翻譯精度。顯然,這是傳統編程實現的線性處理,跟人腦的處理完全是異質的。


語音翻譯 ---日本


語音翻譯方面,早在1986年日本情報通信研究機構(NICT)就著手研究,但是一直進展不大,直到近幾年人工智慧的崛起,才帶來突飛猛進的變化。去年,NICT為了驗證其正在開發的名為VoiceTra的翻譯系統,免費公開了其翻譯應用(APP)。VoiceTra現在可以翻譯英語、漢語等30幾種語言。筆者通過電視屏幕所看到的翻譯場景很振奮人心,它可以瞬時翻譯出語音並伴隨著字幕。為了在2020年東京奧林匹克時投入商用,他們將旅客通常會去的地方,以及醫院等場景的對話數據預先錄入計算機,與全日本的大學與企業合力利用人工智慧技術進行翻譯。設想的用戶為醫師、旅客、以及計程車司機等等。在完全投放市場之前,已經有企業將其應用於遠程通信,電視與電話會議等等。


其他廠商也在積極開發語音翻譯的產品。目前,日本對語音自動翻譯的廠商及其品牌,大概如下表所示。

廠 商

系統 / 軟體名

概 要

日本情報通信研究機構(NICT)

VoiceTra

翻譯系統

・2016年秋季免費公開了其翻譯應用(APP)

・可以翻譯英語、漢語等30幾種語言。

富士通

富士通SSL

LiveTalk

自動語音翻譯系統

・可以進行實時語音識別

・可自動翻譯19種語言。

東芝

RECAIUS

語音翻譯與同聲翻譯系統

・利用了人工智慧的對話型語音翻譯服務

・對應英、漢、韓、日四種語言。

微軟

Microsoft Translator

翻譯軟體

・增加了日語文本與語音的雙向翻譯。


日本的廠家有一個共同的特徵,就是其產品的慎密以及應用的多樣化。廠家設想的應用場景以面向企業應用居多。也就是所謂的B2B應用。這樣的商業模式比較適合大企業的盈利方式,但是因為系統比較複雜,業務模式未成型,所以,開發周期比較長。而中國企業看起來要靈活點,2017年4月26日,中國科技公司科大訊飛聯合洛可可&洛客推出了全球首款中英互譯神器「曉譯翻譯機」。其特點是面向大眾消費者,鎖定中英互譯,軟硬體結合做成一款手機一樣的終端。這種面向消費者的B2C業務模式,刪掉了多餘的功能,簡單而便宜。


率先在日本市場推出B2C模式語音自動翻譯的是LINE。2017/6/15 LINE宣布在今年秋天推出一款安裝人工智慧的翻譯終端,要趕在亞馬遜等美國廠商之前將產品推入市場。這個終端可以給用戶朗讀當天的新聞,以及收到的文本信息。

究竟哪種方式更能獲得市場的認可與歡迎,這需要時間來驗證。


人工智慧的應用,使得自動語言翻譯出現了井噴式變化。按這個勢頭,相信不遠的將來,或者不用等到2020東京奧運會,駕轅外語將成為一件容易的事。起碼對於普羅大眾,為滿足旅行、購物、就診等日常活動的需求,或許並不需要花大力氣去啃語法、背單詞地學外語了。


重建巴別塔後,不知道上帝會作何感想。

文・圖/戴維


相關焦點

  • 巴別塔之路,人工智慧能否顛覆翻譯的未來?
    聽起來,人工智慧翻譯不僅能在實時性上勝過普通翻譯,翻譯準確性也不會差得太遠。但實際上,目前的機器翻譯仍局限於讓用戶「看懂」。基於機器翻譯的結果,用戶連猜帶蒙或許可以弄清外文的含義,但關於流暢度、文學性,乃至語言的美感,人工智慧仍有很大的缺陷。
  • 重建巴別塔,機器翻譯的前世今生丨語言學午餐
    機器翻譯(Machine Translation)想必是大家最耳熟能詳的人工智慧應用之一了,它不僅是計算語言學(Computational Linguistics)的瑰寶,同時也是居家旅行的必需品。雖然機翻已可滿足一些簡單的應用情景,但是它有時犯起蠢來還真是讓人哭笑不得。
  • 從機器翻譯到讀心術 AI能否重建人類巴別塔?
    《聖經·舊約·創世紀》中有這樣一個故事,人類聯合起來興建通往天堂的巴別塔,為了阻止人類的這一計劃,上帝讓人類說不同的語言,使其相互之間無法順暢溝通,計劃因此失敗,人們各散東西。這也從一個側面說明了溝通在人類發展史上的重要性。
  • 人工智慧翻譯 OR 人工翻譯?
    當今,人工智慧已在能源、健康、機器人、商業情報、教育和金融等領域產生了深遠影響。隨著2018博鰲亞洲論壇,「騰訊同傳」事件引發的熱烈的討論,人工智慧翻譯(或機器翻譯)與人工翻譯未來發展的討論再一次出現在人們面前。其實早在上世紀30年代,就有了機器翻譯語言的想法和實踐。
  • 從不被認可到突飛猛進,人工智慧給機器翻譯加了多少馬力?
    人工智慧長久以來的目標就是讓機器完成那些以前只能靠人類自身才能完成的任務,所以在人工智慧的具體應用,除了成為人工智慧中樞以外,如何讓機器幫助人類進行語言翻譯也顯得尤為重要。現在讓我們一起來看看人工智慧狂熱背後,機器翻譯是怎麼革新的吧!
  • 人工智慧讓翻譯人員從此下崗
    ■IT時報記者 吳雨欣近幾年,人工智慧越來越完善,當記者還在為寫稿發愁時,騰訊新聞機器人 Dreamwriter已經開始以單篇成文平均0.5秒的速度進行寫作,並自動配圖和自動剪輯視頻片段。獨自下崗太寂寞,你以為人工智慧只是取代了記者?真是Too young too naive(太年輕太天真),市面上越來越智能的翻譯機已經開始取代翻譯崗位了。百度翻譯機:一鍵翻譯,自帶流量百度共享Wi-Fi翻譯機,是針對出境遊中的跨語言交流與網絡通信需求研發的一款可攜式智能硬體,可以幫助用戶進行便捷的多語言實時語音翻譯。
  • 翻譯界的AlphaGo,魔腦人工智慧翻譯機真的是"狼"來了嗎?
    事實上這是人工智慧的簡歷,準確的說是兩款人工智慧同聲翻譯機的「簡歷」。拋開這家叫「雙猴科技」的公司和他們的魔腦品牌翻譯機營銷方式不談,簡歷風波卻真正引發了網友和行業的廣泛思考,在喊了N多回「人工智慧將會替代人類」之後,這次人工智慧不再只是替代人類的簡單重複工作,而是真的瞄準了翻譯這個在我們常識中高大上的行業了。我們不禁要問,人工智慧替代人類的時代真的來臨了嗎?
  • 人工智慧:日本人工智慧醫療誰負責?出了事故主治醫生全責!
    人工智慧:日本人工智慧的醫療誰負責?出了事故主治醫生全責!這兩年來不管是國外還是國內,我們都期待這可以把人工智慧真正地運用到醫療領域中去,因為老齡化使得許多國家的壓力很大,醫療設備和人員嚴重不足。日本是積極研究人工智慧的國家,他們對於一些問題已經進行了成熟的思考,畢竟人家入行早。日本政府最近對於人工智慧醫療設備的應用出臺了一些規定,其中包含了人工智慧醫療設備怎麼使用啊,如何製造、如何運輸、如何購買等商業流通問題,最關鍵的是法律責任問題。如果機器人出了問題,我們老百姓應該找誰去?
  • 眾巨頭入局 人工智慧翻譯究竟靠譜嗎?
    除了人工翻譯之外,「準兒」智能翻譯機在場上迅速走紅。其實,已經有多家科技巨頭入局人工智慧翻譯,儘管各有招式,但他們面臨同樣問題。縱觀市場上AI翻譯機,下到幾百塊,上到幾千塊的都有,在體驗方面也是各有千秋。下面列舉幾個常見AI翻譯機。
  • 有道段亦濤:人工智慧將顛覆機器翻譯
    段亦濤表示,神經網絡翻譯是人工智慧在翻譯領域的具體應用,是目前最前沿的機器翻譯技術,它帶來的翻譯質量提升是過去十年的總和。  另外,我們集合網易公司的研發之力,和網易杭州研究院一起,攻克了數據處理、大規模框架、模型優化、領域適配等技術難題,開發了一些我們特有的技術,比如我們自己的領域適配技術,使得我們的模型能夠自動識別不同場景。目前已經在新聞、學習、口語和一些科技領域等場景下做到了最優。」  我們做的神經網絡翻譯技術,目前可以很便捷讓用戶體驗到。
  • 百度聯合攜程推出人工智慧翻譯機,支持多種翻譯方式;阿里客服機器...
    —— 百度CEO 李彥宏   人工智慧   百度聯合攜程推出人工智慧翻譯機,支持多種翻譯方式   百度公司近日與攜程國際有限公司聯合推出人工智慧小型翻譯設備,旨在利用百度翻譯技術解決境外旅遊的翻譯難題。
  • 從人工智慧翻譯機器看人工智慧領域的現狀和未來
    伴隨著改革開放的春風,我國科技的水平不斷發展,人工智慧的浪潮也已經進入「第三春」。「聽東風春潮澎湃 看祖國輝煌巨變」首都大學生記者團來到合肥一家專門做智能語音技術的公司科大訊飛,親自體驗了機器識別語音並翻譯的全過程。
  • 人工智慧概念介紹
    隨著上世紀40年代計算機的發明,這幾十年來計算速度飛速提高,從最初的科學數學計算演變到了現代的各種計算機應用領域,諸如多媒體應用,計算機輔助設計,資料庫,數據通信,自動控制等等,人工智慧是計算機科學的一個研究分支,是多年來計算機科學研究發展的結晶。人工智慧是一門基於計算機科學,生物學,心理學,神經科學,數學和哲學等學科的科學和技術。
  • 人工智慧全面爆發?智能翻譯有可能是突破口
    一時間,「機器同傳」這一人工智慧產物迅速成為大眾視野中的「網紅」,繼阿爾法狗(AlphaGo)後,人工智慧再次引爆眼球。機器翻譯,做秀吹牛還是真風口?正所謂人紅是非多,機器同傳的表現既驚豔又充滿爭議。今年舉世矚目的谷歌人工智慧系統阿爾法狗(AlphaGo)戰勝韓國圍棋高手的事件,就是人工智慧強大深度學習能力的卓越表現。光(bu)說(jie)不(di)練(qi)的人工智慧不是好AI相比娛樂競技需求的圍棋項目,語言的翻譯溝通顯然與我們廣大普通人關係更加緊密,也具有更加廣闊的應用場景和市場空間,這也是機器翻譯能引發公眾熱議的原因。
  • 人工智慧可以取代同傳翻譯嗎?
    前陣子,一位同傳翻譯員聲討科大訊飛「AI同傳造假」,在網上引起了軒然大波。人工智慧和同傳翻譯由此成為大家熱議的話題。今天,我們來談一談「人工智慧翻譯是否真的可以取代同傳翻譯員」?機器翻譯如能代替同聲傳譯無疑具有巨大的價值。  人工智慧翻譯的水平如何?  那麼,人工智慧同傳翻譯的能力究竟怎樣?會不會搶走同傳翻譯員的飯碗呢?  今年上半年的博鰲亞洲論壇上,首次出現了AI同傳。然而,現場配備的系統卻掉了鏈子,鬧出詞彙翻譯不準確、重複等低級錯誤。
  • 人工智慧的十大應用
    近年來,伴隨著人工智慧浪潮的興起,無人駕駛成為人們熱議的話題,國內外許多公司都紛紛投入到自動駕駛和無人駕駛的研究中。 03 機器翻譯 機器翻譯是計算語言學的一個分支,是利用計算機將一種自然語言轉換為另一種自然語言的過程。機器翻譯用到的技術主要是神經機器翻譯技術(Neural Machine Translation,NMT),該技術當前在很多語言上的表現已經超過人類。
  • 人工智慧都有哪些應用
    隨著近年來人工智慧浪潮的興起,無人駕駛再次成為話題,國內外很多公司投入了自動駕駛和無人駕駛的研究。智能呼叫機器人在生活中也越來越常見,利用機器模擬人類行為的人工智慧實體形態,實現語音識別和自然語義理解,具有業務推理、語言應答等能力。
  • 人工智慧翻譯上線,使eBay的銷售額增長超10%
    我們經常聽說人工智慧對經濟增長有強大的推動作用,雖然這種說法被普遍接受,但沒有足夠的硬數據來支持它。不過,麻省理工學院和聖路易斯華盛頓大學的經濟學家們最近的一項研究為這種說法提供了一些證據,表明了人工智慧工具是如何通過縮小買賣雙方的語言障礙來促進貿易的。
  • 你知道什麼是人工智慧?人工智慧運用到哪些領域?
    1956年夏,人類歷史上第一次人工智慧研討會在美國的達特茅斯(Dartmouth)大學舉行,標誌著人工智慧學科的誕生。涉及領域:可以應用機器於視覺,指紋識別,人臉識別,視網膜識別,虹膜識別,掌紋識別,專家系統,自動規劃,智能搜索,定理證明,博弈,自動程序設計,智能控制,機器人學,語言和圖像理解,遺傳編程等人工智慧可以涉及到哲學和認知科學,數學,神經生理學,心理學,
  • 摘要翻譯、論文寫作……人工智慧延伸科學交流觸角
    | 字號:A+ | A- 摘要翻譯、論文寫作、信息檢索、抄襲檢測……人工智慧延伸科學交流觸角近日,一款看起來挺有文化的寫稿機器人上線了。他告訴科技日報記者,目前機器翻譯系統的性能很大程度上依賴於其所使用的訓練數據,即平行語料。目前的平行語料多為新聞語料,因此訓練得到的機器翻譯模型對於日常新聞的翻譯效果較好。但學術文獻(比如生物學術論文)與日常新聞在用詞造句等方面都有較大差別,機器翻譯系統對於學術文獻翻譯的效果並不理想。