「機器翻譯」技術到底有哪些現實應用?

2020-12-12 IT168

  機器翻譯(machine translation),又稱為自動翻譯,是利用計算機把一種自然語言轉變為另一種自然語言的過程。

  隨著全球互聯互通日益頻繁,幾乎人人都渴望著實時翻譯這一「逆天」技術能早日變成現實。

  為了實現這一夢想,以IBM、谷歌、微軟、科大訊飛為代表的國內外科研機構和企業均相繼成立機器翻譯團隊,專門從事智能翻譯研究,矢志打破語言障礙。

  IBM從2001起就開始大規模開展該領域的研究,並在英語、阿拉伯語和中文之間的互譯領域進行重點投入。2009年9月IBM正式推出了ViaVoice Translator機器翻譯軟體。

  Google於2011年1月正式在其Android系統上推出了升級版的機器翻譯服務,支持近20種的多國語言之間的互譯。

  微軟的Skype於2014年12月宣布推出實時機器翻譯的預覽版、支持英語和西班牙語的實時翻譯,並宣布支持40多種語言的文本實時翻譯功能。

  近年來國內以科大訊飛為代表的企業也在機器翻譯領域發力,致力於為廣大用戶提供優質的機器翻譯服務。

  科大訊飛從2012年開始進入該領域,並正式推出了「訊飛語音翻譯」等產品,並得到了廣大用戶的高度好評。同時,科大訊飛心繫民族文化的傳播與融合,在近期與新疆大學訊聯合研發完成了世界上首款維漢機器翻譯軟體。該軟體可以準確識別維吾爾語和漢語,實現雙語即時互譯、情景例句學習、詞典互譯等。

  在國內機器翻譯領域深根細作的同時,科大訊飛也積極與國際接軌、跟蹤國際主流的機器翻譯技術。

  2014年,科大訊飛首次參加國際口語機器翻譯評測比賽(InternationalWorkshop on Spoken Language Translation,簡稱IWSLT),即在中英和英中兩個方向中以顯著優勢勇獲第一,一舉打破了中英口語翻譯領域由歐洲機構長期壟斷第一名的局面,充分體現了我國機器翻譯技術在國際上的領先水平。

  在剛剛結束第九屆中博會上,中共中央政治局委員、國務院副總理汪洋親自試用了對科大訊飛的「訊飛語音翻譯」軟體,他饒有興致的問了一句「有沒有煎餅果子?」,軟體立即準確的秒翻成英文「Do you have any fruit pancakes?」。現場頓時響起一片掌聲。

  在看到軟體具備「維漢互譯」功能之後,汪洋副總理非常高興,鼓勵訊飛加快應用的推廣,為民族文化融合和國家發展戰略作出更大貢獻!

  目前,科大訊飛國際領先的中英/英中翻譯技術已經率先應用在「靈犀語音助手」上,按下「按住說中文」或「按住說英文」按鈕,說出需要翻譯的句子,即能實現秒翻 。出國在外,靈犀完全可以充當一個 「隨行翻譯」。

  隨著該項技術在研究與產品應用上的不斷突破,相信它在未來一定能夠在民族融合與文化傳播、社會信息服務、日常生活等方面大展拳腳,幫助人們更加便捷、方便的生活。讓我們共同期待!

相關焦點

  • 神經網絡機器翻譯技術及應用(下)
    何中軍,百度機器翻譯技術負責人。本文根據作者2018年12月在全球架構師峰會上的特邀報告整理而成。神經網絡機器翻譯技術及應用(上)篇,我們為大家介紹了神經網絡機器翻譯的基本原理和挑戰,(下)篇繼續為大家講述機器翻譯的應用與未來。
  • 機器翻譯的夢想與現實
    近年來,隨著計算機性能的提高,雲計算、大數據和機器學習等相關技術迅速發展,人工智慧再度崛起,機器翻譯重新成為人們關注的焦點。一時間,機器翻譯系統如雨後春筍般湧現,各種報導隨之呈井噴式爆發,「機器翻譯將取代人類」的說法也時有耳聞。然而,機器翻譯的真實水平如何,夢想與現實的距離到底有多遠?
  • 機器翻譯技術現狀評述與展望 | 行業觀察
    一時間,機器翻譯系統如雨後春筍般湧現,各種報導隨之呈井噴式爆發,"機器翻譯將取代人類"的說法也時有耳聞。然而,機器翻譯的真實水平如何,夢想與現實的距離到底有多遠?20世紀70年代中後期至80年代前期,部分機器翻譯系統在特定領域得到初步應用(如加拿大蒙特婁大學研製的天氣預報翻譯系統TAUM-METEO)。歐洲共同體實施的歐洲翻譯體系(European Translation System,EUROTRA)計劃和日本對第五代計算機的研究都對機器翻譯研究給予了支持,機器翻譯研究開始復甦。
  • 朱靖波:談談機器翻譯技術發展與產業化
    小牛翻譯董事長、東北大學計算機學院人工智慧系朱靖波教授做了題為《談談機器翻譯技術發展與產業應用》的特邀報告,以下是報告整理,有部分刪減。 5)語音翻譯建模問題 傳統方法通常簡單將語言識別技術和文本翻譯技術串聯起來,會導致錯誤蔓延,如何採用端到端進行語音翻譯建模是一個現實存在的問題。從這一點上看,多模態神經機器翻譯的建模是比較值得關注的。
  • 百度何中軍:機器翻譯——從設想到大規模應用
    2020年6月20日,第16期「AI未來說·青年學術論壇」NLP前沿技術及產業化線上專場論壇以「線上平臺直播+微信社群圖文直播」形式舉行。百度何中軍帶來報告《機器翻譯 —— 從設想到大規模應用》。報告內容:70多年前,第一臺計算機誕生後不久,科學家就提出了利用計算機進行翻譯的設想。此後,隨著技術不斷更迭,算力大幅提升,以及網際網路帶來的數據井噴式增長,機器翻譯質量持續提高。尤其近年來神經網絡機器翻譯的出現及快速發展,使得機器翻譯水平大幅躍升,在人們的生產生活中得到了廣泛應用。
  • 百度CTO王海峰:自然語言處理技術發展飛速 機器翻譯從理想走向現實
    近年來,算力持續突破、算法不斷創新、數據爆發式增長,驅動自然語言處理技術飛速發展,呈現出很多新的變化:從傳統 NLP進行層級式結構分析演變到直接的端到端語義表示;從過去局限於理解句子發展到現在多文本、跨模態的內容理解;而機器翻譯經歷了70年的發展,已經實現質量飛躍,從科幻理想落地現實應用。
  • 關於機器翻譯,還有哪些問題值得探索?
    雖然機器翻譯在過去的二十年中得到了前所未有的發展,但是仍然有許多問題值得探索,離真正實現機器翻譯有很長的路要走,主要有以下三個方面的問題。1. 問題層面機器翻譯研究需要更加關注「機器翻譯」自身的問題。機器翻譯技術方法的研究和機器翻譯產業化應用是兩個不同的維度,現在的模式是二者各司其職,互不「幹擾」:高校和科研院所專注於機器翻譯技術本身,以論文和科研項目為主要出口;而有翻譯需求的企業更多的是使用已經成熟的輔助翻譯軟體,並不關心機器翻譯技術。雖然隨著各個網際網路巨頭對機器翻譯的熱情不斷增高,機器翻譯已經可以作為公共服務被大家所使用,但是不得不說機器翻譯的研究和產業化仍然相對獨立。
  • 機器翻譯技術至今經歷了哪些階段?又有著怎樣的工作原理?
    ,正式拉開了機器翻譯研究的序幕。在這八十多年中,機器翻譯主要經歷這四個階段。那麼,機器翻譯的基本原理到底是怎樣的呢?譯文選擇翻譯句子時,因為語言中一詞多義的現象,會面臨有很多選詞的問題。源語言句子中的「看」應該翻譯成哪個詞呢?而這隻有等機器翻譯系統判定完賓語「書」後,才能做出正確的選擇。
  • 數據增強在機器翻譯中的應用現狀和前景,劉群、黃輝等專場探討
    CCMT旨在為國內外機器翻譯界同行提供一個交互平臺,加強國內外同行的學術交流,召集各路專家學者針對機器翻譯的理論方法、應用技術和評測活動等若干關鍵問題進行深入的研討,為促進中國機器翻譯事業的發展,起到積極的推動作用。
  • 關於數據增強在機器翻譯中的應用現狀和前景,劉群、黃輝等專場探討
    CCMT旨在為國內外機器翻譯界同行提供一個交互平臺,加強國內外同行的學術交流,召集各路專家學者針對機器翻譯的理論方法、應用技術和評測活動等若干關鍵問題進行深入的研討,為促進中國機器翻譯事業的發展,起到積極的推動作用。
  • 機器翻譯的壯美新世界
    如今,在機器翻譯(MT)突飛猛進的背景下,重新讀這一段文字,我仍然覺得這一章節比較有前瞻性,特轉載發布,與大家分享。[……]許多人,包括譯員和翻譯理論研究者,對MT的未來持悲觀的態度。(2001:5) (機器翻譯的結果往往語言形式不自然,有時甚至是行文怪異)。
  • 機器翻譯應用價值凸顯 助力企業智能化升級
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯溝通全世界」為主題的專場活動。IDC中國副總裁兼首席分析師武連峰、百度AI技術生態部總經理劉倩、百度人工智慧技術委員會主席何中軍進行主題演講,同時與在場的40多位來自金融、製造、能源等行業企業信息化負責人聚焦機器翻譯的價值、企業應用需求、未來發展趨勢等話題展開深入的互動討論,分享最佳實踐經驗,助力企業更好的提升機器翻譯大規模產業化應用,推動企業智能化升級。  會上,武連峰講到,企業具備全球化信息能力非常重要。
  • 多家翻譯軟體大型翻車現場?機器翻譯到底有哪些不確定性
    在論文中,作者對於包括但不限於「生詞」的機器翻譯現象給予了一個總結:所有的機器翻譯問題的基本主題都是不確定性,即學習任務的一對多性質,換句話說給定一個句子,有多種翻譯結果。然後,針對這種不確定性,作者分了兩類解釋原因,一類是數據的不確定性,另一類是模型解讀(搜索)信息的不確定性。數據的不確定性來源與兩個方面:內在和外在。
  • 如果人工翻譯一定會被機器翻譯替代,翻譯專業的學生現在怎麼辦?
    如果我們把注意力放在機器翻譯已經能做什麼,而不是不能做什麼,我們就會發現機器翻譯已經很優秀了,加上有能力找到應用場景並給出解決方案的人,可以覆蓋更多實際的應用場景。人工智慧替代某些人類職業的過程,就是一個個具體場景慢慢替代的過程。
  • 機器翻譯與人工翻譯之爭
    專家們對於機器翻譯的信心來自最新一代的翻譯技術——神經網絡翻譯。神經網絡翻譯打造的機器翻譯系統,採用了一系列新的學習手段來模擬人工翻譯。首先,利用人工智慧任務的天然對稱性進行對偶學習。當訓練集中的一個中文句子被翻譯成英文後,系統會將相應的英文結果再翻譯回中文,並與原始的中文句子進行比對,進而從這個比對結果中學習有用的反饋信息,對機器翻譯模型進行修正。
  • 谷歌翻譯高勤:神經網絡技術將主導機器翻譯的未來
    谷歌翻譯研發科學家高勤  中國網科技7月11日訊 谷歌翻譯研發科學家高勤在今天舉行的中國網際網路大會上介紹稱,谷歌翻譯在神經網絡機器翻譯技術上已經取得重要進展,並同時對機器翻譯技術在未來當中實際應用。他表示:「神經網絡機器翻譯和非專業人工翻譯已經相當接近,對於中英文互譯也取得最大提升。」  高勤在大會上稱,神經網絡翻譯技術與傳統翻譯技術有很大不同。傳統機器翻譯技術是基於短語統計機器翻譯拼圖過程,嘗試找出較好翻譯選項,而神經網絡機器學習屬於利用雲語言與目標語言信息,使整各翻譯過程變得連續且完整。
  • 百度機器翻譯實現大規模產業化,哪些行業會獲益?
    破除語言壁壘,讓信息實現低成本的有效交流,已經成為國家的「剛需」,因此網際網路機器翻譯也越來越得到各國政府和產業界的重視。近日,百度機器翻譯項目獲得2015年度國家科學技術進步獎。據悉該國家科技獎項含金量極高,代表了創新技術優勢和研發實力。況且國家科技獎一直遵守「寧缺毋濫」的原則,獎項評審都有嚴格的流程和時間節點,今年連諾貝爾獎獲得者屠呦呦都無緣國家最高科學技術獎。
  • 機器翻譯應用價值凸顯 百度翻譯豐富產品矩陣助力企業智能化升級
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。
  • 將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」
    神經機器翻譯有兩個關鍵技術,一個是 gating,另外還有一個是 attention,這兩個特別適合處理語言中長距離調序,生成的譯文要比傳統的方式生成的譯文流利很多。我們好像找到了打開人類語言寶庫的鑰匙,眾多公司和機構開始了對神經機器翻譯的研究。
  • 《陽光藏漢機器翻譯系統》應用效果良好
    西藏大學現代教育技術中心承擔的2012年西藏自治區重點科研項目——《基於短語的藏漢統計機器翻譯關鍵技術研究》,在藏語自動分詞與詞性標註、藏語語料庫、基於短語的藏漢統計機器翻譯技術等領域進行了深入研究