機器翻譯 取代譯員不是夢

2021-01-18 手機鳳凰網

當你興致勃勃地在網際網路上找到自己想要的資料時,面對一堆堆不認識的單詞或符號,會是怎樣一種心情呢?

科技的發展會幫助我們解決這種尷尬。過去十年來,技術使機器翻譯得到了革新,通過人工智慧計算機,機器翻譯的能力越來越強,利用軟體瀏覽各種語言網站的夢想正在實現。眼下,新的研究還在不斷湧現。最近,南加州大學的科學家們利用軍事中的密碼學,把翻譯視為一種「解碼」過程。科學家表示,這種技術不但能翻譯各種語言,甚至能破譯海豚音和「外星人語言」。

發展過程

近十年才有突破

「科學家從上世紀50年代就開始研究機器翻譯,但長期以來這項研究並未取得大的突破。」南加州大學的計算機科學家凱文·奈特說,最早,他和他的同事採用計算機編碼方式,讓機器進行翻譯,但效果很差,電腦完整翻譯一頁內容需要一年時間。

「早期的機器翻譯,比較像字典,計算機僅進行一個字一個字的轉換,加上一些簡單的語法規則。」谷歌翻譯研發經理陳雍昇說,上世紀80年代個人電腦開始普及之後,機器翻譯的技術才開始有了突破,不僅語法處理變得更為複雜完善,統計式的機器翻譯技術也初步被使用。

十年前,機器學習的翻譯方式開始出現,這是一種人工智慧,機器自己可以學習,可以像人學外語一樣,逐漸掌握語言的規則模式。凱文此前的同事,南加州大學的首席科學家弗蘭茲·奧切加盟了谷歌公司,令谷歌翻譯上升到新的高度。現在,在網頁上只要按一個谷歌翻譯鍵,網頁整段文本就會立刻變成需要的文字。

「谷歌翻譯是往計算機內輸入大量的文字文本,包括原語言的文本,以及對應目標語言人工翻譯的文本,」陳雍昇說,這兩種語言文本,稱為「平行語料」,機器會對海量的文本進行學習,查找各種語言模式,通過統計計算得到認為最為準確的翻譯結果。

「這就好像聯合國開會時,機器坐在翻譯員後面看翻譯員怎麼翻譯,一邊看,一邊學習,看了比如一萬遍後,機器就知道該怎麼翻譯了。」凱文說,他們實驗室所做的主要研究也和谷歌翻譯的類似。

翻譯原理

「機器像猴子一樣聰明」

機器在學習過程中也需要老師,此時人類可以告訴機器一些語法規則。比如,英語中介詞放在句子後面,中文卻在前頭,中文說「我在美國工作」,英語則是「我工作在美國」;阿拉伯語更不同,不是「主謂賓」結構,而是「謂主賓」結構,更像是「工作我在美國」。一個人很難掌握好這些規律,但只要往計算機中輸入這些規則後,翻譯機器很快就明白了。

此外,一些詞彙有很多詞義,比如英語中的「bank」,可以指「河岸」,也可以指「銀行」。在這種情況下,機器可以通過對上下文的查看做出判斷,如果上下文中有「船」這個詞,機器就會翻譯成「河岸」,如果有「取款」這個詞,機器就會翻譯成「銀行」。

凱文說,比較難的情況是遇到中文成語。給外國人講一個成語往往得講完一個故事,但是計算機遇到成語第一次可能比較麻煩,之後就不難了。另外一個難處是比較長的詞彙,在一些語言如芬蘭語中,往往有著超過16個字母的詞語,這時,機器就必須對其進行拆分,然後再進行翻譯。「機器像猴子一樣,很聰明。」凱文說。

技術缺陷

「英譯漢好過英譯日」

機器翻譯雖然已經和十年前大不一樣了,但依然存在很多缺陷。

同一個系統的語言比如英語和法語,因規則相近,所以較好翻譯,但不同的語言系統就難了。在凱文等同事的研究中,「英語翻西班牙語很棒,英語翻漢語還行,英語翻日語就很差。」凱文說,「這就像人一樣,我在日本呆了三年,日語還是不行,但學了兩年漢語後,感覺已經可以了。」

陳雍昇表示,機器翻譯依託龐大的平行語料庫,有時會遇到一種語言和另一種語言之間翻譯語料不足的情況。陳雍昇說,還有很多的技術難度需要解決,比如同義詞的判斷,如旅「行」和銀「行」的「行」字意義不同,再如分詞的判斷,如「如果」和「汽水不如果汁好喝」裡的「如果」意思不同,另外,還有同樣內容的文檔進行段、句、詞、字的對齊等,都是機器處理的技術挑戰。

不過,正是因為機器有著自我學習的智慧,隨著計算機技術的進步,機器翻譯會變得越來越好。

新方法

可破解「外星人語言」

就像一個外語學習的人坐在一大堆外語教材和字典之前一樣,機器學習的基礎就是得有大海一樣的文本材料供其學習。但是世界上有4000種語言,大部分語言是不常用的,沒有那麼多的文本,那怎麼辦?

同樣是南加州大學的科學家,凱文的同事蘇吉斯·拉維想到了一個新的辦法。

6月19日至24日在美國俄勒岡舉行的計算機語言學年會上,他提交了一種全新的機器翻譯方法。

這種方法叫做「解碼外語」,之所以叫「解碼」,是因為他們把英語視為一種初始語言,需要翻譯的外語類似一種加密後的高級文字,通過解碼破譯,把外語「破解」,變成英語。

在每種語言中,都會有一些常用詞彙,比如漢語裡的「這個」、「那個」,這些詞彙出現的頻率在各種語言中都是最多的;很多詞彙,各種語言都可以互換,將其視為一種加密的詞語;此外,還有少數詞彙,其他語言中沒有對應,研究者將這三種詞彙列為不同的計算常數,統計比較其出現的頻率,按照一定的算法進行轉換,並通過不斷調整,得出最佳的翻譯結果。「通過這種破譯方法,計算機就可以甩掉所有的文本資料,無需進行學習,也無需背負辭海,只要輕裝上陣,像軍事家一樣,就可以把一種新的語言破譯」。

拉維表示,這種翻譯方法目前只能翻譯一些短句或電影字幕,尚未運用到長句或片段翻譯中,但是,它給機器翻譯打開了一條新的思路,可以運用到任何一種語言中。因為不需要任何既有的文本為基礎,這種翻譯方法今後甚至可以對「外星人語言」或「海豚音」進行破譯。

採寫/本報記者 金煜

■ 翻譯對比

原文:21世紀什麼最寶貴?人才。 

參考翻譯:what is the most expensive commodity in 21st century? Talent.

谷歌翻譯:What the 21st century the most valuable?Talent.

愛詞霸翻譯:The 21st century? What is the most important people.

雅虎翻譯:The 21st century what is most precious? Talented person.

必應翻譯:What do 21st century most valuable?Talent.

百度詞典(有道翻譯提供):What is the most precious in the 21st century? Talents.

原文:My love is like a red, red rose,that's newly sprung in June. 

參考翻譯:啊,我的愛人像一朵紅紅的玫瑰,在六月裡苞放。

谷歌翻譯:我的愛就像是一個紅色的,紅色的玫瑰,那是在六月份新湧現。

愛詞霸翻譯:我的愛是一樣的一個紅色,紅玫瑰,的新彈在六月。

雅虎翻譯:我的愛是像紅色,紅色rose,that在6月最近被反彈。

必應翻譯:我的愛就像紅色、紅色 rose,that 新開在六月。

百度詞典(有道翻譯提供):我的愛就像鮮豔的紅玫瑰,六月裡迎風初放。

原文:夕暗迫る雲の上,いつも一羽で飛んでいる 

參考譯文:暮色蒼茫的雲層上,一隻悲滄的鷹孤獨地翱翔。

谷歌翻譯:在晚上關閉黑暗的運氣,總有一個在恩戴飛的鳥。

必應翻譯:晚上暗拉說,總是在羽毛飛了。

相關焦點

  • 傳神雲譯客深挖「全球譯員寶藏」 滿足譯員翻譯新體驗
    隨著人工智慧的高速發展,人工智慧如何影響翻譯行業?是取代?是顛覆?還是重構?因此,整個市場對於新環境下的譯員提出了更高的要求,特別是人工智慧的發展,機器引擎的加入,譯員的作用和價值將會被重新定義。  誠然,機器引擎的引入+知識庫大數據的不斷發展會使整個翻譯市場的環境發生改變,但並不會致使傳說中的「機器取代人」情況出現。
  • AI 翻譯能夠取代人類?微軟:看翻譯官大戰機器翻譯,人類贏了
    科技資訊一手掌握,關注阿逗黑科技,了解最新黑科技最近,在大洋彼岸的速譯團隊,給阿逗發來了國外最新鮮的科技資訊,人類大戰機器人翻譯。不是柯潔與阿爾法狗圍棋的人機大戰,而是人工智慧對戰翻譯。1.微軟:機器翻譯已經能夠和人一樣的質量和準確性最近,微軟公司宣稱其機器翻譯服務可以達到「和人一樣的質量和準確度」。這不禁讓人感到人工翻譯產業正處在經歷重大崩盤的風口浪尖上。但是阿逗覺得微軟的這一說法很令人生疑。更站不住腳的是,這是微軟用自己定義的標準來評估自己的產品得出的結論。那麼,翻譯官們應當怎樣打贏和機器翻譯的這場仗呢?
  • 利用「AI+譯員+網際網路服務」 語翼在線人工翻譯平臺火了
    在網際網路科技時代,得益於統計和深度學習技術,讓機器理解語言正逐漸實現。一些科技公司紛紛布局機器翻譯,並推出了在線翻譯系統。機器翻譯解決了語言翻譯的時效性問題,滿足了大多數普通用戶的翻譯需求。再加上能解決專業翻譯需求的傳統翻譯公司,看起來整個翻譯市場似乎沒有了漏洞。但是一個需要專業翻譯和高性價比的群體卻被忽略——中小企業。
  • 探測機器翻譯的「溫度」
    不少信息技術公司推出了一系列機器翻譯系統及實體翻譯終端,不斷顛覆著人們所熟知的「紙—筆—人」的傳統翻譯模式,為翻譯行業注入了新的活力,同時也為世界不同語言地區的經濟貿易、跨文化交流等帶來巨大便利。隨著機器翻譯的不斷發展,機器翻譯將取代人工翻譯之言論甚囂塵上,一些翻譯從業者對自身的發展前景充滿了焦慮,並對機器翻譯本身具有「排斥、恐懼」的心理。
  • 機器翻譯崛起後,人工翻譯何去何從?
    它輔助人同時又「取代人」。人與人、人與技術、技術與技術之間在商業逐利下不斷上演淘汰與進化,沒有誰敢停下。,向公眾和科學界展示了機器翻譯的可行性,從而拉開了機器翻譯研究的序幕。美國、蘇聯及歐洲等國家一時間掀起了機器翻譯的研究熱潮,直到美國語言自動處理諮詢委員會在為期兩年的綜合調查分析和測試後,發布了全面否定機翻可行性的報告《語言與機器》,彼時各國機翻的熱潮退去,陷入蕭條。沉寂10多年後,隨著全球化的發展,機器翻譯的研究再次被提上日程。
  • 機器翻譯人機PK實況:谷歌、有道、百度、搜狗,哪個像專業譯員?
    新智元報導 作者:胡祥傑【新智元導讀】 不得不說,機器翻譯已經和人類水平相差無幾,現在要判斷一段文字是機器翻譯的還是人類翻譯的,難度越來越大了。不信?去試試。最近,我們注意到,有一個叫做「試譯寶」的微信公眾號發布了一個機器翻譯人機PK:具體規則是給出三道題,每道題包含對一句話的四個版本的翻譯(其中有一個答案是人類譯員給出),參與者需要從這四個選項中選出一個自己認為最可能是人類譯員提供的答案,選對了為人類加一顆星,選錯了機器加一顆星。
  • 翻譯的過去與未來:機器翻譯會取代人工翻譯嗎?|周末談
    此後中國的翻譯事業繼續蓬勃發展,魯迅、郭沫若、瞿秋白、傅雷、楊絳、草嬰、朱生豪、錢春綺、柳鳴九......一個個閃光的名字為中外文化交流搭建起橋梁。翻譯的未來機器能否取代人工翻譯隨著科技的迅速發展,機器翻譯的使用越來越普遍,其準確度也在不斷提高,對翻譯行業構成了一定衝擊。
  • 你還在擔心機器翻譯不好用?看看AI時代譯員怎麼翻譯術語吧!
    翻譯不是簡單的語碼轉換,而是一種真正意義上的跨語言,跨文化交際。無論哪個行業,都有其專屬的專業術語。當你接到一個翻譯任務,這裡一個whereof(古體詞)、那裡一個addiem(外來詞),後面又來了一堆組織機構名稱,這些平時很少用到的詞全集中在這一份稿件裡,相信很多不熟悉這個領域的小夥伴一定會一臉蒙圈。面對含有大量術語的稿件你會怎麼做?
  • 未來的世界:機器翻譯VS人工翻譯
    蔡基剛:在特定領域的機器翻譯替代人工翻譯是技術發展的必然趨勢,而且在醫學、生物、法律、航天、海事等專業領域裡的機器翻譯取代大部分人工翻譯將是最近幾年的事情。這個語料加工的技術層面工作,可以讓專業人員(懂英漢兩種語言的法律專業人員)和語言服務專家完成,包括對機器翻譯的譯文進行與原文的比較和校對,然後修改後輸回機器,再讓其進行再學習翻譯,再修改和完善語料庫文本。這樣,隨著機器翻譯實踐的不斷增加,這款專業翻譯機器的準確率達到90%甚至以上不是不可以做到的。翻譯內容越專業,場景或任務越固定,標準越統一,翻譯準確率就越高,替代人工翻譯不是不可能。
  • 為什麼說人工智慧永遠也取代不了「翻譯」
    翻譯這個行業難道就真的如車夫、打字員等一樣要被取代了嗎?到現在,科技的進步讓機器翻譯日臻完善,CAT軟體也蓬勃發展,往日簡單的陪同翻譯都完全可以被一部手機一個app取代!一直以來被視為翻譯頂點的「同傳」(Simultaneous Interpretation)也眼見快被突破(阿里巴巴集團將在今年雙十一展示多語言同步翻譯)!
  • 網絡時代的譯員,應該知道哪些翻譯技術?
    在信息化與全球化的催動下,當今翻譯活動的工作領域、工作內容、工作形態以及工作手段已大大超越了傳統模式,皆發生了劃時代的革命性變化,翻譯行業可謂正在經歷一場數字革命。  信息技術的運用是翻譯數字革命的主要特徵,主要表現為計算機輔助翻譯(CAT)技術、本地化工程技術、語料庫技術、翻譯協作平臺技術、機器翻譯技術等的普及。
  • 知乎高分問答:法律翻譯不容易被AI取代?
    在人人唱衰「機器翻譯終將取代人類」的今天,隨著AI在翻譯領域的廣泛應用,不少人對翻譯的就業前景堪憂。「現在AI都這麼厲害了,我可不敢學英語」「學了外語,機器翻譯來了就失業了」的聲音比比皆是,甚至在知乎上也引起了廣泛討論。
  • 專業翻譯公司譯員西語理解,西班牙語翻譯公司譯員做西語對照示例
    今天為大家帶來一篇關於專業翻譯公司譯員西語理解,西班牙語翻譯公司譯員做西語對照示例文章,這篇文章是道壹翻譯庚老師個人感悟,歡迎大家一起交流。西班牙語翻譯公司譯員做西語對照示例:西班牙語EndemismosEn general fas familias Asteraceae, Cactaceae y Fabaceae endemismos.
  • 為川普當翻譯難倒各路譯員:他說的簡直不是英語
    去年4月,她還為時任國務卿蒂勒森擔任過隨行翻譯。美國《大西洋月刊》稱,在重大外交場合下,國家領導人的翻譯往往扮演著「安全閥」的重要作用——他們不僅要進行語言轉換,還要對講者的措辭和信息準確度進行實時把關。能為歷任總統效力的多為資深譯員。
  • 2019年總結:人工翻譯公司會被機器翻譯取代嗎?
    當您聽到「機器翻譯」時,您會想到什麼?你覺得結局即將到來嗎?您認為翻譯的終結是一種職業嗎?您認為機器接管後會失業嗎?技術,人工智慧和機器學習的進步正在帶來一場競爭和挑戰,在這方面,員工需要更加智能,認識並理解要取得的進步,才能邁出新的一步。神經機器翻譯(NMT)的輸出越來越好。
  • 機器翻譯什麼時候會取代人工翻譯?知行翻譯公司:絕不可能
    機器會取代人工嗎?知行翻譯公司覺得這應該是這幾年在翻譯行業談論最多的一個話題。誠然,自第三次工業革命以來,網際網路行業的變化可以用日新月異來形容,並且還在以肉眼可見的速度發展著。對於翻譯這個相對傳統的行業來說,網際網路也沒有放過,隨著人工智慧的不斷進步,機器翻譯的能力不斷被鍛鍊成長,人工翻譯被取代的呼聲越來越大,今天知行翻譯公司想探討一下機器翻譯是否真的會取代人工翻譯?
  • 翻譯+網際網路=?翻譯平臺語翼用「DNA」匹配譯員
    「語翼Woordee」主要是一個基於 SaaS 的在線翻譯平臺,主要包括兩個部分,DNA 匹配譯員系統和翻譯過程管理系統。 語翼團隊出身於傳神語聯網出身,傳神語聯網是目前 Common Sense Adviser 統計中中國排名第一,亞洲第三的翻譯企業。
  • 人工翻譯是否會被機器翻譯取代
    版權系晨輝翻譯所有,如需要轉載,請聯繫晨輝翻譯!隨著科技的發展,翻譯機的誕生,解決了很多的問題。甚至很多地方都在使用機器翻譯,但是在某些專業領域上仍然很難實現意義上的改變。智能翻譯機真的有那麼厲害嗎?人工翻譯真的有那麼不堪嗎?
  • 原來機器翻譯可以這麼高效,術語詞典了解一下
    所謂「技多不壓身」,能熟練地運用機器翻譯技術進行翻譯,那麼譯員工作起來就能事半功倍。對於譯員來說,翻譯行業中針對不同行業的文稿有著不同的翻譯標準。譯員在翻譯過程中,經常會遇到公司名稱、品牌名稱、產品名稱等專有名詞和行業術語,以及不同含義的縮寫。對於這些特殊詞彙,大多數機器翻譯引擎很難翻譯得準確,經常需要反覆訂正。工欲善其事,必先利其器。
  • 北外李長栓教授:機器翻譯多大程度能替代人工翻譯
    「人工智慧的發展非常迅速,翻譯的準確性越來越高,以至於有人擔心譯員是否會失業,甚至有的家長擔心孩子學習外語專業,將來找不到工作。本人的判斷是:機器翻譯可以極大方便人們獲得國外的信息,提高專業譯員的工作效率,但要想進行深度思想交流,還是必須依賴人工翻譯,最好是直接學習外語。