來源:站酷海洛
AI翻譯要想超越人類,就必須達到美劇《西部世界》裡的強人工智慧水平,否則機器翻譯仍將長期扮演輔助者的角色。
文 | 《中國企業家》記者 張弘
編輯 | 徐曇
近日,一篇關於「科大訊飛AI同傳造假」的爆料帖將科大訊飛推上了輿論的風口浪尖。
9月20日,一位自稱在現場的同聲傳譯員爆料稱,科大訊飛在近日舉辦的一次會議上採用的「智能翻譯」並非採用AI翻譯,而是機器識別同傳說出的譯文後,再將譯文投放到屏幕和直播中,直播中播出語音合成的人聲。
該同傳譯員還稱,科大訊飛事前並未告知他和搭檔會場有語音識別的字幕,也沒有告訴他們直播的同傳是機器朗讀二人翻譯文稿,沒有徵得二人同意就冒名使用了他們的翻譯成果,有侵犯智慧財產權的嫌疑。
這給外界造成一種「所有的成果都是AI翻譯」的錯覺,而忽略了同傳譯員們的背後付出。很快,同傳的圈子議論紛紛,有人認為這樣的做法在很大程度上剽竊了同傳譯員的工作成果。 「實際上,這種做法可以理解成機器只是發揮了一種作為速記和錄入的功能。」一位不願具名的人士稱。
9月21日,科大訊飛回應稱,沒有提到AI同傳,並沒有造假吹牛,目前的情況是一個誤會,「科大訊飛從來沒有把同傳翻譯包裝成機器翻譯。」
9月26日,科大訊飛在其微信公眾號發布一篇《真金不怕火煉,科大訊飛沒有造假》的文章再次澄清,科大訊飛沒有造假,從未「隱瞞」轉寫同傳聲音,「人機耦合」不僅是技術發展的趨勢,更是社會倫理發展的要求,公司將用法律武器維護公司聲譽。
文章進一步解釋稱,在為期兩天的會議過程中,科大訊飛一直按照既定方案進行會議支持,上會的是「訊飛聽見」,而非「機器翻譯」。發帖的同聲傳譯在現場看到兩張屏幕,一張顯示演講者演講的英文文字,一張顯示同聲傳譯的中文文字,但這並不代表科大訊飛只有「轉寫功能」,沒有「機器翻譯」功能。
據劉慶峰介紹,目前AI翻譯包括全自動機器翻譯和人機耦合同傳兩種模式。在9月17日舉辦的2018人工智慧大會上,現場十餘位嘉賓的發言只有三位用了人機協作轉寫同傳老師語音的方式,其餘均採取全自動機器翻譯。
科大訊飛相關工作人員告訴《中國企業家》,此次風波讓很多人誤解科大訊飛只有轉寫,沒有翻譯技術,而科大訊飛的翻譯技術在國際上處於領先地位。
科大訊飛董事長劉慶峰在不同場合曾表示,人機協同、人工智慧+行業,才是未來人工智慧最有希望做成的。
Rokid AI實驗室負責人高鵬博士告訴《中國企業家》,以目前的語音技術水平而言,在日常場景下使用AI翻譯沒有多大問題,但在一些嚴謹的政治、學術會議等場合,並不能完全實現AI同傳,機器只是一種輔助。所謂「人機輔助」,在某種程度上可以減少一些人工重複性的工作,但整體而言,目前的AI翻譯並未解決核心的技術問題。
AI翻譯取代同傳?
AI翻譯是否會取代同傳?隨著AI的火爆、機器翻譯技術的進步,這個問題一直備受同傳行業關注。
「起初,擔憂被機器搶了飯碗,還有點牴觸,後來覺得還是順應時代的發展,未來是屬於人工智慧的。」 一位從事同傳8年的人士告訴《中國企業家》。
也有同傳人士對此表示不足為懼,「AI並不會對我們構成什麼威脅,我們有自己的專業壁壘。」 另一位同傳人士告訴《中國企業家》。
不可否認,在一些涉及政治、技術、學術等會議場合,依然需要專業的同傳人員。「我們不僅要翻譯字面本身的意思,有時還要傳達出演講者本身的意圖、態度和立場,但機器目前卻無法實現。」 上述同傳人士稱。
以目前的AI發展水平來看,AI翻譯廣泛應用於一些非專業場景比如日常翻譯、交流,準確率相對較高,「已經有了大量的樣本存在。但在一些對於容錯率極低的政治、學術等專業領域的翻譯則比較困難,翻譯的準確率並不夠高,很難達到專業場景的要求」。高鵬說。
科大訊飛曾表示這些問題的存在,恰恰是他們探索「人機耦合」道路的另一個原因:讓機器成為同傳的助手,提升同傳工作效率和準確度。
但目前技術層面的突破依然存在很大難度。據高鵬介紹,目前AI語音翻譯涉及三種技術:語音識別、機器翻譯、語音合成轉寫。目前較難的兩項技術突破在於語音識別和機器翻譯。
目前AI翻譯的原理,一般是先通過語音識別將發言人的聲音轉寫成文字,再通過機器翻譯得到目標語言的文字,最後通過語音合成獲得目標語言的聲音。
近幾年,谷歌、微軟、IBM、百度、科大訊飛等都成立了機器翻譯團隊從事相關研究,設法打破語言障礙。
據了解,目前機器翻譯的主流方式叫「統計翻譯」,基本原理是從語料庫大量的翻譯實例中自動學習翻譯知識,然後利用這些翻譯知識自動翻譯其他句子。比如為了讓機器順利實現中英文之間的翻譯,首先需要收集大量中英文雙語句對,然後使用計算機從這些雙語句對中統計並學習翻譯知識。
但對於一個優秀的機器翻譯系統而言,對於詞的翻譯知識、短語的翻譯知識、語法結構的翻譯知識、語義的翻譯知識等等全部都要掌握。「現階段很難說AI翻譯取代了人工同傳,業內使用人工同傳是非常普遍的現象。」高鵬說。
業內人士認為,雖然現在可以通過一些實用的技術讓機器去模擬人的智能活動,模擬人對語義的理解。但相對於徹底的人工智慧和語義理解,還有相當長的一段路要走。
科大訊飛董秘、高級副總裁江濤表示,儘管機器翻譯獲得發展,明年能達到英語專業8級的水平,但依然沒辦法代替同傳。「如果有一天機器真的能夠實現準確的實時翻譯,它們的角色更可能是輔助相關產業的工作人員更輕鬆、便捷地開展工作,而不是取代他們。」
AI技術尚不完美
一方面,要讓機器不斷地學習翻譯知識,另一方面,目前的語音識別技術的發展也面臨著很大的瓶頸。
據了解,由於語音識別技術的很多難題仍處於實驗室研究和學術界討論階段,尚未完全投入到產品和具體的場景應用中,「還沒達到真正可以使用的水平」,高鵬說。
當前正處於弱AI階段,「目前語音識別的準確率較高,理想狀態下雖然可以高達98%。但仍存在口音、距離、幹擾、混響等方面的問題,這些並非短期內能夠解決的。」
高鵬介紹,在語音識別這一環節本身存在一些識別錯誤,機器通過語音識別這一環節後,仍會存在錯誤。「加上翻譯本身也存在準確率問題,在翻譯過程中可能會在原有的錯誤的基礎上增加5%-10%的錯誤。」
2017年,劉慶峰表示,現階段人工智慧技術發展不需要「被神化」,雖然目前機器翻譯在衣食住行等常用生活用語上的中英翻譯可達到大學六級的水平,能夠幫助人們在一些場景處理語言交流的問題,但「距離會議同傳以及高水平翻譯所講究的『信、達、雅』還存在很大的差距。」
此前,多位AI行業人士告訴《中國企業家》,弱AI階段的語音識別技術還不夠完美,存在諸多瓶頸。京東叮咚音箱科學家湯躍忠在接受本刊採訪時稱,目前語音識別、語音合成、自然語言理解、降噪、喚醒等技術僅僅達到可用的程度,尚未達到令交互的用戶十分滿意的階段。而前期研發投入時間和精力最多的就是語音識別、喚醒率、聲音合成等核心技術。
人類語言是非常複雜的體系,與人類獨有的思維模式密切相關,如果科技發展不能在模擬人類思維模式方面實現質的飛躍,那麼也就無法在機器翻譯領域超越人類。
看來,AI翻譯要想超越人類,就必須達到美劇《西部世界》裡的強人工智慧水平,否則機器翻譯仍將長期扮演著輔助者的角色。
。END 。
值班編輯:楊倩 審校:武昭含
[ 推薦閱讀 ] 點擊圖片即可閱讀
2018(第十七屆)中國企業領袖年會
企業領袖 思想風暴 商業前瞻 私享機會
12月1日-2日 | 北京·中國大飯店
年度經典巨獻
一次觸摸前沿的價值機遇
▼
點擊即刻報名