何中軍,百度機器翻譯技術負責人。本文根據作者2018年12月在全球架構師峰會上的特邀報告整理而成。神經網絡機器翻譯技術及應用(上)篇,我們為大家介紹了神經網絡機器翻譯的基本原理和挑戰,(下)篇繼續為大家講述機器翻譯的應用與未來。
前面我們講了機器翻譯的原理以及神經網絡翻譯的發展、以及面臨的挑戰,我們現在看一看,機器翻譯現在有哪些應用?
機器翻譯在越來越多地幫助和影響我們的生活。上圖中列出了幾個利用機器翻譯來進行日常學習和交流的例子。左邊兩位是明星,一位是電影明星,利用翻譯系統翻譯化妝品成分,一位是公交司機,利用翻譯APP學習英文,並運用到工作中去。右邊是交警、售票員利用機器翻譯與外國人進行交流。
這只是機器翻譯應用的一個縮影。隨著技術的發展和交流的需要,機器翻譯已經深切地融入我們的生活。
機器翻譯除了能做翻譯之外還可以做一些很有意思的事情,比如說白話文和文言文的翻譯,其實用的技術是類似的,從一種語言表達翻譯成另外一種語言表達,或者從一個字串變換為另外一個字串,甚至是從一幅圖產生文字說明,凡是這樣的工作都可以用機器翻譯的技術來做。
機器翻譯還可以做什麼,作詩。這是機器翻譯寫的兩首詩,大家可以看一下,右邊這個,「臘梅開時獨自寒,幽香一縷為哪般。東風不解相思意,吹落梨花雪滿天。」意境是不錯的。而它的原理也是機器翻譯的原理,從上一句翻譯到下一句,可以認為上一句是原文,下一句是目標譯文,然後再把第一句和第二句作為原文,產生第三句,這樣整首詩每一句的產生都是依賴於前面的信息,所以整體上就有一個語義上的連貫性。
這是利用機器翻譯做詩的原理圖。首先根據用戶輸入提取關鍵詞,並對關鍵詞進行聯想和擴展,繼而產生意境一致、連貫的詩句。
機器翻譯還可以做什麼,寫春聯。
這個對聯跟以往常見的對聯不太一樣的地方,是我們上聯、下聯和橫批全部都是機器產生的。以前的對對子,我出一個上聯,你對一個下聯兒,但是春聯這個有意思,用戶提供一個詞語,機器自動做出上下聯和橫批。 這裡左邊兩個是人名,第一個是雲鵬,分別出現在上下聯中第4個字的位置。第二個是黃渤,兩個字分別出現在開頭。最後這個,上聯中前兩個字是一個電影的名字。 可見機器翻譯有技術很多有趣的應用。
現在語音、圖像等人工智慧技術不斷發展,並取得了很大的進步,那麼能不能跟機器翻譯結合起來,創造出更多有意思的應用和場景呢?
第一個就是同聲傳譯,我把這四個字拆開來分析。『同』,就是表示時間延遲要短,為什麼同傳比交傳的工資高,就是因為它體現在這個『同』上,在我說話的同時,基本上翻譯結果就傳遞到觀眾那邊去了;『聲』用到的是語音技術,包括語音識別和合成;『傳』就是信息傳遞要準確,翻譯的時候得把我原本的意思表達出來;『譯』就是翻譯技術,對應到機器翻譯。正好這四個字包含了兩個要求、兩個技術。
那麼挑戰在什麼地方?我們來看下圖中的這個句子,這是一個語音識別的結果,那麼要把這樣一個語音識別的結果去做同聲傳譯,用機器把它翻譯出來,有哪些問題呢?
第一個問題就是有噪聲的問題。比如說有冗餘,我現在說話的時候可能就有冗餘,很多詞你是不需要翻出來的,或者是我的口語,或者是我有重複。另外一個就是識別錯誤,這裡面『種莊稼』識別錯了,人可能糾錯能力會更強,能知道是種莊稼。但是這對機器很難,這種錯誤直接影響翻譯質量,所以就需要建立一個更魯棒的語音模型和翻譯模型去做更好的容錯。
第二個難點是句讀、斷句和標點,剛才大家看了是沒有標點的(上圖),沒有標點的時候你不知道該在哪裡翻,該在哪裡停頓,所以我們應該給他加上標點,那這個問題可以看做一個序列標註問題來解決它。
第三個難點是時延,時延其實跟準確率是一個矛盾的概念,人們說話是有邏輯的,要想翻譯的準,我就可能得等到語義表達相對完整了再翻,但是那個時候很有可能就已經延遲了很長時間了,那這個時候那應該怎麼做?我們可以採取一個適當的預測技術,得到一個翻譯質量和時延的平衡。
另外一個應用是翻譯機。除了像剛才說的會議級別的同傳需求以外,另一個滿足我們日常交流的需求,我們出國的時候跟外國人可以自由交流。
出國面臨幾個痛點,一是上網,二是翻譯。我們這款翻譯機同時解決了這兩個問題,你可以用它上網,可以用它來翻譯,還可以用它來導覽。
從網上用戶公開的反饋來看,翻譯機在很多場景下對用戶幫助都非常大。比如說在乘車、在吃飯的時候,甚至是買藥。在買藥的例子中,這個人本身他是懂英文的,但是藥品的名字他不會,那他就用翻譯機把那個藥的名字翻譯出來。下面的例子,在酒店check in的時候,過安檢的時候,翻譯機都可以很好的幫助人們進行交流。
下面一個應用是我非常喜歡的,就是圖像翻譯。我去國外的時候有時會去博物館,我不太願意看大段的介紹說明,因為那上面的字很難看懂。有了這個功能以後,我去博物館裡,每個展品下面有一個說明,那麼我可以去拍一下,翻譯為母語進行閱讀。
上圖中的右邊是一個實物翻譯的功能,識別物品,並同時給出中英文翻譯,可以幫助我們進行雙語學習。
最後,我來總結一下,我畫了一個機器翻譯的立方體,用三個維度去表徵現在機器翻譯的發展,試圖衡量一下現在機器翻譯和人的翻譯都處在一個什麼水平。這三個維度,一個是翻譯質量,一個是領域,還有一個是語言種類,我們最終的目標是要右上角這個頂端,我們在所有的語言、所有的領域上都達到一個非常高的翻譯質量。
那麼人就是這個平面,我把它稱為專家平面,一個人是某一個領域的專家,可能是某一種語言的專家,比如說我是中英、化學領域的專家,那麼我就可以把化學領域、中英這兩種語言翻譯的很好。但是讓我翻譯中文到韓文,翻譯醫藥領域,我不懂這種語言、不是這個領域的專家,就翻譯的不太好。但是好在有別的專家,有的人可能懂好幾種語言,或者跨了好幾個領域,所以整個人類專家是分布在這個平面上的。
機器理論上來說,它可以做任何語言和任何領域的翻譯。但是它的翻譯質量顯然是不如人好,但是在某些特定的領域上我們可以進行一些領域的定製化或者領域的優化,它可以在某一個領域上往前推進,所以機器翻譯最終的目標是達到終級目標,當然這個路非常漫長。
50多年前,也就是在1964年的時候,有三位科學家寫了一本書叫《機器翻譯淺說》,提出了機器翻譯的幾個設想。
第一個設想,『有一天,當你在人民大會堂的時候,你會發現無論哪個國家的人在臺上講話,與會者都能從耳機裡聽到自己國家的語言。同時你會發現耳機裡翻譯的不是人,而是我們的萬能翻譯博士』。這其實就是自動同傳。
第二個設想,『此外,當你去國外旅行的時候,隨身可以帶一個半導體和其他材料製成的小型萬能博士。當我們跟國外,外國朋友交談的時候,博士就立刻給你翻譯出各自國家的語言』。這就是我們剛才講的翻譯機。
五十多年前的預言,其實現在已經出現在我們身邊了。當然還有一個預言,現在還沒有看到產品,就是翻譯印表機。比如說有一天在英國出版了一本新書,你把它放在這個印表機裡去,那麼出來的就是已經譯好的中文譯本、德文譯本、俄文譯本。
其實機器翻譯想做的事情,就是想讓人們在任何時間、任何地點,用任何語言可以進行自由的溝通。
百度自然語言處理(Natural Language Processing,NLP)以『理解語言,擁有智能,改變世界』為使命,研發自然語言處理核心技術,打造領先的技術平臺和創新產品,服務全球用戶,讓複雜的世界更簡單。