昨天上午,「騰訊同傳」參與了2018博鰲亞洲論壇分論壇「未來的生產」的現場中英雙語翻譯,這是已創辦17年的博鰲亞洲論壇,首次嘗試在開幕式及部分論壇現場使用AI同傳翻譯技術。
意外的是,僅僅第一天,就有傳言稱「騰訊同傳」出現翻譯錯誤,不得不求助於人工同傳的消息,還貼出了截圖。
對此,騰訊官方闢謠稱,這是個烏龍事件,外界提及的邀請人工同傳,並非「騰訊同傳」團隊用於此次海南博鰲的現場AI同傳,而是用於服務騰訊新聞團隊北京直播間的專業報導。
騰訊承認,面對博鰲亞洲論壇複雜的語言環境和高大上的專業內容,「騰訊同傳」確實出現了錯誤,答錯了幾道題。
首先是以下流傳最廣的小程序截圖,官方稱之為「大面積單詞無意義重複、大小寫及字符混亂」現象。
出現這個問題,主要是中英雙語切換頻率的問題。當聲源在兩種語言之間不斷轉換時,後臺中、英文識別引擎就會同時開始工作,這會導致兩種識別引擎互相「掐架」,而翻譯結果卻只能選擇一種語言進行輸出,再加上對嘉賓每個語氣詞也做了精準的啊啊啊翻譯,導致引發錯誤。
另一個需要承認的錯誤是下圖中出現的「for for for × n」現象。
出現這種情況主要是包括神經網絡機器翻譯在內的深度學習算法,在原理上或多或少都有一定不確定性,在特定的情況下有一定的概率引發翻譯偏差。今天的嘉賓演講內容中包含「for for for for」、 」that’s that’s that」等重複內容,而翻譯引擎不巧放大了這個重複,導致了翻譯結果出現錯誤。
騰訊表示,作為創新孵化和落地的AI產品,「騰訊同傳」還在不斷學習和成長當中,但是不足就是不足,不足的地方就要繼續加強學習。我們沒有殺一個程式設計師,也沒有砸一臺伺服器祭天,這次做錯了題,我們會繼續學習提升。