不久前,一場峰會的"AI同傳"風波,既讓人看到語音識別並不等於AI同傳,事實澄清之下,也讓人明白人工智慧翻譯機和人工同傳不是一個概念,那它的智能化又"智"在哪?"能"在哪?
AI這樣"聽懂"你的話
人類的溝通行為非常複雜,美國傳播學家艾伯特-梅拉比安曾對於溝通提出一個公式:
溝通時信息的全部表達=7%語調+38%聲音+55%肢體語言。
所以可以看到,一些朋友不懂幾句外語,憑肢體語言也能在多國旅行。而AI翻譯機的挑戰,是要從這"7%語調+38%聲音"裡去聽懂別人的說話。
尤其是語義本來就複雜,如漢語中一句話甚至一個詞在不同的場景有不同的意思。簡單的,比如315這個數字,在"今天是315"、"今天標間315元"這兩句話中,AI翻譯機需要準確譯出來,而不是從字面直譯。
另外還有口音影響和近音詞。如點餐時對服務員說:"我要水餃。"AI翻譯機是不會知道點餐這個場景的,所以它需要聽懂你是要水餃,而不是"睡覺"。
怎麼解決這樣的問題呢?先看看AI翻譯機的工作流程:
這個流程,包括了AI翻譯機的四個核心技術——語音識別、自然語言理解、機器翻譯和語音合成等,相應解決聽得清、聽得懂、譯得準、說得清等問題。其中,機器翻譯技術最為核心、最難攻克,被稱為"人工智慧皇冠上的明珠"。
現在的機器翻譯技術與深度學習結合,成為神經網絡機器翻譯(NMT)技術,其運行原理是讓機器自動從更大規模的語言資料中學習規則,而非直接利用給定的規則。
百度、谷歌、清華準兒等在這方面的技術優勢更為明顯。比如準兒翻譯機採用先進的TZ深度學習算法、TZ神經網絡算法,以5000多萬海外專有名詞、句式,對語音識別引擎、機器翻譯引擎進行訓練,越練越準,用戶也能越用越準。
現在的準兒翻譯機能聽說45個語種,57個國家的"方言",英語可細分到中、英、美、澳、印度、南非、愛爾蘭等9國口音,採用清華團隊自主研發TZ-NMT神經網絡翻譯技術,中日翻譯堪比日語一級水準,中英翻譯堪比專業八級水準。
更高的翻譯準確率,不可缺這兩大因素
同樣,由於人類語義的複雜、語言溝通的場景繁多,現在很難有一款可通用的AI翻譯機。如果有,那肯定是低翻譯準確率的代名詞,缺少市場應用價值。
從技術應用上來說,AI只有解決用戶在實際場景的需求才更有價值。所以,AI翻譯技術選擇什麼領域非常重要。
現實情況是,人工智慧翻譯機這一新興市場,吸引了包括科大訊飛、網易有道、百度、搜狗、清華準兒等科技網際網路巨頭紛紛入場,經過市場和用戶的檢驗,也形成了"南訊飛北準兒"領銜的格局。其中,清華準兒率先聚焦出境遊市場應用,推出全球首款帶屏AI翻譯機。
中國出境遊市場聚焦了億萬人出行時語言溝通不暢的痛點,需求解決更為迫切;同時,聚焦出境遊市場應用,也避免了通用型的翻譯語言在個性化的應用場景中"失真",翻譯準確率也會更高。
準兒翻譯機的第一代產品,在同品類中就有領先的翻譯準確率,中譯英的準確率達97%以上;在出境遊市場的復購率就能達到70%,日調用100.4次,最高一月調用率達到15000+次,成為出境遊市場的高頻應用。
除了聚焦場景應用,採音水平很重要。
在特別嘈雜的場景,差距30公分語音識別效率會大幅度下降。為了提升採音效果,主流高端品牌如蘋果7、華為Mate10這樣的高端機型才會配置的。
準兒翻譯機就自主量身研發了Dsmart4麥列陣降噪技術,用來解決環境降噪、定向增強、回聲消除等問題,可以實現"多人聲音定位"。不久前的香港環球資源移動電子展上,準兒翻譯機被美、英、加、日、 韓、印等全球頂級買家現場求購,用於展會這種嘈雜場景中的商務交流,其採音效果又一次經受了考驗。
好的翻譯機,更能,更智
從市場上多款2.0版機型來看,訊飛翻譯機2.0、準兒翻譯機Fly、網易有道翻譯王Pro、搜狗翻譯寶Pro等,在翻譯功能上變得更"能",不但所支持的語種、口音數量繼續升級,在離線翻譯、拍照翻譯等功能上發展也很快,儘量滿足多種情況下的語音圖文翻譯需求。
同時也看到,這些2.0版機型功能更加豐富,變得更全能。如支持多種形式的全球聯網,加強外語學習功能。在個性化項目上,訊飛曉譯翻譯機2.0帶付費的人工翻譯功能,準兒翻譯機Fly及8月上市的準兒翻譯機Pro支持全球景區導覽。
更重要的是,這些新機型大都配備AI語音助理功能,通過通過語音操控,一句話就可以讓語音助理查詢天氣、匯率、調整音量等,準兒翻譯機還能基於LBS查詢獲取周邊購物、住宿、餐飲、藥店、景點等服務推薦,還有AI識物拍照功能。
雖然這只是開始,但是AI技術的多極應用,會讓AI翻譯機更有AI範,更多的功能、更智能化的操作會成為行業發展的風向標。未來的AI翻譯機,會更智,更能。