智能語音技術如何拯救翻譯機:翻譯機的技術抉擇和優勝略汰

2020-12-27 雷鋒網

雷鋒網按:智能語音技術經年之後的不斷完善,尤其是隨著語音識別準確率的不斷提高,基於智能語音技術的智能硬體紛至沓來,除了智能音箱一再受眾人追捧外,智能翻譯機也悄然逆襲,併入這條快車道。

不同於智能音箱因沒有明確的應用場景備受詬病,智能翻譯機倒是有諸如商務會議、出國旅行等針對性較強的應用場景,由此帶來的則是對深度學習算法更高的要求。

機器翻譯系統:RNN、CNN、transformer

智能翻譯機的技術基礎說到底還是智能語音技術,這一點與智能音箱極為相似,其中,神經網絡翻譯系統尤為關鍵,各大廠商紛紛針對這一系統進行自研,諸如谷歌的GNMT、科大訊飛的INMT、搜狗的SNMT等。

用於機器翻譯的神經網絡系統最為經典的基礎技術可以歸為兩類——RNN(循環神經網絡)和CNN(卷積神經網絡)。主要區別在於兩類系統的執行順序不同,採用RNN神經網絡的機器翻譯系統是順序執行任務,在進行翻譯工作時,要對整個句子從左到右或從右到左依次執行,精準度較高,但無法充分應用系統硬體GPU的並行運算能力;採用CNN神經網絡的機器翻譯系統則是並行執行任務,計算效率更高。 

CNN卷積傳輸示意圖

雖然採用CNN的系統的計算效率更高,但是在做機器翻譯時採用CNN的神經網絡系統一直不如採用RNN的神經網絡系統,尤其是在翻譯精準度上差強人意。因而,長久以來,諸多做翻譯機的公司雖然對RNN和CNN都在跟進研究,但是各家產品中使用的翻譯系統仍是基於RNN架構的較多。 

2017年5月,Facebook的FAIR團隊提出一種使用全新CNN架構的fairseq,官方給出的數據是比基於RNN架構的機器翻譯系統的速度高出9倍,同時,準確性也是當時最好的。這在當時也一度被認為是機器翻譯系統技術的一個轉折點。據雷鋒網了解,就在1個月後,谷歌在發表的《Attention is all you need》論文中提出了不使用CNN及RNN的transformer架構,官方表示採用該架構的機器翻譯模型實際效果超越了當時所有公開的機器翻譯模型。

 

在技術角逐的同時,也不乏有科技公司的產品跟進。例如搜狗於2017年7月上線了基於transformer的機器翻譯系統模型,在解決了transformer機器翻譯系統模型原生系統解碼器解碼速度慢的問題後,將速度提升了8倍,並可以運用到離線翻譯功能。

 

另外,技術之間各有優勢也是必然的,尤其是在還沒有一個成熟的技術時,做產品和技術研發適度整合多種技術也是必由之路。例如搜狗在跟進transformer機器翻譯模型的同時,仍然在用CNN做語音識別上的訓練,搜狗語音交互技術中心研發總監陳偉在參加對外活動時曾提到:在做語音識別時,搜狗用50層CNN結構得到語音識別模型,基於此模型,訓練離線語音識別模型。

產品形態:手機、耳機和翻譯機

翻譯機的產品形態主要有三大類;翻譯機、翻譯手機和翻譯耳機。

現在主流市場還是將翻譯機做成智能硬體單品,例如科大訊飛的曉譯、有道翻譯蛋等,但是市面上較為高端的翻譯機價格都在千元左右,科大訊飛的曉譯2.0價格標定為2999元,這其實已接近市場上中高端手機的價格,因而,還是吸引了以智能翻譯機為主導功能的智慧型手機的入局。2018年6月,國內糖果手機推出糖果S20,支持語音翻譯、拍照翻譯、104種語言、離線翻譯,提供24小時在線人工翻譯服務,將翻譯機功能再度整合到手機中。

耳機類翻譯機最初在國外較為流行,如谷歌的Pixel Buds翻譯耳機、Waverley Lab的Pilot翻譯耳機,通過藍牙與手機中的翻譯APP相連,硬體思路類似藍牙耳機,這類產品更多地考慮到手機翻譯機帶來的便捷、禮儀、衛生的問題,解決了場景應用中的一些尷尬局面。

具體各類翻譯機產品,雷鋒網整理如下表:

智能翻譯機產品五花八門,也很難說今後是否還會出現其他應用形態。不過就應用來看,由於要實現語音識別、語音合成、機器翻譯等對系統功耗和性能要求較高的功能,同時還要考慮語種、口音、噪音幹擾等複雜的應用場景,現在的智能翻譯機還沒有發展到能夠作為一項功能整合到手機或其他成熟的硬體形式中。正如科大訊飛創始人胡鬱談及訊飛翻譯機與谷歌Pixel(手機)相機圖片翻譯的不同時的解釋:谷歌更多從技術落地來考慮,這需要更強的處理器支持,並且也會增加手機的耗電量。

翻譯機的精準度

精準度是翻譯機的靈魂,也是對一個翻譯機的好壞最根本的考量。此前,就各大廠商自報成績單時,科大訊飛的曉譯2.0發布時,官方給出的準確率是98%,搜狗官方公布最新的語音識別準確率是97%。

各大廠商官方公布的準確率確實很高,不過在實際應用中還需要考慮諸如口音、口語及環境噪聲的問題。剛好小編手上有曉譯2.0可供做翻譯測試,兩組測試結果如下:

英文原文:So really,both Linux and Git kind of arose almost as an unintended consequence of your desire not to have to work with many people.

識別/翻譯結果:So really,both limits and get kind of rose almost as an unintended consequence of your desire not to have to work with many people.(因此,實際上兩者的限制和得到種玫瑰幾乎作為一個意外的後果,你的願望不需要與太多的人一起工作。)

中文原文:gitHub是一個面向開源及私有軟體項目的託管平臺,因為只支持git 作為唯一的版本庫格式進行託管,故名gitHub。

識別/翻譯結果:給她是一個面向開源及自由軟體項目的託管平臺,因為只給他作為唯一的版本庫格式進行託管,故名給他。(She is a hosting platform for open source and free software projects,because only for him as the only version of the library format for hosting,so named him.)

 

從結果來看,識別率還是很好的,只是在一些專業詞彙上還無法準確識別;而翻譯結果準確率夠高,口語化略顯不足。由此看來,官方給出的語音識別準確率不能完全用來衡量翻譯機產品的翻譯能力。

誰是攪局者

正是近年來出國旅行備受推崇,外加智能語音技術得到一定突破,使得翻譯機的研發被提上日程。但是處於風口的翻譯機在備受追捧的同時,自然也少不了攪局者。

從產品形態來看,有耳機,也有手機,有基於手機APP的應用,也有智能硬體單品。其中以智能硬體單品居多,其他產品形態更多則是一種嘗試,如無意外,整個產業現在的重心還是要回到智能硬體單品這一形式潛心做功能升級和技術研發。

從翻譯機的價格來看,跨度在百元到幾千元之間,一些沒有成型技術的團隊加入智能語音系統的翻譯機的價格甚至尚不及一支功能簡單的錄音筆,可想其產品架構中軟硬體系統的性能會是怎樣的情形,同時也使得其很難再擁有足夠的資本繼續做技術研發和產品迭代。

雷鋒網(公眾號:雷鋒網)小結

大家看到智能翻譯機的時候經常會認為專業翻譯人員很快會面臨失業問題,其實如此說來為時尚早。現在的翻譯機自身還存在諸多問題有待解決,雖然解決出國旅行時的點餐、問路已不是問題,但是面對諸如商務會晤、技術論壇等更為專業的應用場景,或是娛樂場所、賽事解說等更為複雜的周圍環境及人文環境,智能翻譯機的實際應用還是略顯吃力。

不過就技術角度來講,雖然諸多技術和產品紛紛湧入,而其實,這也才剛剛開始。

產品是技術最好的檢驗。語音技術正在經歷著這樣的檢驗,經過了智能音響的檢驗,這一輪是智能翻譯機的檢驗。

智能翻譯機居當下風口,技術雛形雖然已有,但是機器翻譯系統的翻譯速度和翻譯準確度還需要在整個AI大環境下繼續打磨,在翻譯匹配度、翻譯口語化能力、環境辨別能力,甚至具體產品形態上還需要繼續經受市場用戶的各類反饋和研發團隊的不斷改進。

至於當下市場中魚龍混雜的入局者,市場自然會進行優勝劣汰,剩下的終將會是最適合你的產品。

相關文章:

人工智慧翻譯機內鬥!準兒 VS 曉譯

智能語音助手+全息形象,會是下一個趨勢嗎

Facebook開源 PyTorch版 fairseq,準確性最高、速度比循環神經網絡快9倍

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 智能語音翻譯機實現了智能語音語言技術的突破
    打開APP 智能語音翻譯機實現了智能語音語言技術的突破 OFweek 發表於 2019-12-09 11:15:26 (文章來源
  • 智能翻譯機逆襲,智能語音技術起了什麼作用?
    智能語音技術經年之後的不斷完善,尤其是隨著語音識別準確率的不斷提高,基於智能語音技術的智能硬體紛至沓來,除了智能音箱一再受眾人追捧外,智能翻譯機也悄然逆襲,併入這條快車道。
  • 優勢明顯,科大訊飛翻譯機展現強大的智能語音技術
    自科大訊飛翻譯機面市以來,很多曾經苦練英語的人心裡難免有些不平衡,辛辛苦苦學了N年的英語,現在一下子感覺還不如一臺翻譯機,真的很委屈。但是不得不承認,隨著智能語音技術的不斷進步,人工翻譯的確受到了嚴重的挑戰。那麼,這款科大訊飛翻譯機真的能夠做到翻譯精準無誤嗎?
  • 智能語音技術選擇哪一家!科大訊飛智能翻譯機不可錯過!
    智能語音技術選擇哪一家!科大訊飛智能翻譯機不可錯過!其中科大訊飛在智能語音及人工智慧領域有著自己的見解,所以受到了很多人的喜歡,例如智能翻譯機。如今 科大訊飛已經是「中國人工智慧國家隊」中的一員了,就是因為它在智能語音和人工智慧核心研究和產業化方面的突出成績,並且得到了社會各界和國內外的高度認可。
  • 植入智能語音技術,科大訊飛翻譯機翻譯語種全體驗好
    但現在不一樣了,很多人在出發之前便準備好了一臺科大訊飛翻譯機,無論是點餐還是問路或者是購物,都能和當地人輕鬆溝通。通過人工智慧技術的植入,科大訊飛翻譯機展現出了更加多出色的性能,滿足了用戶的個性化翻譯需求。首先,在實時翻譯這一方面,科大訊飛翻譯機翻譯的速度更快,智能識別的效果也更好,在強大的8核CPU的運作之下,訊飛翻譯機可以帶給用戶更暢快的翻譯體驗。覆蓋近200個國家和地區高達59種語言種類,讓你可以放心無憂的走遍全球。
  • 技術過硬才是王道,科大訊飛翻譯機搭載最新的AI語音技術
    在同一個環境中待久了,難免不會產生一些焦慮不安的情緒,工作和生活上的壓力也時時刻刻在困擾著人們。因此,很多人選擇旅行這樣的方式來解壓。而想要順利的踏上出國遊的行程,首先就是要過了語言關。
  • 搭載AI語音技術,科大訊飛翻譯機成為廣大用戶一致選擇
    不同語言之間的溝通交流就需要翻譯來完成,而在智能翻譯設備問世之前,都是通過人工翻譯來實現的。隨著科大訊飛翻譯機的上市,全球各語言之間的交流變得更加直接、簡單易行了。為什麼這麼說呢?下面我們就來了解一下這款搭載AI語音技術的智能翻譯設備吧。
  • 迎元旦科大訊飛翻譯機送智能語音滑鼠
    感興趣的朋友可直接前往賽格數碼港二層扶梯左轉向東226.227號詳詢,關於科大訊飛翻譯機3.0翻譯機的促銷信息也可諮詢(聯繫電話:13934117600 0351-7555321 QQ:30437355 )該商家。
  • 訊飛翻譯機,引領A.I.翻譯技術創新和應用落地
    在A.I.的浪潮中,智能語音技術已基本成熟,各大科技公司將目光鎖定在人工智慧翻譯機上,一時間,眾多玩家蜂擁而至,不斷加大技術研發和生產投入。目前,翻譯機產品呈現百花齊放的態勢,在A.I.翻譯這條賽道上,科大訊飛旗下的訊飛翻譯機憑藉專業的技術和多元化的應用場景落地呈引領態勢。
  • 訊飛翻譯機再獲獎,智能語音翻譯功能更全面
    近日,由足球明星武磊代言的訊飛翻譯機3.0受到了不少網友的關注,這款號稱智能語音翻譯界的神器,到底有什麼特色功能?為什麼連體育明星都對訊飛翻譯機的強大功能豎起大拇指?來看看下面的介紹就知道了!
  • 腕語智能翻譯機:語音+文字,打通翻譯「最後一公裡」
    從這一基礎需求入手,青島冠義科技推出了一款更為實用的產品——腕語智能語音翻譯機,它沒有華而不實的賣點噱頭,只專注於「翻譯」這一核心功能點,連花甲老人也能夠分分鐘上手操作,就是這麼簡單直接。  說到老人,問題就來了。智能產品往往對上了年紀的人都不怎麼友好,數十年難改的鄉音和方言,可能是阻礙老人家「出門看看世界」的一個絆腳石。
  • 科大訊飛翻譯機一個強大的「語音大師」
    隨著科技的不斷發展,AI智能技術逐漸滲透到生活當中,在語音、視頻、讀取方面都有很好的表現,科大訊飛在AI智能領域的研究更是深受廣大消費者的青睞,為生活帶來了極大的方便,其中,科大訊飛的翻譯機更是帶來良好的體驗,下面跟著小編一起來看看科大訊飛的翻譯機有什麼亮點。
  • 首拆智能翻譯機:內置炬芯ATS3609(D)語音晶片
    外語不熟練如何跟外國人交流呢?這應該是很多人都會遇到的一個痛點問題。現在,很多人都選擇了專門的翻譯機,用來充當跟外國人交流對話的工具。  近日,小編拿到了一款智能語音翻譯機,受到了市場的熱捧。智能語音翻譯機應用的場景非常廣泛,功能強大,支持43種語音互譯。那麼,它究竟有哪些工藝材質上的特色?內部作用到底是怎樣的呢?下面,就來進行拆解測試,一探究竟。
  • 智能翻譯機 新一輪「跑馬圈地」
    隨著出境自由行的日益火爆,越來越多的人有了即時翻譯的需求,AI翻譯機成了出遊新「神器」。科技巨頭打響硬體「PK戰」從AI語音助手到智能音箱,人工智慧語言交互領域的「熱寵」走馬燈似地換,從去年下半年到如今,最受青睞熱捧的產品為AI翻譯機。科大訊飛、網易有道、百度、搜狗等企業紛紛發布了與AI翻譯機相關的新產品。
  • 離線智能翻譯技術實現突破腕語翻譯機再次樹立行業新標杆
    「雖然各大企業已經進入到翻譯機領域,市場上的翻譯機產品也有數十款,但其實整個行業都在研究機器翻譯的未來,也許未來我們看到的機器翻譯產品是個翻譯耳機、翻譯筆或者是其他的可穿戴形態。但不管翻譯機的形態如何變化,它的本質始終是翻譯,我們要解決的問題一定是如何做到在多變的自然和網絡環境下的精準翻譯,真正實現『隨心自由行』」腕語翻譯機的聯合創始人曲潔說。
  • 訊飛翻譯機3.0 打造語音翻譯極致體驗
    隨著亞馬遜推出了Echo智能音箱,率先讓語音技術走進了消費者的家庭,如今國內各大廠商也紛紛推出了自己的語音硬體產品,掀起了AI語音硬體的新風潮。其中,語音翻譯機滿足了境外旅遊、商貿、教育等領域翻譯場景需求而備受用戶青睞。
  • AI智能翻譯機強勢上線!一個智能且專業的隨身翻譯官!
    AI智能翻譯機強勢上線!一個智能且專業的隨身翻譯官!AI即人工智慧(Artificial Intelligence),它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學,那麼AI翻譯機就可以很好的理解為是智能的延伸和擴展人類在語言翻譯技能的一項心得科技產物。
  • 技術強大才能確保產品品質,科大訊飛翻譯機值得入手!
    針對這些人的需求,科大訊飛推出了搭載AI智能技術的翻譯機,不僅翻譯語種多,還支持離線、拍照等翻譯,可以說只要涉及語言翻譯的它都在行。而科大訊飛翻譯機就可以幫助大家解決語言溝通不暢的問題,哪方面都可以給我們提供翻譯服務。據了解,科大訊飛翻譯機覆蓋全球近200個國家和地區,支持中文與58種外國語種的在線翻譯,離線翻譯支持的語種數量及準確性都穩居同類產品之首。其次,科大訊飛翻譯機的翻譯功能更加的豐富,可以獲得更好更準確的翻譯。這臺翻譯機設備支持拍照翻譯、方言翻譯以及行業AI翻譯。
  • 譯世界智能整句翻譯機,大品牌,令外籍人士吃驚的翻譯機
    職場新人進外企工作,口語交流是難以逾越的一道門檻,來往信件、商務合同、產品說明,因為生僻詞、專業詞特別多,新人經常因為用詞不當而鬧笑話,譯世界智能翻譯機不僅內置了專業性極強的《牛津大詞典》,還內置了金融、外貿、建築等10部專業詞典,配合強大的整句翻譯功能和即指即譯功能,隨時查找專業詞彙。
  • 翻譯機哪個品牌最好?訊飛翻譯機3.0領銜三款翻譯機橫比
    那麼隨著小編一起看看幾款備受市場認可的翻譯機吧!  NO.1訊飛翻譯機3.0  提及翻譯機哪個品牌最好時,就不得不提基於科大訊飛的智能語音技術研發的訊飛翻譯機。訊飛翻譯機3.0的在線翻譯功能強大,支持中文與英、日、韓、法、西、德、俄、泰等58種外語的互譯,覆蓋了全球近200個國家和地區,其中英在線翻譯效果等同專業八級水平。