智能翻譯機逆襲,智能語音技術起了什麼作用?

2021-01-20 EDN電子設計技術

智能語音技術經年之後的不斷完善,尤其是隨著語音識別準確率的不斷提高,基於智能語音技術的智能硬體紛至沓來,除了智能音箱一再受眾人追捧外,智能翻譯機也悄然逆襲,併入這條快車道。1epednc

不同於智能音箱因沒有明確的應用場景備受詬病,智能翻譯機倒是有諸如商務會議、出國旅行等針對性較強的應用場景,由此帶來的則是對深度學習算法更高的要求。1epednc

機器翻譯系統:RNN、CNN、transformer

智能翻譯機的技術基礎說到底還是智能語音技術,這一點與智能音箱極為相似,其中,神經網絡翻譯系統尤為關鍵,各大廠商紛紛針對這一系統進行自研,諸如谷歌的GNMT、科大訊飛的INMT、搜狗的SNMT等。1epednc

用於機器翻譯的神經網絡系統最為經典的基礎技術可以歸為兩類——RNN(循環神經網絡)和CNN(卷積神經網絡)。主要區別在於兩類系統的執行順序不同,採用RNN神經網絡的機器翻譯系統是順序執行任務,在進行翻譯工作時,要對整個句子從左到右或從右到左依次執行,精準度較高,但無法充分應用系統硬體GPU的並行運算能力;採用CNN神經網絡的機器翻譯系統則是並行執行任務,計算效率更高。1epednc

1epednc

CNN卷積傳輸示意圖1epednc

雖然採用CNN的系統的計算效率更高,但是在做機器翻譯時採用CNN的神經網絡系統一直不如採用RNN的神經網絡系統,尤其是在翻譯精準度上差強人意。因而,長久以來,諸多做翻譯機的公司雖然對RNN和CNN都在跟進研究,但是各家產品中使用的翻譯系統仍是基於RNN架構的較多。 1epednc

2017年5月,Facebook的FAIR團隊提出一種使用全新CNN架構的fairseq,官方給出的數據是比基於RNN架構的機器翻譯系統的速度高出9倍,同時,準確性也是當時最好的。這在當時也一度被認為是機器翻譯系統技術的一個轉折點。據了解,就在1個月後,谷歌在發表的《Attention is all you need》論文中提出了不使用CNN及RNN的transformer架構,官方表示採用該架構的機器翻譯模型實際效果超越了當時所有公開的機器翻譯模型。1epednc

 1epednc

在技術角逐的同時,也不乏有科技公司的產品跟進。例如搜狗於2017年7月上線了基於transformer的機器翻譯系統模型,在解決了transformer機器翻譯系統模型原生系統解碼器解碼速度慢的問題後,將速度提升了8倍,並可以運用到離線翻譯功能。1epednc

 1epednc

另外,技術之間各有優勢也是必然的,尤其是在還沒有一個成熟的技術時,做產品和技術研發適度整合多種技術也是必由之路。例如搜狗在跟進transformer機器翻譯模型的同時,仍然在用CNN做語音識別上的訓練,搜狗語音交互技術中心研發總監陳偉在參加對外活動時曾提到:在做語音識別時,搜狗用50層CNN結構得到語音識別模型,基於此模型,訓練離線語音識別模型。1epednc

產品形態:手機、耳機和翻譯機

翻譯機的產品形態主要有三大類;翻譯機、翻譯手機和翻譯耳機。1epednc

1epednc

現在主流市場還是將翻譯機做成智能硬體單品,例如科大訊飛的曉譯、有道翻譯蛋等,但是市面上較為高端的翻譯機價格都在千元左右,科大訊飛的曉譯2.0價格標定為2999元,這其實已接近市場上中高端手機的價格,因而,還是吸引了以智能翻譯機為主導功能的智慧型手機的入局。2018年6月,國內糖果手機推出糖果S20,支持語音翻譯、拍照翻譯、104種語言、離線翻譯,提供24小時在線人工翻譯服務,將翻譯機功能再度整合到手機中。1epednc

耳機類翻譯機最初在國外較為流行,如谷歌的Pixel Buds翻譯耳機、Waverley Lab的Pilot翻譯耳機,通過藍牙與手機中的翻譯APP相連,硬體思路類似藍牙耳機,這類產品更多地考慮到手機翻譯機帶來的便捷、禮儀、衛生的問題,解決了場景應用中的一些尷尬局面。1epednc

具體各類翻譯機產品,雷鋒網整理如下表:1epednc

1epednc

智能翻譯機產品五花八門,也很難說今後是否還會出現其他應用形態。不過就應用來看,由於要實現語音識別、語音合成、機器翻譯等對系統功耗和性能要求較高的功能,同時還要考慮語種、口音、噪音幹擾等複雜的應用場景,現在的智能翻譯機還沒有發展到能夠作為一項功能整合到手機或其他成熟的硬體形式中。正如科大訊飛創始人胡鬱談及訊飛翻譯機與谷歌Pixel(手機)相機圖片翻譯的不同時的解釋:谷歌更多從技術落地來考慮,這需要更強的處理器支持,並且也會增加手機的耗電量。1epednc

翻譯機的精準度

精準度是翻譯機的靈魂,也是對一個翻譯機的好壞最根本的考量。此前,就各大廠商自報成績單時,科大訊飛的曉譯2.0發布時,官方給出的準確率是98%,搜狗官方公布最新的語音識別準確率是97%。1epednc

各大廠商官方公布的準確率確實很高,不過在實際應用中還需要考慮諸如口音、口語及環境噪聲的問題。剛好小編手上有曉譯2.0可供做翻譯測試,兩組測試結果如下:1epednc

英文原文:So really,both Linux and Git kind of arose almost as an unintended consequence of your desire not to have to work with many people.1epednc

識別/翻譯結果:So really,both limits and get kind of rose almost as an unintended consequence of your desire not to have to work with many people.(因此,實際上兩者的限制和得到種玫瑰幾乎作為一個意外的後果,你的願望不需要與太多的人一起工作。)1epednc

1epednc

中文原文:gitHub是一個面向開源及私有軟體項目的託管平臺,因為只支持git 作為唯一的版本庫格式進行託管,故名gitHub。1epednc

識別/翻譯結果:給她是一個面向開源及自由軟體項目的託管平臺,因為只是給他作為唯一的版本庫格式進行託管,故名給他。(She is a hosting platform for open source and free software projects,because only for him as the only version of the library format for hosting,so named him.)1epednc

 1epednc

從結果來看,識別率還是很好的,只是在一些專業詞彙上還無法準確識別;而翻譯結果準確率夠高,口語化略顯不足。由此看來,官方給出的語音識別準確率不能完全用來衡量翻譯機產品的翻譯能力。1epednc

誰是攪局者

正是近年來出國旅行備受推崇,外加智能語音技術得到一定突破,使得翻譯機的研發被提上日程。但是處於風口的翻譯機在備受追捧的同時,自然也少不了攪局者。1epednc

從產品形態來看,有耳機,也有手機,有基於手機APP的應用,也有智能硬體單品。其中以智能硬體單品居多,其他產品形態更多則是一種嘗試,如無意外,整個產業現在的重心還是要回到智能硬體單品這一形式潛心做功能升級和技術研發。1epednc

從翻譯機的價格來看,跨度在百元到幾千元之間,一些沒有成型技術的團隊加入智能語音系統的翻譯機的價格甚至尚不及一支功能簡單的錄音筆,可想其產品架構中軟硬體系統的性能會是怎樣的情形,同時也使得其很難再擁有足夠的資本繼續做技術研發和產品迭代。1epednc

1epednc

小結

大家看到智能翻譯機的時候經常會認為專業翻譯人員很快會面臨失業問題,其實如此說來為時尚早。現在的翻譯機自身還存在諸多問題有待解決,雖然解決出國旅行時的點餐、問路已不是問題,但是面對諸如商務會晤、技術論壇等更為專業的應用場景,或是娛樂場所、賽事解說等更為複雜的周圍環境及人文環境,智能翻譯機的實際應用還是略顯吃力。1epednc

不過就技術角度來講,雖然諸多技術和產品紛紛湧入,而其實,這也才剛剛開始。1epednc

產品是技術最好的檢驗。語音技術正在經歷著這樣的檢驗,經過了智能音響的檢驗,這一輪是智能翻譯機的檢驗。1epednc

智能翻譯機居當下風口,技術雛形雖然已有,但是機器翻譯系統的翻譯速度和翻譯準確度還需要在整個AI大環境下繼續打磨,在翻譯匹配度、翻譯口語化能力、環境辨別能力,甚至具體產品形態上還需要繼續經受市場用戶的各類反饋和研發團隊的不斷改進。1epednc

至於當下市場中魚龍混雜的入局者,市場自然會進行優勝劣汰,剩下的終將會是最適合你的產品。1epednc

(來源:雷鋒網;作者:王金旺)1epednc

相關焦點

  • 優勢明顯,科大訊飛翻譯機展現強大的智能語音技術
    自科大訊飛翻譯機面市以來,很多曾經苦練英語的人心裡難免有些不平衡,辛辛苦苦學了N年的英語,現在一下子感覺還不如一臺翻譯機,真的很委屈。但是不得不承認,隨著智能語音技術的不斷進步,人工翻譯的確受到了嚴重的挑戰。那麼,這款科大訊飛翻譯機真的能夠做到翻譯精準無誤嗎?
  • 智能語音產業觀察:翻譯機成新落地場景 各巨頭爭相入局
    在智能語音領域,如果說去年火了智能音箱,那麼今年火的便是翻譯機了。這不僅是因為翻譯機產品種類的火爆,在京東搜索翻譯機,能夠出現超過7300件商品。除此之外,據21世紀經濟報導記者不完全統計,目前市面上還有準兒翻譯機、網易有道翻譯蛋、百度途鴿翻譯機等。甚至,有智慧型手機廠商還專門推出主打翻譯功能的手機。「智能語音目前最實在落地的場景便是翻譯,如果產品確實能夠做好的話,市場空間很大。」
  • 智能翻譯技術不可匹敵,科大訊飛翻譯機3.0更受用戶青睞
    作為人工智慧重要分支之一的AI語音技術,在積極向上的大環境下也正迎來迅猛發展,尤其是機器翻譯更是成為各大科技企業博弈的技術高地。科大訊飛作為智能語音領域的領軍者,推出的訊飛翻譯機經過多次產品迭代升級,功能越來越完善,成為目前智能翻譯設備市場上最具競爭實力的品牌。  科大訊飛翻譯機之所以倍受歡迎,得到諸多用戶的喜愛,是因為這款設備身上綻放出了很多閃光點,是普通的智能翻譯不能媲美的。
  • 科大訊飛翻譯機曉譯2.0 長沙售1800元起
    圖為:科大訊飛翻譯機2.0  科大訊飛翻譯機2.0更專業的發音,科大訊飛在國際語音合成大賽取得「十二連冠」的成,智能發音媲美真人發音;訊飛翻譯機2.0增加了拍照翻譯,覆蓋全場景翻譯需求,1300萬高清攝像頭,為旅遊識圖場景定製;科大訊飛翻譯機2.0兩種模式可選,標準模式:通過拍照,自動定位需要翻譯的文本,並在頁面上顯示翻譯內容。
  • 翻譯機行業規則制定者,科大訊飛以技術創新推動行業良性發展
    而科大訊飛翻譯機的AI智能降噪功能非常強大,即使在人聲嘈雜的環境中拾音也很精準,翻譯速度更是達到了0.5秒閃譯。通過人工智慧技術的植入,科大訊飛翻譯機展現出了更加多出色的性能,滿足了用戶的個性化翻譯需求。基於AI的圖文識別(OCR)及語音識別技術正好是科大訊飛的強項所在,要是你用過訊飛輸入法,精準快速的語音識別一定讓你印象深刻吧。除了這兩項,科大訊飛翻譯機為了提供更加優秀的用戶體驗還搭載了新一代的語音翻譯內核、驍龍八核處理器、第二代四麥克風降噪方案。
  • 聽得懂方言的翻譯機,科大訊飛翻譯機助力實現英語交流無縫對接
    說到旅遊,很多人都有著不同的感受,跟團遊經常被導遊要求買一些毫無作用的紀念品和土特產,參觀景點基本上都是走馬觀花。因此很多人現在都不再抱團跟團遊了。
  • 科大訊飛翻譯機讓你的旅行充滿「底氣」
    深耕智能語音技術領域長達21年的科大訊飛,其語音識別和語音翻譯能力都一直佔據行業領先地位。由科大訊飛研發的訊飛翻譯機3.0集合了訊飛智能翻譯內核、高通八核CPU和全球部署CDN的三大「利器」,再搭配訊飛原創的「端到端」翻譯模式,能夠根據語義理解正確的翻譯多音詞和多義詞,智能理解語義。訊飛翻譯機3.0採用軟硬體一體化的智能翻譯解決方案,輕鬆實現「翻譯快、翻譯準」的效果。憑藉著硬體和訊飛深厚的智能語音技術,訊飛翻譯機3.0在線語音翻譯實力非凡。
  • 智能語音助手的原理_預測智能語音助手的未來
    打開APP 智能語音助手的原理_預測智能語音助手的未來 發表於 2019-07-31 10:16:14    語音助手能和人類進行深度交談的背後,離不開自然語言處理(NLP)和自然語言生成(NLG)這兩種基礎技術。
  • 新學期用訊飛翻譯機不止考高分,還能輕鬆說外語
    訊飛翻譯機是科大訊飛旗下的智能翻譯硬體,其採用神經網絡機器翻譯,具備強大的優勢:核心翻譯功能目前支持語種有51種,覆蓋全球近200個國家和地區,同時基於神經網絡技術,支持整句智能翻譯,通過理解上下文語境給出精準翻譯結果。訊飛翻譯機在操作設計上遵循簡單、極致原則,做到一鍵翻譯,按下「中文鍵」即可語音實時翻譯。
  • 錄音筆+音樂播放器+同聲翻譯機三合一,搜狗S1智能錄音筆體驗點評
    搜狗S1智能錄音筆在右側提供了兩個實體按鍵,分別是面積較大的REC錄音鍵和面積較小的多功能鍵。這兩個按鍵設計較為凸出,略高於側面機身,大概這就是為什麼搜狗S1智能錄音筆在按鍵兩側加入凸起金屬部分的原因,作用就是避免出現誤觸的問題。從這裡可以看到,搜狗S1智能錄音筆機身底部並不平整,而是前方有所凸起,至於原因應該與這個3.5mm耳機插孔的設計有關。
  • 智能語音技術中麥克風陣列的原理
    麥克風陣列能幹什麼?  任何一項技術的發生發展都伴隨著問題的提出及解決,麥克風陣列也是如此。那麼它主要應用在哪些場景下呢?又有著怎樣的功能!  噪聲環境怎麼破?麥克風陣列則可以進行聲源定位,聲源定位技術是指使用麥克風陣列來計算目標說話人的角度和距離,從而實現對目標說話人的跟蹤以及後續的語音定向拾取,是人機互動、音視頻會議等領域非常重要的前處理技術。所以麥克風陣列技術不限制說話人的運動,不需要移動位置以改變其接收方向,具有靈活的波束控制、較高的空間解析度、高的信號增益與較強的抗幹擾能力等特點,因而成為智能語音處理系統中捕捉說話人語音的重要手段。
  • 不懂英語出國遊戰戰兢兢,隨身攜帶科大訊飛翻譯機底氣十足
    以前在大街上要是遇到歪果仁問路什麼的,很多人都會躲著走,因為他們知道自己的英語溝通能力。而現在很多人則很願意主動和歪果仁搭訕,而且交流的話題還比較深入。但對於不懂英語的人來說,出國旅遊又該怎麼辦呢?帶上一部科大訊飛翻譯機就足夠了,因為這款智能翻譯設備翻譯語種多,速度快,而且還有離線、拍照等翻譯功能,非常的實用。
  • 增添更多人性化功能,科大訊飛翻譯機翻譯更精準
    建議帶上科大訊飛翻譯機,再難懂的外語也可以實現面對面交流,而且翻譯結果無需等待!科大訊飛作為中國最大的智能語音技術提供商,用人工智慧建設美好的世界,科大訊飛一直以來都專注於人工智慧的設計與開發,全力推動人工智慧技術產品普及到更多不同的行業領域當中,發揮出人工智慧的絕對優勢。
  • 離線翻譯更準確,科大訊飛翻譯機中英文離線翻譯水平達到6級
    打造軟硬一體化智能翻譯解決方案 深耕智能語音技術領域長達21年的科大訊飛,其語音識別和語音翻譯能力都一直佔據行業領先地位由科大訊飛研發的訊飛翻譯機3.0集合了訊飛智能翻譯內核、高通八核CPU和全球部署CDN的三大「利器」,再搭配訊飛原創的「端到端」翻譯模式,能夠根據語義理解正確的翻譯多音詞和多義詞,智能理解語義。訊飛翻譯機3.0採用軟硬體一體化的智能翻譯解決方案,輕鬆實現「翻譯快、翻譯準」的效果。
  • 首款中英文互譯神器,科大訊飛史詩翻譯機面市,技術革新堪比蘋果
    我們說蘋果是一家不斷創新的公司,他不僅改變了人類的生活方式,而且推出觸屏技術,讓人類告別實體按鍵,可以說是開創了科技進步的先河。時代智能的進步,全球首款實時中英文同聲翻譯器橫空出世 因為,在語音行業已經沉澱近二十年智能語音及語言技術企業——科大訊飛,推出的全球首款實時中英文同聲翻譯器——訊飛曉譯翻譯器,號稱翻譯機中的iPhone。
  • 實用性是最好的驗證,科大訊飛翻譯機翻譯精準度高達95%
    因此,在出國留學之前,很多同學都準備了一臺科大訊飛翻譯機,以備不時之需。那麼,這款智能翻譯設備的實用性到底如何呢?下面我們就連大致了解一下。通過人工智慧技術的植入,科大訊飛翻譯機展現出了更加多出色的性能,滿足了用戶的個性化翻譯需求。基於AI的圖文識別(OCR)及語音識別技術正好是科大訊飛的強項所在,要是你用過訊飛輸入法,精準快速的語音識別一定讓你印象深刻吧。除了這兩項,科大訊飛翻譯機為了提供更加優秀的用戶體驗還搭載了新一代的語音翻譯內核、驍龍八核處理器、第二代四麥克風降噪方案。
  • 訊飛翻譯機3.0:圍繞場景打造產品價值
    隨著翻譯技術的快速發展,不同國家民眾之間的交流效率被大大提升,基於翻譯技術的AI化產品,其中最為大眾熟知的就是語音翻譯機。訊飛翻譯機憑藉著優異的產品體驗,成為博鰲亞洲論壇官方指定翻譯機,訊飛翻譯機3.0更是「圍繞場景打造產品價值」,實現商、學、旅多場景覆蓋。
  • 銷量一直保持領先,科大訊飛翻譯機得到用戶普遍認可
    因此,在出國留學之前,很多同學都準備了一臺科大訊飛翻譯機,以備不時之需。那麼,這款智能翻譯設備的實用性到底如何呢?下面我們就連大致了解一下。通過人工智慧技術的植入,科大訊飛翻譯機展現出了更加多出色的性能,滿足了用戶的個性化翻譯需求。  基於AI的圖文識別(OCR)及語音識別技術正好是科大訊飛的強項所在,要是你用過訊飛輸入法,精準快速的語音識別一定讓你印象深刻吧。除了這兩項,科大訊飛翻譯機為了提供更加優秀的用戶體驗還搭載了新一代的語音翻譯內核、驍龍八核處理器、第二代四麥克風降噪方案。
  • 國內智能語音行業分析報告
    一、智能語音簡介智能語音是人工智慧技術的重要組成部分,包括語音識別、語義理解、自然語言處理、語音交互等。當前,人工智慧的關鍵技術均以實現感知智能和認知智能為目標。智能語音技術是人工智慧產業鏈上的關鍵一環
  • 中英文識別率更高,用科大訊飛翻譯機獲得滿滿體驗感
    科大訊飛翻譯機自從上線以來,特別是3.0版本,因為功能豐富而且強大,所以備受用戶的青睞,銷量一直都保持領先。通過人工智慧技術的植入,科大訊飛翻譯機展現出了更加多出色的性能,滿足了用戶的個性化翻譯需求。基於AI的圖文識別(OCR)及語音識別技術正好是科大訊飛的強項所在,要是你用過訊飛輸入法,精準快速的語音識別一定讓你印象深刻吧。除了這兩項,科大訊飛翻譯機為了提供更加優秀的用戶體驗還搭載了新一代的語音翻譯內核、驍龍八核處理器、第二代四麥克風降噪方案。在這些黑科技的加持下,這款翻譯機能夠實現「0.5秒閃譯」,足以「秒殺」那些反應遲鈍的在線翻譯App。