昨日,科大訊飛在京發布訊飛翻譯機2.0產品。相比一代翻譯機,它可以翻譯的語種增加至33種,除了語音翻譯、離線翻譯外,還支持拍照翻譯功能。值得一提的是,訊飛翻譯機2.0還針對國內用戶口語、方言問題進行優化,目前已支持 東北話、四川話、河南話、粵語4種方言翻譯。其官方售價為2999元,與一代產品價格相同。
剛剛過去不久的博鰲亞洲論壇上,同樣有科大訊飛翻譯機的身影,訊飛翻譯機已成為博鰲論壇官方指定產品,與會期間受到國際政要與企業高管的好評。
其實科大訊飛在2016年就將機器翻譯技術落地,推出曉譯翻譯機,引領了國內智能翻譯機市場的發展。在過去一年訊飛翻譯機銷量達到20萬臺,覆蓋137個國家,服務次數2000萬,用戶好評率達98%。
科大訊飛執行總裁、消費者BG總裁胡鬱欣喜地談到:「我們探索出一個新的品類,並且證明機器翻譯可以做成一種硬體並取得不錯的成績,引領了這個行業的發展。」而近兩年也確實是機器翻譯快速落地的一年,搜狗、百度、網易等紛紛在訊飛之後推出翻譯機產品。
▲科大訊飛執行總裁、消費者BG總裁胡鬱
會後,智東西同胡鬱圍繞訊飛翻譯機產品思路、定價策略、翻譯機市場狀況、機器翻譯行業現狀等進行深度溝通,呈現了他在打磨翻譯機過程中對手機與翻譯機、機器翻譯技術與落地產品之間的利弊平衡與思考。
方言翻譯成亮點,訊飛定義旗艦翻譯四大標準
訊飛翻譯機2.0是在「拷問」中誕生的。2016年科大訊飛推出第一代翻譯機,20餘萬臺的銷量也沉澱了一大批用戶,而大量的用戶反饋與市場調研也不斷迫使訊飛團隊思考,翻譯的語言多少才夠用?說不好普通話怎麼辦?嘈雜噪音環境下能不能好好工作?出國遇到文字信息怎麼辦?翻譯機達到什麼水準才夠實用?
據訊飛翻譯機產品負責人翟吉博介紹,翻譯機86%的用戶用於出境遊,這給他們指明了方向,聚焦於用戶需求的原點,針對產品翻譯語種數量、多樣化口音翻譯、真實使用環境、口語外的其他翻譯以及翻譯準確度進行嚴格拷問,訊飛翻譯機2.0於昨日正式發布,它針對以上問題一一給出了答案。
結合國內出境遊用戶經常去的國家,訊飛翻譯機也由一代支持6種語言,到二代翻譯機支持全球33種語言與中文的互譯,滿足了絕大部分中國用戶的出境遊。
而針對國內用戶30%不會說普通話,63%普通話帶有口音的現象,科大訊飛依託訊飛輸入法長期積累的方言數據與能力,將帶方言口音的普通話識別率整體達到95%,並支持粵語、四川話、東北話、河南話四種方言翻譯。翟吉博介紹到,訊飛一代翻譯機已經上線中英文離線翻譯,下一步訊飛將擴大中日、中俄、中韓等語言間的離線翻譯。
訊飛翻譯機2.0另一個亮點——拍照翻譯。畢竟出境遊客不只需要語言交流,還需要看懂外國文字,比如你在國外餐館吃飯卻看不懂菜單該怎麼辦?這時候拍照翻譯就顯得尤為重要。訊飛翻譯機2.0 正面帶有一個屏幕,背面還有一個攝像頭,通過攝像頭對需要了解的信息進行拍照,然後通過圖片識別技術就可以將圖片中的外文轉換為中文。目前訊飛翻譯機2.0已支持英、日、韓等11種語言的拍照識別。
此外,出境遊很可能面臨嘈雜的溝通環境,如何保證翻譯機在這種環境下靠譜工作呢?在語音識別較高的準確率下,嘈雜環境最大的問題是如何有效的獲取用戶清晰的聲音,訊飛翻譯機2.0搭載了一個四麥的麥克風陣列來解決這個問題。在一段對比iPhone手機視頻中,我們可以感受到,在同等音量下,訊飛翻譯機獲取的聲音更加清晰,噪點較少。
通過以上幾點「問題、拆解、答案」的呈現,訊飛提出了A.I.旗艦翻譯的四大標準:聽得清、聽得懂、譯得準、發音美。我們清晰的感受到,科大訊飛不只是單純為了落地技術而做翻譯機,而是深刻圍繞核心用戶的使用場景和使用痛點在打磨產品。可見作為開拓者的科大訊飛,在翻譯機上又向前邁進了一步。
有了手機,為何還要做翻譯機?
有人可能會說在手機中裝個翻譯軟體不就行了,為何還要做一款翻譯機?科大訊飛執行總裁、消費者BG總裁胡鬱意味深長地說:「做翻譯機是科大訊飛深思熟慮的結果」。而這背後體現著訊飛對技術落地的探索、對產品的思考,以及對翻譯事業的戰略重視。
科大訊飛是一家擁有19年歷史的本土語音技術公司,技術布局涵蓋語音識別、語義理解、語音合成、機器翻譯等各個語音領域,其中機器翻譯便是訊飛一項重要的技術。
早在2011年,科大訊飛率先在國內將神經網絡技術應用到機器翻譯,在國際與谷歌都是同一時期進軍這一領域的。基於神經網絡技術,訊飛分別於2011年~2013年推出新一代的語音識別、語音合成、機器翻譯語言模型。依託這些技術,訊飛在系列國際語音類大賽中獲獎,比如在2014年IWSLT國際口語機器翻譯比賽中,訊飛獲得冠軍,在著名的Blizzard Challenge語音合成比賽,訊飛已經連續十二年奪冠。語音技術上的優勢為訊飛落地行業與應用打下良好的根基。
比如像訊飛翻譯機中使用的機器翻譯技術就涉及到語音識別、翻譯器、語音合成等過程。以訊飛翻譯機為例,首先基於訊飛四麥的麥克風陣列以及前端信號處理的算法,能夠在更加自然的距離清晰獲取用戶的聲音,然後通過語音識別技術將用戶的語音轉換成中文文字,接著通過翻譯器實現中文與外文的翻譯,接著再憑藉語音合成將外文以語音的形式呈現給對方。這裡面涉及到的每一個環節都需要相關技術的支撐,沒有良好的技術支撐便不能保證良好的用戶體驗。近年來訊飛在語音技術上仍不斷探索,提出語音到語音的機器翻譯、全雙工語音翻譯等。
在產品層面,胡鬱從三個角度解答了為何有了手機之後我們還要做翻譯機的問題。首先,手機的主要使用場景是近場使用,它沒有考慮到在翻譯過程中人可能離的比較遠、環境噪聲大等問題;其次,他認為智能硬體的精髓在於好用,在於方便快捷,打開即用,一步到位才能有更好的體驗,而手機中使用APP的過程繁瑣,操作不便;第三,翻譯場景應該有更自然、更親和力的交互,將手機直接放在別人嘴邊也不符合我們的交往禮儀。
而在戰略層面,翻譯已經深入科大訊飛骨髓。作為語音技術的重要落地方向,翻譯是訊飛的一項關鍵業務。訊飛也從2009年就參與了少數民族語言的翻譯工作,正如胡鬱所言:「翻譯對於科大訊飛不僅僅是一項技術或產品,而是一項事業。」
作為人類之間溝通最便捷的方式,語言之間的轉換,直接影響到我們將來人類的整個交流,甚至影響到我們人類將來的命運。今年,科大訊飛董事長劉慶峰在今年兩會上就提出了,人類語言大互通的計劃。訊飛還與國際電信聯盟、上海外國語大學、中國外文出版發行事業局、東北大學等合作,共同推動翻譯事業的發展。
胡鬱還提出,未來的翻譯行業是人與機器的結合與互動。機器翻譯不會取代人工,而是能夠取代技能比較低的部分,從而讓人從事更有創造性的工作。
2999元的定價是何考慮?
近兩年翻譯機不斷的湧現市場,科大訊飛、百度、搜狗、網易等紛紛推出翻譯機產品,似乎翻譯機迎來了一個春天。儘管科大訊飛是翻譯機市場的引領者,但當下也面臨兩類玩家的競爭,一類是同樣推出翻譯機產品的搜狗、網易等,一類是微軟、百度、騰訊等推出的翻譯APP。
面對搜狗翻譯機1498的價格,以及其他千元以內的翻譯產品,科大訊飛為何要將價格繼續定在2999元呢?胡鬱解釋到,翻譯機產品本身還沒有到成熟的階段,作為一個新的垂直品類,最重要的還是產品的用戶體驗和功能性,一味的低價競爭並沒有意義。言下之意,訊飛翻譯機這款旗艦新品會更注重產品的打磨和用戶體驗,進而贏得用戶。
而當談到谷歌、微軟、以及百度、騰訊、網易等做的手機翻譯APP時,胡鬱以微軟翻譯為例分析他們與訊飛的不同,儘管微軟也做了翻譯,但沒有做硬體,但並沒有從應用場景做分析。而訊飛更加聚焦,圍繞中國用戶的需求,深入研究出境遊的場景化需求,將中文與其他語言之間的互譯做透。
胡鬱還談及了訊飛翻譯機與谷歌Pixel相機圖片翻譯的不同,谷歌手機無需拍照,就可以對圖片信息做到識別,這裡應用到的技術是AR(增強現實),但是谷歌更多從技術落地來考慮,這需要更強的處理器支持,並且也會增加手機的耗電量。而訊飛做翻譯機更多是從產品層面來考量,採用的是先拍照後識別的技術,拍照已經能夠滿足用戶的需要,減輕CPU、內存的負擔,並增強翻譯機的續航能力。
他近一步談到,機器翻譯技術已經到了可用的時間,並且在這個過程中訊飛率先推出產品,並向市場證明翻譯機能夠賣出量,無疑對行業起到引導作用。如果說技術的可用是一個先決條件,那麼對未來智能硬體市場的看法則是另一個關鍵因素。他認為手機更像是一個通用模擬器,其霸主地位短時間並不會改變,但是未來智能硬體會多元化,在某些場景下智能硬體能夠與場景和用戶體驗深度結合,也會有很強的需要。
當問及他對翻譯機市場空間的看法時,胡鬱稱還有待進一步觀察,他舉例到2016年他們剛開始做翻譯機的時候沒有想到會有這麼大的需求,但現在感受就不一樣了,這是一個在不斷探索中發現的過程。他笑稱,預測未來最好的方式就是把它實現,不然等大家都搞清楚了在做,就沒有機會了。並且未來翻譯機是什麼形態並不重要,因為翻譯的需求是不變的,溝通的需求也是不變的。可以預見,訊飛會圍繞翻譯繼續深入布局。
而翻譯機只是機器翻譯落地在消費端產品的一個點,機器同傳、會議系統等都是機器翻譯應用的表現。比如在今年博鰲亞洲論壇上,騰訊機器同傳在現場表現不佳,出現了較多的錯誤。這裡面也有機器翻譯行業共同的問題,如機器翻譯缺少對上下文的理解、口音問題、專業性問題等等,機器翻譯行業還存在許多挑戰。
但胡鬱並沒有過多強調機器翻譯行業在技術上的不足,而是認為行業的問題和挑戰更多的在於落地的使用效果。大體來講機器翻譯能夠解決90%~95%的問題,但是剩下的5%的問題可能是很致命的,往往要攻克這5%所花費的代價也要比攻克95%的問題大的多。
「但是我們要考慮的是什麼樣的情況能夠達到用戶的需求,不是解決所有的問題才能給用戶去用,而是要在現有的技術效果下,怎麼通過產品設計去規避現在技術上的不足,讓用戶體驗感覺很好」,胡鬱也表明了他對技術與產品之間權衡利弊的思考。
結語:讓應用反哺技術
正如胡鬱所言:「語音產業將成為人工智慧產業落地和發展的重要入口,如何發揮應用創新優勢、實現產業升級和品牌突圍,是目前國內AI企業面臨的重要課題。
科大訊飛本次發布的第二代翻譯機產品,正是其圍繞機器翻譯技術與消費者使用場景,將技術落地翻譯機的進一步探索。
而反過來,大量用戶在翻譯機使用過程中的「鮮活」數據,以及各種口音、方言數據,都是機器翻譯技術不斷迭代的力量源泉,最終推動機器翻譯技術走向更高的維度。