(圖為中譯語通常務副總經理梁鎮爽)
翻譯是一個很傳統的行業,但由於人工智慧技術的逐步普及,機器翻譯的準確率提升,這個傳統行業也湧入了一批網際網路企業。在這個賽道上,出身自傳統翻譯公司的中譯語通顯得有些「格格不入」。
在不久前的中國國際消費電子博覽會上,億歐採訪了中譯語通常務副總經理梁鎮爽,也通過她的敘述看到了一家不太一樣的科技公司。
不存在轉型,中譯語通一直都是一家科技公司
在採訪中,梁鎮爽表示儘管中譯語通的母公司中國對外翻譯有限公司是一家翻譯公司,但中譯語通從成立開始的定位就是一家科技公司,而核心技術就是機器翻譯。
機器翻譯技術是一個逐步完善的過程,而在不同的語種也有著不同的完成度。例如英語的使用頻率高、使用人群數量大,語料庫豐富,因此中英互譯技術就更完善,其準確度可以達到97%;但對於很多小語種來說,準確率達不到要求。尤其是在國家「一帶一路」政策之下,其語言服務需求實際上是非常旺盛,這就給中譯語通這樣的機器翻譯公司帶來了很大的挑戰。
在這種情況下,作為一家出身傳統翻譯的科技公司,這個「身份」還是給中譯語通帶來了很大的便利。和大多數的技術公司或者大公司的機器翻譯部門不同,中譯語通不是單純只做這樣專業性很強的一項工作,而是在產業互補上,有更大的整體規劃。
當語音、語料資源還不豐富的時候,中譯語通可以利用全球多語種呼叫中心這個平臺,先用人工進行在線的多方位服務,並逐步積累語音語料,當積累達到一定的量,再進行語音、語料的採集加工,有了詳實的數據再進行模型訓練,逐漸地將機器翻譯和人工翻譯相結合起來。
同時,中譯語通還會和院校合作,跟當地其他資源合作,將該地區原先積累的資源挖掘出來。梁鎮爽表示:「其實它們現在手裡有很多積累下來的語音語料資源,但是沒有人去做這個工作。」
如此來看,在快速發展的市場中,能夠多管齊下解決問題,似乎就是中譯語通重要的制勝手段。
「機器翻譯行業市場容量很大,還談不上競爭」
儘管之前我們說的是競爭優勢,梁鎮爽認為機器翻譯行業還遠遠沒有到競爭的地步,「相對巨大的市場容量來講企業真的不太多,因為語言是一個溝通的最基礎的東西。」
中國機器翻譯行業其實可以分為兩類公司或者團隊,簡單來說就是to B和to C。一類主要面向消費者和個人用戶,而另一類主要面向企業、科研機構和政府單位,例如中譯語通。
儘管都是機器翻譯,但是後者有更強的行業屬性,因此面對不同行業有不同的語料庫,不同的機器翻譯公司也有各自擅長的領域。梁鎮爽說:「大數據技術和人工智慧應用,實際上就這兩、三年才興起來的。在我前年去貴州參加大數據峰會的時候感覺到,整個展廳裡面,農業的、氣象的等等,其實每一家找一個方向,都是一個大市場,在某一個大的領域裡找一個應用就足夠它立足了。」
事實也確實如此,目前,中國人工智慧行業從很大程度上來說,合作關係確實要大於競爭關係。無論是機器翻譯還是語音識別,每個公司實際上都有聚焦點,也都是共生的關係,並不能去把每一件事做到盡善盡美。
做跨語言大數據的生產者和挖掘者
通過對中譯語通更加深入的了解,筆者發現,在很大程度上中譯語通已經不是一家單純的人工智慧或者機器翻譯技術公司,它的主要業務更多集中在了語言大數據上。梁鎮爽也表示,之所以說2016年是中譯語通非常重要的一年,就是因為當年中譯語通的整體發展戰略定位在了跨語言大數據的方向,同時打造了譯見這樣一個平臺。
目前,中譯語通的譯見大數據平臺,覆蓋了政府、科研、金融、工業、旅遊等多個領域。
以科研領域為例。中譯語通科研大數據主要服務於政府、高校、企業、科研院所等,為用戶提供全球範圍內的科技類知識服務和智能語義檢索服務,能夠提供網際網路上最新的科技資訊、專利、期刊等文獻數據,並能夠以專題服務和智能分析報告的形式呈現。這是一個全流程的多語言科技數據平臺,能夠實現科技數據採集、數據清洗、數據分布式存儲、建模分析及可視化展現。
簡而言之,通過機器翻譯技術,中譯語通成為了一個新的數據生產者,並且希望同時成為這些數據的掘金者。
這種模式其實對更多人工智慧公司的商業化落地,有著很好的參考價值。人工智慧行業內的大多數公司,都扮演著數據使用者的角色,通過大量數據進行模型訓練,然後將模型放在語音或圖像識別的各個場景中,從而改變場景的服務模式,創造商業化價值。但是以中譯語通搭建的大數據平臺為例,反過來看,人工智慧公司同時也能夠成為數據的生產者,並且推動產業鏈進一步延伸。
如何判斷未來翻譯機市場?
在機器翻譯行業,近兩年最亮眼的產品大概就是翻譯機了,中譯語通同樣也有自己的翻譯機產品,對於這個新誕生的硬體市場,梁鎮爽表達了中譯語通的看法。
首先,翻譯機是中譯語通能力的一個體現,是把人工智慧技術應用到智能硬體當中的,一個跨領域的能力展示。這其實和大多數翻譯機的產品目的是相同的,翻譯機所表現的能力不只有機器翻譯技術,更重要的是人工智慧技術與硬體之間相結合,實現產品化的能力。
梁鎮爽說:「我們內部曾經討論過翻譯機的市場到底是一個什麼樣的市場,它的市場容量到底有多大?它是否是剛需?我們甚至判斷說它有可能是一個偽需求。」在經過討論和判斷後,中譯語通將自己的翻譯機產品定位在了中高端產品,面向國內和海外市場。
本身,翻譯機面向的需求場景就是非常低頻,如果只是在出國旅遊、學外語這樣的場景下使用,它甚至在便捷程度上不如一款手機APP。因此,未來中譯語通計劃將翻譯機產品列入到行業應用,或者行業服務解決方案中,成為特點場景下機器翻譯一體化解決方案的一部分,在特定領域內讓這款低頻產品的使用頻率提高。
無論是大數據平臺還是翻譯機業務策略,其實都可以看作是中譯語通構建機器翻譯生態的一部分。市場發展到現在的階段,機器翻譯,甚至整個人工智慧產業的發展已經很難用技術壁壘來形成競爭優勢。而在另一方面,這個領域中企業的商業模式創新成為了形成差異化的重要因素。
因此,評價一家企業的標準也發生了變化。在技術上,大家的差距不過是小數點後的細微差別,很難分出一個誰都信服的高低;不過,從業務創新的方面來看,中譯語通做的不錯。