本篇文章為大家介紹了機器翻譯產品以及其具體使用場景。
聲明:本文僅代表個人觀點,不代表任何機構立場
「不謀全局者,不足謀一域。」 ——古語
機器翻譯在2018的科技媒體絕對是一個高頻詞。看過WMT和IWLST等國際大賽中國玩家奪得好名次的消息,也見識過《揭秘進博會同聲傳譯背後:不是人,是機器人》這樣的驚悚標題;見過實時字幕投屏的機器同傳的驚豔,也經歷過「人機耦合」的刷屏;看過一場場翻譯機翻譯蛋翻譯耳機的發布會新聞,也等到了百元級別價格屠夫的出現……
但作為一個好奇執著的翻譯產品關注者,觀察君更關注的是,機器翻譯這個近兩年日漸成熟的技術,在這一番熱鬧之下,在產品層面如何的演化?滲透進了哪些場景?呈現出了怎麼樣的趨勢?
先來一張圖:
機器翻譯+場景是最有意思的部分,觀察君把它們分為三大類場景:信息發布、信息獲取、信息交換。當然這個分類不是絕對的,比如視頻翻譯和文檔翻譯就可以既歸於信息發布又可以歸於信息獲取,並有融合的趨勢。
下面就這張圖一一細說:
最常見的形態就是這種在線翻譯:
這類產品,除了語種在默默增加,各家系統暗自較勁,有兩個大的變化:
一是幾乎一夜之間齊刷刷冒出來的文檔翻譯,就連之前老氣橫秋的谷歌翻譯大叔也改版了;
二是中譯語通、新譯、愛特曼等公司,在通用翻譯之外,推出了專業領域翻譯。可以預見接下來會更多樣化,比如增加用戶上傳術語之類的功能。
出於安全考慮,一些財大氣粗的政府機構、情報機構或者企業,會直接採購私有的翻譯系統部署在本地,當然具體需求各異,但安全、定製化是大家一致的需求。下面是to B類機器翻譯賽道上的一些公司:
以上只列舉了部分,提供機器翻譯私有部署服務的還有橙譯中科、傳神、語智雲帆、歐米翻譯等公司。
另外,正如近年一個有趣的現象:友商之間競爭有時非常短暫,大家跑著跑著就不在一個賽道了。比如中譯語通轉向大數據,愛特曼科技轉向醫療(同類公司還有具備人機翻譯背景的深度智耀),百度翻譯、搜狗翻譯也」橫插一腳「提供私有化部署服務。
CAT(計算機輔助翻譯):除了翻譯記憶庫,這個「古老」工具最大變化之一是機器預翻譯以前是免費的,現在開始收費了,畢竟機器翻譯越來越靠譜了。
還有一個重要變化是從複雜的客戶端演變成在基於web端的輕量化工具,無需下載安裝,上手容易。CAT工具可以分成三類:
交互式機器翻譯方面,創立於2015年的Lilt今年10月剛剛宣布A輪融資;騰訊AI Lab 11月也剛剛發布了交互式機器翻譯產品Transmart。
超越傳統CAT基於翻譯記憶和機器翻譯譯後編輯模式,這個產品實現了人機互動的數據閉環,無疑代表了專業筆譯工具的未來。
隨著工具門檻的降低,來自各行各業的「非專業」譯者,憑藉自己的專業知識背景,有望快速擴大這個原本不足百萬的用戶群體。
翻譯輸入法:代表產品有譯雲輸入法、輕敲輸入法、搜狗輸入法(翻譯只是其中一個功能,海外版名字叫Typany)、新譯預測性翻譯、輕敲輸入法等。
需要改變用戶習慣的客戶端輸入法已經被驗證是雞肋產品,借著名的俞軍產品價值公式:產品價值=(新體驗-舊體驗)-換用成本。輸入法高昂的換用成本,導致這個等式右邊目前只能為負。
今年出現的Transmart和預測性翻譯是一種「輕量級」的輸入法,只是在輸入時,提供單詞補全和短語提示,但是起到了減少鍵盤敲擊次數的作用。
文檔翻譯/word翻譯插件:只是簡單的機器翻譯+格式處理,文檔翻譯應該算是2018年最低調但是最流行的機器翻譯產品了,而且受眾廣泛,以至於可以出現一家公司就專注於文檔翻譯,比如翻譯狗。
當然,隨著百度、搜狗、谷歌翻譯相繼推出免費版本,這個產品的盈利方式挑戰嚴峻。
視頻翻譯:根據語音實時生成多語字幕,Youtube很早就有這個功能了,可惜大多數朋友享受不到。不過字幕通和網易見外不僅可以實時自動翻譯字幕,還更進一步,可以編輯生成的字幕,加一些簡單的特效。把傳統字幕翻譯的6個步驟變成2個步驟。在視頻內容激增、5G風雨欲來的背景下,視頻翻譯未來幾年是否會爆發?
跨語言搜索:用谷歌搜索外文關鍵詞,搜索結果會顯示「翻譯此頁」,部分解決了網頁瀏覽的語言問題。不過,假如觀察君想了解糖尿病,打開google卻尷尬的是發現不會拼這個詞……不過現在有一個替代方案了,搜狗英文也多做了一步——幫你翻譯查詢詞。
電商商品翻譯:電商平臺本身就涉及多種翻譯場景,比如商品描述、買家評論、買家賣家即時跨語言交流。這方面阿里巴巴走在前面。Amazon、Booking、Tripadvisor、Yelp這些網站也有大量商品點評的自動翻譯。
網頁翻譯:除了傳統的網頁翻譯插件,彩雲小譯推出的外媒內容翻譯是一個很有意思的嘗試,堪稱重度內容患者的福音。
相比於網頁插件,這個產品有兩個亮點:幫你把海外各大媒體分好類;翻譯時是原譯對照,給人一種「安全感」。
跨語言大數據:海量信息抓取+機器翻譯+文本處理和分析,下圖是中譯語通的部分產品。當然,在這些產品中,機器翻譯作為一種能力隱藏起來了。這種應用方式契合中譯語通「機器翻譯最大的意義是擴大了人類認知信息的廣度與深度」的看法。類似的產品還有今年剛上線的因鉭投智,通過醫療健康產業數據抓取+機器翻譯+處理分析,為醫療行業投資者提供數據分析服務。
社交翻譯:微信的「長按翻譯」就是典型應用,除了Facebook、Instagram、Twitter、微博、阿里賣家海外版這些大眾社交軟體,還有一批主打翻譯社交的小眾app。不過,隨著翻譯不再小眾,這類翻譯社交APP機會渺茫。
語音翻譯:除了早年的主打語音翻譯的APP,翻譯機的爆發讓很多人都驚呼意外,目前在京東上架的翻譯機已接近200種。當然,直到現在堅持認為「翻譯機就是收智商稅的產品」的還大有人在。翻譯機會怎麼樣?這是另一個有意思的話題,觀察君擇日會和你分享一些觀察和思考。
AI同傳:自騰訊同傳在博鰲亞洲論壇「上崗」之後,AI同傳算得上最奪人眼球的機器翻譯產品,畢竟佔據著大會的屏幕,讓原本只能聽見的聲音「看得見」。對這個產品而言,好消息是,人機耦合的風波漸漸退去,相比於人工同傳的高成本,這個產品不會有翻譯機那種「是否雞肋」的爭議,畢竟人工同傳的價格擺在那。壞消息是,我們究竟有多少會議需要現場同傳?除了PR效果,這個市場容量到底怎麼樣?
智能問答:從形式上看,一種作為問答機器人的一項「技能」,和定鬧鐘,放首歌,查天氣一樣,通過語音交互,比如小愛同學APP和智能音箱。還有一種集成到微信的形式,比如彩雲小譯和桔子互動合作的小譯問答&翻譯機器人——小譯9號。
除了以上機器翻譯上層應用,圍繞機器翻譯廠商這樣的淘金者,有Tmxmall、Flitto這樣的數據供應商、也有Intento這樣的API集成商——幫你「打包」集成各家的API。近日,Tmxmall也宣布開放文件解析回填API,加上機器翻譯和翻譯記憶檢索API,極大降低了CAT等翻譯工具類的成本。
觀察君說:機器翻譯技術大幅躍遷之後,目前進入技術「調優」階段,應用爆發,開枝散葉。翻譯類工具有成為大眾工具之勢——使用門檻降低、需求分散、場景增多、知名度提升。可以預見工具屬性還將弱化,日漸融合,至終演化為基礎設施。另一方面,鑑於語言遠超圖像和語音的複雜度,加上「人們總是高估新技術短期影響」的魔咒,每一個設計產品的人都應該重點考慮這兩個因素,避免過度自嗨。
聲明:關於以上產品觀察和評價,觀察君盡力做到客觀、中立、全面。既是追隨自己的興趣,也為關注機器翻譯產品的朋友服務,做一些收集整理的工作。
限於觀察君的有限腦洞和觀察力,歡迎各種拍磚討論。
作者:Stayhungry,微信公眾號@機器翻譯觀察。個人微信號:jeusmypower
本文由 @Stayhungry 原創發布於人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基於CC0協議