機器翻譯產品全景圖

2020-12-11 人人都是產品經理

本篇文章為大家介紹了機器翻譯產品以及其具體使用場景。

聲明:本文僅代表個人觀點,不代表任何機構立場

「不謀全局者,不足謀一域。」 ——古語

機器翻譯在2018的科技媒體絕對是一個高頻詞。看過WMT和IWLST等國際大賽中國玩家奪得好名次的消息,也見識過《揭秘進博會同聲傳譯背後:不是人,是機器人》這樣的驚悚標題;見過實時字幕投屏的機器同傳的驚豔,也經歷過「人機耦合」的刷屏;看過一場場翻譯機翻譯蛋翻譯耳機的發布會新聞,也等到了百元級別價格屠夫的出現……

但作為一個好奇執著的翻譯產品關注者,觀察君更關注的是,機器翻譯這個近兩年日漸成熟的技術,在這一番熱鬧之下,在產品層面如何的演化?滲透進了哪些場景?呈現出了怎麼樣的趨勢?

先來一張圖:

機器翻譯+場景是最有意思的部分,觀察君把它們分為三大類場景:信息發布、信息獲取、信息交換。當然這個分類不是絕對的,比如視頻翻譯和文檔翻譯就可以既歸於信息發布又可以歸於信息獲取,並有融合的趨勢。

下面就這張圖一一細說:

一、開放翻譯系統

最常見的形態就是這種在線翻譯:

這類產品,除了語種在默默增加,各家系統暗自較勁,有兩個大的變化:

一是幾乎一夜之間齊刷刷冒出來的文檔翻譯,就連之前老氣橫秋的谷歌翻譯大叔也改版了;

二是中譯語通、新譯、愛特曼等公司,在通用翻譯之外,推出了專業領域翻譯。可以預見接下來會更多樣化,比如增加用戶上傳術語之類的功能。

二、私有翻譯系統

出於安全考慮,一些財大氣粗的政府機構、情報機構或者企業,會直接採購私有的翻譯系統部署在本地,當然具體需求各異,但安全、定製化是大家一致的需求。下面是to B類機器翻譯賽道上的一些公司:

以上只列舉了部分,提供機器翻譯私有部署服務的還有橙譯中科、傳神、語智雲帆、歐米翻譯等公司。

另外,正如近年一個有趣的現象:友商之間競爭有時非常短暫,大家跑著跑著就不在一個賽道了。比如中譯語通轉向大數據,愛特曼科技轉向醫療(同類公司還有具備人機翻譯背景的深度智耀),百度翻譯、搜狗翻譯也」橫插一腳「提供私有化部署服務。

三、機器翻譯+具體使用場景

1. 信息發布場景

CAT(計算機輔助翻譯):除了翻譯記憶庫,這個「古老」工具最大變化之一是機器預翻譯以前是免費的,現在開始收費了,畢竟機器翻譯越來越靠譜了。

還有一個重要變化是從複雜的客戶端演變成在基於web端的輕量化工具,無需下載安裝,上手容易。CAT工具可以分成三類:

交互式機器翻譯方面,創立於2015年的Lilt今年10月剛剛宣布A輪融資;騰訊AI Lab 11月也剛剛發布了交互式機器翻譯產品Transmart。

超越傳統CAT基於翻譯記憶和機器翻譯譯後編輯模式,這個產品實現了人機互動的數據閉環,無疑代表了專業筆譯工具的未來。

隨著工具門檻的降低,來自各行各業的「非專業」譯者,憑藉自己的專業知識背景,有望快速擴大這個原本不足百萬的用戶群體。

翻譯輸入法:代表產品有譯雲輸入法、輕敲輸入法、搜狗輸入法(翻譯只是其中一個功能,海外版名字叫Typany)、新譯預測性翻譯、輕敲輸入法等。

需要改變用戶習慣的客戶端輸入法已經被驗證是雞肋產品,借著名的俞軍產品價值公式:產品價值=(新體驗-舊體驗)-換用成本。輸入法高昂的換用成本,導致這個等式右邊目前只能為負。

今年出現的Transmart和預測性翻譯是一種「輕量級」的輸入法,只是在輸入時,提供單詞補全和短語提示,但是起到了減少鍵盤敲擊次數的作用。

文檔翻譯/word翻譯插件:只是簡單的機器翻譯+格式處理,文檔翻譯應該算是2018年最低調但是最流行的機器翻譯產品了,而且受眾廣泛,以至於可以出現一家公司就專注於文檔翻譯,比如翻譯狗。

當然,隨著百度、搜狗、谷歌翻譯相繼推出免費版本,這個產品的盈利方式挑戰嚴峻。

視頻翻譯:根據語音實時生成多語字幕,Youtube很早就有這個功能了,可惜大多數朋友享受不到。不過字幕通和網易見外不僅可以實時自動翻譯字幕,還更進一步,可以編輯生成的字幕,加一些簡單的特效。把傳統字幕翻譯的6個步驟變成2個步驟。在視頻內容激增、5G風雨欲來的背景下,視頻翻譯未來幾年是否會爆發?

2. 信息獲取場景

跨語言搜索:用谷歌搜索外文關鍵詞,搜索結果會顯示「翻譯此頁」,部分解決了網頁瀏覽的語言問題。不過,假如觀察君想了解糖尿病,打開google卻尷尬的是發現不會拼這個詞……不過現在有一個替代方案了,搜狗英文也多做了一步——幫你翻譯查詢詞。

電商商品翻譯:電商平臺本身就涉及多種翻譯場景,比如商品描述、買家評論、買家賣家即時跨語言交流。這方面阿里巴巴走在前面。Amazon、Booking、Tripadvisor、Yelp這些網站也有大量商品點評的自動翻譯。

網頁翻譯:除了傳統的網頁翻譯插件,彩雲小譯推出的外媒內容翻譯是一個很有意思的嘗試,堪稱重度內容患者的福音。

相比於網頁插件,這個產品有兩個亮點:幫你把海外各大媒體分好類;翻譯時是原譯對照,給人一種「安全感」。

跨語言大數據:海量信息抓取+機器翻譯+文本處理和分析,下圖是中譯語通的部分產品。當然,在這些產品中,機器翻譯作為一種能力隱藏起來了。這種應用方式契合中譯語通「機器翻譯最大的意義是擴大了人類認知信息的廣度與深度」的看法。類似的產品還有今年剛上線的因鉭投智,通過醫療健康產業數據抓取+機器翻譯+處理分析,為醫療行業投資者提供數據分析服務。

3. 信息交換場景

社交翻譯:微信的「長按翻譯」就是典型應用,除了Facebook、Instagram、Twitter、微博、阿里賣家海外版這些大眾社交軟體,還有一批主打翻譯社交的小眾app。不過,隨著翻譯不再小眾,這類翻譯社交APP機會渺茫。

語音翻譯:除了早年的主打語音翻譯的APP,翻譯機的爆發讓很多人都驚呼意外,目前在京東上架的翻譯機已接近200種。當然,直到現在堅持認為「翻譯機就是收智商稅的產品」的還大有人在。翻譯機會怎麼樣?這是另一個有意思的話題,觀察君擇日會和你分享一些觀察和思考。

AI同傳:自騰訊同傳在博鰲亞洲論壇「上崗」之後,AI同傳算得上最奪人眼球的機器翻譯產品,畢竟佔據著大會的屏幕,讓原本只能聽見的聲音「看得見」。對這個產品而言,好消息是,人機耦合的風波漸漸退去,相比於人工同傳的高成本,這個產品不會有翻譯機那種「是否雞肋」的爭議,畢竟人工同傳的價格擺在那。壞消息是,我們究竟有多少會議需要現場同傳?除了PR效果,這個市場容量到底怎麼樣?

智能問答:從形式上看,一種作為問答機器人的一項「技能」,和定鬧鐘,放首歌,查天氣一樣,通過語音交互,比如小愛同學APP和智能音箱。還有一種集成到微信的形式,比如彩雲小譯和桔子互動合作的小譯問答&翻譯機器人——小譯9號。

四、最後

除了以上機器翻譯上層應用,圍繞機器翻譯廠商這樣的淘金者,有Tmxmall、Flitto這樣的數據供應商、也有Intento這樣的API集成商——幫你「打包」集成各家的API。近日,Tmxmall也宣布開放文件解析回填API,加上機器翻譯和翻譯記憶檢索API,極大降低了CAT等翻譯工具類的成本。

觀察君說:機器翻譯技術大幅躍遷之後,目前進入技術「調優」階段,應用爆發,開枝散葉。翻譯類工具有成為大眾工具之勢——使用門檻降低、需求分散、場景增多、知名度提升。可以預見工具屬性還將弱化,日漸融合,至終演化為基礎設施。另一方面,鑑於語言遠超圖像和語音的複雜度,加上「人們總是高估新技術短期影響」的魔咒,每一個設計產品的人都應該重點考慮這兩個因素,避免過度自嗨。

聲明:關於以上產品觀察和評價,觀察君盡力做到客觀、中立、全面。既是追隨自己的興趣,也為關注機器翻譯產品的朋友服務,做一些收集整理的工作。

限於觀察君的有限腦洞和觀察力,歡迎各種拍磚討論。

 

作者:Stayhungry,微信公眾號@機器翻譯觀察。個人微信號:jeusmypower

本文由 @Stayhungry 原創發布於人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基於CC0協議

相關焦點

  • 越來越聰明的機器「翻譯家」
    如果按轉換層面進行劃分,可以分為直接翻譯、轉換翻譯和中間語言翻譯,其中轉換翻譯又可以分為短語層、句法層、語義層等(圖2)。圖2 機器翻譯的轉換類型早期的機器翻譯系統常用「直接翻譯法」,也就是我們常說的「詞到詞」的翻譯方式,將一種語言句子中的每個單詞或固定詞組直接替換成目標語言對應的詞或詞組。
  • 360度全景圖是如何生成的?
    360度全景圖以其栩栩如生的互動和強沉浸性的感受,一直備受許多攝影愛好者的喜愛。但是針對一般的觀賞者來講,這類能夠360度隨意收看的照片,還是具備奇妙的風採。今日,小九也講一講一張360度全景圖是怎樣轉化生成的吧!
  • 【彭博研究巨獻】2016 機器學習生態全景圖 3.0:機器智能改變世界
    【新智元導讀】Bloomberg Beta 團隊回顧總結全球機器學習 2016 一年發展,總結技術、應用、產業等各方面並展望未來。核心請看他們繪製的《機器學習生態全景圖 3.0》。(文/Bloomberg Beta 團隊)大約一年前,我們發表了一份《年度機器智能公司生態全景圖》(The current state of machine intelligence 2.0),從那時起我們有幸見證了這個領域的很多活動。
  • 以翻譯產品為例,談談產品工作展開的方法論
    筆者一直從事機器翻譯領域的工作。隨著產品的成熟,用戶增長逐漸放緩,需要去探尋業務和收入的新增點,在此基礎上,提出了新增人工翻譯業務的想法。以新增人工翻譯業務為案例,總結了一套產品工作開展方法論,希望對大家有所啟迪和幫助。
  • 機器翻譯應用價值凸顯 百度翻譯豐富產品矩陣助力企業智能化升級
    機器翻譯作為人工智慧關鍵技術之一,正日益成為企業智能化升級的重要應用場景。12月1日,百度大腦開放日舉辦了以「機器翻譯 溝通全世界」為主題的專場活動。
  • 探究B端產品的體驗設計方法——角色全景圖
    編輯導讀:隨著B端產品需求量與日俱增,B端市場的春天也逐漸到來,在這過程中B端體驗設計變得越來越受到重視。面對挑戰,設計師的設計思路該是怎樣的?本文作者對 B 端產品體驗設計方法——角色全景圖展開了分析說明,供大家一起參考和學習。01 研究背景1.
  • 2020國際機器翻譯大賽:火山翻譯力奪五項冠軍
    (圖:WMT2020 中英翻譯前幾名系統得分。Ave.z代表人工評估標準化分數,也是目前機器翻譯最受認可的指標。)火山翻譯的LightSeq、mRASP等技術讓人眼前一亮,機器翻譯有廣闊的發展空間,非常期待火山翻譯為機器翻譯的技術研究和產品應用探索更多可能性。」
  • 2020 國際機器翻譯大賽:火山翻譯力奪五項冠軍
    (圖:WMT2020中英翻譯前幾名系統得分。Ave.z代表人工評估標準化分數,也是目前機器翻譯最受認可的指標。)相比「中文-英語」,「德語-英語」在WMT比賽上是傳統項目,也是歐洲國家最關注的語向。火山翻譯的LightSeq、mRASP等技術讓人眼前一亮,機器翻譯有廣闊的發展空間,非常期待火山翻譯為機器翻譯的技術研究和產品應用探索更多可能性。」
  • Atman 劉昌芳:醫學機器翻譯與機器寫作
    演講者為 Atman 產品負責人劉昌芳,為方便閱讀,「KnowingAI知智」進行了不影響原意的編輯。Atman 產品負責人劉昌芳Atman 是一家由微軟亞洲研究院(MSRA)和微軟 Bing 的人工智慧專家創辦的公司,60% 的同事來自微軟。
  • 神經網絡機器翻譯技術及應用(下)
    前面我們講了機器翻譯的原理以及神經網絡翻譯的發展、以及面臨的挑戰,我們現在看一看,機器翻譯現在有哪些應用?機器翻譯在越來越多地幫助和影響我們的生活。上圖中列出了幾個利用機器翻譯來進行日常學習和交流的例子。
  • 機器翻譯簡史
    所以無論是現實中,還是科幻電影中,人們一直希望能有一個機器,讓人不學外語也能暢快溝通。隨著技術進步,這個夢想正在一步步成為現實。來自俄羅斯的Ilya Pestov,最近寫就了一篇《機器翻譯簡史》,較為完整地回顧了人類過去幾十年來在機器翻譯方面的探索和努力。
  • 機器輔助翻譯之TRADOS知多少
    翻譯是克服語言障礙的有力手段,專業的翻譯公司是跨文化交流的橋梁,translator更是文化傳播的使者。然而,傳統的純人工翻譯方式因成本高、耗時長等原因似乎已經不能滿足翻譯市場某些客戶稿件數量大、時間緊的需求。於是,機器輔助翻譯應運而生。 那麼,什麼是機器輔助翻譯呢? 在說機器輔助翻譯之前,我先說下我對機器翻譯的理解。
  • 設計研究院|探究B端產品的體驗設計方法——角色全景圖
    接著可以用可視化的方式表達任務節點的費力度等級、角色體驗評估內容,然後匯總成角色全景圖。 角色全景圖合集 04 進行「全景圖」觀察
  • 百度機器翻譯獲2015年度國家科技進步二等獎(圖)
    百度機器翻譯項目在大會上被授予國家科技進步獎,成為BAT中首個獲此獎項的企業。機器翻譯是人工智慧領域最難的課題之一。1947年,機器翻譯步入歷史舞臺,50年代機器翻譯研究持續升溫,美國、前蘇聯等國家均出現了研究熱潮。
  • 機器翻譯+人工翻譯,認識翻譯之美
    每年9月30日是國際翻譯日,是全體從事翻譯工作者的節日。在以往,人工翻譯佔主流,如今機器翻譯和人工翻譯相輔相成,共同推進世界範圍內的翻譯工作。全語通翻譯機在機器翻譯沒有成熟之前,只要涉及到跨語種,只能依靠人工。機器翻譯成熟之後,則將人類解放了出來,只需要在法律、金融等專業垂直領域依靠人工來完成工作。有人說,機器翻譯搶了人類的活,但是從另外一種角度考慮,正是機器翻譯的出現,才逼迫人類往更好的方向發展。
  • 搜狗機器翻譯團隊獲得 WMT 2017 中英機器翻譯冠軍
    近年來,幾乎所有的研究機構在發表關於機器翻譯新方法的論文時,都會以 WMT 數據集作為實驗數據,並以 BLEU 評分來衡量方法的有效性,給出一個量化的、可比的翻譯質量評估,因此,WMT 數據集已經成為機器翻譯領域公認的主流數據集。
  • 阿里獲WMT國際機器翻譯大賽5項冠軍
    圖為阿里巴巴達摩院獲得5個項目自動評測第一名。供圖中新網杭州5月24日電 (黃慧)在WMT2018國際機器翻譯大賽上,阿里巴巴達摩院機器智能-NLP翻譯團隊在提交的5項比賽中全數獲得冠軍。在本屆大賽上,阿里達摩院機器智能技術實驗室資深算法專家陳博興帶領達摩院機器翻譯團隊參賽。他們基於業界最新的Transformer結構進行了網絡結構的改進和對詞語位置信息的充分利用,全面改進了機器翻譯的性能。陳博興曾任加拿大國家研究委員會研究員,擔任過NLP領域所有頂級會議和期刊的審稿人,並曾多次在各類機器翻譯評測中取得優異成績。
  • 一文看懂我國機器翻譯發展情況及BAT、科大訊飛等機器翻譯格局分析
    3.騰訊機器翻譯(TencentMachineTranslation)是騰訊公司研發的人工智慧機器翻譯產品,基於自研的神經網絡翻譯引擎,能夠從海量語料庫中自主學習,在翻譯的全過程中整體建模,從而達到翻譯結果的高準確率與流暢度。
  • 五張動圖,看清神經機器翻譯裡的Attention
    新智元報導來源:towardsdatascience編輯:大明【新智元導讀】近年來,神經機器翻譯的突飛猛進讓越來越多的人類翻譯感到壓力山大,瑟瑟發抖,那麼如此強大的機器翻譯架構內部的運行機制究竟是怎樣的
  • 機器翻譯的夢想與現實
    近年來,隨著計算機性能的提高,雲計算、大數據和機器學習等相關技術迅速發展,人工智慧再度崛起,機器翻譯重新成為人們關注的焦點。一時間,機器翻譯系統如雨後春筍般湧現,各種報導隨之呈井噴式爆發,「機器翻譯將取代人類」的說法也時有耳聞。然而,機器翻譯的真實水平如何,夢想與現實的距離到底有多遠?