近日,機器翻譯受到格外關注,很多關心中譯語通的朋友紛紛問詢機器翻譯的未來到底會是什麼樣子?一時間被問得也覺得需要好好思考下。於是默默地、很是認真地梳理了2015年以來中譯語通在機器翻譯及其核心組件語料庫方向申請受理的專利情況,也想藉以認真判斷一下和國內巨頭們的差距到底有多大。
為了比較準確的分析自家研發水平到底咋樣,所以還是比較認真的設定了一些標準。比如,近年來機器翻譯發展尤為迅速,特別是2016年神經網絡算法的出現使得機器翻譯技術有了突破性發展,所以選取了時間區間2015年至今,在專利分類中G06F17(特定功能的數字計算設備或數據處理設備或數據處理方法)進行比對。此外,在專利檢索引擎我們使用了我們自家的JoveEye科技大數據平臺(www.joveeye.com)和合享Incopat專利檢索系統(www.incopat.com)交叉驗證,避免俺們自家的系統搞區別對待。
首先,為了避免遺漏,我使用最寬的條件進行檢索,將「翻譯」作為關鍵詞在專利分類計算機領域進行檢索,得到申請專利數量排名前10的公司列表如下:
然後我們再將「機器翻譯」、「文本翻譯」作為關鍵詞進行檢索,相關專利申請數量排名前五的公司如下:
還是為了避免遺漏,我們又將「語音翻譯」、「圖片翻譯」、「圖像翻譯」、「視頻翻譯」、「字幕翻譯」、「輔助翻譯」、「翻譯系統」、「文件翻譯」、「網頁翻譯」作為關鍵詞進行檢索,相關專利申請數量排名前五的公司如下:
然後,我把「機器翻譯」、「文本翻譯」、「語音翻譯」、「圖片翻譯」、「圖像翻譯」、「視頻翻譯」一起合併作為關鍵詞檢索分析,專利申請數量排名前五的公司如下:
至此,在機器翻譯領域國內的大體情況已大概能知曉。但為了更加的嚴謹,我對這五家公司的專利類型做了些分析。因為在搜索過程中,我發現有些專利是指的機器翻譯應用裝置等相關的申請。所以,想看看真正機器翻譯核心技術研發的專利情況如何。
考慮到搜狗和網易有道在業內的知名度,我也對他們的相關專利進行了了解,按照我第一步最寬的條件以「翻譯」為關鍵詞進行檢索,結果是搜狗擁有18個,網易有道有5個。
在最開始我提到過,神經網絡算法從2016年開始推動了機器翻譯技術的發展,各家也當然會加強此算法的專利研究。我特別看了一下從2015年到2018年的情況,百度擁有8個、中譯語通擁有7個、騰訊擁有2個、科大訊飛擁有2個,而且大部分發力階段都從2017年開始。
如果要全面分析機器翻譯技術的發展,光在國內肯定是不夠的。我又繼續以機器翻譯、文本翻譯為關鍵詞對於國外專利情況進行了檢索和分析,排名前五的公司不出意外的依然是耳熟能詳的國際大品牌:
詳細的專利列表清單如下:
總算花了些時間,基本上從國內和國際兩個範圍,從大範圍到小範圍,分析了機器翻譯領域相關專利的分布情況。基於此,幾點思考與大家探討:
1、機器翻譯最大的意義是擴大了人類認知信息的廣度與深度;
2、#新摩爾定律#「每18個月全球新增信息量是計算機有史以來全部信息量的總和」。某種意義上,今天99%以上機器翻譯處理的信息,都是此前人類力所不能及的;
3、高質量的機器翻譯引擎,其單位時間內翻譯的速度與質量可能都是人類無法企及的;
4、所謂替代人類,孰優孰劣,要有比較對象和對比標準;高質量引擎,不考慮消耗的時間,僅評比翻譯質量,如若還是垂直領域的,那麼機器翻譯超過90%以上的人類完全可能。太多的替代與不可替代的討論,設定條件根本就不在同一個場景,如同雞同鴨講;
5、不相信機器翻譯,是因為沒見到過更好的,但並不代表不存在,如同今天的特斯拉無人生產車間,阿里京東全自動化的包裹物流,已經可以無人工作。其實只是你沒見過而已;
6、有人問「人機耦合」是機器翻譯發展的未來嗎?對這個問題我做了認真思考。個人認為「人機耦合」輔助同聲傳譯,在會議口譯實踐中是個偽命題。與其人機耦合不如純機器翻譯質量提高來得更靠譜。同聲傳譯工作過程中,聽說時差(EVS,Ear Voice Span)一般為2-3秒鐘。同傳譯員耳機一側蓋住耳朵聽發言人聲音,另一側耳機是不蓋住耳朵,目的是要聽到自己講話的聲音,以控制譯員自身語音語調和語速。(我們自己帶耳機唱歌的時候會有感受,聽不到自己的聲音跑調太正常了。)因此譯員需要多任務的精力分配,聽懂,翻譯,重要數字記筆記,發言人表情,會議現場情況等等。在當前人類大腦多任務處理能力現狀,人機耦合的概念提出顯然是非專業人士的一廂情願,顯得格外格外的牽強。
轉載請註明出處。