我查了下機器翻譯專利的申請量,於是有了些思考

2020-12-09 泡泡網

我查了下機器翻譯專利的申請量,於是有了些思考

2018年09月30日 14:30作者:黃頁編輯:黃頁

近日,機器翻譯受到格外關注,很多關心中譯語通的朋友紛紛問詢機器翻譯的未來到底會是什麼樣子?一時間被問得也覺得需要好好思考下。於是默默地、很是認真地梳理了2015年以來中譯語通在機器翻譯及其核心組件語料庫方向申請受理的專利情況,也想藉以認真判斷一下和國內巨頭們的差距到底有多大。

為了比較準確的分析自家研發水平到底咋樣,所以還是比較認真的設定了一些標準。比如,近年來機器翻譯發展尤為迅速,特別是2016年神經網絡算法的出現使得機器翻譯技術有了突破性發展,所以選取了時間區間2015年至今,在專利分類中G06F17(特定功能的數字計算設備或數據處理設備或數據處理方法)進行比對。此外,在專利檢索引擎我們使用了我們自家的JoveEye科技大數據平臺(www.joveeye.com)和合享Incopat專利檢索系統(www.incopat.com)交叉驗證,避免俺們自家的系統搞區別對待。

首先,為了避免遺漏,我使用最寬的條件進行檢索,將「翻譯」作為關鍵詞在專利分類計算機領域進行檢索,得到申請專利數量排名前10的公司列表如下:

然後我們再將「機器翻譯」、「文本翻譯」作為關鍵詞進行檢索,相關專利申請數量排名前五的公司如下:

還是為了避免遺漏,我們又將「語音翻譯」、「圖片翻譯」、「圖像翻譯」、「視頻翻譯」、「字幕翻譯」、「輔助翻譯」、「翻譯系統」、「文件翻譯」、「網頁翻譯」作為關鍵詞進行檢索,相關專利申請數量排名前五的公司如下:

然後,我把「機器翻譯」、「文本翻譯」、「語音翻譯」、「圖片翻譯」、「圖像翻譯」、「視頻翻譯」一起合併作為關鍵詞檢索分析,專利申請數量排名前五的公司如下:

至此,在機器翻譯領域國內的大體情況已大概能知曉。但為了更加的嚴謹,我對這五家公司的專利類型做了些分析。因為在搜索過程中,我發現有些專利是指的機器翻譯應用裝置等相關的申請。所以,想看看真正機器翻譯核心技術研發的專利情況如何。

考慮到搜狗和網易有道在業內的知名度,我也對他們的相關專利進行了了解,按照我第一步最寬的條件以「翻譯」為關鍵詞進行檢索,結果是搜狗擁有18個,網易有道有5個。

在最開始我提到過,神經網絡算法從2016年開始推動了機器翻譯技術的發展,各家也當然會加強此算法的專利研究。我特別看了一下從2015年到2018年的情況,百度擁有8個、中譯語通擁有7個、騰訊擁有2個、科大訊飛擁有2個,而且大部分發力階段都從2017年開始。

如果要全面分析機器翻譯技術的發展,光在國內肯定是不夠的。我又繼續以機器翻譯、文本翻譯為關鍵詞對於國外專利情況進行了檢索和分析,排名前五的公司不出意外的依然是耳熟能詳的國際大品牌:

詳細的專利列表清單如下:

總算花了些時間,基本上從國內和國際兩個範圍,從大範圍到小範圍,分析了機器翻譯領域相關專利的分布情況。基於此,幾點思考與大家探討:

1、機器翻譯最大的意義是擴大了人類認知信息的廣度與深度;

2、#新摩爾定律#「每18個月全球新增信息量是計算機有史以來全部信息量的總和」。某種意義上,今天99%以上機器翻譯處理的信息,都是此前人類力所不能及的;

3、高質量的機器翻譯引擎,其單位時間內翻譯的速度與質量可能都是人類無法企及的;

4、所謂替代人類,孰優孰劣,要有比較對象和對比標準;高質量引擎,不考慮消耗的時間,僅評比翻譯質量,如若還是垂直領域的,那麼機器翻譯超過90%以上的人類完全可能。太多的替代與不可替代的討論,設定條件根本就不在同一個場景,如同雞同鴨講;

5、不相信機器翻譯,是因為沒見到過更好的,但並不代表不存在,如同今天的特斯拉無人生產車間,阿里京東全自動化的包裹物流,已經可以無人工作。其實只是你沒見過而已;

6、有人問「人機耦合」是機器翻譯發展的未來嗎?對這個問題我做了認真思考。個人認為「人機耦合」輔助同聲傳譯,在會議口譯實踐中是個偽命題。與其人機耦合不如純機器翻譯質量提高來得更靠譜。同聲傳譯工作過程中,聽說時差(EVS,Ear Voice Span)一般為2-3秒鐘。同傳譯員耳機一側蓋住耳朵聽發言人聲音,另一側耳機是不蓋住耳朵,目的是要聽到自己講話的聲音,以控制譯員自身語音語調和語速。(我們自己帶耳機唱歌的時候會有感受,聽不到自己的聲音跑調太正常了。)因此譯員需要多任務的精力分配,聽懂,翻譯,重要數字記筆記,發言人表情,會議現場情況等等。在當前人類大腦多任務處理能力現狀,人機耦合的概念提出顯然是非專業人士的一廂情願,顯得格外格外的牽強。

轉載請註明出處。

相關焦點

  • 電氣設備行業發明專利申請量排行榜:國電南瑞第一
    發明專利申請量反映了公司技術創新的活躍度。那麼,電氣設備行業的發明專利申請量究竟如何呢?「新浪財經科創屬性研究中心」將為你一一解答。Choice的數據顯示,截至1月31日,電氣設備行業共有193家公司。
  • 醫藥生物行業外觀設計專利申請量排行榜:白雲山第一
    外觀設計專利申請量反映了公司技術創新的活躍度。那麼,醫藥生物行業的外觀設計專利申請量究竟如何呢?「新浪財經科創屬性研究中心」將為你一一解答。Choice的數據顯示,截至1月31日,醫藥生物行業共有317家公司。Sixlens的數據顯示,這317家公司的外觀設計專利申請總量為12505件,其中233家申請了外觀設計專利,另外84家沒有申請外觀設計專利。
  • 國防軍工行業外觀設計專利申請量排行:國睿科技第一
    外觀設計專利申請量反映了公司技術創新的活躍度。那麼,國防軍工行業的外觀設計專利申請量究竟如何呢?「新浪財經科創屬性研究中心」將為你一一解答。Choice的數據顯示,截至1月31日,國防軍工行業共有69家公司。
  • 中國網際網路雲技術專利申請量近14萬 騰訊申請量和授權量均居榜首
    1月10日,智慧財產權出版社i智庫發布《中國網際網路雲技術專利分析報告》(下稱報告)。報告顯示,截至2019年12月,網際網路企業在雲技術領域的中國專利申請量共計139780件。其中騰訊公司專利申請量和專利授權量分別以4899件和1892件位列榜首。同時,騰訊發明人規模達到5984人,位居第一位。
  • 翻譯們要失業了,聯合國推出了翻譯專利的 AI
    與普通翻譯不同,專利翻譯由於涉及眾多專業詞彙,翻譯機構通常會藉助專門的工具進行處理。
  • 中歐啟動專利中英文機器翻譯合作
    人民網布魯塞爾12月6日電   (記者 孫天仁)國家知識產權局和歐洲專利局6日在布魯塞爾正式啟動了專利中英文機器翻譯合作。 根據雙方達成的協議,歐洲專利局網站建立起英文、中文的自動翻譯體系,使中文專利內容能夠在網站上自動翻譯成其他指定國家的語言,也可以把網站上的英文內容自動翻譯成中文。
  • 中日雙方就專利信息及機器翻譯系統問題交流溝通
    11月4日下午,國家知識產權局副局長楊鐵軍會見了來訪的日本專利信息機構專務守屋敏道一行。雙方就專利信息及機器翻譯系統相關問題進行了交流與溝通。    楊鐵軍對守屋敏道一行的來訪表示歡迎,並向其介紹了國家知識產權局專利信息與機器翻譯系統有關情況。
  • 這回輪到翻譯們失業了,聯合國推出了翻譯專利的AI
    與普通翻譯不同,專利翻譯由於涉及眾多專業詞彙,翻譯機構通常會藉助專門的工具進行處理。如今,聯合國已經開發出了一種基於人工智慧的翻譯機 Wipo,將專利翻譯的質量又提升了一個檔次。圖片來自:FTWipo 項目的成員主要來自愛丁堡和蒙利利爾這兩所大學的工程師與 AI 學術專家,他們研發的「神經網絡」能夠在精確翻譯專利技術語言的同時,保留比其它系統更為自然的語序,這一點在翻譯兩門差別較大的語言時,優勢尤其明顯。
  • 中國上半年專利商標申請量「雙降」 官方:實現高質量發展
    孫自法 攝中新網北京7月9日電 (記者 孫自法)針對2019年上半年,中國發明專利、商標註冊的申請量出現「雙降」情況,中國國家知識產權局9日回應稱,這是持續優化申請結構、不斷提高創造質量的結果,實現了專利商標申請的高質量發展。總體上,2019年上半年,中國主要智慧財產權指標符合發展預期,智慧財產權綜合實力穩步提升。
  • 首份中國網際網路雲安全技術專利分析報告出爐:騰訊申請量第一
    近日,智慧財產權出版社有限責任公司旗下平臺i智庫發布了《中國網際網路雲安全技術專利分析報告》(以下簡稱報告),以中國網際網路企業為研究對象,從專利角度對中國雲安全技術領域的發展現狀進行分析。報告顯示,雲安全技術領域網際網路企業的中國專利申請量共計26485件,騰訊憑藉1542件的專利申請量位列第一,同時在專利授權量、細分雲安全技術、專利價值等多方面也穩居行業第一。
  • 中國2017年國際專利申請量坐二望一,或三年後超過美國
    中國日報網3月22日電世界智慧財產權組織(WIPO)21日公布了2017年全球各國申請註冊國際專利的數據。中國的國際專利申請量首次升至全球第二,更有望三年內趕超美國坐上頭把交椅。  而中國國家知識產權局受理的專利總量(國內+國外),早在2016年就位列世界第一。中國正在成為智慧財產權「強國」。
  • 2020年1-11月智慧財產權主要統計數據,專利、商標申請量超去年全年
    發明專利申請量增加164976件,授權量增加53084件(同比增長12.72%);實用新型專利申請量增加714386件,授權量增加741781件(同比增長52.59%); 外觀設計專利申請量增加56962件,授權量增加174481件(同比增長35.06%)。
  • 專利文獻翻譯領域的「狼」來了?
    人工智慧翻譯系統科專笑飛或將使專利文獻翻譯行業重新洗牌「狼,真的來了!」當人工智慧應用浪潮襲來時,智慧財產權出版社有限責任公司(下稱智慧財產權出版社)董事長諸敏剛對此作出如此評價。今年「4·26」世界智慧財產權日期間,智慧財產權出版社發布了一款被翻譯工作者稱之為「狼來了」的人工智慧產品——科專笑飛人工智慧機器翻譯系統(下稱科專笑飛),致力於為智慧財產權領域提供專業的專利文獻翻譯服務。該系統的上線,不僅是響應黨中央、國務院關於提升專利審查質量要求的具體部署,也是落實國家知識產權局黨組要求運用新技術推動審查質量提升的具體舉措。
  • 2017年深圳PCT國際專利申請量排名前10名企業
    2017年深圳PCT國際專利申請量排名前10名企業,其中,中興通訊股份有限公司、深圳市華星光電技術有限公司,申請量大幅下滑,都是負增長;但2016年的PCT申請量不足10件,且不在深圳前100名的惠科股份有限公司、深圳傳音通訊有限公司、平安科技有限公司、深圳華星光電半導體顯示技術有限公司,在2017年卻異軍突起,海外布局意圖相當明顯。
  • 中國人工智慧專利申請量世界第一併率先實現5G商用!
    (圖片來源於網絡)不僅如此,從全球範圍來看,自2020年開始,全球的5G網絡將有30%採用中國的技術。在此前的國新辦發布會中,國家科技部高新技術司司長秦勇就表示,我國在移動通訊技術上實現了5G技術領跑,5G核心專利數排名世界第一,並率先實現了5G商用。
  • 廣州開發區PCT國際專利申請量位居全國219家經開區首位
    廣州開發區「探索智慧財產權運用和保護綜合改革試驗」被國家知識產權局列入第一批智慧財產權強省建設試點和典型案例,「智慧財產權大保護大協同機制」入選廣州市首批優化營商環境典型經驗,廣州開發區知識產權局聯合黃埔海關查處侵犯「Dettol」商標專用權一案入選2019年中國海關智慧財產權保護十大典型案例……據統計,2019年,廣州開發區PCT國際專利申請量
  • 機器翻譯三大核心技術原理 | AI知識科普
    在認識到不眠不休窮盡人類一生的力量,也只能掌握幾十種語言時,很多科學家開始思考,如何用機器來幫助人們去解決溝通問題,於是機器翻譯應運而生。02曲折中前行的機器翻譯機器翻譯的故事始於1933年,從最開始的只是科學家腦海中一個大膽設想,到現在大規模的開始應用,機器翻譯技術的發展道路大概有6個階段。
  • 機器翻譯簡史
    如果不是1956年又有兩名蘇聯科學家發現了他的專利,世界上不會有人知道,曾經有人構想過這樣一臺機器。那是冷戰初期,1954年1月7日,在紐約的IBM總部開始進行Georgetown–IBM實驗,IBM 701計算機完成了史上首例機器翻譯,自動將60個俄語句子翻譯成了英語。
  • 中國專利申請量大幅提升,已是美國2倍多,穩坐世界第一
    【編輯/作者 日月探索欄目 火光/小灰灰】前言:專利數量對於一個國家發展而言相當重要,專利越多,掌握技術也就越高,能夠讓國家各行各業發展更為快速。中國在專利申請方面目前已經有量很大進步,這說明中國的實力也在增加。
  • 國內民營銀行新巨頭:超越四大銀行,它的專利申請量全球排第一
    以其細分領域銀行業為例,在近日英國《銀行家》雜誌發布的2020年全球銀行1000強榜單中,國內便有143家銀行進入1000強陣營。榜單數據顯示,四大行位居榜單前4名:中國工商銀行位居榜首,而中國建設銀行(第二名)、中國農業銀行(第3名)和中國銀行(第四名)則緊隨其後。科技是第一生產力。