中新網4月20日電 19日,第十屆中國電子信息技術年會在北京萬壽莊賓館舉行。由百度牽頭與中科院自動化所、浙江大學、哈爾濱工業大學、中科院計算所、清華大學聯合研發的《基於大數據的網際網路機器翻譯核心技術及產業化》項目獲得科技進步一等獎。項目成果被院士專家鑑定為「在多策略融合翻譯等技術方面取得突破,在翻譯質量、翻譯語種方向、響應時間三個指標上達到國際領先水平,並取得了顯著的經濟效益和巨大的社會效益」。
在全球化背景下,網際網路大數據為機器翻譯研究帶來了前所未有的機遇與挑戰,傳統翻譯模型和方法亟待創新。百度此項項目在海量翻譯知識獲取、翻譯模型、多語種翻譯技術等方面取得重大技術突破,解決了傳統方法研發成本高、周期長、質量低的難題,實時準確地響應網際網路海量、複雜的翻譯請求,使我國掌握了網際網路機器翻譯的核心技術,佔據該領域的技術制高點,同時也促進人工智慧技術的發展。
百度技術副總裁王海峰在論壇現場做主題為《網際網路機器翻譯及產業化》演講
基於在網際網路大數據方面的多年積累,百度機器翻譯團隊研發出海量、高質翻譯知識獲取技術,突破了傳統方法在知識獲取方面規模小、成本高的瓶頸;提出了創新的基於網際網路大數據的多策略翻譯模型,突破了單一方法的限制,實時響應每天來自全球超過上億次複雜多樣的包含網絡新詞、科技文獻、電子商務、古文、粵語等多領域、多文體的翻譯需求。為了進一步提高翻譯質量,該項目在翻譯消歧、譯文調序、小語種翻譯等世界性難題上提出創新的解決方案。項目申請專利40項,已獲授權17項;制定國際標準1項;取得軟體著作權34項;出版專著3部;發表領域頂級論文90餘篇。
據了解,多年來百度牽頭並聯合國內著名高校和研究機構,積極深入的開展機器翻譯相關研究及產業化應用,受到國家高技術發展研究計劃(863計劃)支持,並將此作為國家戰略重要組成部分的高技術提升至國際領先水平。
除了在學術領域取得了豐碩的研究成果外,該項目也取得了巨大的經濟和社會效益。項目成果已應用於國家多個重要部門和「百度翻譯」等產品中,覆蓋全球超過5億用戶。通過免費開放API,該項技術成果支持了包括華為、敦煌網等企業的超過7000個第三方應用,有力地提升了我國中小企業的開放創新能力,帶動了相關產業的繁榮與發展。如「敦煌網」等電子商務網站通過使用「百度翻譯」進行跨境貿易,更加有效地幫助平臺上的買家和賣家完成交易,跨越語言障礙,真正做到了外貿的無障礙交流。
隨著科技和社會經濟的快速發展,全球的互聯互通潮流也為機器翻譯提供了適合孕育的土壤。小到出國旅遊、科技文獻翻譯,大到國際貿易、跨語言文化交流,不斷深化的多語言信息聯通正不斷催熟著機器翻譯研究與產業化的快速升級。
首個多語翻譯機器人小度與海外嘉賓互動
百度技術副總裁王海峰表示,「語言是人類區別於其它生物的基本能力。不同語言之間的翻譯更是只有少數人才能做到。採用器翻譯技術自動實現語言之間翻譯是人工智慧的終極目標之一。過去幾年裡,我們取得了一系列基於網際網路大數據的機器翻譯關鍵技術突破,百度翻譯每天收到的翻譯請求量已經上億,滿足了廣大用戶多方面的翻譯需求,也帶動了很多相關產品和產業的發展。」
中國工程院院士倪光南也在大會上表示,機器翻譯現在擁有強大的工具,可以把大數據的威力充分發揮出來。百度這方面在全世界佔有領先的地位,「我相信我們在這些領域做好,通過機器翻譯促進機器智能的發展。」
中國工程院院士倪光南在論壇上發言
不僅在國內,百度機器翻譯取得的成果在國際上也受到了廣泛關注,國際機器翻譯協會主席、《機器翻譯》主編Andy Way,電氣電子工程師學會兼美國計算機協會音頻、語音及語言處理彙刊主編李海洲,美國計算機協會智能系統和技術處理彙刊創辦主編楊強等多位在人工智慧、機器翻譯領域的海外專家學者紛紛表示,機器翻譯是人工智慧的終極目標之一,得益於在自然語言處理方面的領先技術優勢與不懈的創新努力,百度翻譯在人工智慧研究中取得了矚目成績,能夠幫助人類拓展自身能力,讓生活更美好。
業內人士表示,幾十年來,作為自然語言處理領域最重要的研究方向之一,自主研發的機器翻譯技術不僅在學術領域具有重要意義,更成為了全球互聯世界裡的一種跨文化貿易交流推手、戰略性信息安全資源、甚至產業化助推器。在單語世界到多語世界的發展潮流中,機器翻譯技術正在逐步改變人們的工作和生活方式。也許三五年之後,如今在很多人眼中仍屬於「高大上」的機器翻譯將不斷融入大家的日常生活中,機器翻譯產業必將引領新一輪產業浪潮。(中新網IT頻道)