美國時間3月26日,由美國權威科技雜誌 MIT Technology Review (《麻省理工科技評論》)舉辦的年度科技大會 EmTech Digital 在舊金山舉行。
百度自然語言處理部首席科學家、技術委員會聯席主席吳華博士受邀發表題為「Breaking Barriers with Machine Translation」的報告,介紹了百度機器翻譯的最新技術進展及創新產品。
百度是此次機器翻譯領域唯一被邀請出席的企業嗷!(驕傲臉
MIT Technology Review 隨後發文詳細報導了這次演講,稱讚百度作為中國網際網路巨頭在機器翻譯上取得的重大進展。點擊文末「閱讀原文」可查看詳細報導。
EmTech Digital聚焦全世界最前沿的人工智慧科技進展,每年邀請世界一流公司和研究機構如百度、亞馬遜、谷歌、微軟、UC Berkeley 等探討人工智慧熱點話題,涵蓋機器人、計算機視覺、自然語言處理等人工智慧領域前沿領域。
今年的 EmTech Digital 密切關注領導中國 AI 變革的企業,AI 如何從製造業向零售業滲透,以及 AI 的道德問題。百度受邀作為機器翻譯領域的代表,向全世界展示機器翻譯最新進展。
現場,吳華結合百度的具體實踐,介紹了機器翻譯的歷史以及神經網絡機器翻譯取得的巨大進步。吳華表示,世界語言的多樣性使得人類一直存在「巴別塔困境」,而機器翻譯的使命正是運用人工智慧打破人與人之間交流的障礙,這同時也是人工智慧的終極目標之一。
她介紹,機器翻譯發展至今經歷了三個階段:第一個階段是基於規則的方法,第二個階段是基於統計的方法,第三個是基於神經網絡的方法。
2015年,百度率先在機器翻譯系統中採用深度神經網絡,機器翻譯質量由此有了質的提升。吳華談及神經網絡機器翻譯時認為這是個令人興奮的進步,因為三年來機器翻譯質量的提高甚至已經遠超過去二十年發展的總和。
事實上,早在2013年百度就已經開始布局神經網絡機器翻譯,在算力、算法、模型等方面展開研究,突破了神經網絡機器翻譯的核心技術瓶頸。作為百度自然語言處理部的首席科學家,吳華更是很早就致力於將深度學習應用於自然語言處理(NLP)中。
福布斯專欄文章和《紐約時報》都曾對吳華所取得的成就表示讚賞,稱
吳華提出的神經網絡機器翻譯(Neural Machine Translation, NMT)多任務學習框架是「開創性」的工作。
神經網絡的應用是推動機器翻譯真正落地的重要裡程碑。吳華介紹時說,在神經網絡的框架下,我們能夠在多個語言對之間共享語義表達,無需為每個語言對單獨構建編碼器或解碼器,這意味著可以在沒有語料庫的情況下也能提高翻譯質量。
百度已於2015年推出了全球首個神經網絡賦能的機器翻譯服務,目前已擁有數億用戶。此外,百度也在同年實現了基於神經網絡的離線翻譯。
在採訪環節,主持人與吳華利用百度 WiFi 翻譯機進行了互動,精準的語音翻譯和便捷的應用場景博得觀眾的陣陣驚呼,現場掌聲不斷。演講結束後,吳華被聽眾包圍交流關於百度機器翻譯及智能翻譯機的研究,大家對百度在人工智慧領域取得的快速進展表示稱讚,紛紛表示想要合作。
近年來,神經網絡機器翻譯促使翻譯質量大幅提高,越來越多的公司投入巨大的人力、物力、財力,力圖在這一前沿領域取得一席之地,競爭空前激烈。
2017年底,MIT Technology Review 評出2018年世界十大技術突破,在官方榜單中,百度被列為實時語音翻譯領域「關鍵玩家」,成為本年度唯一一家入選的中國公司。
可以預見到的是,融入不同 AI 技術的機器翻譯將改變不同語言之間的交流方式,日益深入地走進我們的生活,幫助我們實現更為輕鬆順暢的跨語言交流。