【環球網智能綜合報導】 據印度《經濟時報》9月2日報導,Facebook的研究人員已經開發出了一種更快、更準確的方法,使用人工智慧翻譯烏爾都語和緬甸語等低資源語言。
據《福布斯》雜誌報導,這項突破將在自然語言處理頂級會議 EMNLP上展示。由於Facebook這一社交媒體巨頭使用自動語言翻譯來幫助世界各地的用戶閱讀適用他們的語言的帖子,因此這一突破對其可能很重要。
Facebook人工智慧研究院 ( FAIR )部門的團隊,從維基百科等公開網站中獲取大量不同語言的不同文本,以此來提升機器翻譯 (MT)。
需要注意的是,這些文本是相互獨立的。「建立一個平行語料庫很複雜,因為你需要找到精通兩種語言的人來創建它。例如,如果你想建立一個葡萄牙語和尼泊爾語的平行語料庫,需要找到精通這兩種語言的人,這是非常困難的,」研究科學家兼FAIR巴黎研究實驗室主任Antoine Bordes表示:「另一方面,建立葡萄牙語和尼泊爾語單語語料庫非常容易:無論它們是否為平行句子,也不管它們談論的是否為同一件事,你只需要從葡萄牙語和尼泊爾語網站下載網頁就可以了。」
大多數語言翻譯計算機系統使用單語語料庫和平行語料庫來學習。Bordes稱:「我們方法的新穎之處在於,只用從單語語料中提升MT系統,我們不需要任何平行語料。理想化來說,如果一本書是用外語寫的,我們可以用我們的模型將其翻譯成英語。」(實習編譯:吳瓊 審稿:劉洋)