原標題:我國自主研發藏漢在線翻譯系統今年將面世
Resize of 使用藏漢翻譯軟體操作極其便捷 攝影:張麗娜
Resize of 陽光藏漢翻譯系統使用界面
中國西藏網訊 「有沒有藏漢翻譯的軟體,請推薦一款,急用!」網民@熱血永狂0000在某網頁上提出了這樣的求助,然而,這個問題從2014年提出至今還沒有一個答覆。不過,據西藏大學現代教育技術中心主任尼瑪扎西介紹,這個問題即將得到解決,「我們的陽光藏漢機器翻譯系統將在今年與網民用戶見面,屆時可以為很多需要翻譯的網友提供方便,工作效率可節約80%。」他說。
據西藏自治區科技廳介紹,2012年西藏自治區重點科研項目《基於短語的藏漢統計機器翻譯關鍵技術研究》取得標誌性研究成果——《陽光藏漢機器翻譯系統》獲得成功應用。該項目在藏語自動分詞與詞性標註、藏語語料庫、基於短語的藏漢統計機器翻譯技術等領域進行了深入研究,歷時近3年時間。
打開這款藏漢在線翻譯系統的界面,輸入藏文段落後,在很短時間內即可獲得相應漢語譯文,準確度比較高。據尼瑪扎西介紹,「陽光藏語自動分詞系統」的分詞速度達到每秒1000個藏文單詞,在藏文現代公文領域的分詞準確率達到95%。「在技術研發過程中,我們面臨著藏文分詞與藏漢翻譯兩大技術難點,目前我們還在不斷豐富語料庫、不斷完善翻譯技術。」在尼瑪扎西看來,這個系統就像一個牙牙學語的小孩,要不停地教給它各領域各行各業的知識,它才可以說出更漂亮的句子來。
Resize of 研發小組正在忙碌著 攝影:張麗娜
為了豐富語料庫,西藏大學研發隊伍還專門搜集網上、媒體、紙質書籍等信息源進行翻譯、書寫等加工,藏語語料庫建設了約300MB的藏語通用語料庫,包括約10MB藏語訓練語料、30多萬句藏漢雙語精確對照語料等。
藏文距今已有1300多年的歷史,是世界上古老的文字之一,也是廣大藏族群眾基本的交流工具。隨著當計算機和信息技術在全球普及,電腦、行動電話和網際網路在西藏的使用更加頻繁,藏文的信息化成為一種迫切需要解決的問題。
「藏文信息化也是近20年來才出現的新現象,從簡單輸入法到各項標準的制定,從字處理到句處理、段處理,是一種社會需求的表現、技術發展的必然。」20多年間,尼瑪扎西一直領銜西藏藏文信息化研究隊伍,他陸續主持制訂出藏文編碼國際、國家標準,研發出藏文計算機平臺、藏文計算機辦公套件、藏文行動電話、藏文短消息發布平臺、藏漢雙語遠程教育系統等一系列填補國內外空白的信息產品。
研發小組的具體負責人擁措仍然在忙碌著,「這個項目是小組的近30名成員利用近3年時間加班加點協作完成的,現在我們仍然需要努力,讓它的準確率更高,不斷增加它的學習次數。」擁措介紹說。為了輔助藏語自動分詞與詞性標註,該研究項目修訂完善了《信息處理用藏語詞類標記規範》,使之更符合藏文自動分詞、精確標註和藏漢機器翻譯的實際需求。研究團隊還研發了用於輔助藏語自動分詞與標註的藏文電子詞典,包括10萬詞條的《機讀詞典》和《人讀詞典》。
「現在在公文領域這款機器準確率比較高,今後我們還將向文學領域、宗教領域發展,使其更完善。我們的設想是,當一名遊客來到西藏,她遇到自己感興趣的藏文時,打開手機上的APP翻譯軟體就能夠獲知該藏文是什麼意思。」尼瑪扎西將他帶領的團隊做出的藏文信息化軟體都取名「陽光」,意為可以為更多的人帶來溫暖與服務。
聲明:凡註明為其他媒體來源的信息,均為轉載自其他媒體,轉載並不代表本網贊同其觀點,也不代表本網對其真實性負責。您若對該稿件內容有任何疑問或質疑,請即與東方網聯繫,本網將迅速給您回應並做處理。
電話:021-962007