為做好2019年度雲南省科學技術獎勵提名工作,完善科技獎勵的社會監督工作,確保科技成果獎勵的公正性,根據《雲南省科學技術獎勵辦法》(雲南省人民政府令第157號)、《雲南省人民政府辦公廳關於印發雲南省深化科技獎勵制度改革實施方案的通知》(雲政辦函〔2018〕98號)等相關文件規定及《雲南省科技廳關於2019年度雲南省科學技術獎提名工作的通知》(雲科獎發〔2019〕1號)的相關要求,現對以下項目的基本情況、項目簡介、候選人對項目的貢獻情況、代表性論文專著情況等信息予以公示,公示期為8天(2019年5月27日-2019年6月3日)。
公示期間任何對公示內容有異議的單位或個人,請在公示期內實名並提供書面材料向科學技術院反映。
聯繫人: 科學技術院 李老師
聯繫電話:0871-65916002
聯繫郵箱:kmustzhb@163.com
昆明理工大學
2019年5月27日
一、項目基本情況
項目名稱:納西-漢語雙語語料庫建設與機器翻譯方法
項目完成單位:昆明理工大學
擬提名情況:雲南省自然科學獎
二、項目簡介
納西語是世界上唯一活著的象形文字,納西象形文字信息化處理及翻譯研究對納西文化的傳承和保護有著重要的作用。項目主要針對納西語語言信息處理及雙語機器翻譯過程中的關鍵難點問題深入研究。開展納西字庫製作、詞典、納西依存樹庫、納西漢語雙語語料庫等納西語言信息處理及機器翻譯基礎資源庫構建。研究納西語言輸入方法、納西語言詞法及依存句法分析方法、納西句子相似度計算方法、納西-漢語雙語詞語對齊方法、納西-漢語機器翻譯方法,突破納西語言信息處理關鍵技術與方法。研發納西語輸入法、納西語言信息處理詞法及句法分析系統,漢語-納西雙語機器翻譯系統等系統及工具,為在納西語言信息處理及應用提供技術及系統保障。取得以下創新成果:
1. 在納西資源建設方面,製作了納西字庫,構建了納西-漢語-英語三語電子詞典,構建了3萬句的納西依存樹庫,構建了5萬句漢語-納西語詞對齊語料庫,形成了漢語-納西語語言信息處理的單語及雙語對齊語料庫;
2. 在納西語言信息處理平臺方面,提出了基於漢語-納西語語言對齊關係的納西語依存樹庫生成方法、提出基於組塊編輯距離的納西語句子相似度計算方法,研發了中文、英文和納西拼音三種方式的納西文字輸入法,研發了規則與統計相結合的納西依存句法分析器,為納西語言信息處理提供基礎的算法及工具支撐;
3. 在漢語-納西詞對齊方面,針對納西-漢語的語言特點,提出了融合特徵約束及實體約束的納西-漢語雙語詞語對齊方法,結合納西動詞後置、名詞後置、實體組合等特點,設計了相關約束函數,並將約束函數有效融合對數線性模型,有效提高了納西-漢語雙語詞對齊準確率;
4. 在納西-漢語雙語機器翻譯方面,針對納西-漢語的語法差異,在短語翻譯模型的基礎上,提出了融合謂詞-論元的漢語-納西語短語統計機器翻譯方法;在句法統計機器翻譯基礎上,提出了融合依存語言模型、改進的依存樹到串、樹到樹及子樹對齊的漢語-納西語句法統計機器翻譯方法,有效利用了漢語-納西語語言特點,提升了翻譯的效果;
5. 項目發表論文16篇,其中SCI收錄3篇,EI收錄11篇,ISTP收錄2篇,受理髮明專利1項,授權外觀設計專利1項,登記軟體著作權4項,已經培養博士研究生2名,培養碩士研究生15名,獲得省級優秀碩士論文1篇。
三、候選人對項目的貢獻情況
序號
姓名
性別
工作單位
對成果創造性貢獻
1
高盛祥
女
昆明理工大學
漢納機器翻譯方法
2
餘正濤
男
昆明理工大學
納西語依存句法分析及漢納機器翻譯方法
3
毛存禮
男
昆明理工大學
輸入法及語料庫
4
線巖團
男
昆明理工大學
漢納雙語詞對齊方法
昆明理工大學全面負責項目的方案制定、計劃實施、關鍵技術研發及組織管理等方面的工作,單獨完成項目。
四、代表性論文專著情況
代表論文8篇
[1].Shengxiang Gao, Mingjia An, Cunli, Mao, Yantuan Xian, Zhengtao Yu*. A method for building Naxi language dependency treebank based on Chinese-Naxi language relationship alignment [J]. International Journal of Database Theory and Application, 2015, 8(2):25-32. (EI:20152200882429)
[2].Meng Su, Zhengtao Yu*, Shengxiang Gao, Lanjiang Zhou, Mingjia An. A novel Naxi dependency parsing method based on rules and statistics [C]. 2014 11th International Conference on Fuzzy Systems and Knowledge Discovery, FSKD 2014. August 19-21, 2014, pp. 447-452, Xiamen, China. (WOS:000359803500080) (EI: 20150200418444)
[3].Zhengtao Yu*, Yantuan Xian, Wei Tian, Jianyi Guo, Tao Zhang. Naxi-English Bilingual Word Alignment Based on Language Characteristics and Log-Linear Model [J]. CHINA COMMUNICATIONS, MAR 2012, 9(3):78-86. (WOS::000301908400009)
[4].張濤,餘正濤*,郭劍毅,曹先彬. 融合特徵約束模型的納西-漢語雙語詞語對齊算法[J].西安交通大學學報,2011年9月,45(10):48-53. (EI: 20114614515134)
Tao Zhang, Zhengtao Yu*, Jianyi Guo, Xianbin Cao. A bilingual word alignment algorithm of Naxi-Chinese based on feature constraint models [JA]. Hsi-An Chiao Tung Ta Hsueh/Journal of Xi'an Jiaotong University, OCT 2011, 45(10): 48-53. (In Chinese) (EI: 20114614515134)
[5].Huihui Zhang, Zhengtao Yu*, Longhua Shen, Jianyi Guo, Xudong Hong. Naxi sentence similarity calculation based on improved chunking edit-distance [J]. International Journal of Wireless and Mobile Computing, JAN 2014, 7(1): 48-53. (EI:20140717307760)
[6].Shengxiang Gao, Xiuzhen Yang, Zhengtao Yu*, Xiao Pan, Jianyi Guo. Chinese-Naxi machine translation method based on Naxi dependency language model [J]. International Journal of Machine Learning and Cybernetics. FEB 2017, 8(1):333-342. DOI:10.1007/s13042-014-0325-2 (WOS:000393309600027) (EI: 20170603329646)
[7].Shengxiang Gao, Zhengtao Yu*, Chao Liu, Lin Chen, Xudong Hong. A Chinese-Naxi Tree-to-Tree Machine Translation Method Based on Subtree Alignment [J]. Mathematical Problems in Engineering, OCT 2015, 2015(4):414963. (WOS:000364699100001) (EI:20154701582105)
[8].Lei Li, Zhengtao Yu*, Cunli Mao, Jianyi Guo. The extracting method of Chinese-Naxi translation template based on improved dependency tree-to-string [C]. 14th Workshop on Chinese Lexical Semantics, CLSW 2013, May 10-12, 2013, Zhengzhou, China, pp.350-358. (EI:20140617285041)