近日,歐洲科學院公布2020年院士增選結果,清華大學計算機系教授孫茂松當選歐洲科學院外籍院士。孫茂松的研究方向為自然語言理解、中文信息處理、Web智能和社會計算,他率領團隊研製出一個集自動分詞、詞性標註、專名識別和新詞識別於一體的漢語分析軟體,應用於清華與歐盟近10個國家合作的研究項目「超對等語義搜尋引擎」中。
歐洲科學院,全稱歐洲人文和自然科學院,成立於1988年,其總部位於英國倫敦,是由歐洲各國科學部長倡導創立、並由英國皇家學會等代表歐洲國家最高學術水平的國家科學院共同發起成立的國際科學組織;科學院分20個學部,其學科領域涵蓋人文科學、社會科學、自然科學和科學技術等,是國際上跨地域和學術領域最廣泛、學術地位最高、影響最大的科學組織之一 。
歐洲科學院院士主要從歐洲各國科學院院士中選出,代表歐洲人文和自然科學界最優秀的科學精英和學術權威,其中包括74位諾貝爾獎獲得者、7位圖靈獎獲得者、15位菲爾茲獎獲得者等;院士候選人選拔過程嚴格,首先由來自不同國家的院士推薦到科學部,經學部初審後推薦到提名委員會進行通訊評審,最後由歐洲科學院的專門委員會審核通過。
孫茂松現任清華大學計算機科學與技術系教授,清華大學學位委員會委員兼計算機學位評定分委員會主席,清華大學人工智慧研究院常務副院長。
他長期以來從事自然語言處理、人工智慧以及社會人文計算等方面的研究工作,同團隊青年教師一起,指導學生在頂級國際學術會議和一流期刊上發表了一系列高水平論文,Google Scholar引用超過13000次;2012年領導完成並正式發布了文本信息處理領域兩個國際標準。
孫茂松的研究重點之一是中文信息處理最為基礎性的課題:漢語自動分詞。他提出了若干重要概念,如「最大交集型歧義切分欄位」、「真切分歧義與偽切分歧義」、「全局統計量與局部統計量」,並在大規模漢語語料庫上對「最大交集型歧義切分欄位」進行了窮盡式考察,給出了有效的處理策略,並以此為基礎,研製出一個集自動分詞、詞性標註、專名識別和新詞識別於一體的漢語分析軟體CSegTag,應用於清華與歐盟近10個國家合作的歐盟第六框架計劃(FP6)項目「超對等語義搜尋引擎」中。
2013年根據學校部署,孫茂松率領團隊設計並實現了我國第一個中文大規模開放在線課程平臺「學堂在線」,目前已發展成為具有世界影響力的慕課平臺,註冊學習者約6000萬人,註冊人次約1.83億;2015年領銜研製了人工智慧中國古典詩詞寫作系統「九歌」,已為廣大網民寫作逾1000萬首詩詞。基於上述研究成果的軟體工具包在GitHub上被組織成三個系列開源,共獲約3.8萬星標,受到了學界和業界的關注。
來源:北京日報客戶端 | 記者 任敏
編輯:蔡文清
流程編輯:郭丹