近日,歐洲人文和自然科學院(Academia Europaea)正式公布新晉院士名單,共有來自世界範圍內的361位學者當選。
清華大學計算機系教授孫茂松當選歐洲科學院外籍院士。
歐洲科學院是國際上跨地域和學術領域最廣泛、學術地位最高、影響最大的科學組織之一 。其院士主要從歐洲各國科學院院士中選出,代表歐洲人文和自然科學界最優秀的科學精英和學術權威,其中包括74位諾貝爾獎獲得者、7位圖靈獎獲得者、15位菲爾茲獎獲得者等。
孫茂松現任清華大學計算機科學與技術系教授,清華大學學位委員會委員兼計算機學位評定分委員會主席,清華大學人工智慧研究院常務副院長。
他的主要研究方向為自然語言理解、中文信息處理、Web智能和社會計算,長期以來從事這些領域的研究工作,同團隊青年教師一起,指導學生在頂級國際學術會議和一流期刊上發表了一系列高水平論文,Google Scholar 引用超過 13000 次。
孫茂松教授在自然語言處理方面做出了重要貢獻,特別是漢語分詞和詞性標註、表示學習、知識圖譜、機器翻譯和詩歌生成等方面。
他的研究重點之一是中文信息處理最為基礎性的課題:漢語自動分詞。
他研製出了一個集自動分詞、詞性標註、專名識別和新詞識別於一體的分詞標註系統CSegTag,應用於清華與歐盟近10個國家合作的歐盟第六框架計劃(FP6)項目「超對等語義搜尋引擎」中。
孫茂松教授的貢獻和研究成果:
2012年領導完成並正式發布了文本信息處理領域兩個國際標準。
2013年,孫茂松教授率領團隊設計並實現了我國第一個中文大規模開放在線課程平臺「學堂在線」,目前這一慕課平臺在國內外具有廣泛的影響,註冊學習者約6000萬人,註冊人次約1.83億。
2014 年,孫茂松教授作為首席科學家牽頭組織了題為「面向三元空間的網際網路中文信息處理理論與方法」的國家重點基礎研究發展計劃(973計劃)項目。
2015年,由孫茂松教授帶領的 THUAIPoet 團隊研發的中文詩歌自動生成AI系統「九歌」。上線至今,「九歌」已累計為用戶創作近1000萬首詩詞。這一項目在GitHub上被組織成三個系列開源,共獲約3.8萬星,受到了學界和業界的關注。
九歌開原始碼連結:https://github.com/THUNLP-AIPoet/
2019年7月1日,清華大學人工智慧研究院自然語言處理與社會人文計算研究中心正式成立,由孫茂松教授擔任主任。在成立儀式上,尤政院士和張鈸院士向孫茂松教授頒發了中心主任聘書。
今年5月份,清華大學孫茂松、劉知遠教授的新書《知識圖譜與深度學習》問世。這本書介紹了在知識圖譜與深度學習方面的研究成果,對人工智慧研究具有一定參考意義。
此前,在新智元重磅發布的新書《智周萬物:人工智慧改變中國》中,針對「2049 年人工智慧未來展望」這一主題,我們邀請了人工智慧領域知名學術專家和產業領袖進行討論,接下來分享清華大學孫茂松教授對這些問題的看法。
第四次工業革命正在悄然來臨,世界各國都已經認識到人工智慧將是未來國家之間競爭的關鍵賽場。對中國而言,人工智慧更是一個歷史性的機遇,如果把握住,將有可能躋身 AI 強國之列。那麼在接下來關鍵的 30 年中,中國在全球人工智慧中將處於怎樣的地位?中國最急需發展的 AI 子領域是什麼?中國是否會擁有全球領先的 AI 企業呢?
對於 2049 年中國能否引領全球 AI 發展,孫茂松教授給出了自己的看法:
首先,我不太建議使用「引領」這個表述。我們要謙虛一點,從比較深刻的角度來看,我們還缺乏足夠可資驕傲的本錢。我們還是要韜光養晦,不要鋒芒畢露,動不動就試圖去引領世界。我們能夠和人家並駕齊驅就很不錯了,應該多從構造人工智慧人類命運共同體這個角度來認識和闡述。其次,錢學森先生曾把科學研究分為三個層次:基礎科學、技術科學和工程技術。比如,基礎科學可以對照牛頓力學,技術科學可以對照結構力學,工程技術可以對照架橋、蓋房子。如果按這個標準考察國內的人工智慧研究現狀,目前為止我們在基礎科學方面的貢獻幾乎找不太到,國際上人工智慧相關的圖靈獎得主已有10 名左右,但中國一個也沒有。這是我國一個極大的短板。在技術科學方面,我們的研究成果屬於上品的也乏善可陳,屬於中下品的則相對多一些。當然,在工程技術方面,國內已經有不少重大的應用(如阿里巴巴、騰訊等),這方面的成果在世界範圍內已經屬於領先水平了。
要真正引領世界人工智慧的潮流,在基礎科學方面的研究是最為關鍵的,必須要有幾個世界級科研領軍人物才可能引領這個潮流。只有達到「此時立在最高山」的境地,才能形成「天高地平千萬裡」般高屋建瓴的氣勢。同時根深才能葉茂,否則經不起風吹雨打。在發展戰略上,我們要多一點著眼於根,而不僅僅是枝葉。對中國人工智慧的未來發展,重中之重在遠慮而不是近憂。
而基礎科學領域頂尖人才的培養,恰恰是我國又一個極大的短板。高考制度最大限度地保證了教育公平,基於這個體制的我國高等教育,從人才培養的平均水平上說,在國際上是比較高的,但同時也導致了一個很嚴重的結果,就是很容易把潛在的、有個性的天才式人物給抹殺掉了。
此外,基礎科學的研究需要高秉賦、高水平的學者具有「板凳甘坐十年冷」的研究精神和執著態度。現在這種學者太少了。
所以總體上看,我國要在 2049 年引領世界人工智慧的潮流,應該說是一項非常艱巨的任務,必須從長計議,綜合施策。
當前人工智慧領域取得的突破,大多是在特定領域的特定任務上的突破,如 AlphaGo 在圍棋比賽中戰勝人類冠軍,人工智慧程序在大規模圖像識別任務中超越了人類的水平,人工智慧系統診斷皮膚癌達到專業醫生水平等。可以說,在局部智能水平的單項測試中,人工智慧可以超越人類智能。
但通用人工智慧尚處於起步階段。通用人工智慧也被稱為「強人工智慧」,是指達到人類水平的、能夠自適應地應對外界環境挑戰的、具有自我意識的人工智慧。人的大腦是一個通用的智能系統,能舉一反三、融會貫通,可進行判斷、推理、學習、思考、規劃、設計等,可謂「一腦萬用」。真正意義上完備的人工智慧系統應該是一個通用的智能系統。因此,在通用人工智慧的實現上,我們還有很長的路要走。
強人工智慧到 2049 年能不能研究出來,難以預料。在通往這個目標的道路上,會面臨很多難以克服的困難和挑戰。清華大學計算機系孫茂松教授認為,這取決於若干重要因素。
第一,腦科學會有什麼突破,腦科學的研究能否給人工智慧帶來足夠多的啟示。雖然歷史上人工智慧的發展從腦科學受益有限,但強人工智慧的研究越來越期待腦科學的研究成果,則是毫無疑問的。
第二,不管強人工智慧的發展需要依賴多少支持條件,其中有一個條件是絕對離不開的,這就是需要形式化的人類知識體系作為支持。但很可惜,這個知識體系目前並不存在。雖然已經有號稱規模巨大的知識圖譜,但稍加考察就會發現,它所包含的知識,無論是在廣度上還是在深度上,都還是比較膚淺的。沒有形式化的人類知識體系,機器推理就難以實現,人工智慧的可解釋性和健壯性都無從談起。而要建成這個知識體系,需要有深遠眼光和大格局的學者,帶領一批人,進行持之以恆的資源建設工作。同時,需要相當長期的、穩定的經費投入,才有做出來的可能(也存在著做不出來的風險)。但非常可惜,各國政府都不太願意支持這種長周期、帶有一定風險性的資源建設工作。
第三,要看有沒有更具創意的算法,能夠把上述重要因素更有效地融合起來。
目前來看,我們應該先集中力量研究、解決這些比較現實的科學問題,然後才有條件討論強人工智慧的問題。否則,坐而論道,未免流於空談。
可以設想,如果有朝一日強人工智慧真的研究出來了,那麼機器智能就真的很可能超越人類智能,這將是世界進化史上的一個斷代式的質變。我不相信這種質變會來得這麼容易,應該是一個很漫長的過程。所以,我認為到2049年,不太可能出現強人工智慧。
參考連結:
https://www.ae-info.org/ae/Member/Sun_Maosong
http://www.bjd.com.cn/a/202008/05/WS5f2a7c47e4b0bde5c60731e0.html