智東西(公眾號:zhidxcom)作者 | 心緣編輯 | 漠影
在普通人眼中,魏哲巍是典型的學霸,競賽拿省一等獎,保送和高考都能上北大,本科作為04級北大數院信息數學系第一名畢業,在港科大3年半讀完計算機博士,又在歐洲算法中心做了兩年博士後,28歲回國加入中國人民大學信息學院,33歲破格晉升為人大當年最年輕的正教授、博導。
如今,魏哲巍成為中國人民大學高瓴人工智慧學院的首批老師,為人大培養有溫度的人工智慧人才貢獻自己的力量。
回憶考學生涯時,魏哲巍始終態度謙和,還屢屢以「學渣」自居。但這無關「凡學」附體,行進在學術的道路上,他看到過許多更巍峨的高山,在言談之間不時流露出對知識的敬畏。
由高瓴資本捐資成立的高瓴人工智慧學院成立不滿兩年,曾因組建豪華的導師團隊而「出圈」,在2020年9月,這所年輕的學院迎來第一批學生。
作為學院本科教學工作委員會的負責人,魏哲巍同智東西分享了高瓴人工智慧學院有著怎樣的教學特點和願景,以及學院探索人工智慧教學方法的思考與選擇。
在科學思維與人文精神交融的人民大學校園裡,一群富有想法和激情的年輕人將湧入人工智慧這一方興未艾的浪潮。他期待幫助學生們成長,去開拓人工智慧的更多可能。
一、從長郡中學到北大「瘋人院」,與天才為伍的求學歷程
2008年,魏哲巍以北大數院信息數學系第一名的成績本科畢業。但在他長期的求學經歷中,他的自我認知卻並不是一個「學霸」。
北大有四大「瘋人院」——數院、物院、化院、生科,其中數學科學學院(簡稱「數院」)是四大「瘋人院」之首。這裡雲集了全國智商爆表、天賦異稟的學神級人物,在這裡,恐怖的智商壓制對於多數普通高考生來說是一件習以為常的事。
在北大數院,魏哲巍領略了什麼是「天才中的天才」。「純數學的學生太厲害了,」魏哲巍感嘆道,「我北大畢業後,才知道自己是一個普通人,因為天才實在太多了。」
北大數院有計算數學、信息數學、純數學、金融數學、統計五大專業,專業與專業之間的差距非常大,「比如我在信息數學系是第一,到金融數學系可能是第二、第三,但如果我到純數學系,連前三十都排不進去。」魏哲巍說。
在他的印象裡,北大數院幾乎網羅了所有的國際數學奧林匹克競賽IMO金牌,另一部分學生是通過高考考入,通常競賽保送生之於高考生的優勢很明顯,這個差距是很難靠天賦去彌補的。
魏哲巍高中就讀於湖南長沙四大名校之首——長郡中學。高中期間,他也參加過競賽,還拿了省一等獎,但因為不知道能被保送,最後還是通過高考考上了北大數院。
▲人民大學高瓴人工智慧學院長聘副教授、博導魏哲巍
在勇攀學術高峰的旅程上,魏哲巍不斷遇到新的「智商天花板」。
本科畢業後,魏哲巍赴香港科技大學計算機科學及工程系攻讀博士,隨後在導師的推薦下,前往丹麥奧胡斯大學海量數據算法研究中心做博士後,那裡有幾位專門做理論計算機科學(TCS)的天才,「你說個什麼問題,他很快能想到解法,比我聰明很多。」魏哲巍說。
或許受這些經歷的影響,聊起這些往事時,魏哲巍總是態度謙遜,毫不吝惜對這些天才的誇讚。
他坦誠又不失謙虛地說道,做特別高深的理論研究,確實需要很高的天賦。不過,對於大多數人來說,就像老師常念的一句話:「你的努力程度,還輪不到你拼天賦。」很多情況是因為不夠努力,不是天賦不夠。
二、卓越的科研實力
那麼,對於既有天賦,又不吝勤勉的科研工作者來說,他們所取得的科研成績必然是耀眼的。2014年,在丹麥做滿兩年博士後研究生,魏哲巍決定回國發展,來到中國人民大學信息學院,從事大數據領域的研究。
魏哲巍教授的研究方向是大數據近似算法,其核心思想是利用採樣(sampling)、略圖(sketching)等技術將大數據轉換為小數據,解決由數據規模擴張帶來的計算效率問題。
資料庫與大數據是中國人民大學信息學院的傳統優勢方向,2014年加入信息學院之後,魏哲巍教授在資料庫領域取得了豐碩的研究成果,每年都在SIGMOD會議上發表論文,至今已經持續7年。
SIGMOD是國際計算機界資料庫領域公認具有最高學術地位的頂級會議,由美國計算機協會(ACM)數據管理專業委員會(SIGMOD)發起,至今已舉辦38屆。SIGMOD每年收錄的論文約在60-80篇,而中國大陸高校在SIGMOD以第一單位發表論文的數量一般都不會超過10篇。
正是由於這些優秀的成果,讓魏哲巍在2019年通過全校選拔破格晉升為正教授,成為了信息學院乃至人民大學最年輕的教授。
在2020年加入高瓴人工智慧學院之後,魏哲巍教授又開始了對人工智慧領域的探索。
在過去一年裡,魏哲巍教授團隊對圖神經網絡(Graph Neural Networks)領域的過平滑(over-smoothing)與可擴展性(scalability)兩大難題進行攻關,成功設計了64層的深層圖卷積神經網絡模型GCNII與十億邊級別的超大規模圖神經網絡訓練算法GBP,相關工作分別發表於機器學習的頂級會議ICML2020和NeurIPS2020上。
魏哲巍教授的論文投稿的一個特點是接受率很高:SIGMOD迄今投稿11篇接收9篇,VLDB迄今投稿6篇接收5篇,KDD、ICML、NeurIPS等數據挖掘和機器學習頂級會議目前都是100%的接受率。論文的接受率高,主要原因是論文的理論與實際緊密結合。
魏哲巍教授要求投出的論文滿足兩個條件:一是提出的算法必須有理論保證,能夠在數學上證明其性質優於前人提出的算法,二是算法的實現要足夠簡單,能夠在實際場景中得到應用。
這樣的論文既有理論深度,又能在實際場景中落地,自然會受到評審人的青睞。「當然,論文被拒並不是一件壞事,一些很有影響力的論文,比如Google的MapReduce論文,就曾經被拒過。研究領域既需要有理論深度的工作,也需要天馬行空提出新想法新思維的工作。」魏哲巍說。
三、融合AI+人文學科,培養有溫度的人工智慧人才
轉到高瓴人工智慧學院算是順水推舟。魏哲巍是大數據管理與分析方法研究北京市重點實驗室團隊中的一員,這個實驗室的部分師資,都隨著實驗室主任文繼榮教授一同進入了高瓴人工智慧學院。
高瓴人工智慧學院於2019年4月22日正式成立,是中國人民大學下屬二級學院,由高瓴資本創始人兼CEO、中國人民大學校友張磊捐資支持建設,中國工程院院士潘雲鶴任學術委員會主任,文繼榮教授任執行院長,教師序列實行「長聘制」。
談及學院的目標,他引用了文繼榮教授常說的一句話:「我們要培養有溫度的人工智慧。」高瓴人工智慧學院的重要使命,是促進AI與人民大學的法律、傳播學、經濟學、社會治理等一流人文學科的交叉融合,培養跨學科人才。
作為本科教學工作委員會的負責人,魏哲巍負責培養方案、課程調配等,包括召集老師開會討論每門課程的教學大綱,做整體規劃。
相比下設在計算機學院、信息學院的智能專業,獨立的人工智慧學院能帶來更豐富的課程選擇和培養體系。
國內獨立的人工智慧學院十分少見,可供借鑑的成熟方案不多。
在本碩博課程建設方面,高瓴人工智慧學院借鑑了國內外名校人工智慧專業培養方案,並對浙江大學、清華大學等多個院校人工智慧專業進行實地考察,召開多次本碩博課程建設會議,開設了「高級機器學習、人工智慧的數學基礎、神經網絡與深度學習、模式識別與計算機視覺、智能信息檢索、對話系統」等特色的人工智慧研究生課程;建設「人工智慧與Python程序設計」的本科生金課與新生研討課。
除了開設人工智慧核心理論專業課程外,還結合人民大學自身優勢,選擇與人民大學發展最契合的幾個「AI+」方向進行布局。
學院還會開設覆蓋一些跨學科應用的個性化選修課。比如邀請法學院老師來上AI倫理專業必修課,講解諸如自動駕駛撞了誰負責、數據產權歸屬之類的案例。「人大高瓴人工智慧學院是新學院,課程靈活度稍微大一些。」魏哲巍說。
如今課程體系已經建好,教學大綱已經就緒,首批教師已到位。高瓴人工智慧學院在2020年開始招生,第一批研究生在去年9月入學,今年將迎來第一批本科生。
魏哲巍特意提到,目前高瓴人工智慧學院仍在招聘教師、專職研究員及博士後,歡迎全球優秀人才前來申請。
四、國內人工智慧各方面人才都很欠缺
2020年11月9日,在高瓴人工智慧學院首屆學生開學典禮上,執行院長文繼榮教授表示,實現「打造世界一流人工智慧學院」的願景,最重要的是培養這四類一流人才:
一流的人工智慧科學家、一流的人工智慧工程師、具有創新精神的人工智慧創業者、以及人文社科領域的人工智慧開拓者。
魏哲巍教授認為,在當前國內人工智慧產學界,各方面人才都很欠缺。
一方面缺做基礎理論和系統的人才,這些恰恰是國外非常關注的領域。比如斯坦福、伯克利等高校招助理教授,特別喜歡招有機器學習系統背景的人,相對來說,國內更多研究以應用為主。
另一方面是交叉人才。比如DeepMind都做蛋白質解構,為什麼能做出來?正是因為有交叉的能力,有真正懂生物的、懂蛋白質、同時又懂機器學習的人在團隊中。這不是有一個人懂機器學習,有一個人懂生物,兩人一起就能做成的,而是要求兩個人對兩方面都得懂,才有對話能力。
這也是為什麼高瓴人工智慧學院非常樂意與社會學、法學院等學院合作。魏哲巍說,原則上,高瓴人工智慧學院的選修課面向全校公開,其他學院的學生如感興趣,均可選修相應課程。
如今學院已經形成20人左右的專職導師團,正持續積極引進海內外頂級師資,並計劃推行「本科生雙導師培養方案」,允許本科生自大二起選擇一名科研導師和一名實踐導師,解答科研、學業、生活及職業發展的種種困惑,還將組織學院高年級本科生前往海外遊學,以及參與和海外高校的聯合培養項目。
「因為我現在跟阿里合作,我的學生研二就在阿里實習了。」魏哲巍說。高瓴人工智慧學院已同微軟、百度、滴滴、美團等20餘家人工智慧相關企業達成實訓基地的合作意向,與這些企業開展聯合培養課程,邀請企業內部經驗豐富的專家進行授課,同時派送學生開展企業參觀、實踐工作。
同時,在科研方面,高瓴人工智慧學院準備建設一個交叉融合中心,以支撐全校AI相關的研究。
學院將依託北京市大數據管理與分析方法研究重點實驗室,盤活新建東南樓、文化大廈、地下機房等場地資源,再建一批新的伺服器,並與企業進行雲計算資源方面的合作,為學院的教學及科研需求提供支撐。
儘管成立時間很短,在2020年,高瓴人工智慧學院8位教師指導31篇論文被國際頂級期刊會議錄取(CCF-A),其中許多成果均有本科生的參與。
基於長期的經驗積累,魏哲巍認為基礎有好有壞勉強不來,做科研,最重要的是「動機」,即主動想要做科研,有足夠的自我驅動力。他也給了一些不同方向人工智慧研究的建議,如果做純理論,需要數學基礎打得特別牢;如果偏應用,最好有企業實習經歷,理解應用是做什麼。
他希望未來從高瓴人工智慧學院畢業的學生,既能掌握牢固的人工智慧基礎知識,同時具備一定的人文情懷。至於未來想往哪個方向發展,則尊重學生自己的意願。
結語:知識的傳遞永無止境
在很多人的印象裡,中國人民大學以法學、新聞學、金融等偏人文社科專業而聞名,其實中國最早的資料庫教學研究正是在人民大學開創的,而發展以深度學習為重心的人工智慧技術,迄今還離不開海量高質量數據的驅動。
科學思辨和人文精神的底蘊,早已刻在人民大學的基因中。高瓴人工智慧學院既背負著興盛人民大學理工類學科的希望,也正邁向一個將人文教育、人文情懷與人工智慧交融的未來,這也將是高瓴人工智慧學院學生將接受的獨特薰染。
人工智慧可以改變什麼?過去數年的變革似乎已經給出許多顯而易見的答案。但人工智慧未來將通往何方?還沒有人能給出確切無誤的答案。
這些答案,需要一代代學習和研究人工智慧的學子去探索,很多代科研工作者知識經驗的積累與傳承,才能在歷史的長河中,突然碰撞出剎那間靈感的火花,產生一個出人意料的顛覆性方向。
遠方的路還很長,知識的傳遞永無止境,魏哲巍以及高瓴人工智慧學院的老師們,正在將薪火相傳。