專訪普林斯頓大學貢三元教授:做 AI 研究要有價值觀,數學更是...

2021-01-11 雷鋒網

雷鋒網 AI 科技評論按:機器學習和神經網絡的出現給人工智慧領域所帶來的極具革命性的影響,如今整個人工智慧研究界都有目共睹。作為人工智慧神經網絡方向的學術界資深科學家,貢三元教授深諳當前深度學習神經網絡所存在的問題,對此,他提出了 NN 3.0 的概念,創造性地採用深入學習(Internal Learning)的方法來訓練神經網絡模型,不僅能夠實現內部神經元可學習性,還兼具內部神經元可解釋性。對於這一成果,貢三元教授也在 4 月 9 日的第二屆全球人工智慧應用創新峰會上進行了分享。

會後,雷鋒網 AI 科技評論也藉此機會與貢三元教授進行了一次交流,圍繞他的研究經歷、成果以及治學理念進行了深入探討。

貢三元教授,1977 年獲得史丹福大學電子工程博士學位;1974 年加入美國安達爾公司任職工程師;1977 年至 1987 年,在美國南加州大學電子工程系統專業任職教授;1987 年至今,任職普林斯頓大學電子工程專業教授。同時,他還是史丹福大學、代爾夫特大學、早稻田大學訪問教授,中國科技大學榮譽教授以及香港理工大學榮譽講座教授。此外,他還是美國 IEEE 終身院士、 Journal of VLSI Signal Processing Systems 主編等等。

貢三元教授的研究領域包括,機器學習、系統建模與識別、人工神經網絡、無線傳輸、傳感器陣列處理、多媒體信號處理、生物信息數據挖掘與識別,曾發表 400 餘篇(部)論文及專著,包括:《大規模集成電路和現代信號處理》(英文版及俄文版)、《大規模集成電路處理器》(英文版、俄文版及中文版)、《數字神經網絡》(英文版)、《主成分神經網絡》(英文版)、《生物信息認證:一種現代方法》(英文版)等。鑑於其學術貢獻,他曾獲得的重要獎項包括:IEEE Signal Processing Society 技術進步獎、最佳論文獎、傑出講座學者,IEEE Third 千禧年勳章等。

轉入神經網絡和機器學習,始於興趣而終於使命

博士畢業於史丹福大學電子工程專業的貢三元教授一開始的研究方向主要是計算機體系結構、模式識別和多媒體信號處理等,直到 1980 年才轉入神經網絡領域。當時,神經網絡技術取得了一定進展,也為該領域的研究者帶來了充足的科研經費,在這樣的大背景下,貢三元教授開啟了他在神經網絡領域的研究並取得了豐碩成果,不僅先後出版了 4 本相關學術專著,還提出一系列創新性和前瞻性的理論。

之後,貢三元教授更是對機器學習領域產生了濃厚的興趣,而這份興趣,則是源自於他對整個機器學習發展歷程的思考。他提到,機器學習分為監督學習 (supervised learning) 和無監督學習 (unsupervised learning),現在大家所講的 NN1.0 及 NN2.0 都屬於監督學習。同時機器學習系統包括兩個子系統——特徵工程 (feature engineering) 和標籤工程 (label engineering),而 NN1.0、NN2.0 兩個階段對這兩個子系統的訓練方法是非常不同的:

在 NN1.0 的時代,機器學習只顧得上後半段標籤工程,而前半段的特徵工程得依賴於領域專家將特徵找出來。這樣的話,靠機器學習實際完成的部分其實是比較少的。而在 NN2.0 時代,機器學習的特徵工程部分也由神經網絡來完成,其使用的學習方法就是今年的圖靈獎獲得者提出的反向傳播算法(BackPropagation, BP),也就是說整個機器學習過程都由同一個 BP 算法來完成。

貢三元教授以一個 Lenet-5 深度學習模型為例,來具體闡述二者在訓練方法上的不同:「它的前面 3 層做特徵工程, 而後 2 層做標籤工程。NN1.0 時代,前 3 層的特徵工程依賴於領域專家找出特徵;而 NN2.0 所使用的 BP 則能夠利用反向傳播訓練到所有 5 層:包括 3 層特徵層及 2 層標籤層。這樣的話,NN2.0 就擺脫了對領域專家的依賴,NN 因而也正式地進入 NN2.0 (Deep Learning)時代。現在 AI 和機器學習基本上是綁定在一起了,大家也公認 NN2.0 是當下 AI 的領頭樣,從而也把 NN2.0 及 AI2.0 畫上了等號。」

然而, NN2.0 雖然擺脫了對領域專家的依賴,讓神經網絡進入到一個新的時代,但是它仍存在某種程度上的問題和缺陷。對此,貢三元教授分析到:

由於 NN 2.0 的 Teacher 是擺在外部的, 因此這樣的訓練過程無法做結構和神經元細粒度優化,也就是說在 NN2.0 時代,機器學習事先設定了固定的架構,只做參數訓練,所以對 NN2.0 而言,網絡的訓練取決於外部優化指標(External Optimization Metric,EOM)。更準確地說,BP 算法取決於相對於 Teacher 的誤差,誤差越大,修正就越多。

這實際上也暴露了 NN 2.0 所存在的某些問題:首先,當機器學習要學習太多層時,普通 BP 是無法應對過來的,需要使用 Deep BP 的技術;而更嚴峻的問題是,神經網絡的架構一旦確定後就無法改變,也就是說如果網絡的大小、寬度和厚度事先都固定好了,一旦無法通過調參來得出好的結果時,就不得不重新訓練另外一個網絡結構。

在對機器學習以及神經網絡的這一探索過程中,貢三元教授也產生了深深的使命感,正是在這種使命感的引導下,他也一直致力於為 NN 2.0 所存在的問題尋找出路。而這一出路便是貢三元教授最新提出的 NN3.0。

從 NN 2.0 的深度學習到 NN3.0 的深入學習

NN3.0 也是貢三元教授在本次全球人工智慧應用創新峰會上分享的重要成果。他創造性地提出了深入學習(Internal Learning)這一新概念,對神經網絡同時做參數和架構的訓練,這樣的話,整個訓練過程就能深入網絡內部結構,並實現神經元的優化,不僅能夠實現內部神經元可學習性,還兼具內部神經元可解釋性。由此,NN 跨入 NN 3.0 時代。

貢三元教授也非常詳細地解釋了 NN 2.0 及 NN 3.0 的區別,以及 NN 3.0 為機器學習領域所帶來的革命性影響。他表示,雖然 NN 3.0 與 NN 2.0 一樣,都屬於監督學習,需要 Teacher,然而它放置 Teacher 的位置與 NN 2.0 截然不同:NN 2.0 將 Teacher 放置在神經網絡外部,只能從神經網絡外部進行訓練,無法捕捉內部神經元的行為;而 NN 3.0 則將 Teacher 放置於神經網絡的內部,既能調參數,同時也能調架構。

另外在對 Teacher 所使用訓練方法上,NN3.0 也與 NN2.0 有所不同:除了外部優化指標(External Optimization Metric,EOM), NN3.0 還採用了內部優化指標(Internal Optimization Metric,IOM)來實現神經網絡的內部學習。這樣的話,NN3.0 可以直接深入到神經網絡內部,利用數學模型就能夠很簡易地對每一個神經元實現精準計算和衡量。其具體的實現方式是,在機器學習過程中將 Teacher 送進神經網絡內部,然後用 IOM 評價標準算出各個神經元的分數,再淘汰掉分數最低的神經元,從而對神經網絡結構做出最優化處理。實際上,這也說明了神經元參差不齊的特性,因而機器學習也應該將其作為結構學習的重要指標。

貢三元教授又以一個實際案例對神經元參差不齊的特性以及判斷出各個神經元的好壞的重要性,進行了補充說明:「比如說在雙人網球賽上,一般大家會認為隊伍中每個球員都很重要,缺一不可。然而在大團隊計劃中, 隊員們的水平往往會參差不齊,並且團隊最忌諱的就是有破壞性的「豬隊友」——它不僅不給團隊加分,反而會減分。所以,如果要讓神經網絡能做結構訓練,就必須讓它自行判斷出哪個神經元好以及哪個不好,然後選擇出最壞的、最有破壞性的神經元,並將其丟掉。」

值得一提的是,貢三元教授還表示這一創新理論其實也受到了生物學相關知識的啟發。他提到:「人每天起床前,都會有成千上萬個腦神經元在睡夢中退化淘汰,經過新陳代謝後,人的思維反而更清晰了。同樣的道理,NN2.0 中不好的那些神經元不僅會消耗計算,而且經過訓練後也可能會導致過擬合(overtrained)的問題。而 NN3.0 則提供了解決捷徑:通過淘汰掉低分數的神經元,神經網絡在提升性能的同時,也大幅度節省計算。」

藉助鯤雲在晶片上的優勢,NN3.0 能高效率應用在 FPGA

為了加強 NN3.0 的應用,貢三元教授在整個 NN3.0 網絡的設計上,也考量了對於機器學習來說至關重要的五項指標:第一,高性能;第二,小體積;第三,快速度;第四:低功耗;第五:延遲性問題。在本次主題演講裡,他也將 NN3.0 模型和最有代表性的 NN2.0 模型做了綜合性的比較,結果顯示,NN3.0 在以上指標呈現出了相當程度的優勢。

貢三元教授表示,其團隊目前正在嘗試跟鯤雲科技合作,希望藉助鯤雲科技在技術應用落地尤其是人工智慧晶片上的積累和優勢來加速 NN 及 AI 的應用。

對於 NN3.0 以後的發展,貢三元教授表達了他的信心, 並指出了 NN3.0 可能實現的兩種突破性應用:

第一種可能的應用,是 NN3.0 將能在夠機器互動及機器間互學習方面發揮巨大的價值。「現在我們正在迎接 5G 時代的來臨,未來在很小的範圍內就有可能同時進行成千上萬的機器學習,而機器互動及機器間互學習也會變成數據處理的一個新裡程碑。正是得益於 NN3.0 的深入學習讓我們在網絡結構的訓練上有了更深入的了解,我們的團隊目前在研究一種加強性的轉換學習技術 (Reinforced Transferable Learning),該技術有潛能把一個機器學習的結構轉換為另外一個機器所用,從而加強另外一個機器的性能。」另一種可能的應用,則是 NN3.0 的內部神經元可學習性(Internal Neuron Learnability)可以直接應用到 XAI3.0 的內部神經元可解釋性(Internal Neuron Explainability),從而解決 BP 算法所存在的不可解釋性。對於 AI 可解釋性在未來 AI 發展領域的重要性,貢三元教授也用具體實例來進行了說明:「在 80 年代,美國政府曾對 NN1.0 給予了大量經費資助,然而之後停了一大段時期,因此深度學習 NN2.0 的主要發現(獲今年圖靈獎)反而是靠加拿大政府資助的。為了扭轉乾坤,美國政府又奮起直追,將成千上萬經費投資在可解釋性 AI(XAI)上,這也順勢帶領了未來 AI3.0 的趨勢——朝著可解釋性的人工智慧網絡發展,也就是所謂的 XAI3.0。」AI 技術實際應用有 5 大要素

雖然貢三元教授一直在學術界耕耘,我們在採訪中也探討了關於 AI 技術在實際應用上的現狀以及它所面對的挑戰,他認為 AI 工業應用有 5 個關鍵要素:

第一個是架構及晶片設計 (Architecture & Chip Design)第二個是計算方法 (Algorithm)第三個是應用(Application)第四個是通訊網絡 (Communication network)第五個是雲端 (Cloud)

對於目前這 5 個關鍵要素在各個國家的實現程度,貢三元教授特別指出中國雖然在晶片設計、計算方面尚存在不足,但整體而言在其它領域都有相當的規模及深度。

在晶片設計、計算方面的不足在某種程度上也暴露出了中國研究者在 AI 基礎性研究方面所存在的不足,而這深根究底就離不開中國目前的教育制度以及研究方法所存在的問題。對此,貢三元教授也從中美兩國不同的教育機制角度,表達了他的看法:

目前中國學術界大多是使用論文做基本指標,並且指標周期也是相對短期的:在一兩年內要求他們出成果。然而在美國,我認為我的母校史丹福大學就做得很好,它會給予研究者 2 年到 5 年的研究期限。普林斯頓大學就更是如此,它是全世界最具有學者氛圍的高校,一般的研究期限可以達到 5 年到 20 年,這也是我能夠有寬裕的時間寫出這麼多書的原因。在這種科研發展體制下的 AI 研究工作,一開始有可能是不斷摸索,甚至於無止境地燒錢,但是一做出成果就相當有分量,甚而有圖靈獎級的成果。這是當下中國教育及中國科研發展亟需學習和思考的。

做基礎研究要有基本價值觀,數學是 AI 研究的「制勝法寶」

作為一位人工智慧領域的前輩研究者以及一位德高望重的教育家,貢三元教授也一直關注著中國後輩研究者的研究動態,對於他們,他也提出了三點建議:

第一,做基礎研究要有自己的基本價值觀。當下研究圈內跟風、跟熱點的現象比較嚴重,所以研究者們一定要有自己的判斷以及長遠的眼光,不能被短期的研究熱點所迷惑,不能跟風。第二,要對事情存疑。尤其是中國學生特別容易相信論文或者權威,其實這種思維很危險。研究者們一定要懂得去探究為什麼,不然跟錯了方向都不自覺,這是我對中國年輕人的期許。第三,一定要加強對基礎知識尤其是數學的重視。特別是博士學生,更是要加強自己在數學方面的積澱,因為如果想把中國的人工智慧研究帶到全世界頂尖的位置,就必須要藉助數學這一制勝法寶。

其中,對於數學的重要性,他更是以自己在教學方面對於數學的看重為例進行強調:「現在我在普林斯頓大學教的課表面上是深度學習、神經網絡相關課程,事實上我的授課重點是面向深度學習的數學。這是因為我認為數學基礎對於 AI 科研工作者來說非常重要。」

也正是因為中國學生在數學方面無論是質還是量都達到了世界一流的水平,貢三元教授也在看到了他們在 AI 基礎研究方面的極高潛能。 「數學好,才能夠在 AI 領域做出革命性的成果。而中國學生在這方面擁有極大的優勢,因而對於中國學生而言,AI 絕對是一個千載難逢的機會。」

(完)雷鋒網 AI 科技評論報導。

相關焦點

  • 著名數學家、普林斯頓大學教授張壽武,這樣評價華中師大!
    9月3日,華中師範大學第165期「華大論壇」在數學與統計學學院6401報告廳舉辦。國際著名數學家、美國人文與科學學院院士、普林斯頓大學張壽武教授為大家帶來了一場題為「從正整數的冪和談起」的精彩報告。副校長夏立新教授,數統學院負責人、教師代表和100多名研究生參加。
  • 施一公:我在普林斯頓大學做助理教授的日子
    責編 ∣吉 佳對每一位剛剛在清華大學生命科學學院或醫學院建立獨立實驗室的年輕PI(Principal Investigator),我都會不止一次地忠告:至少要在前三年,你們一定要把自己當成超級博士後,身先士卒、盡全力地在實驗室做研究、做自己的課題,同時訓練培養博士生
  • 顏寧教授離開清華大學,遠赴普林斯頓大學任教的真實原因是什麼?
    顏寧是現任西湖大學校長施一公教授的得意門生,她在海外完成了學業以後,便回到了中國,回到了清華大學,成為了清華大學的一名老師,顏寧的加入讓清華大學如虎添翼,加入清華大學以後,顏寧教授十分用心地在高科研,做學術研究,她帶領著清華大學的研究團隊,取得了許多顯著的研究成果,為清華大學爭光,
  • 專訪史丹福大學教授崔屹:矽負極鋰電池走向產業化
    新華社舊金山10月3日電 專訪:矽負極鋰電池快速走向產業化——訪史丹福大學華人教授崔屹  在現代科學體系內,能開闢一個重要研究領域的科學家並不多,史丹福大學材料科學與工程系教授崔屹是其中一個。2016年,美國權威學術雜誌《科學》發表長篇通訊,專門介紹崔屹和他對矽負極鋰電池發展做出的開創性貢獻。
  • 「獨家」圖靈獎得主姚期智出任Pony.ai首席顧問,將打造自動駕駛...
    他強調,「我昨天正好和Michael Jordan(機器學習奠基人、加州大學伯克利分校教授)有個會面,我跟他討論都認為,深度學習不會是最終的最優的理論體系,在一定程度的時候將會有更先進的理論體系會被研究出來,希望清華在這方面引領趨勢和前沿,中國在這個方面有機會重新站在世界前列。」對於人工智慧這樣的學科,產學研的優勢非常大。
  • 《自然》:普林斯頓大學在量子拓撲物質研究有重大發現
    在數學裡,拓撲學(topology)是一門研究拓撲空間的學科,主要研究空間內,在連續改變形狀後還能保持不變的一些性質的學科,它只考慮物體間的位置關係而不考慮它們的形狀和大小。量子拓撲物質研究是將量子力學和拓撲學相結合的一門新興研究領域,通過量子力學原理,運用拓撲學數學工具,主要是對物質的微觀基礎機理的研究。由普林斯頓大學研究人員領導的一個國際團隊,發現了一種展現出奇異量子效應的拓撲磁鐵,這種新型的磁體具有可擴展至室溫的新型量子效應。
  • 普林斯頓大學教授張壽武:中國大學教育扼殺了創新人才苗子
    編者按:9月3日,國際著名數學家、美國人文與科學學院院士、普林斯頓大學張壽武教授應邀到華中師範大學進行訪問講學。上午,張壽武在數學與統計學院為師生作了一場學術報告。下午張壽武到華師一附中進行訪問座談,與師生交流。9月4日上午,在雄楚國際大酒店,華大在線記者對張壽武進行了一個小時的專訪。
  • 專訪:矽負極鋰電池快速走向產業化——訪史丹福大學華人教授崔屹
    新華社舊金山10月3日電 專訪:矽負極鋰電池快速走向產業化——訪史丹福大學華人教授崔屹  新華社記者林小春  在現代科學體系內,能開闢一個重要研究領域的科學家並不多,史丹福大學材料科學與工程系教授崔屹是其中一個。
  • 普林斯頓大學研究:AI算命不靠譜,400多研究者跨界合作
    普林斯頓大學研究者牽頭髮起一個大規模合作項目,證實了人生軌跡的可預測性極低。編譯 | 溫淑編輯 | Panken智東西1月11日消息,據報導,普林斯頓大學研究人員進行了一項大規模協作研究,試圖用機器學習算法對人生軌跡進行預測。
  • 施一公:我35歲成為普林斯頓大學終身教授,你們有誰能像我這樣?
    也許很多人沒有聽說過他的名字,但是單憑他的姓氏也會讓人覺得印象深刻,施一公是中科院的院士、生物學家、也是清華大學的教授,清華大學教授,同時他還擔任著中國科學技術協會第九屆全國委員會副主席。無疑他的人生是成功的。在去年的10月份,施一公在接受央視訪問時談到自己在35歲時就成為了普林斯頓大學分子生物學的終身教授,有誰能夠像我這樣?
  • 壟斷全球頂級數學家,世界數學中心美國普林斯頓學派200年發展史
    而霍爾斯特德是在美國第一所研究型大學約翰·霍普金斯大學的著名數學家西爾維斯特手下拿到的數學博士學位。具備更多數學專業知識的霍爾斯特德告訴範因,真正的數學研究在歐洲,想研究數學就必須去歐洲尋找數學大師。而真正讓普林斯頓成為全球數學中心則是希特勒上臺。1933 年,突然的浩劫降臨,毀滅了哥廷根數學學派,那一年希特勒上臺了,頒布了一系列針對猶太人的法令。由於不少哥廷根大學的教授都是猶太人,導致不少猶太裔的教授出走。絕大多數哥廷根派的教授逃亡美國。如諾特、柯朗、馮·諾依曼等。恰逢這時,美國商業大亨拜姆博格找到教育家富萊斯納,希望在紐約近郊創辦一所醫學院。
  • 這些中國著名科學家,都曾擔任過普林斯頓大學的研究員
    這些中國著名科學家,都曾擔任過普林斯頓大學的研究員普林斯頓大學為世界培養了眾多的精英。中國著名的科學家華羅庚、施一公、姜伯駒、中國科學院外籍院士陳省身、李政道、楊振寧都曾擔任過普林斯頓大學的高級研究院研究員。
  • 專訪數學家張壽武:在數學殿堂裡,依然懷抱小學四年級的夢想
    同樣重要的是,張壽武來到了普林斯頓,他口中的「數學殿堂」。除了普林斯頓大學數學系,這座新澤西州小城還有普林斯頓高等研究院(IAS),愛因斯坦、馮•諾依曼、外爾、莫爾斯等如雷貫耳的名字都曾在此停留,共同締造出數學王朝。「如果說猶太人或者穆斯林必須到耶路撒冷拜訪,那一個學數學的人必須去普林斯頓高等研究院。」張壽武說道。
  • 專訪菲爾茲獎得主高爾斯:漫遊音樂與數學,發現古老猜想反例
    在另一次人生中,他認為自己或許會與熱愛數學的作曲家父親互換身份,成為一位音樂家。這位劍橋大學純數學與數理統計系研究教授、《普林斯頓數學指南》、《牛津通識讀本:數學》作者曾在音樂和數學的天地間漫遊,直到在劍橋大學三一學院的課堂上,他發現了巴拿赫空間並被深深吸引。大多數巴拿赫空間是無窮維空間,可看成通常向量空間的無限維推廣。
  • 專訪施一公教授:基礎研究的喜悅無與倫比
    施一公教授、潘建偉教授、許晨陽教授也將迎來屬於他們的這份榮譽。今天,我們將為各位讀者送上未來論壇對三名獲獎人的專訪。讓我們一道在問答中,領略他們的風採。您覺得目前第二步對於分子機理的理解,在您以及其他一些國際同行的工作基礎上,我們已經接近完美了,還是說仍有很多工作要做?您現在在這個方向上最為核心的課題是什麼?
  • 專訪田剛:四合院裡的北大數學「特區」,能否再締造黃金一代
    數學一直是北大的驕傲。田剛在未名湖畔開闢了一片小小的數學「特區」,四合院內蒼蒼古木掩映仿古的朱瞢碧瓦,靜待良鳳來儀。「做數學到了一定階段,也會嚮往起桃李滿天下的收穫感。」北京大學副校長、北京國際數學研究中心(下簡稱「數學中心」)主任田剛院士近日在未來論壇深圳峰會上接受澎湃新聞專訪時表示。
  • 專訪數學家張壽武:終有一日,要讓別人解中國人出的數學題
    張壽武 資料圖數學家張壽武去普林斯頓大學上班的時候,辦公室通常會開著門。任何學生都可步入交流。張壽武通常會告訴他們自己眼下在做什麼研究,有什麼解決不了的難題。「只要你解出來,你就超過了我。」在本科生僅有70人的普林斯頓大學數學系,30多位數學教授同樣可以實踐這幅生動而浪漫的圖景。但在每年迎來幾百名新生的中國大學數學系,哪怕是北大清華這樣的頂尖學校都深負壓力。「國內有些教授教一門課,上課的人有四五十人。我覺得他們把課教完,作業改好就差不多了,讓每個學生享有每周一小時的辦公室交流是不可能的,連碩士生都做不到。」
  • 田剛院士出席克雷數學研究大會 並做主旨報告
    2010年6月9日,「2010克雷數學研究大會」在法國巴黎龐加萊研究所召開,北京大學國際數學研究中心主任田剛院士出席會議,並做了題為 「Metric geometry and analysis of 4-manifolds」的大會主旨報告。克雷數學研究大會是國際數學界非常關注的重要會議,會議旨在對數學領域的最新重大研究成果進行確認和研討。
  • 世界級北大數學天才遠走美國大學,給國人留下3句話,發人深省
    但今天要給大家講的卻是一個發人深省的故事,一位來自中國的世界級北大數學天才遠走美國大學,給國人留下3句話,發人深省。在數學領域方面,普林斯頓大學還誕生過很多世界知名的大數學家和數學相關領域大咖,例如:艾倫·圖靈(1938屆):計算機科學家、密碼學家,蓋瑞·貝克(1951屆):1992年諾貝爾經濟學獎得主,約翰·福布斯·納什:數學教授。主要工作領域為博弈論和微分幾何學,並提出了著名的納什均衡。可以說,來到美國普林斯頓大學深造對於許晨陽來說是很好的留學去處之一,這對於他未來的數學發展道路絕對是極為有利的。
  • 藤門留學-普林斯頓大學校訓及含義
    同時普林斯頓大學也是全球最具學術研究能力的大學之一。真是因為這樣的變化,普林斯頓大學曾經有一句拉丁語普林斯頓大學校訓:她因上帝的力量而繁榮。而現在,它擁有著一句新的非官方的普林斯頓大學校訓:普林斯頓——為國家服務。