Ian Goodfellow:我最大的失敗是用無監督解決計算機視覺的監督學習問題

2021-02-15 新智元



  新智元編譯  

來源:veronika.com

編譯:肖琴

【新智元導讀】Ian Goodfellow是谷歌大腦團隊的staff research scientist,負責領導一個研究AI中對抗技術的研究團隊。他入選了MIT技術評論的「35 under 35」,他是生成對抗網絡(GAN)的發明者,還是《深度學習》一書的主要作者。最近,他參加了一個名為「How I Fail」的訪談,吐露自己失敗的經歷。

1. Hi Ian~ 感謝加入「How I Fail」系列的訪談!你能告訴我們一些關於你自己的事嗎?

Ian Goodfellow:謝謝你邀請我!

我是谷歌的一名AI研究員,領導一個研究團隊。我們正在致力於更好地理解AI失敗的情況,以便我們能夠為負責任的AI開發建立明確的工程原則。我的個人時間大部分都在學習如何使AI安全——例如,如何確保惡意攻擊者無法欺騙AI系統去執行攻擊者的意圖,而不是設計者的意圖。

2. 在Twitter上,你曾經發過一份被拒絕學校的名單,可以詳細說說嗎?

Ian Goodfellow:當時,我的同事 Moritz Hardt 在Twitter上提醒大家,說「要記住,一個典型的成功的學術生涯的開端,是被一批優秀的研究生院拒絕。」

我於是回復了一份我被拒絕的研究生院和獎學金的名單。當時只是簡單列舉了,這裡是更完整的故事:

在史丹福大學念本科時,我在為從事神經科學的工作做準備的同時,曾在生物和化學課上苦苦掙扎。我的成績很好,但我覺得自己做得不夠好,無法成為一名教授。

當我將注意力轉向計算機科學後,我作為本科生申請了幾個實習。值得一提的是,谷歌拒絕了我的實習申請。

我曾經申請過一名史丹福大學教授的暑期實習。申請材料中包含了我的成績單。教授回復我:「為什麼你在我的課上有一個A?」原來,我實際上並沒有在那門課上得到A。我以為是教授評分慷慨,但其實只是因為電腦故障。那次實習申請的結果是斯坦福給我的成績單降低了評分。

其他的大型科技公司給我提供了實習機會,但不是在機器學習或計算機視覺領域工作。在我的簡歷上,你看不到這些失敗,只是看到最終的成功(我非常感謝Willow Garage和史丹福大學的CURIS項目讓我有機會在夏季實習期間研究機器人視覺)

在我的碩士和博士階段,我大部分時間都沒有獲得外部獎學金。這意味著我不得不當教學助理,或費心申請專門的補助金,而無法專注於我的研究興趣。我不斷地申請獎學金,比如魁北克的PBEEE。我在2009 - 2013年每年都嘗試申請,但並沒有獲得,直到2013年,Google給了我第一個深度學習的PhD Fellowship。

像ECCV這樣的視覺會議拒絕了我在博士之前寫的大部分論文。我做了很多有關機器人感知的工作,但這些工作從未見過天日。

3. 你認為哪些因素幫助你克服了這些挫折?

Ian Goodfellow:在高中時,我在學校的辯論隊裡呆了三年,由兩位非常出色的老師指導:Kerry Koda和Thomas King。

在我的科學職業生涯中,這段辯論的經歷經常在不同的方面幫助到我,這令我很驚訝。在克服挫折方面,辯論是有用的,因為辯論者都學會了如何處理失敗情緒。每場辯論都有勝利者和失敗者。沒有人能夠一直勝利。如果你堅持辯論的時間很長,你很快就會習慣輸掉一輪比賽時的挫折感,然後立即去另一個教室再進行另一輪比賽,習慣輸掉一場錦標賽,然後在下個周末馬上去參加另一場比賽。你學會了不去反芻失敗和自責。此外,你對自己期望會得到很大調整。你會習慣不斷地經歷失敗和成功。


4. 對於簡歷的這段失敗經歷,有些回應說這是你謙虛的自誇,你的回答是什麼?

Ian Goodfellow:我之前在推特上公開這些事時,人們並沒有這樣回復。很多人感謝我分享這些信息。我完全可以理解為什麼有人會認為這是一種謙虛的自誇,但我想大多數人也明白我這樣做是為了幫助其他人擺脫妄自菲薄。


5. 另一方面,你是否認為失敗是普遍的,人們可能會決定不分享他們的成功?

Ian Goodfellow:不,我們基本上都是被迫分享成功,無論是工作中的績效評估,還是在申請資金等方面。在向會議和期刊提交論文時,每個人都很有動力去展示他們論文的優勢,並試圖將缺點掩蓋。我個人儘可能地反對這種動機,但我不認為這會很快消失。


6. 到目前為止,我們談論的成功和失敗都源於一些獨立的決策,還有其他類型的事情可以令人失敗,你自己是否有這樣的經歷?

Ian Goodfellow:實際上,我認為大多數獨立的失敗事件(被接受/被拒絕某個特定的研究生課程,或被接受/被拒絕提交給會議的論文等)並不重要。

我在推特上說自己被很多研究生院拒之門外,但這沒什麼,因為我也被其他很多學院接受了。

例如,在2009年,我遇到的最大的障礙不是被一些頂尖學校比如MIT和CMU拒絕,而是我沒法確定在其他接受了我的院校裡(比如斯坦福和伯克利)能否做想做的研究。也不知道導師是誰,而且這些學校支持深度學習研究的導師相對較少。我選擇去蒙特婁大學來克服這一障礙,因為可以提前選Yoshua  Bengio做導師。

我認為最大的失敗可能是,我在博士期間大部分時間都在試圖用無監督的特徵學習方法去解決計算機視覺的監督學習問題,而當Alex、Ilya和Geoff 用純粹的監督方法贏得了ImageNet競賽時,我完全是措手不及。我想,浪費時間在寫論文上,而且這些論文完全沒見得天日,這是我失敗的主要原因。特別是現在,在arxiv.org上發表文章是很正常的。如果一篇文章影響到其他研究人員,哪怕被會議拒了,我認為這個工作仍然是成功的;如果一篇文章沒有產生任何影響,哪怕它被會議接收了,這個工作仍然是失敗的。


7. 有沒有什麼事情是你覺得你目前做失敗了的,或者你對它的未來猶豫不決的?

Ian Goodfellow:我一直在努力理解為什麼神經網絡很容易被輸入的小小擾動所迷惑(通過自己直接的研究工作,以及努力增加其他研究人員對這個主題的興趣),這個問題已經提出近4年,仍然沒有人知道在這種設置下如何構建高精度的 模型。

從職業成功的傳統衡量標準來看:我今年提交給ICML的論文的評審意見尤其殘酷,預計它們中的大部分都會被拒。

另一件值得一提的事情是:我工作的方式。我會快速地嘗試一些想法,看看它們是否有成功的希望,然後放棄掉大部分想法。當我有很多時間時,我可能會對3-5個想法編碼,然後可能發現它們都不work。每個想法投入的時間成本很小,但我可以嘗試大量不同的想法。從這個角度來看,失敗只是我工作流程中固定的一個部分。


8. 說到成功的研究人員,你如何看待論文發表之類的權重的分布?是否存在一些容易被忽視的因素?

Ian Goodfellow:我認為我們衡量成功的標準正在導致社會錯失所有的成功人士。

例如,我們花費大量時間評估工作和評估人員,但我們並沒有花費大量時間評估這個評估過程本身。沒有人負責確保會議審查流程公平和準確。從Eric Price寫的NIPS experiment這篇文章就發現,評審過程中存在很多噪音(Eric Price發現,領域主席們在處理論文時經常意見不一致的情況比意見一致的情況更多),但是沒有人帶頭提出更好的審查流程。研究社區應該重視提高整個社區效益的努力,但到目前為止,我們似乎沒有任何方法為這些努力提供價值。


9. 你認為機器學習領域的失敗與其他領域的失敗有不同嗎?是否以不同的方式影響著不同的人群?

Ian Goodfellow:機器學習對快速產生大量成功的工作和對其他人的工作產生影響這方面有很高的期待。例如,Ilya Sutskever在Google學術搜索的引用量超過50000次,而在數學領域,菲爾茲獎最近的四名獲獎者沒有一個引用量超過5000。這很奇怪,在我們這個領域,成功是如此的具有爆炸性。可能部分原因是我們經常使用arxiv.org,而不是主要關注同行評審的出版物。說實話,我不太了解這是如何影響不同群體的。


10. 你對機器學習的負面結果有何看法?

Ian Goodfellow:我認為很難在機器學習的負面結果中找到價值,因為很難知道造成負面結果的原因。一個負面的結果可能是由於想法本身根本就是錯的,但也可能只是一個出於非常小的一個軟體錯誤,嘗試的超參數不對,模型太小,等等。

11. 你想給過去的自己提什麼建議

Ian Goodfellow:我希望我使用一部分為深度學習購買的GPU來挖一些比特幣。

【加入社群】

新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號: aiera2015_3  入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。

相關焦點

  • 谷歌CVPR最全總結:45篇論文,Ian Goodfellow GAN演講PPT下載
    新智元 - CVPR 2018專題  來源:Google、iangoodfellow.com在計算機視覺領域,生成對抗網絡GAN無疑是最受關注的主題之一,本文一併帶來谷歌 Staff Research Scientist、GAN的提出人Ian Goodfellow在CVPR 2018上作關於GAN的演講的PPT。
  • 無監督學習的魅力
    無監督學習是機器學習算法裡非常撲朔迷離的一個類別,負責解決這些「沒有真實值 (no-ground-truth) 」的數據。本文會講到,無監督學習到底是什麼,和機器學習的其他算法有何本質區別,用的時候有哪些難點,以及推薦閱讀的傳送門。最簡單的理解方式,就是把算法想像成考試。
  • 專訪Ian Goodfellow:欲在谷歌打造GAN團隊,用假數據訓練真模型
    許多研究者,包括 LeCun,相信 GAN 能夠達成「無監督學習」,這是 AI 研究領域的一個強烈願景:不需要人類直接幫助的機器學習。讓 Goodfellow 冒出這個想法的酒吧叫 Les 3 Brasseurs,或稱 The 3 Brewers。
  • 手把手教你實現GAN半監督學習
    目前機器視覺領域的急速發展離不開監督學習。而無監督學習的訓練事先沒有訓練標籤,直接輸入給算法一些數據,算法會努力學習數據的共同點,尋找樣本之間的規律性。無監督學習是很典型的學習,人的學習有時候就是基於無監督的,比如我並不懂音樂,但是我聽了上百首歌曲後,我可以根據我聽的結果將音樂分為搖滾樂(記為0類)、民謠(記為1類)、純音樂(記為2類)等等,事實上,我並不知道具體是哪一類,所以將它們記為0,1,2三類。典型的無監督學習方法是聚類算法,比如k-means。
  • 【無監督學習最新研究】簡單的「圖像旋轉」預測,為圖像特徵學習提供強大監督信號
    從定性和定量兩方面證明,這個看似簡單的任務實際上為語義特徵學習提供了非常強大的監督信號。在過去的幾年中,深度卷積神經網絡(ConvNets)已經改變了計算機視覺的領域,這是由於它們具有學習高級語義圖像特徵的無與倫比的能力。然而,為了成功地學習這些特徵,它們通常需要大量手動標記的數據,這既昂貴又不可實行。
  • GAN之父Ian Goodfellow :那個賦予機器想像力的人類
    未來,計算機將會更好地消化原始數據,並沒有明確命令的情況下,從原始數據中找出它們需要從中學習的東西。這將標誌著 「無監督學習」的一大飛躍。無需離開車庫,自動駕駛汽車就可以自學如何處理不同的路況;無需四處走動,機器人就能夠預估到在一個忙碌的倉庫中可能遇到的障礙。我們能夠想像和思考不同的場景,這是我們作為人的一部分。
  • 人物 | Ian Goodfellow親述GAN簡史:人工智慧不能理解它無法創造的東西
    Goodfellow 說:「你可以將此看作是一位藝術家(生成模型)和一位藝評家,藝術家想要愚弄藝評家,使其相信藝術家的生成的圖像是真的。」由於第二個人工智慧在鑑別圖像真假上十分賣力,第一個人工智慧可從其學到通過自學無法學到的方式來仿製逼真圖像。在這一過程中,這兩個神經網絡不斷推動人工智慧前進直到有一天計算機可以脫離人類的指導而存在。
  • Ian Goodfellow:GAN相比其他生成模型的優缺點及應用
    圖1 生成對抗網絡的基本架構近兩年來學術界相繼提出了條件生成對抗網絡(CGAN),信息生成對抗網絡(InfoGAN)以及深度卷積生成對抗網絡(DCGAN)等眾多GAN的變種,圖2來自去年一篇論文:Image-to-Image
  • 吳恩達《Machine Learning》精煉筆記 1:監督學習與非監督學習
    今天帶來第一周課程的筆記:監督式學習和非監督式學習。主要內容:監督學習和無監督學習單變量線性回歸問題代價函數梯度下降算法1-1. 監督學習Supervised Learning利用監督學習預測波士頓房價(回歸問題)大多數情況下,可能會擬合直線有時候用二次曲線去擬合效果可能會更好的
  • 監督學習、非監督學習和強化學習
    learning)、非監督學習(Unsupervised learning)與強化學習(Reinforcement learning),不過在沒有任何概念的前提下,只看定義很難理解它們,我試著用教育孩子的方式來解釋,如果有什麼疏漏之處,歡迎大家指正。
  • CVPR 2020丨無監督動作遷移TransMoMo
    人體動作遷移在計算機圖形學動畫製作和仿生機器人領域有廣泛的應用,長期以來有許多基於動作捕捉設備的研究。近年來,隨著移動計算的普及和深度學習在計算機視覺領域的應用,獲取人體動作信息的成本大大降低。此外,得益於生成式對抗網絡(GAN)的研究進展,通過計算機合成高度真實的圖像和視頻成為可能。
  • 無監督學習異常檢測綜述
    這一挑戰被稱為無監督異常檢測,並在許多實際應用中得到解決,例如在網絡入侵檢測、欺詐檢測以及生命科學和醫學領域。在這一領域已經提出了幾十種算法,但不幸的是,研究界仍然缺乏一個比較通用的評估以及公共可用的數據集。本研究解決了這些缺點,在來自多個應用領域的10個不同數據集上評估了19種不同的無監督異常檢測算法。
  • 論文分享|學習無監督學習規則
    學習的更新規則UnsupervisedUpdate(;Ɵ)為了建立更新,在基本模型中每一層l的每一個神經i都有一個輸出hil(;Φ)。所有的更新網絡共享元參數Φ,並且hil只在無監督訓練階段評估。評估每一批數據的單元激活統計量在監督學習中被證明有幫助,同時在手工設計的無監督學習中也被證明。因此我們在每一個訓練批次中讓hil積累統計量。
  • 用Transformer振興CNN骨幹網絡,港大、騰訊等聯合提出視覺自監督表徵學習CARE
    而今年的 NeurIPS 2021,Lecun 剛發推感嘆他與另外一位 CV 泰鬥 Jean Ponce 的自監督投稿 VICReg 被拒掉了,可見在機器學習領域,自監督學習的競爭激烈程度。另外一方面,最近熱門的 Transformer 給計算機視覺算法帶來了全面的升級。那麼 Transformer 跟自監督表徵學習在一起會迸發出怎樣的火花?
  • Ian Goodfellow回憶GAN誕生故事:幾杯啤酒喝出「20年來最酷的深度學習想法」
    監管Facebook人工智慧研究的Yann LeCun將GAN稱為「過去20年來最酷的深度學習思想」。深度學習是一種AI,它正在改變所有網際網路最大的公司的方向,包括谷歌,微軟,和亞馬遜,以及Facebook。 Goodfellow的想法還在不斷發展,但它們已經快速傳遍AI社區。
  • 73歲Hinton老爺子構思下一代神經網絡:屬於無監督對比學習
    Hinton 在此次報告中回顧了神經網絡的發展歷程,並表示下一代神經網絡將屬於無監督對比學習。人工神經網絡最重要的待解難題是:如何像大腦一樣高效執行無監督學習。第一類的典型代表是 BERT 和變分自編碼器(VAE),它們使用深度神經網絡重建輸入。但這類方法無法很好地處理圖像問題,因為網絡最深層需要編碼圖像的細節。
  • 無監督學習站起來了!Facebook第三代語音識別wav2vec-U,匹敵監督模型,Lecun看了都說好
    wav2vec-U,小眾語言也能用語音識別啦!無論是給計算機或其他設備下達指示,還是回答用戶的問題,語音識別在各個方面讓電子產品的使用變得更加容易,無需學習,想要幹什麼只要跟他「說」就可以了。但是直到今天為止,語音識別這項技術還是只適用於全球數千種語言中的一小部分,因為高質量的語音識別系統需要從大量轉錄的語音音頻中訓練得到。這些數據並不適用於所有的語言、方言和說話風格。
  • 通過視頻著色進行自監督跟蹤
    我們將從基本的目標跟蹤開始,然後討論什麼是計算機視覺的自我監督學習,最後詳細討論這種方法。隨著深度學習時代的到來,社會上出現了非常有創新性的研究並且深度學習方法成功地勝過了傳統的CV方法來應對公共跟蹤挑戰。儘管在公共挑戰方面取得了巨大成功但深度學習仍在努力為現實世界中的問題陳述提供通用的解決方案。 深度模型的挑戰在訓練深度CNN模型時,我們面臨的主要挑戰之一是訓練數據。訓練數據:深度學習方法需要大量的數據,這幾乎每次都會成為一個瓶頸。
  • 突破 DeepMind為強化學習引入無監督輔助任務,人工智慧的Atari遊戲水平達到人類的9倍
    DeepMind 的主要任務是開拓人工智慧的新疆界,開發可以自主解決任何複雜問題的新系統。我們的強化學習代理已在 Atari 2600 遊戲和圍棋中實現了突破。但這些系統需要大量數據進行長時間訓練,我們一直致力於提高我們的通用學習算法,改變這一情況。
  • GMIS 2017大會鄧力主題演講:無監督學習的最新進展
    上午,Citadel 首席人工智慧官鄧力發表了主題為《無監督學習的最新進展》的演講,他探討分享了無監督學習的優勢,並詳細介紹了隨機原始-對偶梯度方法(SPDG)與其優良的性能,下面我們將一起瀏覽鄧力老師的盛宴。首先鄧力老師介紹了無監督學習的概念和強大之處,鄧力表明無監督的學習範式即是深度學習當中的一種範式。