論文連中兩大CV頂會,這位博士生分享了自己在谷歌實習的研究心得

2020-11-22 雷鋒網

雷鋒網(公眾號:雷鋒網) AI 科技評論按:近日,谷歌專為學生群體開設的谷歌學生博客(Google Student Blog)上發出了一篇採訪,採訪對象是在谷歌實習的博士生 Philip Haeusser。Philip Haeusser 在這段谷歌實習經歷中受益匪淺,他也詳細分享了自己的感受。雷鋒網 AI 科技評論把這篇採訪編譯如下。

先介紹一下你的博士論文題目吧?

大家好!我是 Philip,我的學校是慕尼黑工業大學(TU Munich),目前是計算機科學專業博士三年級,我的導師是 Daniel Cremers。我的研究方向是計算機視覺,就是要讓計算機理解圖像和視頻。對計算機來說,圖像和視頻僅僅是一大堆沒什麼含義的數字而已。不過如果用顏色把他們表示出來,人類就可以馬上分辨出來圖像中有什麼內容。

為了讓計算機也能做到這樣的事情,我的方法是訓練神經網絡;這是一大類模型,它們可以看作是「迷你視覺皮層」的一種實例。訓練的目標是把組成圖像的那些數字映射更成有意義的東西,就比如「貓」這樣的類別標籤。神經網絡在這種任務上的表現非常好。我研究過的問題包括 光流 optical flow(「視頻中一幀到下一幀之間發生了什麼?」)、領域適應(「如何讓一個領域的知識/標籤在另一個領域發揮作用,比如讓手寫圖像的標籤在谷歌街景的門牌號識別任務中發揮作用」)。

在做研究之外,我還有一個 YouTube 頻道「Pill's Physics」,裡面的內容是我做一些科學實驗、討論一些科學知識。

你是如何選擇做這個方向的?

2014年的時候,我剛剛在美國加州大學聖克魯茲分校拿到物理學碩士學位。那時候我在一個研究如何給盲人移植視網膜的跨學科小組裡面,有一次實驗中我們需要處理一些採集起來非常費錢的數據,然而我們又沒法充分利用這些數據,因為我們的數據處理程序過於簡單了。所以我就開始自學機器學習和神經網絡。我很快就對這東西著迷了,然後開始聯繫在這個領域做研究的教授們。Daniel Cremers 邀請我過去展示我的工作成果,我覺得非常榮幸,後來他也就成為了我的博士導師。

你選擇來谷歌實習的原因是什麼?你的導師起到的幫助大嗎?

深度學習領域的進步速度非常快。幾乎每周都有人發表突破性的新神經網絡或者訓練方法。很多時候,論文作者都是來自谷歌的。這就讓我非常好奇谷歌在這個領域都做了些什麼樣的研究。在一個夏令營中,我遇到了 Olivier Bousquet,他做了一個關於谷歌大腦團隊的演講,講得非常棒。他給我介紹了谷歌研究實習生的事情,我就很快發了申請。我的博士導師也很支持我,因為接觸新的觀點、跟別人接觸、跟別人交換意見永遠是好事,尤其是在深度學習這樣的新領域中。而且,谷歌有很多的資源可以用於研究,很多大學裡沒有條件計算的實驗都可以在這裡完成。

你實習期間做的是什麼項目?

我很榮幸可以和 Alexander Mordvintsev 一同工作,他是 DeepDream 的創始人之一。我們做的項目是關於一種用無標籤數據和半監督學習訓練神經網絡的新方法的。

我們開發出的新方法叫「從聯想中學習(Learning by Association)」。它的思路和「聯想遊戲」很像,給你一個單詞,然後你要回答你聯想到的第一個東西。幾輪聯想下來,一般都會形成很好玩的聯想鏈。

我們做的事情就跟這個很類似:我們首先訓練一個能夠生成表徵(神經激活模式)的神經網絡,這樣的表徵也可以用來做聯想。這樣的聯想就可以把有標籤數據和無標籤數據聯繫起來。假設我們能夠生成一條有標籤數據和無標籤數據之間的聯想鏈,然後就可以從無標籤數據進行第二次聯想,再聯想到有標籤數據。這樣就形成了一個「聯想循環」。那麼,你就可以把這個循環開頭的那個標籤和最後聯想到的標籤做對比。我們的目標是建立連續的聯想循環,意思就是說循環中的標籤都是相同的。我們給這個過程建立了一個損失函數,然後通過實驗表明了這個方法可以極其有效地用更少的數據訓練分類神經網絡。

你在谷歌實習期間有發表論文嗎?

有的,我寫了一篇論文並且提交到了CVPR,這是世界上最大的計算機視覺會議;我還在CVPR 2017現場展示了這篇論文。出席大會的旅費也是谷歌出的,所以這段實習經歷不僅給我帶來了很多業界公司的經驗,而且也讓我發表了一篇引以為豪的論文。

你在實習期間所做的研究和你的博士研究題目聯繫緊密嗎?

剛開始的時候,我和谷歌大腦團隊的人一起探索了很多不同的題目,最後選中的這個和我的博士研究題目配合得非常完美。另外,即便做一個和博士研究題目完全沒有關係的項目也會有很大幫助,比如在編程和項目管理技能方面。

你自己寫代碼了嗎?

寫了好多呢!我尤其要感謝谷歌的代碼審查,讓我的代碼質量提高了很多,而且讓我對代碼風格和可拓展性也做了很多思考。谷歌允許代碼開源的這一點也讓我很高興,這就跟研究領域的慣例是一樣的。這樣一來,我在谷歌之外也可以繼續研究這個題目,並和全世界的研究人員一起共享這些代碼。我還寫了一篇後續論文「聯想領域適應(Associative Domain Adaptation)」,剛剛也被 ICCV 接收了。

現在你在谷歌實習已經是第二次了,你回到谷歌有哪些原因?

谷歌裡面有趣的研究項目太多了,一次實習經歷怎麼能夠呢?哈哈,不開玩笑了,Sylvain Gelly 團隊有一個非常有趣的項目邀請我參加。去年我就和他和他的同事碰過面,他們人都很棒,我不想錯過這個和他們一起工作的機會。

在谷歌的這段時間裡,你都學到了哪些關鍵技能?

我的代碼質量提高了很多。在谷歌有機會跟著有很多經驗而且非常聰明的編程人員身上學習,他們寫的代碼完善、快速,而且他們還能教你如何寫出這樣的代碼。我還和谷歌中很多不同團隊、不同背景的人都建立了聯繫;我遇到了一些優秀的產品經理,給我講了他們設計成功的產品的時候都有哪些深入的見解。我甚至還跟他們一起開發了一個新的YouTube功能,因為我剛好是一個YouTube內容開發者。其實還有很多,我最後再說一點,我在谷歌內部的健身中心裡加入了一個「最強泥人」團隊,經過鍛鍊以後我的身體素質也有提升。

這段實習經歷對你的博士學業有哪些影響?

現在回頭來看的話,這段實習經歷是我博士期間重要的裡程碑。我申請實習的時候其實沒有期待它會幫我改變一切,但是我覺得自己結束實習的時候是帶著滿腦子的新點子和渾身的動力回到學校的。

那根據你現在的經驗做個回顧:你覺得博士生應該申請去谷歌實習嗎?有什麼建議給他們嗎?

當你的博士讀到一半的時候,肯定會有那種覺得自己困在問題裡走不出去的時候。這時候你就需要接觸一些新東西。還可以是當你想試著做一個需要用到1000個GPU的實驗的時候;或者是當你覺得自己無所不知無所不能、想要挑戰自己的時候;又或者是你開始考慮博士畢業之後做什麼,你在想像寫大型程序、帶來大的改變會是什麼感覺。我覺得一段實習經歷可以有很多不同的理由。那麼谷歌也就是一個很有意思的地方,可以挑戰自己,也可以收穫一篇好論文、一群好朋友、各種好點子,甚至在谷歌工作的機會。

(完)

via Google Student Blog,雷鋒網 AI 科技評論編譯

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 一位博士生選擇自殺,在論文中了頂會之後
    頂會召開前9天,論文確定入選的中國籍博士生,自盡終結了生命。禍起頂會論文事情緣由,是一篇名為《3D-based video recognition acceleration by leveraging temporal locality》的ISCA論文,Huixiang Chen是論文一作。
  • 4位CVPR論文講者乾貨大爆料,想要在頂會發Paper 必看!
    第三位分享嘉賓是中科大&微軟亞洲研究院聯合培養博士生鄭賀亮。鄭賀亮在大四開學時就進入微軟亞洲研究院實習,期間在同一實驗室師兄師姐們的鼓勵下,首次投CVPR論文就被選中。在實驗室中每個人研究的課題都不一樣,但是到大會上會有很多workshop,每個方向都有很多人研究。你可以找到興趣相同的朋友 ,甚至可以深入討論實驗的細節,有一種彼此相通的感覺。「Paper is not the end」發表論文並不是終點。到大會上你會發現大牛研究的都是一條線,而不是一個點。
  • 讀博無門就業碰壁,孤獨當了7個月「民科」後,我的論文中了頂會
    他決定給自己8個月的時間,在頂會上發表一篇論文,不然就去做程序猿。最終他做到了!他收到了超過100條私信,來問怎樣像他一樣做個「獨立研究者」。於是他把自己的經歷詳細寫了下來,還給了忠告:這條路太苦了,能不走就別走。
  • 清華姚班出身,95後博士生陳立傑獲理論計算機頂會最佳學生論文
    【新智元導讀】理論計算機科學領域最頂級的國際會議STOC最佳學生論文獎,頒給清華姚班畢業生、MIT陳立傑等人,陳立傑在中學、大學本科階段,創造了無數神話,連清華大學老師都直呼他是」神人「。95後的理論計算機科學家來了。
  • MIT周博磊:CV本質上是一門科學研究
    在參會期間,雷鋒網(公眾號:雷鋒網) AI 科技評論與周博磊進行了一次交流,他分享了對計算機視覺研究的一些心得體會。其實是底下的桌子,這就是一個物體交互的過程,會涉及到更多認知層面的東西。AI 研究的工程化和平民化在做研究的過程中,我一個很深的感受是,現在的深度學習或者說 AI 的研究變得越來越工程化了,變成一種群體作戰。這也可以解釋為什麼現在公司其實是佔優勢的。
  • 博士生全文剽竊論文 稱自己也是受害者
    9月4日,王教授的一名研究生發現王教授以前發表的一篇學術論文,幾乎原封不動地出現在了另一學術雜誌上,「作者」變成了這位在讀博士生!昨晚,李猛終於做了鄭重道歉,但同時他連呼自己也是這篇論文的受害者!  網上熱論:博士生「剽竊」他人論文  9月4日,某網站上出現了一篇署名「王子彥」的文章,文章中,王子彥聲稱四川某大學「經管學院博士生李猛」於2004年發表於雲南《生態經濟》學術期刊上的《現代自然與可持續發展》一文,全文剽竊了他的同名文章。王證明,此文是他當年讀博時和自己的導師陳昌曙聯合署名的論文,發表於1998年《自然辯證法研究》期刊第2期。
  • 頂會論文審稿人帶你復現論文,還有獎學金可拿
    對於本科生,論文復現可以幫你快速奠定理論基石並徹底搞懂,為課題研究打好基礎;對於碩博生,如果你要發AI論文,就必須要快速大量的閱讀特定方向的重要論文,並且理解創新點,進行復現,這才有利於找到自己的研究方向;對於在職開發者,可以探索最前沿的先進技術,解鎖算法優化的新思路。
  • 一川大博士被華為以200萬年薪錄用!分享以下科研及論文寫作經驗
    在旁人看來如同「過五關、斬六將」的選拔和面試,對劉大一恆而言,更像是對自己多年學習研究的總結和展示。最觸動劉大一恆的是最終環節的面試,在與公司高管的交流中,他感受到華為公司對高精尖技術和人才的看重,以及致力科研的情懷,認為自己找到了未來的舞臺。劉大一恆坦言,比起被大家關注的高薪,更讓他興奮的是這個機會能夠讓自己的所學所知轉化為理論應用,創造出更精尖技術的可能。
  • 分析17萬篇AI頂會論文,揭示了計算資源貧富分化的證據
    事實上,富裕的大學和大公司在深度學習方面具有優勢,這一點並不奇怪。像AlphaGoZero和GPT-3這樣的大型現代網絡需要數百萬美元用於算力的訓練,並且2019年12月的一份分析報告將谷歌、史丹福大學、麻省理工學院、卡內基梅隆大學、加州大學伯克利分校和微軟列為引領人工智慧研究研討會的前六大貢獻者。
  • 聚焦人工智慧領域發展,微信9篇論文入選ACL和IJCAI兩大頂會
    ACL是自然語言處理與計算語言學領域影響力最大、最具活力的國際學術會議之一,由計算語言學協會主辦,每年都會有眾多頂級學術機構和科技企業如史丹福大學、谷歌等,在會議上提交在自然語言處理、人工智慧、機器學習方面的最新研究成果。IJCAI則是人工智慧領域的首個國際學術性會議,備受國內外人工智慧領域學者重視。
  • 頂會抄頂會?SIGIR論文作者回應質疑,ACM主席已介入
    被指責抄襲的作者親自下場分辨,卻被反駁「漏洞百出」,頂會抄頂會的故事還沒有最終定論。SIGIR 2019 論文的作者在研究中引用了 WWW『18 的論文(但很奇怪的是,那篇 RecSys 18 論文並沒有引用他們自己之前的這項工作)。針對第 2 條指控,作者解釋稱,兩篇論文都是基於對抗訓練,WWW『18 的論文也是如此。在句子結構中,GRU / CNN 都是相當普遍的序列到序列學習策略。
  • 如何發頂會論文_頂會論文 - CSDN
    Scalers 點評: 兩個月前,成長會的Ramon(S290)收到了計算機視覺頂級會議CVPR論文錄取的通知,而且是口頭報告。CVPR在計算機視覺領域屬於三大頂級會議之一,具有較高的影響力,對於一名在校博士生,能在這個會議上能發表論文,是很不錯的一件事情。於是我請Ramon特意撰文,分享了這篇論文從想法到獲得成果的一路歷程。
  • 臺北科技大學為博士生加值 實習兩年才有學位
    華夏經緯網10月12日訊:據臺灣媒體報導,為縮短學用落差,臺北科技大學採取創舉為博士生加值。北科大和金屬工業研究中心籤訂合作計劃,未來要送首度招生的「技術博士」到金屬中心實習,且要滿兩年的工作經驗才能取得博士學位。讓博士生不只懂研究,更能與企業界連結。
  • 港生首入中科院實習:沒料到工作強度如此大
    這是首次有香港學生進入中國最高學術機構實習,羅冠宇與21位香港同齡人一起,近距離接觸人工智慧、區塊鏈、大數據分析、軟體開發等領域的前沿研究。羅冠宇近日在港接受記者專訪時表示,這次的中科院經歷與他以往參與過的「走馬觀花」式實習大相逕庭。他們在中科院導師、博士生的指導下,直接負責或參與一項全新的研究。「始終是自己負責的東西,想儘量把它做好。」
  • 2013年至今各大AI頂會最佳論文整理分享
    其中A+類屬於頂級會議;A類是僅次於頂會的高級別會議;B類的會議論文錄用難度相對比較容易,當然也有非常多論文質量很硬的會議。C類和L類會議相對知名度比較低,論文發表也很容易,但是認可度不高。 本資源收集了自2013年開始各大計算機領域頂會的最佳論文,涉及交叉領域的頂會(AAAI、IJCAI、WWW、ICML、ICLR等),數據挖掘與信息抽取(KDD、SIGIR、CIKM、WSDM等),計算機視覺(CVPR、ICCV)和自然語言處理(NLP、EMNLP)。
  • 交大90後男神博士:3年看1800篇論文,研發成果超越谷歌,還入選福布斯精英榜
    在大三那年(2011年),張祥雨拿下了美國大學生數學建模競賽(MCM)特等獎提名獎,當時創下西安交通大學參加該項競賽以來歷史最好成績。憑藉這次獲獎經歷,張祥雨獲得了後來到微軟亞洲研究院實習的資格。於是,張祥雨就成了孫劍組裡第一個做深度學習的博士生。張祥雨做的第一個深度學習相關的工作,就是復現深度學習經典論文AlexNet。他花了兩個月的時間對論文進行了復現,包括寫完底層全部代碼。復現 AlexNet 的經歷算是深度學習的入門,當時深度學習的框架非常少,於是張祥雨乾脆自己寫了一個。
  • 谷歌的KDD 2017:九篇錄用+雙料博士論文獎
    Bryan Perozzi 摘得,這一獎項被授予在數據挖掘和知識發現領域有所建樹的傑出博士生。這一獎項是為了肯定他在石溪大學跟隨 Steven Skiena 教授所做的圖表機器學習研究課題《Local Modeling of Attributed Graphs: Algorithms and Applications》,其中的一部分內容是 Perozzi 在 Google 實習期間完成的。
  • 如何寫好綜述論文?Nature分享5大要領
    同時,撰寫這類文章可以為自己的研究提供靈感,還可以做一些寫作練習。不過,很少有科學家接受過如何寫綜述類論文的訓練,或者不知道一篇優秀的綜述文章是怎樣構成的。再比如,在綜述論文中加入短視頻,以突出一些關鍵方面。這可以增加讀者群和可讀性,因為視頻更容易在社交媒體平臺上分享。
  • 如何寫好綜述論文?Nature分享5大要領
    馮維維 | 編譯 綜述類論文是科學家的重要資源。它們可以提供一個領域的歷史背景,以及關於該領域未來發展的個人看法。同時,撰寫這類文章可以為自己的研究提供靈感,還可以做一些寫作練習。
  • NIPS 2017錄用論文先睹為快!GAIR大講堂NIPS清華專場精彩回顧
    那麼對於廣大還沒來得及註冊或者沒有機會去到前方會場的同學們來說,如何才能更進一步的了解本次NIPS的論文情況呢?由雷鋒網主辦,清華數據派THU承辦的第五期「GAIR大講堂」在上周六邀請了5位NIPS 2017論文入選者,5位同學來到清華大學,為大家做本次NIPS 入選論文的介紹分享。五位嘉賓中年齡最小的還在讀大四,最大的博士還沒畢業,但是各自都在學術方向有了一定深度的研究。