讀博難,大神來支招:DeepMind科學家Sebastian Ruder提出十條實用建議

2021-01-11 澎湃新聞

機器之心

選自ruder.io

作者:Sebastian Ruder

機器之心編譯

機器之心編輯部

如何找到合適的研究方向?如何維持飽滿的科研熱情?如何通過讀博實現長期規劃?……DeepMind 科學家 Sebastian Ruder 來支招。

「聽過很多道理,仍然過不好這一生」?但有些道理還是有用的。

機器之心曾經報導過多篇和讀博相關的文章,最近我們發現 DeepMind 研究科學家 Sebastian Ruder 也發布了一篇博客,介紹自己的讀博建議。

鑑於 Sebastian Ruder 博士期間主要研究機器學習和自然語言處理,因此他給出的建議也更適用於這兩個研究方向的同學。不過,這份建議並不僅限於博士生。如果你是一名獨立研究者,並且想開始攻讀博士學位,或者只是想單純地學習,那麼這些建議大部分也是適用的。

不過 Sebastian Ruder 建議大家,在閱讀本文時做好篩選,因為每個人的情況都不相同。根據自己的具體情況選擇並改良這些建議,再進行實踐,或許是最好的做法。

Sebastian Ruder 一共給出了十條建議,均來自其自身實踐,他認為這十條建議對長期發展也有好處。

廣泛閱讀

同時做兩個項目

要有雄心壯志

有合作意識

積極主動

寫博客

維護科研能量

發揮長處

實習或訪問大學

放長線釣大魚

廣泛閱讀

博士生涯鼓勵每個人深入研究一個特定的主題,但你可以通過在不同主題或不同領域之間建立聯繫來增加研究價值。建立跨領域連接的論文通常會很有見地,比如,深度學習領域的許多思想是從生物學、神經科學、物理學等其他領域獲得靈感。

想汲取靈感,你需要培養各種興趣,超越當下的視野。比如,參加其他地區的暑期學校,與其他實驗室的同學時常溝通,或在會議上與不同領域的人交流,抑或是閱讀不同學科的論文。

arXiv 網站上有大量的研究論文資源,但是時時刷 arXiv 有一定難度。Sebastian Ruder 採取的方式是使用 arXiv sanity preserver、arXivist、Twitter 流以及朋友推薦等方式來獲取最新研究動態,尋找不同的主題。

關於如何閱讀論文,Sebastian 表示,他通常更喜歡粗略地閱讀 10 篇論文,而不是深入地閱讀一篇文章(這和 Jeff Dean 的建議一致)。此外,使用帶有搜索功能的論文管理系統(如 Mendeley),你可以隨時重新閱讀最相關的文獻。

在博士生涯初期涉足不同的領域有助於你找到自己的研究興趣。一旦找到,你只需專注於這些自己真正感興趣的問題。

同時做兩個項目

雖然在開始新項目之前先完成上一個項目是最優選擇,但是過分專注於一個項目也有消極面。如果項目進展不順利,研究者的動力也會受挫。在遇到並解決障礙前,大多數人將無能為力,還會「卡」上很長一段時間。培養這種韌性很重要,但有時需要付出高昂的心智損耗。

而同時處理兩個項目就很有用。在其中一個項目中遇到障礙,你可以轉頭去處理另一個項目。這可以幫助研究者解放緊繃的神經,獲得全新的視角。同時,如果其中一個項目進展順利,這也可能幫助你在另一個項目上取得進展。

為了最大程度地減少思維切換,Sebastian 通常每天只嘗試一個項目。如果兩個項目屬於相似的領域,也會很有幫助,這樣你可以將一個項目中學習到的知識應用到另一個項目中。

要有雄心壯志

若你瞄準月亮,即使錯失,也是落在星辰之中。

——Norman Vincent Peale

同時進行兩個項目的另一個好處是使研究者更加大膽。當然,你可以選擇一個相對安全的項目,同時選擇另一個高風險但更有影響力的項目。相對安全保守的項目可確保你順利畢業,而高風險的項目則可能產生更大的影響力。

研究者需要略帶一些野心。選擇高風險的項目,說明你很有創造力,能夠提出新想法。其實,不管是高風險的項目還是相對保守的項目,二者都很有價值。即使項目失敗,這些經歷也可能促使研究者獲得一些意外收穫。但是,所謂的「雄心壯志」並不表示迎合大眾口味,高影響力也可以集中在小社區範圍內。判斷項目是否具備影響力的可靠指標是,如果其他人發表了這項研究你會感到振奮。

「雄心壯志」意味著,你想成為挑戰現狀、指引自己航向的人。

有合作意識

博士通常被認為是一項孤獨的事業,是一條知識求索的漫漫旅途。為了順利畢業,你需要獨自完成龐大的工作量,但這並不表示你是完全孤獨一人。

相反,合作是一項重要的技能。機器學習和自然語言處理領域中的很多影響力較大的項目,如 AlphaGo 或 OpenAI Five,都是由團隊開發完成的。無論你是大團隊中的一員還是小組負責人,你都必須學會與他人合作。

與導師和博士之間的關係相比,合作關係具備更強的流動性。合作其實就是構建相互信任與尊重。想成功地完成合作需要大量實踐。在合作過程中,你需要清晰地完成溝通並設置好預期,特別是遠程合作的情況。

如果你同時做兩個項目,那麼請在其中一個項目中與他人展開合作。與導師以外的人合作可以給你帶來新的角度,你能學到的會比獨自工作的收穫更多。

如果你在實驗室工作,那麼與實驗室同學進行合作通常是最簡單的操作。但是,與其他機構的人保持溝通與合作可能帶來長期的有益影響。

積極主動

這可能是最重要的一條建議。不要把社交範圍限制在當前的圈子,多接觸他人。會議的主要價值是把人們聚在一起。參加會議前,通過查找接收論文的作者查看參會者,並給他們發電子郵件。要儘量保持尊重的態度,簡要地介紹自己,表明自己想要與他們見面的理由。大部分資深研究人員會參與這類會議。試著與很多研究人員交談,尤其是那些還不怎麼知名的人。

在會議以外,通過郵件諮詢同領域內其他人員來獲取研究建議也是很有用的做法。但是,郵件禮儀很重要,寫郵件時一定要讓忙碌的研究人員願意回覆你的郵件。具體來說,你需要清晰闡述自己的研究和探索的解決方案。

除了諮詢建議之外,這類聯繫或許還能帶來其他機會,如工作 offer、合作、導師、Twitter 消息。最重要的是,這類溝通應基於相互興趣與尊重。因此,請尊重他人的時間。此外,擁有共同興趣的早期研究者通常比擔負眾多責任的資深研究人員更加開放。

保持積極主動的態度,還與你如何看待和談論自己的研究有關:通過在自己的網站上強調、線上討論和寫博客的方式,讓其他人更容易地發現你的工作。

寫博客

寫博客好處多多。

它可以幫你鍛鍊寫作能力,並學著享受寫作。要想順利完成博士學業,你必須寫一篇博士論文,而這個過程通常很折磨人。寫博客可以提供一定的寫作訓練,幫你為論文馬拉松做好準備。

從研究的角度來看,寫博客可以幫助你練習清晰表達和解釋事物的能力。這兩者是將優秀論文與普通論文區分開來的重要標準。事實上,清晰的寫作對於論文接收和高影響力都有很大幫助。與研究論文相對固定緊湊的格式不同,你可以在博客中進行試驗,找到自己的風格。

博客還是展示和分享工作的良好媒介。一篇介紹論文的優秀博客不僅重申研究的主要成果,還進行一定的補充。博客要比論文更加靈活:你可以將有趣的聯繫突出顯示出來,為讀者提供大量文獻概覽和未來方向,展示生動示例、代碼段或交互可視化,或者進行深度誤差分析。

開始寫博客的另一種不錯方式是討論你剛學到的知識。Rachel Thomas 將其表述為「你最適合幫助落後你一步的人」。如果你已經深入某一個領域,為什麼不總結相關工作和自己的見解,幫助節約他人的時間呢?Sebastian Ruder 表示其大部分博客都是用這種方式開始的。

如果你學到了如何很酷地完成一件事,請寫一篇博客來告訴他人。反之,如果你想了解某個主題,但無法在網上找到相關信息,你也可以考慮自己創建相關的資源。

Sebastian Ruder 表示,寫博客帶來了其整個博士生涯最積極的互動。ML 和 NLP 社區如此廣大,即使你寫的是小眾主題,還是會有人感興趣。

儘量忽略沒有建設性的反饋,記住:社區欣賞真誠的聲音。

維護科研能量的幾種方式

外部獎勵(如論文被接收)總是比較稀少的,因此利用內在獎勵通常是必要的操作。

保持研究積極性與活力的最自然方式是,研究令你興奮的話題,遵從自己的好奇心。鑑於你的資金或職位,你可能無法自行選擇研究主題。那麼,請儘量找到自己感興趣的角度。即使是現有算法的應用也可以帶來新的待解決問題。

博士是很消耗人的過程。因此構建可以依賴的支持網絡就顯得至關重要。將自己置身於積極的人之中,他們都能支持你的想法和野心。

同時,找到事情進展不順時可以給你帶來積極能量的活動,可以是合作、副項目、愛好、鍛鍊、冥想等等。對於 Sebastian Ruder 而言,這樣的活動是寫博客。(大牛果然是大牛……)

最後,積極能量的最重要來源不是你所擁有的計算量,而是你的個人良好狀態。GPU 崩潰了可以重啟,燒壞可就沒轍了。

發揮自己的長處

「人最大的價值來自於做其他人不能做或想不到做的事情。」

——Sam Altman

隨著人們對 ML 和 NLP 的興趣激增,找到容易出成果但又比較新的研究主題變成了難事。好的策略是研究你目前最好解決的問題。完美的研究主題具備以下特點:有影響力,你感興趣,你是唯一適合這項工作的人。

怎麼才能成為唯一適合的人呢?你需要具備以下特點的其中一項:背景;對特定技術、方法、語言或數據的了解;個人偏好。你是非計算機背景?那麼把這作為研究靈感吧。你是一個具備視覺創造力的人?那麼用各種圖表和分析補充博客和論文吧。你是很厲害的程式設計師?那麼著手實現有技術難度的模型吧。你數學很好?試試用數學方式證明自己的論斷。

另一個優勢是你所處的人際網絡和可獲取的觀念多樣性。因此,尋找那些能夠幫助你補足優勢的人,不管是導師還是合作者。

實習或訪問大學

建立有意義連接的最佳方式是與人們密切合作,建立私人了解。實習和研究訪問都是擴展人際網絡的好機會,它們可以幫助你與有才華的人並肩戰鬥。

你可以藉此了解另一個環境是如何展開研究的。如果你還在猶豫進入學界還是業界,那麼直接查看業界如何開展研究是一項寶貴的數據。研究訪問或實習還可以幫助你決定之後應該加入實驗室還是進入公司。

最後,實習和研究訪問都是絕佳的學習體驗,在此過程中你通常需要熟悉新的技術棧或研究領域。通過導師的指引,你還可以發現個人成長的不同方面。

放長線釣大魚

我們中的大多數人之所以成為今天的自己,是因為有人早早將賭注押在了我們身上。Sebastian Ruder 表示,他的首次科研訪問要特別感謝導師給予的機會。所以,如果獲得了機會,你就要把握住並延續下去。不要只想著實現自身預期獎勵的最大化,也要考慮到身邊的人。

在大機構工作可以讓你接觸並創建自己早期的人際網絡,從長遠來看,你還要拓展這一網絡,爭取與更多的聰明人一起工作。在建立人際網絡過程中,你需要積極主動,儘可能地幫助其他人。實現的方式有很多,如撰寫博客文章或編寫庫、發布教程和課程、做播客、復現模型或者幫助開發開源軟體等。堅持這麼做,你會贏得勤奮努力和樂於助人的好名聲,其他人也會樂意與你一起工作。

要善待他人,毫不吝嗇地給予讚揚和肯定,不要心存怨恨。事實上,與人為善是個人取得成功必不可少的重要因素。與人為善還有一個好處:會議不只是研究展示和想法交流,更是朋友之間不可多得的年度聚會。

照顧好自己。努力工作的同時保證睡眠和鍛鍊。抽出時間學習新東西,涉獵自己不擅長的領域。最後,時刻提醒自己,雖然博士生涯是以一篇博士論文作為終結,但讀博更重要的是在過程中尋找到更好的自己。

閱讀原文

相關焦點

  • DeepMind發了篇物理論文,用神經網絡求解薛丁格方程
    但現實很骨感,迄今為止,科學家只能精確求解一個電子的氫原子,即使是只有兩個電子的氦原子都無能為力。既然找不到精確解,科學家們希望能找到一種實用的近似解求法,只要結果足夠近似,也能預測原子或分子的行為。官方建議最好用GPU來運行,因為他們計算乙烯分子就用8個GPU花2天時間才算出。除了研究電子外,DeepMind還將神經網絡用於其他基礎科學研究,比如蛋白質摺疊、玻璃態動力學、晶格量子色動力學等。
  • DeepMind開源薛丁格方程求解程序:從量子力學原理出發,TensorFlow...
    但現實很骨感,迄今為止,科學家只能精確求解一個電子的氫原子,即使是只有兩個電子的氦原子都無能為力。原因是有兩個以上電子組成的薛丁格方程實在太複雜,根本無法精確求解。既然找不到精確解,科學家們希望能找到一種實用的近似解求法,只要結果足夠近似,也能預測原子或分子的行為。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    Deepmind最初由三名科學家聯合創辦,就像其創始人兼CEO哈薩比斯(Demis Hassabis)所說的,它的性質更像一個科技研究院而不是創業公司,因為公司一開始並沒有任何產品,而是一直在通過遊戲來研究人工智慧算法。在被谷歌收購前,Deepmind通過人工智慧的無監督學習算法打爆了57個atari遊戲,即八九十年代國內也很流行的小霸王卡帶遊戲。
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    他表示,教學工具共有兩萬多個變化,三十七萬多步棋組成,通過 AlphaGo 的視角,分析並建議圍棋開局的諸多下法。同時每步棋 AlphaGo 都會給出自己的勝率分析,希望 AlphaGo 對圍棋的獨特理解可以給我們一些啟發。本教學工具使用的版本是 AlphaGo Master。
  • 開學指南:讀博壓力如何化解?五位科學家的建議為你指點迷津
    在這裡,科學前沿的5位科研工作者分享了他們的經歷,並給出了一些關於如何在競爭激烈的科研圈保持心理健康的建議。希望這可以對在讀的博士生和準備讀博的研究生有一定的啟發和幫助。Mattias Bjornmalm:倫敦帝國理工學院材料科學研究員建議:改變科研文化環境現在的科研文化是許多科學家出現心理健康問題的核心所在,科研競爭壓力很大,成功的道路異常狹窄,人們都想儘可能多做研究多寫論文。
  • 讀博「黃金法則」4條
    幸運的是,讀研究生的第一年,我運氣很好。儘管我滿心焦慮,但卻得到了資深物理學者們的引導,他們堅持認為,我必須先開始研究,在研究過程中獲取相關的知識。這就好比遊泳,要麼選擇淹死,要麼奮力遊過去。令我驚訝的是,我發現這樣做真的有用,我很快便獲得了一個博士學位。儘管拿到博士學位時,我對物理學幾乎一無所知,但是我確實學到了一個重要道理:沒人知道所有的事情,你也無需如此。
  • 深度學習之Google Deepmind的Alphago人工智慧算法技術演變歷程
    最近大家比較關心的圍棋人機大戰(Alphago vs 李世石)中,deep mind基於Nature2016文章的Alphago在5局制的比賽中已經取得了4-1的獲勝。這兩篇文章都是蒙特卡洛搜索樹+DCNN,效果Google的Alphago優於facebook的方法,剛好藉此機會將之前看到的deep mind該領域的文章捋了一下。
  • 谷歌DeepMind 的可微分神經計算機 DNC 怎麼樣?看 Facebook AI...
    賈揚清,擁有加州大學伯克利分校計算機科學博士學位、清華大學碩士學位和學士學位,曾於新加坡國立大學、微軟亞洲研究院、NEC美國實驗室、Google Brain工作,現任 Facebook那麼我們究竟該如何看待谷歌 Deepmind 團隊最新發布的可微分神經計算機 DNC 呢?果然,已經有人在知乎上提出這個問題。編者註:該知乎提問中「谷歌deeplearning團隊」實際上應該指的是「谷歌Deepmind團隊」。
  • 給想要建立閱讀習慣的人的建議:「雜讀」、少量讀、讀經典
    但對很多還沒建立起閱讀習慣的人來說,總是說來容易做來難。「書海茫茫,我要從哪本看起呢?」「想看書,可是一本書看了很久還停在第一章,怎麼破?」這些都是常見的困惑。這些問題怎麼解決呢?讀書達人、腦科學家茂木健一郎在《如何用閱讀改造大腦》這本書中,給困惑的朋友提出了一些實用的閱讀建議。
  • DeepMind破解蛋白質摺疊難題
    分子摺疊方式變幻無窮,其重要性很難估計。大多數生物過程都圍繞蛋白質,而蛋白質的形狀決定了其功能。只有當知道蛋白質如何摺疊時,他我們才能知曉蛋白質的作用。例如,胰島素如何控制血液中的糖水平以及抗體如何對抗冠狀病毒,都由蛋白質的結構來決定。
  • 讀博18年難畢業!東北大學清退52名博士生研究生 網友:工科生太難了
    讀博18年難畢業!公示表示,研究生本人對處理決定如有異議,可於公示期內向所在學院提出書面申訴,逾期未提出申訴的,不再予以受理,學校將按照規定作出正式處理決定。公示期結束後,視為退學決定書已送達。此番東北大學信息科學與工程學院公布的超過最長學習年限的博士研究生共有52人,大部分是學控制科學與工程,其中入學時間最早的一人為2002年入學,已經「讀博」18年之久。
  • DeepMind宣布解決蛋白質摺疊問題,獲92.4準確性得分
    讓我們來快速且全面地了解一下。科學家雖然獲取了這個蛋白質的X射線晶體結構,但是一直無法解釋它。解決50年的挑戰克裡斯蒂安·安芬森在1972年諾貝爾化學獎的獲獎感言中,提出了一個著名的假設,即理論上,蛋白質的胺基酸序列應該完全決定其結構
  • 讀博讀廢了是種什麼樣的體驗?
    不是怕這哥們讀博讀廢了,而是怕他接著讀下去,把學校的這個專業讀廢了。  案例二  生物博士,美國讀博第五年,來聊聊出國讀博的風險。  2.很多人繼續讀博是因為想不出來以後幹啥先拖著,不要這樣,浪費的是你自己的時間。  3.讀生物博士總體來講還是建議出國尤其是美國,對未來的職業發展還是有好處的。  4.美國相比國內好處是工資高、壓力小 (大部分) ,想移民,如果老闆人好和在天堂差不多。
  • DeepMind提出可微分邏輯編程,結合深度學習與符號程序優點
    DeepMind在最近發表的一篇論文中,提出了可微分歸納邏輯編程方法ILP,既能解決傳統歸納邏輯編程擅長的符號類任務,也對噪聲數據、訓練集中的誤差有一定容忍度,還可以通過梯度下降來訓練。怎麼樣?我們來看看DeepMind在官方博客上對這種方法的解讀:想像一下踢足球的場景,球到了你腳下,你決定把它傳給沒人盯防的前鋒。這個看似簡單的行為,需要兩種不同的思維。首先,你認識到自己腳下有一個球,這需要的是直觀的感性思維——你沒辦法簡單地描述出你是怎麼知道腳下有個球的。
  • DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!
    DeepMind團隊使用的方法都以深度神經網絡為基礎,來從基因序列中預測蛋白質的兩種物理性質:胺基酸對之間的距離及連接這些胺基酸的化學鍵之間的角度。首先,研究小組訓練了一個深度神經網絡,來預測蛋白質中每對胺基酸殘基之間距離的分布情況。然後,研究人員將這些數值轉化為評分,來對蛋白質結構的精確程度進行評估。
  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    代碼:https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13模型:https://www.biorxiv.org/content/10.1101/846279v1.full.pdf根據DeepMind的介紹,在預測蛋白質結構的物理性質方面使用了兩種不同的方法來構建預測模型