吳恩達的課上完了?如何科學開啟你的深度學習論文閱讀生涯

2021-01-11 騰訊網

大數據文摘出品

編譯:睡不著的iris、Zhifu、Hope、CoolBoy

當你閱讀了深度學習相關的書籍或者上過精彩的在線課程後,你將如何深入學習?如何才能夠「自力更生」,獨立地去了解相關領域中最新的研究進展?本文作者Nityesh Agarwal,畢業於賈達普大學,在學校裡學習過信息技術,現在作為志願者為開源社區做貢獻。以下是作者第一人稱給出的建議。

事先聲明——我不是深度學習方面的專家。我也是最近才開始閱讀研究論文的。本文將會介紹我自己在開始閱讀文獻的時候積累的一些經驗。

意義所在

曾經有人在Quora上提問,如何才能鑑定一個人是否有資格從事機器學習工作。谷歌大腦創始人之一、百度人工智慧小組前負責人吳恩達(Andrew Ng)如是說:任何人都有資格。當你上過一些機器學習相關的課程後,想要更進一步時,可以閱讀一些研究論文。最好能做到重現論文中的方法,得到相似的結果。

OpenAI研究者達裡奧·阿莫迪(Dario Amodei)對這個問題的回答是:「為了驗證你是否適合在人工智慧安全或者機器學習領域工作,請快速嘗試使用各種模型。在近期的一篇論文中找到一個機器學習模型,運用這個模型,並嘗試讓它快速運行起來。」

這些都說明閱讀研究論文對於進一步理解該領域至關重要。

在深度學習領域,每個月都會有數百篇論文被發表。如果要做到認真地學習,僅憑藉學習教程或者上課是遠遠不夠的。在你讀文章的時候,新的突破性研究正在進行中。深度學習領域的研究正以前所未有的迅猛速度發展著。只有養成良好習慣,持續閱讀科研文獻,才能跟上節奏。

本文中,我會教大家如何獨立閱讀一篇論文,並提供一些切實可行的建議。然後,在文末我會帶大家破解一篇真實的科研論文,讓大家能夠進行實踐。

方法建議

首先,閱讀科研論文很難。事實上——「沒有什麼事情比閱讀科研論文更令你感到愚蠢了。」

我這麼說是為了讓你在讀文章百思不得其解的時候,不要感到氣餒。開始讀了好幾遍的時候,可能你還是不能夠理解文章的意思。沒事,請堅持下去,再讀一次!

現在,我們介紹一些有助於文獻閱讀的寶貴資源。

arXiv.org

這是在網際網路上大家發表文章的一個地方,充滿了一些尚未在知名期刊正式發表的文章(這些文章也可能永遠無法正式發表)

他們為什麼要這麼做?

事實證明,做研究和寫文章並不是科研的全部!將論文提交並發表在某些科學期刊上是一個相當漫長的過程。一旦論文被提交至某個期刊,就會進入非常緩慢的同行評審過程(有些甚至需要多年的時間!)。當下,對於機器學習這些快速發展的領域,這種速度真是讓人無法忍受。

這就是arXiv出現的意義!!!

研究人員將他們的論文發表在arXiv這樣的預印庫上,以便快速發布他們的研究並獲得及時的反饋。

Arxiv Sanity Preserver

研究人員能夠便捷地提前發表研究論文是好事情,但是對於讀者來說呢?當你打開arXiv的網站,很容易感到害怕、渺小和迷茫,認為這絕對不是新手該來的地方(僅個人觀點,但非常歡迎你使用它?)。

輸入Arxiv Sanity Preserver。

這是由特斯拉的人工智慧部門主管Andrej Karpathy創建,他是我個人非常喜歡的AI大神。

Arxiv Santiy在arXiv的作用與Twitter的信息流在Twitter的作用相似(不過Arxiv Sanity是完全開源的,而且沒有任何廣告)。從浩如煙海的微型博客中, Twitter的信息流會根據個人喜好為你推送有趣的微型博客。

Arxiv Sanity採用類似的方法,為你推薦arXiv上你可能最感興趣的機器學習論文。使用Arxiv Santiy,你可以根據當前趨勢、你的過往喜好和你所關注的人的喜好對論文進行排序。(這就是在社交媒體上我們已經習慣使用的個性化推薦功能。)

關於網站的簡介可以瀏覽這個視頻?

機器學習:Reddit上的WAYR主題帖

WAYR是What Are You Reading(你正在閱讀什麼)的簡寫。它是Reddit機器學習板塊的一個主題帖,大家把自己本周讀過的機器學習論文發布在上面,並對感興趣的問題展開討論。

正如我之前所說,每周有非常多關於機器學習領域的論文被發表在arXiv上。對於需要兼顧日常生活的正常人,每天需要上學、工作或與人溝通,不可能每周都把所有的論文讀完。另外,並不是所有的論文都值得花時間去閱讀。

因此,你需要把精力放在最有意思的論文上,上面我提到的主題帖就是一種方法。

電子報刊,電子報刊,電子報刊!

電子報刊是我的個人最愛,通過它我可以時時刻刻追蹤人工智慧領域最新的進展。你可以非常簡單地訂閱它們,並且讓它們每周一傳送到你的電子信箱裡面,不用花一分錢!就這麼簡單,你就可以了解本周與AI相關的最有意思的新聞、文章和研究論文。

以下是我目前訂閱的一些電子報刊:

1.Jack Clark的引入AI

https://jack-clark.net/

這是我的最愛,因為這份電子報刊除了提供我上面提到的所有信息以外,它還包括一個叫做「科技童話」的部分,包含一篇由過去一周的新聞主題編輯的AI科幻短篇小說。悄悄地告訴你,即使有那麼幾周我對AI的新進展失去熱情,我也會因為想看科技童話這部分而瀏覽這個電子報刊

2.Sam DeBrule的機器學習

https://machinelearnings.co/

作者還有一本同名的媒體出版物,其中包含了一些非常有趣的文章,請務必查看。

文章連結

https://machinelearnings.co/a-humans-guide-to-machine-learning-e179f43b67a0

3.Nathan Benaich的Nathan.ai

https://www.getrevue.co/profile/nathanbenaich

前兩份電子報刊都是周報,而這份是季刊。因此,每隔三個月你會收到一封長長的電子郵件,裡面總結了過去三個月以來AI領域最有趣的發現和發展狀況。

4.Denny Britz的AI狂野一周

https://www.getrevue.co/profile/wildml

我個人真的很喜歡這份電子報刊,因為它的版面很乾淨,演示很簡潔,不過近兩個月以來好像沒有繼續更新了。無論如何,給大家一個參考,希望Danny什麼時候再恢復更新。

5.Twitter上面的AI大V

另一個可以追蹤時新的方法是關注知名研究者和開發人員的Twitter帳戶。以下是我關注的人員列表:

Michael Nielsen

Andrej Karpathy

Francois Chollet

Yann LeCun

Chris Olah

Jack Clark

Ian Goodfellow

Jeff Dean

OpenAI

聽起來都很不錯,但是我應該怎麼開始呢?

是的,這是一個更加迫切的問題。

好的,首先你需要確保自己已經了解了機器學習的相關基礎知識,例如回歸等算法;你還需要知道一些深度學習的基本知識,比如最基本的神經網絡,反向傳播,正則化。

最好還能夠稍微了解難一些的概念,例如ConvNets、RNN 和LSTM是如何工作的。我真心不覺得閱讀研究論文是了解這些基礎知識的最好的方法,有很多其它的資源可以供你參考。

一旦有了基本的了解,你首先應該閱讀一篇相關的論文。這樣,你就可以專注地熟悉學術論文的基本格式和體裁。你並不需要完全讀懂你閱讀的第一篇學術論文,因為你對論文的主題已經非常熟悉了。

我建議你先從講述AlexNet的論文開始。

連結:

https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks

為什麼選擇這篇論文?

請看下面的這張圖:

你看見代表Computer Vision and Pattern Recognition的紅線從2012年之後飆升得非常明顯了吧?這種情況很大程度上要歸功於這篇論文。

這篇論文重新點燃了人們對深度學習的所有興趣。

由Alex Krizhevsky,Ilya Sutskever和Geoffrey Hinton撰寫,題為《ImageNet Classification with Deep Convolutional Networks》的這篇論文被認為是該領域最具影響力的論文之一。這篇論文描述了作者如何使用名為AlexNet的卷積神經網絡,並贏得2012年度ImageNet大規模視覺識別挑戰賽(ILSVRC)的冠軍。

如果你不太了解情況,讓我來為你解釋一下。讓計算機能夠觀察和識別對象(又名計算機視覺)是計算機科學最早的目標之一。 ILSVRC就像是這個領域內的奧運會。參賽者(計算機算法)試圖將圖像正確地歸為1000個類別的其中一個。 在2012年,AlexNet以絕對巨大的優勢贏得了這一挑戰:

AlexNet以15.3%的top-5(模型預測概率的前五位包含目標物體)錯誤率榮登榜首,而第二名的錯誤率則只有26.2%!

毫無疑問,整個計算機視覺社區都震驚了,關於該領域的研究正前所未有地飛速發展。人們開始意識到深度神經網絡的強大,利用它每個人都能夠從中受益!

別看這篇文章看起來很難,如果你通過一些課程或者教材對卷積神經網絡有基本的了解,那麼掌握這篇論文的內容是非常容易的。趕緊行動吧!

當你讀完了上面那篇文章之後,你可以閱讀與卷積神經網絡相關的其他具有開創性意義的論文,也可以轉移到你感興趣的其他架構(比如RNN,LSTM,GAN)。

Github的存儲庫上面也有很多重要的深度學習方面的研究論文。 當你開始閱讀的時候請先看看這份指引,它們將幫助你創建屬於自己的閱讀列表。

連結:

https://github.com/floodsung/Deep-Learning-Papers-Reading-Roadmap

不得不提到的其它資源

Distill.pub :

https://distill.pub/about/

我只想提一點:如果所有研究論文都在Distill期刊上發表,那我這篇文章就可以不用寫了。你不必閱讀這篇文章來學習如何開始閱讀研究論文,並且我們也不需要在網際網路上創建這麼多的課程和教程來解釋這些開創性的研究思想,Distill就是這樣一個綜合性的平臺。

相關焦點

  • 吳恩達授課,斯坦福CS230深度學習課程資源開放
    課程簡介:深度學習是 AI 領域中最受歡迎的技能之一。這門課程將幫助你學好深度學習。你將學到深度學習的基礎,理解如何構建神經網絡,並學習如何帶領成功的機器學習項目。你將學到卷積神經網絡(CNN)、循環神經網絡(RNN)、長短期記憶網絡(LSTM)、Adam 優化器、Dropout 方法、BatchNorm 方法、Xavier/He 初始化方法等。
  • 吳恩達被diss了
    吳恩達Twitter一發,說得好像這個問題已經解決了一樣,可是他們只找了4名放射科醫師,略微超過了他們的平均成績。醫生Eric Topol也在論文結果中標註了這樣兩句話,提醒我們注意:還有一名懂機器學習的放射科醫師Declan O』Regan指出,論文中的數據不足以支撐吳恩達Twitter的結論,沒有曲線下面積(AUC)的統計對比,沒有未選病例的外部盲測,沒有細節,沒有正常病例的比例,對誤分類情況也沒舉出例子
  • 吳恩達NIPS2016:利用深度學習開發人工智慧應用的基本要點含唯一的...
    雷鋒網按:為了方便讀者學習和收藏,雷鋒網特地把吳恩達教授在NIPS 2016大會中的PPT做為中文版,由三川和亞峰聯合編譯並製作。今日,在第 30 屆神經信息處理系統大會(NIPS 2016)中,百度首席科學家吳恩達教授發表演講:《利用深度學習開發人工智慧應用的基本要點(Nuts and Bolts of Building Applications using Deep Learning)》。
  • 吳恩達 NIPS 2016:利用深度學習開發人工智慧應用的基本要點(含...
    今日,在第 30 屆神經信息處理系統大會(NIPS 2016)中,百度首席科學家吳恩達教授發表演講:《利用深度學習開發人工智慧應用的基本要點(Nuts and Bolts of Building Applications using Deep Learning)》。
  • 高效「煉丹」必備技能:一文實現深度學習數學原理入門,還有吳恩達...
    尤其是深度學習算法開發人員,追求模型結構優化和提高編程效率是永遠的目標。但是,如果只做代碼「搬運工」,不了解神經網絡背後的數學原理,很難對項目有深刻全面的理解,debug反而會更難、耗時更長。就以深度學習中常用的神經網絡來說,典型模型包括多層感知機(DLP)、卷積神經網絡(CNN)、循環神經網絡(RNN)等等,不同的項目,對神經網絡的調參需求也不相同。
  • 吳恩達演講直指AI落地三大挑戰,並提出解決方案
    近日,機器學習大牛吳恩達在史丹福大學 HAI 研討會上分享了一些有趣的觀點,即「如何彌補 AI 的概念驗證與生產之間的差距」。小數據適用的算法包括 GAN、GPT-3、自監督、遷移學習等。挑戰 2:算法的魯棒性和泛化能力大家可能已經發現,已發表論文中效果顯著的模型通常在生產中不起作用,研究中聲稱算法結果已經超過人類的方法卻不能很好地投入到生產,訓練的模型不能很好地泛化到其他數據集等。吳恩達以醫療領域舉例進行說明。然而這些問題不僅存在於醫療領域,其他領域也面臨相同的問題。
  • 我在Google用AI研究基因,入門從吳恩達的課程開始
    Q:你是如何把機器學習與基因研究結合起來的?於是在Google員工的推薦下,我把Coursera上吳恩達(Andrew Ng)的機器學習課程學習了一遍,有了不少入門知識和樂趣,如果現在讓我推薦入門課程,我想沒有比吳恩達的課程更好的了。
  • 如何深入自學深度學習?
    你或許有興趣學習更多深度學習研究方面的知識但卻又從未有機會在實驗室裡工作
  • 吳恩達創業關你什麼事?
    我們不知道百度和Deeplearning.ai 之間的關係——以及它與吳恩達離去之間的關係。當然,也可能純粹只是個錯誤。 吳恩達今年3 月下旬離開公司,承諾將繼續把AI 的好處帶給大家。百度以自然語言處理的專業技術聞名,最近一直將資源投入到自動駕駛汽車和其他特定的深度學習應用中。
  • 如何閱讀論文
    你們中的許多人來找我們,要求我們就如何理解科學文獻提出更多(和更嚴肅的)建議,所以我們邀請了十幾位處於不同職業階段和廣泛領域的科學家來告訴我們,他們是如何做到的。結果很明顯,隨著經驗的積累,閱讀科學論文變得更加容易,但絆腳石是客觀存在的,而每一位科學家都有責任確定並應用最適合他們自身的閱讀技巧。為清晰簡潔起見,我們對採訪回復進行了編輯。
  • 有人幫你選出了top 5優質課
    如果可以堅持上完整個課程,你將在大約四個月內對機器學習有一個較好的基本了解。之後,你可以再學習感興趣的高階或專項課程,如深度學習、機器學習工程等。這門課程對於新手來說無疑是最好的課程。參考文章:資源 | 吳恩達《機器學習》筆記,哥大研究生獻上二、吳恩達深度學習專項課程該課程同樣是吳恩達開設的。
  • NIPS 2016精華大盤點丨吳恩達、LeCun等大師的論文、PPT都在這兒...
    關注微信公眾帳號【AI科技評論】,在微信公眾號後臺回復關鍵詞「大神」,獲取PPT。吳恩達昨日在吳恩達教授在 NIPS 上發表演講:《利用深度學習開發人工智慧應用的基本要點(Nuts and Bolts of Building Applications using Deep Learning)》。
  • 2018年最具影響力的20篇數據科學研究論文,盤它!
    最近,通過一場網絡研討會,他發現人工智慧大神吳恩達(Andrew Ng)也有一樣的習慣。吳恩達提到,他經常隨身攜帶一個裝滿研究論文的文件夾,利用搭車的空閒時間研究論文。Daniel Gutierrez因此建議,不管是數據科學從業者還是研究者,都可以準備一個論文文件夾來裝一些論文,就像吳恩達建議的:如果你每周閱讀幾篇論文(部分論文可以泛讀),一年後你就閱讀了100多篇論文,足夠比較深入地了解一個新領域。
  • 從ACM班、百度到亞馬遜,深度學習大牛李沐的開掛人生
    作為深度學習「大神」,李沐的開掛人生經歷並不被所有人熟知。為了加深大家對李沐的了解,我們對其學習、職業和研究生涯做了一個簡單的總結。ACM班、百度、CMU、亞馬遜,李沐的傳奇人生Research 實習生,2013 年夏 百度高級研究員, 2011.4 - 2012.8 香港科技大學研究助理,2009 - 2010 微軟亞洲研究院實習,2007 年夏 上交 ACM 班現狀:在亞馬遜發光發熱按照李沐的領英個人頁面介紹,他在亞馬遜的工作職責主要有:領導 AWS AI 科學團隊,使深度學習易於使用,包括
  • 深度學習自學指南:6個月,從基礎知識到模型構建
    原作:Bargava安妮 編譯自 Medium量子位 出品 | 公眾號 QbitAI給你6個月的時間開始學習深度學習,能夠達到怎樣的程度?在這篇文章中,數據科學培訓老師Bargava就帶你半年入門深度學習。在這份攻略中,我將給大家講講零基礎入門深度學習可行性強的資料和學習方法。
  • 吳恩達的最新研究是否嚴謹?Nature論文作者撰文質疑AI醫療影像研究...
    本文作者 Luke Oakden-Rayner 是阿德萊德大學的放射科在讀博士,曾作為第一作者於今年 5 月在 Nature 上發表文章介紹了自己利用深度學習等技術預測人類壽命的研究。如果你關心機器學習和醫學,請閱讀這篇重要而深刻的文章。
  • 深度學習遇上稀缺數據就無計可施?這裡有幾個好辦法!
    唯一的問題是你既不在谷歌工作,也不在臉書工作,你的數據是稀缺的,那麼你該怎麼辦?你是能繼續使用是深度學習的能力,還是已無計可施?下面就讓我介紹幾個在有限的數據上使用深度學習的方法,以及闡述為什麼我認為這可能是未來研究中最令人興奮的領域之一。
  • 吳恩達deeplearning.ai五項課程完整筆記了解一下?
    項目地址:https://github.com/mbadry1/DeepLearning.ai-Summary上周吳恩達在推特上展示了一份由 TessFerrandez 完成的深度學習專項課程信息圖,這套信息圖優美地記錄了深度學習課程的知識與亮點。這一份信息圖的詳細介紹請查看:這是一份優美的信息圖,吳恩達點讚的 deeplearning.ai 課程總結 。
  • 如何評價周志華深度森林模型,熱議會否取代深度學習 DNN
    原標題:如何評價周志華深度森林模型,熱議會否取代深度學習 DNN 【新智元導讀】昨天,新智元報導了南京大學周志華教授和馮霽的論文「深度森林」,引發很多討論。今天,新智元整理了網上一些評價。中文內容來自知乎,已經取得授權。外網內容來自 Hacker News,由新智元編譯整理。正在看這篇文章的你,也歡迎留下你的看法。
  • 教你如何閱讀高頻被引論文
    the spatial variation of strength of deep cement-mixed Liu,Y;He,LQ;Jiang,YJ;Sun,MM;Chen,EJ;Lee,FH GEOTECHNIQUE 69(5):391-405 MAY 2019 ---如何訪問閱讀