吳恩達的課上完了?如何科學開啟你的深度學習論文閱讀生涯

2020-12-16 騰訊網

大數據文摘出品

編譯:睡不著的iris、Zhifu、Hope、CoolBoy

當你閱讀了深度學習相關的書籍或者上過精彩的在線課程後,你將如何深入學習?如何才能夠「自力更生」,獨立地去了解相關領域中最新的研究進展?本文作者Nityesh Agarwal,畢業於賈達普大學,在學校裡學習過信息技術,現在作為志願者為開源社區做貢獻。以下是作者第一人稱給出的建議。

事先聲明——我不是深度學習方面的專家。我也是最近才開始閱讀研究論文的。本文將會介紹我自己在開始閱讀文獻的時候積累的一些經驗。

意義所在

曾經有人在Quora上提問,如何才能鑑定一個人是否有資格從事機器學習工作。谷歌大腦創始人之一、百度人工智慧小組前負責人吳恩達(Andrew Ng)如是說:任何人都有資格。當你上過一些機器學習相關的課程後,想要更進一步時,可以閱讀一些研究論文。最好能做到重現論文中的方法,得到相似的結果。

OpenAI研究者達裡奧·阿莫迪(Dario Amodei)對這個問題的回答是:「為了驗證你是否適合在人工智慧安全或者機器學習領域工作,請快速嘗試使用各種模型。在近期的一篇論文中找到一個機器學習模型,運用這個模型,並嘗試讓它快速運行起來。」

這些都說明閱讀研究論文對於進一步理解該領域至關重要。

在深度學習領域,每個月都會有數百篇論文被發表。如果要做到認真地學習,僅憑藉學習教程或者上課是遠遠不夠的。在你讀文章的時候,新的突破性研究正在進行中。深度學習領域的研究正以前所未有的迅猛速度發展著。只有養成良好習慣,持續閱讀科研文獻,才能跟上節奏。

本文中,我會教大家如何獨立閱讀一篇論文,並提供一些切實可行的建議。然後,在文末我會帶大家破解一篇真實的科研論文,讓大家能夠進行實踐。

方法建議

首先,閱讀科研論文很難。事實上——「沒有什麼事情比閱讀科研論文更令你感到愚蠢了。」

我這麼說是為了讓你在讀文章百思不得其解的時候,不要感到氣餒。開始讀了好幾遍的時候,可能你還是不能夠理解文章的意思。沒事,請堅持下去,再讀一次!

現在,我們介紹一些有助於文獻閱讀的寶貴資源。

arXiv.org

這是在網際網路上大家發表文章的一個地方,充滿了一些尚未在知名期刊正式發表的文章(這些文章也可能永遠無法正式發表)

他們為什麼要這麼做?

事實證明,做研究和寫文章並不是科研的全部!將論文提交並發表在某些科學期刊上是一個相當漫長的過程。一旦論文被提交至某個期刊,就會進入非常緩慢的同行評審過程(有些甚至需要多年的時間!)。當下,對於機器學習這些快速發展的領域,這種速度真是讓人無法忍受。

這就是arXiv出現的意義!!!

研究人員將他們的論文發表在arXiv這樣的預印庫上,以便快速發布他們的研究並獲得及時的反饋。

Arxiv Sanity Preserver

研究人員能夠便捷地提前發表研究論文是好事情,但是對於讀者來說呢?當你打開arXiv的網站,很容易感到害怕、渺小和迷茫,認為這絕對不是新手該來的地方(僅個人觀點,但非常歡迎你使用它?)。

輸入Arxiv Sanity Preserver。

這是由特斯拉的人工智慧部門主管Andrej Karpathy創建,他是我個人非常喜歡的AI大神。

Arxiv Santiy在arXiv的作用與Twitter的信息流在Twitter的作用相似(不過Arxiv Sanity是完全開源的,而且沒有任何廣告)。從浩如煙海的微型博客中, Twitter的信息流會根據個人喜好為你推送有趣的微型博客。

Arxiv Sanity採用類似的方法,為你推薦arXiv上你可能最感興趣的機器學習論文。使用Arxiv Santiy,你可以根據當前趨勢、你的過往喜好和你所關注的人的喜好對論文進行排序。(這就是在社交媒體上我們已經習慣使用的個性化推薦功能。)

關於網站的簡介可以瀏覽這個視頻?

機器學習:Reddit上的WAYR主題帖

WAYR是What Are You Reading(你正在閱讀什麼)的簡寫。它是Reddit機器學習板塊的一個主題帖,大家把自己本周讀過的機器學習論文發布在上面,並對感興趣的問題展開討論。

正如我之前所說,每周有非常多關於機器學習領域的論文被發表在arXiv上。對於需要兼顧日常生活的正常人,每天需要上學、工作或與人溝通,不可能每周都把所有的論文讀完。另外,並不是所有的論文都值得花時間去閱讀。

因此,你需要把精力放在最有意思的論文上,上面我提到的主題帖就是一種方法。

電子報刊,電子報刊,電子報刊!

電子報刊是我的個人最愛,通過它我可以時時刻刻追蹤人工智慧領域最新的進展。你可以非常簡單地訂閱它們,並且讓它們每周一傳送到你的電子信箱裡面,不用花一分錢!就這麼簡單,你就可以了解本周與AI相關的最有意思的新聞、文章和研究論文。

以下是我目前訂閱的一些電子報刊:

1.Jack Clark的引入AI

https://jack-clark.net/

這是我的最愛,因為這份電子報刊除了提供我上面提到的所有信息以外,它還包括一個叫做「科技童話」的部分,包含一篇由過去一周的新聞主題編輯的AI科幻短篇小說。悄悄地告訴你,即使有那麼幾周我對AI的新進展失去熱情,我也會因為想看科技童話這部分而瀏覽這個電子報刊

2.Sam DeBrule的機器學習

https://machinelearnings.co/

作者還有一本同名的媒體出版物,其中包含了一些非常有趣的文章,請務必查看。

文章連結

https://machinelearnings.co/a-humans-guide-to-machine-learning-e179f43b67a0

3.Nathan Benaich的Nathan.ai

https://www.getrevue.co/profile/nathanbenaich

前兩份電子報刊都是周報,而這份是季刊。因此,每隔三個月你會收到一封長長的電子郵件,裡面總結了過去三個月以來AI領域最有趣的發現和發展狀況。

4.Denny Britz的AI狂野一周

https://www.getrevue.co/profile/wildml

我個人真的很喜歡這份電子報刊,因為它的版面很乾淨,演示很簡潔,不過近兩個月以來好像沒有繼續更新了。無論如何,給大家一個參考,希望Danny什麼時候再恢復更新。

5.Twitter上面的AI大V

另一個可以追蹤時新的方法是關注知名研究者和開發人員的Twitter帳戶。以下是我關注的人員列表:

Michael Nielsen

Andrej Karpathy

Francois Chollet

Yann LeCun

Chris Olah

Jack Clark

Ian Goodfellow

Jeff Dean

OpenAI

聽起來都很不錯,但是我應該怎麼開始呢?

是的,這是一個更加迫切的問題。

好的,首先你需要確保自己已經了解了機器學習的相關基礎知識,例如回歸等算法;你還需要知道一些深度學習的基本知識,比如最基本的神經網絡,反向傳播,正則化。

最好還能夠稍微了解難一些的概念,例如ConvNets、RNN 和LSTM是如何工作的。我真心不覺得閱讀研究論文是了解這些基礎知識的最好的方法,有很多其它的資源可以供你參考。

一旦有了基本的了解,你首先應該閱讀一篇相關的論文。這樣,你就可以專注地熟悉學術論文的基本格式和體裁。你並不需要完全讀懂你閱讀的第一篇學術論文,因為你對論文的主題已經非常熟悉了。

我建議你先從講述AlexNet的論文開始。

連結:

https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks

為什麼選擇這篇論文?

請看下面的這張圖:

你看見代表Computer Vision and Pattern Recognition的紅線從2012年之後飆升得非常明顯了吧?這種情況很大程度上要歸功於這篇論文。

這篇論文重新點燃了人們對深度學習的所有興趣。

由Alex Krizhevsky,Ilya Sutskever和Geoffrey Hinton撰寫,題為《ImageNet Classification with Deep Convolutional Networks》的這篇論文被認為是該領域最具影響力的論文之一。這篇論文描述了作者如何使用名為AlexNet的卷積神經網絡,並贏得2012年度ImageNet大規模視覺識別挑戰賽(ILSVRC)的冠軍。

如果你不太了解情況,讓我來為你解釋一下。讓計算機能夠觀察和識別對象(又名計算機視覺)是計算機科學最早的目標之一。 ILSVRC就像是這個領域內的奧運會。參賽者(計算機算法)試圖將圖像正確地歸為1000個類別的其中一個。 在2012年,AlexNet以絕對巨大的優勢贏得了這一挑戰:

AlexNet以15.3%的top-5(模型預測概率的前五位包含目標物體)錯誤率榮登榜首,而第二名的錯誤率則只有26.2%!

毫無疑問,整個計算機視覺社區都震驚了,關於該領域的研究正前所未有地飛速發展。人們開始意識到深度神經網絡的強大,利用它每個人都能夠從中受益!

別看這篇文章看起來很難,如果你通過一些課程或者教材對卷積神經網絡有基本的了解,那麼掌握這篇論文的內容是非常容易的。趕緊行動吧!

當你讀完了上面那篇文章之後,你可以閱讀與卷積神經網絡相關的其他具有開創性意義的論文,也可以轉移到你感興趣的其他架構(比如RNN,LSTM,GAN)。

Github的存儲庫上面也有很多重要的深度學習方面的研究論文。 當你開始閱讀的時候請先看看這份指引,它們將幫助你創建屬於自己的閱讀列表。

連結:

https://github.com/floodsung/Deep-Learning-Papers-Reading-Roadmap

不得不提到的其它資源

Distill.pub :

https://distill.pub/about/

我只想提一點:如果所有研究論文都在Distill期刊上發表,那我這篇文章就可以不用寫了。你不必閱讀這篇文章來學習如何開始閱讀研究論文,並且我們也不需要在網際網路上創建這麼多的課程和教程來解釋這些開創性的研究思想,Distill就是這樣一個綜合性的平臺。

相關焦點

  • 如何開啟深度學習論文的閱讀模式
    | 全文共4004字,建議閱讀時8分鐘 | 本文經機器之心(微信公眾號:almosthuman2014)授權轉載,禁止二次轉載選自:Medium作者:Nityesh Agarwal參與:劉曉坤、李亞洲在讀完書或者完成深度學習在線課程之後,如何才能繼續學習機器學習?
  • 吳恩達:機器學習畢業後,如何規劃職業生涯才能成為「老司機」?
    作為曾在多個著名企業和學術機構擔任實驗室負責人的「老司機」,吳恩達可謂經驗豐富,他就以上問題給出了出色的建議,帶你穩步上車。他特別提到了編程技能、實踐應用、持續學習和深入某個領域的重要性,此外,他認為團隊比公司更重要,要在職業生涯中「從事一份你不會厭倦的工作」,最後他還指出了在職業生涯中需要避免的幾個誤區。
  • 吳恩達的深度學習課程值不值得學?四晚學完的高手給你建議
    目前,吳恩達正在做的三大項目已有兩個項目被公布:深度學習在線課程Deeplearning.ai和一個 1.5 億美元的面向人工智慧投資的風投基金。其中,深度學習在線課程的發布讓來自全球的 AI 愛好者圍在這位人工智慧專家身邊,希望能從這門課裡學到更多知識,正在看這篇文章的你或許也想報名參加,先別忙,有位大神花了四個晚上刷完了這套課並拿到了證書,先聽聽他怎麼說。
  • 吳恩達神秘新項目揭曉:迄今最全面的深度學習在線課程!
    這些課程專為已有一定基礎(基本的編程知識,熟悉 Python、對機器學習有基本了解),想要嘗試進入人工智慧領域的計算機專業人士準備。介紹顯示:「深度學習是科技業最熱門的技能之一,本課程將幫你掌握深度學習。」在這 5 堂課中,學生將可以學習到深度學習的基礎,學會構建神經網絡,並用在包括吳恩達本人在內的多位業界頂尖專家指導下創建自己的機器學習項目。
  • 機器之心專訪吳恩達,深度學習課程項目Deeplearning.ai正式發布
    我想斯坦福的學生樂於開源自己的軟體、公開論文、分享自己的成果,這正是基礎的研究精神。機器之心:你曾在推特上說,2017 是 AI 創新的好時機,為什麼?吳恩達:你知道,之前我們看到生態系統足以支持技術或產品的時候,那技術或產品就是起飛的時機。
  • 吳恩達教你如何成為AI業界大佬
    如何規劃 ML 職業生涯,才能獲得長期成就?吳恩達教授為機器學習領域的畢業生提供了一些建議。這篇文章內容取自史丹福大學教授、Coursera 聯合創始人吳恩達的課堂演講,主題為《關於在機器學習領域獲得成功職業生涯的幾點建議》。
  • 吳恩達手把手教你刷論文!
    斯坦福教授吳恩達在上周發布了一篇博客,手把手教你如何讀論文,以上問題都在文中一一被解答。在煉丹界中,快速刷論文了解一下最前沿研究已經是每個煉丹師的必備技能了。為了讓自己的知識不過時,從業者們也都要保持學術思維和習慣,和一些走上工作崗位後只用從社會大學學習的領域還不同。
  • 把吳恩達深度學習系列課程畫出來是這個樣子
    NG也教了一些課程,如機器學習課程,包含了他錄製的視頻講座和斯坦福CS299課程的學生材料。吳恩達的理想是讓世界上每個人能夠接受高質量的、免費的教育。吳恩達目前在做三個AI新項目,第一個AI項目就是Deeplearning.ai。這是個致力於傳播AI知識的項目,正準備在Coursera上推出新的深度學習系列課程。這些課程能幫助你掌握深度學習、有效地運用它,並開啟AI領域的職業生涯。
  • 深度學習入門必看---吳恩達深度學習課程
    吳恩達今天分享的是吳恩達的深度學習課程。吳恩達是人工智慧領域的大牛,著作頗豐,其推出的機器學習課程在學生之中反響強烈,深受中國學生的推崇。在眾多網友,學生,工作者的呼籲下,2017年8月,吳恩達推出了自己的深度學習課程,由於長時間拖更,經常被網友吐槽,最終在今年的時候全部更新完畢。考慮到中國學生對課程的喜愛,吳恩達和網易雲課程合作,提供帶有中文字幕的學習視頻。
  • 被吳恩達新開的深度學習課程刷屏?我們幫你做測評
    原標題:被吳恩達新開的深度學習課程刷屏?我們幫你做測評 「深度學習的基礎,明白如何建立神經網絡,學習如何做一項成功的機器學習項目。你會學到關於卷積網絡、循環神經網絡、長短時記憶網絡、Adam、Dropout、BatchNorm、Xavier/He 初始化等知識。
  • 票圈被吳恩達新開的深度學習課程刷屏?到底如何,我們幫你做了個測評
    你會學到關於卷積網絡、循環神經網絡、長短時記憶網絡、Adam、Dropout、BatchNorm、Xavier/He 初始化等知識。你會做有關醫療、自動駕駛汽車、閱讀手語、生成音樂和自然語言處理等的案例,你不僅能掌握理論知識,還能夠學到如何在Python和TensorFlow上將它們應用到各個行業當中。你也可以聽到很多頂尖深度學習專家講的課程,他們會分享個人經歷,並給你一些職業建議。」
  • 機器學習研究者的養成指南,吳恩達建議這麼讀論文
    個人發展在研究生涯中,無論如何分配時間,你都必須學習很多東西。但從長遠來看,如果你有規律地留出時間專注於個人發展,則能夠更有機會完成出色的工作。具體來說,在從事現有項目的同時,你應該撥出一部分時間來繼續充實機器學習領域的一般性知識。
  • 吳恩達建議這麼讀論文(附機器學習研究者的養成指南)
    前面三點都是從其它研究者獲得信息,最後則是你自己的思考。想法與目標,研究的原動力一般來說,我們有兩種方式來決定下一步研究工作:想法驅動:如果你看文獻時發現對於「如何處理 X」這個問題有想法,那麼就可以開啟一個項目來測試新想法;目標驅動:如要想要實現某些 AI 功能,那就要解決實現過程中的各種問題。
  • 吳恩達教你如何讀論文:繪製進度表格,論文至少看三遍,還要問自己問題
    白交 發自 凹非寺量子位 報導 | 公眾號 QbitAI吳恩達教你如何讀論文,高效了解新領域。就算是博士,也很難對所有的關鍵技術都參透了解。那麼如何有效了解一個新領域,是研究者們必備的一項技能。
  • 吳恩達深度學習又開新課啦!
    所有筆記的匯總如下:【乾貨】吳恩達deeplearning.ai專項課程歷史文章匯總還沒結束!大牛是停不下腳步的。最近,吳恩達在史丹福大學又開設了高質量的深度學習課程 CS230。這門課的主頁是:https://web.stanford.edu/class/cs230/關於這門課的描述為:深度學習是 AI 領域最受歡迎的技能之一。我們將幫助你學好深度學習。在這門課中,你將學習深度學習的基礎,理解如何構建神經網絡,並且學習如何領導一個成功的機器學習項目。
  • 【封面推薦】剛剛,我們詳細對比了吳恩達和Udacity的深度學習課程,你們感受下...
    吳恩達有將複雜問題抽絲剝繭講得很明白的實力,以及他對工業的了解,很可能再次成為一個爆款課程。那麼,吳恩達的課程內容有哪些?課程結構如何?有哪些練習題?以下是本次吳恩達即將開啟的在線深度學習專項課程的詳細介紹,AI科技大本營在第一時間將其全部翻譯完畢,來看看吳恩達到底會給想要學習AI的程序猿們帶來什麼驚喜?
  • 【機器學習基礎】重磅發布!吳恩達 AI 完整課程資源超級大匯總!
    隨著近些年來 AI 越來越火的大趨勢下,吳恩達一直致力於普及、宣傳、推廣 AI 教育,包括最前沿、最火爆的 AI 基礎課程、深度學習課程等等。惠及全球超過 500w 的人工智慧愛好者。「AI 如何更好地入門與進階?」,「有沒有一套起點不是很高的 AI 學習路徑?」,「這麼多優秀公開課,究竟哪一個更適合我?」等,這些往往是初學者們最為關心的幾個問題。
  • 重啟數據科學:如何開啟第二次的學習?
    若你想重新學習機器學習和數據科學,該從何處下手呢?筆者最近就打算重拾數據科學,有趣的是,預期和實際開始學習的方式截然不同。不同人對學習方式各不相同。有人更喜歡看視頻學習,有些人選擇看書,還有許多人選擇參加付費課程督促自己學習。而筆者更喜歡逐步推進、由易到難的方式,從一些實例開始,然後逐步轉向更為深奧的理論。
  • 送你一份機器/深度學習自學指南(附視頻&速成方案)
    建議閱讀這本書的前兩章,與吳恩達的課程並行。當你熟悉更多概念後,開始搞深度學習時,可以再看書中的其餘部分。如果你英文不好,這本《神經網絡與深度學習》也有中文翻譯版本,可以免費在線查看。Ian Goodfellow傳奇般的「花書」《深度學習》,簡明扼要的概括了大部分重要主題。建議大家儘可能深入地閱讀線性代數、概率、信息理論的章節。每當讀論文遇到深度學習概念時,都可以在書中找到參考。
  • 你們要的吳恩達深度學習課程【漢化】視頻來了!
    上推出的「深度學習專項課程「引起了一波AI學習熱潮,而自發布以來,國內學習者對於課程漢化的呼聲也從未停止。是否值得註冊學習?文摘菌連夜測評後,這就帶你來一探究竟。吳恩達深度學習系列課程【漢化】視頻終於來了!6 月 23 日,吳恩達通過 Twitter 宣布自己離職百度之後的新一步動向——Deeplearning.ai,並在本月初,通過 Coursera 發布了深度學習的最新在線課程。