沈向洋:讀論文的三個層次

2020-12-25 雷鋒網

5月14日,沈向洋博士在全球創新學院(GIX)課程上曾做了一場線上公開課《You are how you read》,分享他對於科研論文閱讀、撰寫的寶貴經驗,引起一時轟動。由於圍觀網友太多,導致會議系統崩潰,眾多網友無法接入觀看,不免唏噓不已。近日,為滿足廣大網友的需求,微軟亞洲研究院將沈向洋博士的報告視頻公開。 這場報告亮點紛呈,引人深思。

「或許你永遠不知道你以前讀過的書能在什麼時候能夠派上用場,但請保持閱讀,因為閱讀的過程也是在你大腦中建立認知的過程。」

沈向洋博士在報告如是強調持久閱讀的重要性。

「深度閱讀論文,要敢於對論文質疑,質疑論文作者的研究方法、思路、技巧。還要設身處地去想:如果我來寫這篇論文,我能用什麼方法。」

沈向洋博士如是強調論文閱讀中「懷疑一切」的精神。科研離不開日常讀論文;而讀論文絕不僅是「下載、打開、閱讀」這樣的被動操作。我們不妨來看一看沈向洋博士的論文閱讀經驗。

AI科技評論針對沈向洋博士的報告內容,做了有刪改的編譯,感謝沈向洋博士對本文的親自修改和確認!

沈向洋:

在研究生院讀書是人生中最美好的時光,在這段時間你可能沒有足夠的錢,但是卻有足夠的時間學習。在讀書的這段時間應該學習一些重要的技能,比如有效的閱讀、寫作和演講。

閱讀是每一個人生活中必不可少的部分,尤其是對正在讀書的研究生來說,他日常的任務可能就是讀一些論文,看一些期刊等,但是高效的閱讀並不容易。

在過去的20年的時間裡,我培養了三十多個博士生,有一些學生能夠出色地完成閱讀工作,但也有些學生覺得有困難。閱讀論文確實很難,這裡面可能有很多的原因。

首先可能是論文本身寫的不是特別好,因為大多數作者的母語並不是英語,而英語又是大多數研究論文的官方語言,所以一些作者在論文語言把控上欠缺火候。

我也是把英文作為第二語言的人,我的論文寫得也不夠好,現在回過頭看看我早期寫的論文,真希望當初自己不要寫那些論文。

第二個原因是在讀論文的時候,讀者需要對論文主題有很深的背景知識。

還有,當你在閱讀中遇到困難的時候,應該從哪裡尋求幫助呢?可以向誰尋求幫助?能夠獲得什麼樣的幫助?

另外,現在在網上很容易找到與你閱讀相關的東西,所以坐下來長時間專注於閱讀一篇長文章或者一本書變得比以前困難很多。

JonathanShewchuck教授在CMU攻讀博士學位時候曾經寫下過一句話:從所閱讀的論文中提取中心思想,就像一句諺語所說「從針眼裡吸出一頭駱駝」(sucking a camel through the eye of the proverbial needle)。這個比喻非常恰當,以至於我讀到這句話的時候也是眼前一亮。

相關文章連結:http://www.cs.cmu.edu/~jrs/sins.html

在那篇文章中,Jonathan指出了CS和數學領域寫作的三個常見錯誤,分別是「祖母式」的引言(意思是引言絮絮叨叨,沒有直入主題)、段落式的目錄結構、不切題的結論。當然,這三個觀點對於寫作非常重要,但我們今天的主題不是它,我們今天的主題是:如何閱讀。

說實話,有些論文寫得確實不好,但寫得不好的論文你也要讀,因為有時候你沒有選擇。其實,論文閱讀之所以難,最主要的原因是閱讀和寫作脫節,也就是作者和讀者之間的脫節。

作者一心想把東西「拿」出來,而讀者一心想從文章中得到一些東西,這裡面必然有理解的偏差。幾千年來,自從語言出現並開始寫作至網際網路(以及社交網絡)出現之前,一直有此困境,即寫作只是從作者到讀者的單行道,沒有循環反饋渠道。

例如,直到現在人們還在爭論孔子寫過的那些文字到底是什麼意思。

仔細想想,這類似於香儂的資訊理論原理,論文是作者和讀者之間交流信息的渠道,實際上主要是單向傳輸。更為具體一些,寫作就像編碼,閱讀就像解碼,所以需要一本Codebook來介紹「編碼」到「解碼」所需要的知識,也即作者按照這本Codebook中的規範進行「編碼」,閱讀者則用它來「解碼」。其實,香儂理論只是概括了閱讀與寫作的一部分,真實的閱讀往往超越了傳統的「傳輸-壓縮」框架,它更多的是一個反覆的理解過程。

在這個過程中,讀者將作者的意圖(信息)解釋成能夠理解的片段,隨後這些片段被構建到讀者腦中的認知模型裡。所以,閱讀等同於理解,不同層次的閱讀對應不同層次的理解——深度閱讀導致深度理解,淺顯的閱讀對應的必然是淺顯的理解。

知道了閱讀的本質,那麼我們應該如何對待閱讀呢?不同需求應該對應不同的閱讀層次,你可能需要快速瀏覽,可能需要仔細閱讀,如果你的導師需要你復現論文中的細節,那麼你就需要非常深入地研讀。

快速閱讀:劃分結構層次

對於快速閱讀,一個小的技巧是圖文瀏覽。因為一些好的論文必然是圖文並茂,所以只要弄清楚論文中表格和圖片的標題和注釋,就能夠獲得這篇論文八、九成的信息。

對於仔細閱讀,你的心態必須是批判和創造的。精讀一篇論文,首先要對論文進行否定、質疑,仔細挑毛病;其次,對論文有了足夠的了解之後,如果發現論文中提到的想法非常優秀,那麼要創造性地思考你能用這篇論文做什麼。

除了閱讀的方式,讀者還要理解所讀的論文是如何寫出來的。因為一篇好的論文在邏輯上是層層遞進的,不僅能夠傳達信息也能夠激勵讀者。

所以作者在寫的時候也是有結構化的邏輯性思考程度的。總體上作者會思考:這篇論文的真實任務是什麼、研究發現是什麼;論文的貢獻是什麼等等。相應的,讀者在讀論文的時候也應該要有邏輯,首先要清楚論文中的表達是否是我想要學習到的;其次,我能從論文中學到多少呢;最後,這篇論文的背景是什麼——是什麼樣的背景讓這篇論文變得重要和有趣。

論文結構化的層次只是微觀層面,在宏觀層面上,讀者還需要了解論文的類型:1、提出問題型論文;2、解決問題型論文;3、闡述和調查型論文。

講完了論文的類型和邏輯結構,接下來進入關於快速閱讀和仔細閱讀的細節介紹。著名科學家Don Geman曾提到:一篇論文實際上有標題、摘要、引言、論文主體(The restof the paper)組成,論文四個部分的每一部分都需要花同樣的時間進行撰寫。所以,對論文進行快速閱讀需要著重關注論文的標題、摘要和引言,如此便能了解論文是否值得讀、能夠從論文中讀到些什麼。論文最重要,也是最難寫的部分是引言。

我的前同事,微軟美國研究院的著名圖形學專家Jim Kajiya在他的一篇著作」How to get your Siggraphpaper rejected」中強調:你必須要下功夫把引言寫好,寫到審稿人容易看懂。這篇論文是關於什麼的,它解決了什麼問題,迷人之處在哪,有什麼新的東西,為什麼那麼神奇。

《How to write a good paper》:

https://www.cc.gatech.edu/~parikh/citizenofcvpr/static/slides/malik_write_good_paper.pdf 

如何讀論文的引言?舉個例子,我最近在讀《擁有倫理學:企業邏輯、矽谷與倫理學的制度化》(Owning Ethics:Corporate Logics, SiliconValley, and the Institutionalization of Ethics),在引言部分,我問了Kajiya的幾個問題。

首先這篇論文講的是高科技公司在道德方面做了什麼;其次,解決的問題是現在的實踐(擁有道德)做法;再者,迷人之處在於最近的醜聞和技術後衝(techlash);這篇文章的最新之處是對17位「道德擁有者」進行了採訪;最後,整體的邏輯是道德所有者在令人擔憂的動態中運營公司。所以,一旦把引言分解成這些東西,然後你就可以決定:這是有趣的嗎?應該繼續讀下去麼?

如何讀摘要?計算機學科論文中的摘要一般是非常枯燥的,如果一行一行的讀,那麼將會更加枯燥。所以要讀摘要的時候,將其分解並加上一些有趣的亮點,便可能利於閱讀。

舉個例子,在《可信度指標對社交媒體新聞分享意願的影響》(Effects of Credibilit Indicators on Social Media News Sharing Intent)論文中摘要部分,主要講了社交媒體有可能傳播假新聞,對這些媒體加上可信度標記可以減少人們分享假新聞傾向。了解文章的主題之後,然後你需要問自己這篇論文真正的發現是什麼?通過繼續閱讀,你發現論文探究了四種可信度指標,每種可信度指標都能夠減少人們分享的傾向,一些審查工作也能帶來積極的效應,進一步發現,人口統計和個人特徵以及社會特徵會對可信度指標產生顯著差異的影響。

了解了這篇論文研究成果之後,接著問自己:我為什麼要關注這個問題。接著讀發現,原來這篇論文的研究成果對遏制虛假信息的傳播有著重要的影響。考慮到目前美國信息傳播的現狀,這對節省研究員的學術精力非常重要,所以對於我來說,我應該關注這個問題。

接下來簡單介紹標題如何讀,標題一般只有一句話。從整篇論文的排版的角度來看,在一頁半的引言、四分之一頁的摘要以及八頁的雙欄正文面前,只有一句話的標題顯得不太「重要」。但是標題是總結、抽象的概括。除了論文標題,圖表的標題也是非常抽象。我曾經嘗試只用兩個高度概括的詞,並以ing結尾來做Siggraph論文的標題,例如Plenoptic sampling、Lazy Snapping、Poisson matting。所以對於讀者來說在讀這些抽象的詞或句子的時候,只有花費較多的時間才能讀懂論文作者的意圖。以上是快速閱讀的一些技巧,下面轉向仔細閱讀。

仔細閱讀:批判思維

以評判性閱讀開始,帶著質疑的心態問問題。如果作者論文中聲稱解決了一個問題,那麼你就要在心裡問自己:論文是否正確、真正地解決了問題?作者論文中所用方法是否有局限性?如果所讀的論文沒有解決問題,那麼我能解決麼?我能採用比論文中更簡單的方法解決麼?所以,一旦進入仔細閱讀的狀態,要在讀論文之前對自己說:這篇論文可能有問題,我要找出來。

批判性閱讀可能非常難,也可能佔用你很多的時間,你可能在讀的過程中被卡住,但不要驚慌失措,要堅持下去!多找一些背景知識閱讀,多做筆記,多在網上搜索相關論文,然後再次通讀所卡殼的論文,並試著把它與其他論文相聯繫起來,如此堅持下去,定能渡過難關。另一個建議是,找熟悉這方面工作的人幫忙,讓他們解釋你遇到的難點。

但你要意識到找人幫忙也可能遇到困難,一方面,你要找誰幫忙,導師?師姐?學長?另一方面,如何能讓他們愉快的接受你幾分鐘、十幾分鐘、甚至接近一個小時的諮詢?這一點,對於我來說非常幸運,我在CMU讀研究生的時候,我身邊的同學和教授都非常友好,尤其是一個比我稍微年長的學長,他的學識比我豐富許多,每當我問他一些論文方面的事情時候,他總能給我令人驚嘆的答案。

我從他那學到的其實不光是我應該看哪些論文,更多的是不應該看哪些論文。他會告訴我某人的論文你不要讀,因為那會擾亂你的思路。 

創造性閱讀:積極思考

好了,現在你已經知道了如何進行批判性的閱讀,以及確信哪些論文值得讀下去,甚至在讀的過程中可能會產生一些好的想法。那麼接下來要做一些改進,從而進入創造性閱讀層面。這時候你要問自己:在我所讀的論文中,作者有哪些點還沒有想到?如果我現在做這項研究,我能做的新事情是什麼?

創造性的閱讀需要把你所讀的論文和其他相關的論文建立聯繫,從而產生一些新的想法,這些想法可以支撐你進行三個月到五個月的研究。如果你真正想理解你所讀的論文,那麼就寫一個摘要吧,最好做一個口頭展示,這樣你會發現,只有把東西寫下來或者說出來才能真正深刻理解。如果你能做一個報告,那就更好了,因為做報告的時候,別人可以問你問題,這會強迫你理解所讀的論文。

在做這個演講之前,我曾經向我的同事、學生詢問了關於論文閱讀有哪些問題可以「問自己」,上面這張圖片是一個總結,圖片的上半部分是比較客觀的問題,包括論文的核心觀點是什麼?主要的局限性是什麼?代碼和數據是不是可得的?論文的貢獻是否有意義?論文中的實驗是否足夠好?

圖片的下半部分是比較主觀的問題,包括我錯過了什麼相關論文麼?這對我的工作有何幫助麼?這是一篇值得關注的論文麼?這個研究領域的領頭人是誰呢?其他的人對這篇論文有何看法呢?如果有機會見到作者,我應該問作者什麼問題?當你在閱讀論文的時候如果能回答出上面列出的問題,我相信你會對你所讀論文有非常深刻的理解。

此外,還有一些工具能夠幫助閱讀,例如谷歌以及必應網頁搜尋引擎、谷歌學術、arXiv等能夠搜索到你想要的論文;OneNote可以幫助你做筆記;CliffsNotes作為美國知名的學習指南網站,能夠提供文獻學習指南;Mendeley是非常優秀的參考文獻管理。另外也強烈建議大家使用在線論壇討論論文,增加學術交流,增強對所讀論文的理解能力,但是遺憾的是,尚未有非常適合討論論文的在線論壇,現在的一些社交網絡產品或許很棒,但是它並不是為了學術研究目的而設計,畢竟學術論文的「非有趣性」不適合社交產品的調性。

最後,上面有幾個小貼士希望你注意。我最想強調的是要養成寫小總結的習慣,最好能做報告,這樣真的能夠增加你對所讀論文的理解。或許你永遠不知道你以前讀過的書能在什麼時候能夠派上用場,但是請保持閱讀,因為閱讀的過程也是在你大腦中建立認知的過程。

(雷鋒網)、(雷鋒網)、(雷鋒網(公眾號:雷鋒網)

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 沈向洋、華剛:讀科研論文的三個層次、四個階段與十個問題
    開班儀式上,沈向洋博士與同學們分享了他閱讀、撰寫科研論文的寶貴經驗。閱讀論文有消極閱讀、積極閱讀、批判性閱讀和創造性閱讀這四個階段,也有速讀、精讀與研讀這三個層次,有價值的論文閱讀將幫助研究者建立認知模型,找到有價值的研究想法。
  • 院士教你:讀科研論文的三個層次、四個階段與十個問題
    開班儀式上,沈向洋博士與同學們分享了他閱讀、撰寫科研論文的寶貴經驗。閱讀論文有消極閱讀、積極閱讀、批判性閱讀和創造性閱讀這四個階段,也有速讀、精讀與研讀這三個層次,有價值的論文閱讀將幫助研究者建立認知模型,找到有價值的研究想法。
  • 沈向洋、華剛:讀科研論文的三個層次、四個階段與十個問題
    首先要對論文進行否定、質疑,仔細挑毛病;其次,對論文有了足夠的了解之後,如果發現論文中提到的想法非常優秀,那麼要創造性地思考你能用這篇論文做什麼。第三個步驟,我稱之為「研讀」,比如說自己嘗試將文章中的算法實現一遍。除了閱讀的方式,讀者還要理解所讀的論文是怎樣寫出來的。
  • 論文寫作的三個層次結構
    論文由大到小有三個層次的結構:功能結構、大綱結構、微觀結構。本文按順序先後討論我們熟悉的大綱結構、常被忽視的微觀結構和我們不熟悉的功能結構。掌握三個層次結構的要領,可以不再糾結於如何安排寫作邏輯,從而專注於填寫內容,提高寫作效率和論文質量,有助於寫出一篇讓讀者進得來、留得下並記得住的論文。
  • 漫談論文的三個層次結構
    論文由大到小有三個層次的結構:功能結構、大綱結構、段落與句子結構。掌握三個層次結構的要領,可以不再糾結於如何安排寫作邏輯,從而專注於填寫內容,提高寫作效率和論文質量,有助於寫出一篇讓讀者進得來、留得下並記得住的論文。摘要、引言和結論是論文中常見的標題明晰的大綱結構。除此之外,還有一些標題比較自由的大綱結構,用以介紹論文的核心內容,包括方法和結果等內容。 標準的數學論文還有自己特定的要求。
  • 沈向洋,被清華大學首次線上受聘的教授,是什麼來頭?
    沈向洋他究竟有什麼過人之處?01沈向洋1980年畢業於南京工學院,之後在香港大學獲得電子工程系碩士學位。獲得碩士學位之後,到美國名牌大學攻讀計算機專業博士學位。在博士畢業後加入了微軟研究院,成為微軟的一員。
  • 對話沈向洋:未來人工智慧最大的機會是什麼
    沈向洋介紹,今天能夠做到的人工智慧,大多數還是專注於某個數據量大、運算量大的特別領域的工作。但實際上真正的智能離我們還很遙遠,比如常識的問題,推理的問題都還沒解決。談到未來人類社會的科技發展,沈向洋表示他最看好的三個方向分別是人工智慧,增強現實,和量子計算。同時沈向洋也認為下一個革命性的硬體可能是智能眼鏡。
  • 論文的三個層次結構,原來有這麼大的學問!
    論文由大到小有三個層次的結構:功能結構、大綱結構、段落與句子結構。本文按順序先後討論我們熟悉的大綱結構、常被忽視的段落與句子結構和我們不熟悉的功能結構。又如,「我們可以將論文劃分為三個層次來理解閉環寫作」包含了主題「閉環寫作」以及論點「劃分為三個層次」。④段落的結論對於重要的主題段落,應有一個結論,可以是主題語句中論點的具體化。⑤詳細內容除主題語句和結論外,主題段落還包含一些解釋主題、支持論點的詳細內容。
  • 離職微軟後,沈向洋受聘清華大學雙聘教授,開啟博士生招生計劃
    如今,根據清華大學相關消息,3月5日,「春風講堂」系列講座第四講將在清華大學工字廳舉行,主講人正是離職微軟三個月的沈向洋,講座題目為Engineering Responsible AI。屆時,清華大學校長邱勇還將向沈向洋教授頒發聘書,正式聘請沈向洋為清華大學高等研究院雙聘教授。
  • 麥可·歐文·喬丹、沈向洋在北大等你
    Jordan)北京大學人工智慧研究院學術委員會主任沈向洋博士將聯袂奉上一場精彩的學術盛宴北京大學人工智慧研究院組織主辦的學術活動大師講堂--「因AI之名」以在線直播的形式喬丹教授長期引領著機器學習、統計學、數學優化的理論、方法與系統研究,是貝葉斯網絡、概率圖模型、層次隨機過程等多個重要方向的主要奠基者之一,也是統計學與機器學習交叉融合的主要推動者。
  • 如何從這三個層次去閱讀提升Essay寫作質量?
    由淺顯的直接成效,到深度的鋪墊積累,閱讀一共可分為三個層次:1讀Essay;2讀與寫作題材相關的材料;3多樣化閱讀。;每一個論點要涵蓋三個evidence,每個evidence還要有原文的quote支撐……其實Essay和國內的議論文比較類似,但是我在初中時只接觸過記敘文寫作,於是一上十年級就成了啥也寫不出的傻子。
  • 論文寫作的三個階段
    一般來說,論文的要求也許大概可以分成以下三個層次或者階段:第一階段:力求紮實紮實的意思就是:你的研究方法是嚴謹的,設計是完整沒有缺陷的,分析是沒有錯誤的,結果是經得起穩健性檢驗的考驗的,研究過程和「故事」之間的邏輯是吻合的,不存在「驢唇不對馬嘴」或者說「掛羊頭賣狗肉」的地方。簡單來說,就是做出了結果,做對了結果,做實了結果。
  • 沈向洋突然離職!告別信稱離開微軟是一生中最艱難的決定
    對於沈向洋的下一步打算,我們也有三個猜測:獨角獸 – 人才遍天下 科學家身份 – 工程院和科學院(兩個外籍院士) 學者- 教書育人 – 清華北大浙大西安交大等名譽教授創業 - 做一個自己的公司Satya微軟官方博客對沈向洋的感謝信感謝你,Harry!感謝您,沈向洋博士!
  • 對話微軟全球執行副總裁沈向洋:關於人工智慧的終極「七問」
    三問:對人工智慧來說,EQ(情商)比IQ(智商)重要駱軼航:這很有意思,之前人們對於小冰的很多理解是娛樂性的:小冰跟我推測一下,我講的是哪一個人?小冰跟我聊聊天。小冰給我隨便打個電話。中國網際網路還有相對特別的地方,就是網民中大概有三分之一,上網發表一個意見以後,從來沒有人回應。比如說一些到城裡來打工的人群,就算有一個朋友圈,大家相互之間的隔膜也比較多。他們其是希望有一個可以相互理解、交流的過程。我同事說像你這樣的人,微信隨便發個東西,只有 200 個贊,就好像很不滿意。但是很多其他人不是這樣的情況,通常沒人理。所以後來我們做了聊天機器人。
  • 效力23年,微軟最高AI領導者「沈向洋」突然離職,美科技巨頭再無...
    同時微軟大中華區也附上一首散文詩來送別,「你給研究院選的那塊地毯,依然如故,時刻提醒著我們,做科研要腳踏實地,因為「千裡之行,始於足下」......22,000餘篇論文、4,000多項全球專利,廿三歲月,赤子之心!縱有萬千語,難訴離別情!。」先來一觀沈向洋的完整告別信:同事們,11月,對我來說,在過去的二十三年裡,具有非常特殊的意義。
  • 專訪微軟沈向洋:下一個攻堅點是通用人工智慧
    微軟全球執行副總裁沈向洋  騰訊科技 紀振宇 9月17日矽谷報導  對於微軟全球執行副總裁、人工智慧研發的總掌舵人沈向洋來說,他正在帶領著團隊駛向一片從未涉足的領域:沒有人明確地知道人工智慧未來會走向何方
  • 沈向洋,被微軟「耽擱」的獨角獸催化大師
    在知名AI大牛沈向洋離職微軟,重入江湖大海以來,與其相關的產業公司,可謂捷報頻傳。這不,美國最大的本地新聞信息平臺,美國版「今日頭條」\「一點資訊」——News Break,剛剛官宣完成1.15億美元C輪融資,投後估值超過10億美元,晉升獨角獸。
  • 人工智慧將顛覆整個世界——專訪微軟全球執行副總裁沈向洋
    人工智慧(AI)無疑是眼下全球科技和網際網路界最熱門的詞彙之一,作為全球人工智慧領域的頂尖專家,51歲的微軟全球執行副總裁沈向洋14日出現在華盛頓大學主辦的創新峰會上。在用流利的英文發表了半個多小時的主題演講後,沈向洋接受本報記者專訪。說起人工智慧技術的發展,沈向洋言簡意賅,「它將顛覆整個世界。」
  • 簡單幾筆素描就能「復原」真實人臉,這是沈向洋高徒出品的CSAGAN
    △最後一排是真實照片中科大團隊這篇論文的第一作者,是來自中國科學技術大學類腦智能技術及應用國家工程實驗室的Yuhang Li。論文的通訊作者,是該實驗室的陳雪錦副教授。陳老師專注於計算機圖形學、計算機視覺研究,在中科大讀博期間,師從沈向洋教授,2010年從耶魯大學計算機系博士後出站。論文的另外兩位作者,是中科大信息科學技術學院執行院長吳楓教授和該實驗室副主任查正軍教授。
  • 沈向洋:阿爾法狗了不起,但微軟人工智慧更重「情商」與對話
    這意味著微軟正式將人工智慧提上優先地位,也意味著沈向洋將統領一隻由5000多名計算機科學家和工程師組成的人工智慧研發大軍。那麼,沈向洋將如何指揮這隻大軍呢?微軟AI未來最大的目標是對話機器人:聊天是剛需談起微軟在人工智慧領域的未來布局,沈向洋說,「可能不只要定一個小目標吧,你要對這個世界有一個遠大的判斷。