沈向洋:讀論文的三個層次

2020-12-06 雷鋒網

5月14日,沈向洋博士在全球創新學院(GIX)課程上曾做了一場線上公開課《You are how you read》,分享他對於科研論文閱讀、撰寫的寶貴經驗,引起一時轟動。由於圍觀網友太多,導致會議系統崩潰,眾多網友無法接入觀看,不免唏噓不已。近日,為滿足廣大網友的需求,微軟亞洲研究院將沈向洋博士的報告視頻公開。 這場報告亮點紛呈,引人深思。

「或許你永遠不知道你以前讀過的書能在什麼時候能夠派上用場,但請保持閱讀,因為閱讀的過程也是在你大腦中建立認知的過程。」

沈向洋博士在報告如是強調持久閱讀的重要性。

「深度閱讀論文,要敢於對論文質疑,質疑論文作者的研究方法、思路、技巧。還要設身處地去想:如果我來寫這篇論文,我能用什麼方法。」

沈向洋博士如是強調論文閱讀中「懷疑一切」的精神。科研離不開日常讀論文;而讀論文絕不僅是「下載、打開、閱讀」這樣的被動操作。我們不妨來看一看沈向洋博士的論文閱讀經驗。

AI科技評論針對沈向洋博士的報告內容,做了有刪改的編譯,感謝沈向洋博士對本文的親自修改和確認!

沈向洋:

在研究生院讀書是人生中最美好的時光,在這段時間你可能沒有足夠的錢,但是卻有足夠的時間學習。在讀書的這段時間應該學習一些重要的技能,比如有效的閱讀、寫作和演講。

閱讀是每一個人生活中必不可少的部分,尤其是對正在讀書的研究生來說,他日常的任務可能就是讀一些論文,看一些期刊等,但是高效的閱讀並不容易。

在過去的20年的時間裡,我培養了三十多個博士生,有一些學生能夠出色地完成閱讀工作,但也有些學生覺得有困難。閱讀論文確實很難,這裡面可能有很多的原因。

首先可能是論文本身寫的不是特別好,因為大多數作者的母語並不是英語,而英語又是大多數研究論文的官方語言,所以一些作者在論文語言把控上欠缺火候。

我也是把英文作為第二語言的人,我的論文寫得也不夠好,現在回過頭看看我早期寫的論文,真希望當初自己不要寫那些論文。

第二個原因是在讀論文的時候,讀者需要對論文主題有很深的背景知識。

還有,當你在閱讀中遇到困難的時候,應該從哪裡尋求幫助呢?可以向誰尋求幫助?能夠獲得什麼樣的幫助?

另外,現在在網上很容易找到與你閱讀相關的東西,所以坐下來長時間專注於閱讀一篇長文章或者一本書變得比以前困難很多。

JonathanShewchuck教授在CMU攻讀博士學位時候曾經寫下過一句話:從所閱讀的論文中提取中心思想,就像一句諺語所說「從針眼裡吸出一頭駱駝」(sucking a camel through the eye of the proverbial needle)。這個比喻非常恰當,以至於我讀到這句話的時候也是眼前一亮。

相關文章連結:http://www.cs.cmu.edu/~jrs/sins.html

在那篇文章中,Jonathan指出了CS和數學領域寫作的三個常見錯誤,分別是「祖母式」的引言(意思是引言絮絮叨叨,沒有直入主題)、段落式的目錄結構、不切題的結論。當然,這三個觀點對於寫作非常重要,但我們今天的主題不是它,我們今天的主題是:如何閱讀。

說實話,有些論文寫得確實不好,但寫得不好的論文你也要讀,因為有時候你沒有選擇。其實,論文閱讀之所以難,最主要的原因是閱讀和寫作脫節,也就是作者和讀者之間的脫節。

作者一心想把東西「拿」出來,而讀者一心想從文章中得到一些東西,這裡面必然有理解的偏差。幾千年來,自從語言出現並開始寫作至網際網路(以及社交網絡)出現之前,一直有此困境,即寫作只是從作者到讀者的單行道,沒有循環反饋渠道。

例如,直到現在人們還在爭論孔子寫過的那些文字到底是什麼意思。

仔細想想,這類似於香儂的資訊理論原理,論文是作者和讀者之間交流信息的渠道,實際上主要是單向傳輸。更為具體一些,寫作就像編碼,閱讀就像解碼,所以需要一本Codebook來介紹「編碼」到「解碼」所需要的知識,也即作者按照這本Codebook中的規範進行「編碼」,閱讀者則用它來「解碼」。其實,香儂理論只是概括了閱讀與寫作的一部分,真實的閱讀往往超越了傳統的「傳輸-壓縮」框架,它更多的是一個反覆的理解過程。

在這個過程中,讀者將作者的意圖(信息)解釋成能夠理解的片段,隨後這些片段被構建到讀者腦中的認知模型裡。所以,閱讀等同於理解,不同層次的閱讀對應不同層次的理解——深度閱讀導致深度理解,淺顯的閱讀對應的必然是淺顯的理解。

知道了閱讀的本質,那麼我們應該如何對待閱讀呢?不同需求應該對應不同的閱讀層次,你可能需要快速瀏覽,可能需要仔細閱讀,如果你的導師需要你復現論文中的細節,那麼你就需要非常深入地研讀。

快速閱讀:劃分結構層次

對於快速閱讀,一個小的技巧是圖文瀏覽。因為一些好的論文必然是圖文並茂,所以只要弄清楚論文中表格和圖片的標題和注釋,就能夠獲得這篇論文八、九成的信息。

對於仔細閱讀,你的心態必須是批判和創造的。精讀一篇論文,首先要對論文進行否定、質疑,仔細挑毛病;其次,對論文有了足夠的了解之後,如果發現論文中提到的想法非常優秀,那麼要創造性地思考你能用這篇論文做什麼。

除了閱讀的方式,讀者還要理解所讀的論文是如何寫出來的。因為一篇好的論文在邏輯上是層層遞進的,不僅能夠傳達信息也能夠激勵讀者。

所以作者在寫的時候也是有結構化的邏輯性思考程度的。總體上作者會思考:這篇論文的真實任務是什麼、研究發現是什麼;論文的貢獻是什麼等等。相應的,讀者在讀論文的時候也應該要有邏輯,首先要清楚論文中的表達是否是我想要學習到的;其次,我能從論文中學到多少呢;最後,這篇論文的背景是什麼——是什麼樣的背景讓這篇論文變得重要和有趣。

論文結構化的層次只是微觀層面,在宏觀層面上,讀者還需要了解論文的類型:1、提出問題型論文;2、解決問題型論文;3、闡述和調查型論文。

講完了論文的類型和邏輯結構,接下來進入關於快速閱讀和仔細閱讀的細節介紹。著名科學家Don Geman曾提到:一篇論文實際上有標題、摘要、引言、論文主體(The restof the paper)組成,論文四個部分的每一部分都需要花同樣的時間進行撰寫。所以,對論文進行快速閱讀需要著重關注論文的標題、摘要和引言,如此便能了解論文是否值得讀、能夠從論文中讀到些什麼。論文最重要,也是最難寫的部分是引言。

我的前同事,微軟美國研究院的著名圖形學專家Jim Kajiya在他的一篇著作」How to get your Siggraphpaper rejected」中強調:你必須要下功夫把引言寫好,寫到審稿人容易看懂。這篇論文是關於什麼的,它解決了什麼問題,迷人之處在哪,有什麼新的東西,為什麼那麼神奇。

《How to write a good paper》:

https://www.cc.gatech.edu/~parikh/citizenofcvpr/static/slides/malik_write_good_paper.pdf 

如何讀論文的引言?舉個例子,我最近在讀《擁有倫理學:企業邏輯、矽谷與倫理學的制度化》(Owning Ethics:Corporate Logics, SiliconValley, and the Institutionalization of Ethics),在引言部分,我問了Kajiya的幾個問題。

首先這篇論文講的是高科技公司在道德方面做了什麼;其次,解決的問題是現在的實踐(擁有道德)做法;再者,迷人之處在於最近的醜聞和技術後衝(techlash);這篇文章的最新之處是對17位「道德擁有者」進行了採訪;最後,整體的邏輯是道德所有者在令人擔憂的動態中運營公司。所以,一旦把引言分解成這些東西,然後你就可以決定:這是有趣的嗎?應該繼續讀下去麼?

如何讀摘要?計算機學科論文中的摘要一般是非常枯燥的,如果一行一行的讀,那麼將會更加枯燥。所以要讀摘要的時候,將其分解並加上一些有趣的亮點,便可能利於閱讀。

舉個例子,在《可信度指標對社交媒體新聞分享意願的影響》(Effects of Credibilit Indicators on Social Media News Sharing Intent)論文中摘要部分,主要講了社交媒體有可能傳播假新聞,對這些媒體加上可信度標記可以減少人們分享假新聞傾向。了解文章的主題之後,然後你需要問自己這篇論文真正的發現是什麼?通過繼續閱讀,你發現論文探究了四種可信度指標,每種可信度指標都能夠減少人們分享的傾向,一些審查工作也能帶來積極的效應,進一步發現,人口統計和個人特徵以及社會特徵會對可信度指標產生顯著差異的影響。

了解了這篇論文研究成果之後,接著問自己:我為什麼要關注這個問題。接著讀發現,原來這篇論文的研究成果對遏制虛假信息的傳播有著重要的影響。考慮到目前美國信息傳播的現狀,這對節省研究員的學術精力非常重要,所以對於我來說,我應該關注這個問題。

接下來簡單介紹標題如何讀,標題一般只有一句話。從整篇論文的排版的角度來看,在一頁半的引言、四分之一頁的摘要以及八頁的雙欄正文面前,只有一句話的標題顯得不太「重要」。但是標題是總結、抽象的概括。除了論文標題,圖表的標題也是非常抽象。我曾經嘗試只用兩個高度概括的詞,並以ing結尾來做Siggraph論文的標題,例如Plenoptic sampling、Lazy Snapping、Poisson matting。所以對於讀者來說在讀這些抽象的詞或句子的時候,只有花費較多的時間才能讀懂論文作者的意圖。以上是快速閱讀的一些技巧,下面轉向仔細閱讀。

仔細閱讀:批判思維

以評判性閱讀開始,帶著質疑的心態問問題。如果作者論文中聲稱解決了一個問題,那麼你就要在心裡問自己:論文是否正確、真正地解決了問題?作者論文中所用方法是否有局限性?如果所讀的論文沒有解決問題,那麼我能解決麼?我能採用比論文中更簡單的方法解決麼?所以,一旦進入仔細閱讀的狀態,要在讀論文之前對自己說:這篇論文可能有問題,我要找出來。

批判性閱讀可能非常難,也可能佔用你很多的時間,你可能在讀的過程中被卡住,但不要驚慌失措,要堅持下去!多找一些背景知識閱讀,多做筆記,多在網上搜索相關論文,然後再次通讀所卡殼的論文,並試著把它與其他論文相聯繫起來,如此堅持下去,定能渡過難關。另一個建議是,找熟悉這方面工作的人幫忙,讓他們解釋你遇到的難點。

但你要意識到找人幫忙也可能遇到困難,一方面,你要找誰幫忙,導師?師姐?學長?另一方面,如何能讓他們愉快的接受你幾分鐘、十幾分鐘、甚至接近一個小時的諮詢?這一點,對於我來說非常幸運,我在CMU讀研究生的時候,我身邊的同學和教授都非常友好,尤其是一個比我稍微年長的學長,他的學識比我豐富許多,每當我問他一些論文方面的事情時候,他總能給我令人驚嘆的答案。

我從他那學到的其實不光是我應該看哪些論文,更多的是不應該看哪些論文。他會告訴我某人的論文你不要讀,因為那會擾亂你的思路。 

創造性閱讀:積極思考

好了,現在你已經知道了如何進行批判性的閱讀,以及確信哪些論文值得讀下去,甚至在讀的過程中可能會產生一些好的想法。那麼接下來要做一些改進,從而進入創造性閱讀層面。這時候你要問自己:在我所讀的論文中,作者有哪些點還沒有想到?如果我現在做這項研究,我能做的新事情是什麼?

創造性的閱讀需要把你所讀的論文和其他相關的論文建立聯繫,從而產生一些新的想法,這些想法可以支撐你進行三個月到五個月的研究。如果你真正想理解你所讀的論文,那麼就寫一個摘要吧,最好做一個口頭展示,這樣你會發現,只有把東西寫下來或者說出來才能真正深刻理解。如果你能做一個報告,那就更好了,因為做報告的時候,別人可以問你問題,這會強迫你理解所讀的論文。

在做這個演講之前,我曾經向我的同事、學生詢問了關於論文閱讀有哪些問題可以「問自己」,上面這張圖片是一個總結,圖片的上半部分是比較客觀的問題,包括論文的核心觀點是什麼?主要的局限性是什麼?代碼和數據是不是可得的?論文的貢獻是否有意義?論文中的實驗是否足夠好?

圖片的下半部分是比較主觀的問題,包括我錯過了什麼相關論文麼?這對我的工作有何幫助麼?這是一篇值得關注的論文麼?這個研究領域的領頭人是誰呢?其他的人對這篇論文有何看法呢?如果有機會見到作者,我應該問作者什麼問題?當你在閱讀論文的時候如果能回答出上面列出的問題,我相信你會對你所讀論文有非常深刻的理解。

此外,還有一些工具能夠幫助閱讀,例如谷歌以及必應網頁搜尋引擎、谷歌學術、arXiv等能夠搜索到你想要的論文;OneNote可以幫助你做筆記;CliffsNotes作為美國知名的學習指南網站,能夠提供文獻學習指南;Mendeley是非常優秀的參考文獻管理。另外也強烈建議大家使用在線論壇討論論文,增加學術交流,增強對所讀論文的理解能力,但是遺憾的是,尚未有非常適合討論論文的在線論壇,現在的一些社交網絡產品或許很棒,但是它並不是為了學術研究目的而設計,畢竟學術論文的「非有趣性」不適合社交產品的調性。

最後,上面有幾個小貼士希望你注意。我最想強調的是要養成寫小總結的習慣,最好能做報告,這樣真的能夠增加你對所讀論文的理解。或許你永遠不知道你以前讀過的書能在什麼時候能夠派上用場,但是請保持閱讀,因為閱讀的過程也是在你大腦中建立認知的過程。

(雷鋒網(公眾號:雷鋒網))、(雷鋒網)、(雷鋒網)

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • AI領域頂尖學者沈向洋:要走出一條培養中國研究型人才的道路
    11月1日,在深圳全球創新人才論壇上,世界AI領域頂尖學者、粵港澳大灣區數字經濟研究院理事長沈向洋回答了上述問題。 「必須認真對待認知模型自然語音處理帶來的機會!」沈向洋認為「懂語言者得天下」,在人工智慧道路上,認知智能方面依然是發展的短板,也是下一步人工智慧發展的關鍵,包括如何認知模型,如何進行常識建模和因果推理。
  • 沈向洋:駕馭科技 造福人類
    沈向洋 ■ 深圳特區報記者 林捷興 11月1日,在深圳全球創新人才論壇上,粵港澳大灣區數字經濟研究院理事長沈向洋以《人工智慧與數字生產力——人才 發展 創新》作主題演講,對人工智慧、數字經濟發展從研究方向、人才培養、創新機制等方面提出見解。
  • 微軟小冰確認「單飛」,沈向洋重回微軟系掌舵小冰業務
    官方數據顯示,微軟小冰已經在全球多個國家覆蓋6.6億在線用戶、4.5億臺第三方智能設備和9億內容觀眾,已落地的商業客戶覆蓋金融、零售、汽車、地產、紡織等數個領域。沈向洋重回「微軟系」此次,沈向洋被任命微軟小冰新公司董事長,代表著微軟在中國的「發言人」沈向洋重新回到微軟系——微軟控股的中外合資公司。
  • 線上受聘,十萬人見證:沈向洋任清華大學雙聘教授
    對於沈向洋來說,在正式離開工作了 23 年的微軟之後,更重要的身份可能是「沈向洋教授」。Raj Reddy 培養出了沈向洋、洪小文、李開復等一眾計算機科學和人工智慧領域的領軍人物,微軟亞洲研究院 20 年來的 4 任院長,有三位都是他的學生。在微軟期間,沈向洋培養出了曠視科技首席科學家孫劍、原騰訊優圖實驗室傑出科學家賈佳亞等眾多 AI 學者。在微軟的 23 年裡,沈向洋憑藉對計算機視覺和計算機圖形學的研究以及開發必應搜索而聞名。
  • 微軟沈向洋:AI 時代,世界向哪裡走?
    「今年的 CES 上 AI 火熱,從 Harry(沈向洋)的視角來看,你預判整個 2018 年科技領域裡的關鍵詞彙會是什麼?」作為「CES 極客之夜」的固定環節,極客公園創始人張鵬邀請微軟全球執行副總裁沈向洋在提前準備好的題板上,用一個詞寫下他在今年 CES 上感受最深事情。
  • 沈向洋博士:未來科技,想像力是最大生產力
    沈向洋:其實我相信不僅僅只是微軟,所有的公司,特別是大公司,在思考未來的時候,它必須有一套自己的線路圖。整個計算機科學,回過頭來五六十年,向前看五六十年,實際很多技術的東西萬變不離其宗,整個 Computer Science,講到最後,是三件事情的 trade off(此消彼長)。
  • 沈向洋,被清華大學首次線上受聘的教授,是什麼來頭?
    沈向洋他究竟有什麼過人之處?01沈向洋1980年畢業於南京工學院,之後在香港大學獲得電子工程系碩士學位。獲得碩士學位之後,到美國名牌大學攻讀計算機專業博士學位。在博士畢業後加入了微軟研究院,成為微軟的一員。
  • 微軟執行副總裁沈向洋離職,矽谷華人高管或已全面失勢
    微軟最強華人高管離職,曾統領AI業務,在職23年智東西11月14日凌晨消息,剛剛,微軟CEO納德拉發送公司內部郵件稱,微軟集團執行副總裁、微軟AI+研究部負責人沈向洋(Harry Shum)將在2020年2月正式離職微軟,沈向洋並未表明其下一步計劃。微軟CTO Kevin Scott將接替沈向洋的職務,領導微軟AI+研究院的職責,立即生效。
  • 扒一扒陸奇、沈向洋、李開復、洪小文四人在CMU和職業生涯早期的故事
    「固執」同門師兄弟:李開復與洪小文李開復是四人中最早進入 CMU 的「大師兄」,李開復回憶到,當時 Sphinx 是他的博士論文主攻方向。Sphinx 最初是由李開復一人在做,後來隨著洪小文進入博士班,後者開始與李開復一起推進 Sphinx。
  • 離職微軟後,沈向洋受聘清華大學雙聘教授,開啟博士生招生計劃
    如今,根據清華大學相關消息,3月5日,「春風講堂」系列講座第四講將在清華大學工字廳舉行,主講人正是離職微軟三個月的沈向洋,講座題目為Engineering Responsible AI。屆時,清華大學校長邱勇還將向沈向洋教授頒發聘書,正式聘請沈向洋為清華大學高等研究院雙聘教授。
  • 沈向洋揮別微軟,但微軟人的中國故事沒有劇終
    耕耘23年後,微軟在中國的「發言人」沈向洋於昨晚確認離職。沈向洋是微軟全球執行副總裁、微軟人工智慧及微軟研究事業部負責人。他的離職引發了國內科技圈的震動。沈向洋是最後一位蓋茨年代的高級副總裁,他的離職也標誌著微軟全球執行副總裁職位中將再無華人身影。接替沈向洋AI與研究工作的是微軟CTO Kevin Scott。
  • 微軟前全球執行副總裁沈向洋加入清華大學當教授
    3月3日消息,去年11月微軟CEO納德拉發送公司內部郵件稱,微軟集團執行副總裁、微軟AI+研究部負責人沈向洋(Harry Shum)將在2020年2月正式離職微軟。當時並沒有公布其具體去向,現在確定沈向洋是加入清華大學當教授去了。
  • 一個時代落幕:沈向洋和那些出走的微軟華人高管們
    北京時間11月14日凌晨,微軟公司宣布了一項重要消息,公司全球執行副總裁沈向洋將在明年2月1日正式離職,接替他的是現任微軟首席技術官凱文·斯科特(Kevin Scott)。對於離職的計劃,微軟CEO納德拉在一封公開信中表示,沈向洋和他規劃已有一段時日,在2020年初離職之後,沈向洋將繼續擔任他和比爾·蓋茨的顧問。
  • 微軟副總裁沈向洋離職,曾任職微軟23年,是美國院士和世界級專家
    他曾是微軟全球執行副總裁,也是美國國家工程院外籍院士、英國皇家工程院外籍院士,曾在微軟效力時間長達23年,在計算機視覺、計算機圖形、模式識別、統計學習和機器人學領域,發表了100餘篇論文,並擁有50多項美國專利。
  • 沈向洋出走微軟 選擇回國可能性較大
    微軟CEO納德拉表示,關於沈向洋的離職,內部已討論了很長時間如何過渡。離職後,沈向洋選擇回國的可能性大。錢童心11月14日,微軟宣布重大人事變動。在公司效力23年之久的職級最高的華人高管,微軟全球執行副總裁、亞洲研究院聯合創辦人沈向洋突然離職。
  • 微軟前副總、AI負責人沈向洋去向定了 加入清華大學當教授
    2019年11月份,微軟副總裁、AI項目負責人沈向洋發表內部信,宣布從微軟離職,2020年2月份正式離開工作23年的公司。此前他沒公布具體去向,現在確定是加入清華大學當教授去了。在微軟另一位傳奇華人高管陸奇離職之後,沈向洋就是微軟華人員工中職位最高的高管了,離職前擔任微軟集團執行副總裁、微軟AI+研究部負責人,而他任內最重要的工作之一就是聯合創立了微軟亞洲研究院MSRA,是微軟在美國本土之外最大的研究中心。
  • 聊聊沈向洋為什麼從微軟離職-虎嗅網
    微軟中國博客更是直接發了散文詩來致敬和感謝沈向洋,情深意切。微軟今日官方宣布,全球執行副總裁、人工智慧及研究事業部負責人沈向洋將於明年年初辭職。隨後微軟發言人確認,沈向洋的離職時間是2月1日。他的工作職責將立即交給目前微軟CTO凱文·斯科特。微軟CEO納德拉盛讚和感謝了沈向洋對微軟的貢獻,也表示他會繼續擔任自己和蓋茨的顧問。但這實際上是一個高管離職的慣例操作。
  • 沈向洋 「回歸」,從微軟 「獨立」的小冰要彎道超車了
    一條消息,讓沈向洋在八個月後再次 「刷屏」。微軟今日宣布,將人工智慧小冰業務分拆為獨立公司運營,並委任沈向洋為新公司董事長,李笛為執行長。大佬 + 明星產品,會帶來什麼新變化?
  • 爆款網紅沈向洋,續聘清華「雙聘教授」,全網十萬人在線圍觀!
    我在微軟亞洲研究院工作的第7年,也就是2005年成為了清華大學高等研究院博導、雙聘教授,20多年來和清華結下了不解之緣,有機會與十幾個博士生一起研究,也有幸在清華開課,與更多的同學們共同學習。藉此機會,我也感謝清華多年來和微軟公司的緊密合作。
  • 沈向洋離職微軟,意味著什麼?
    所以沈向洋離開微軟,是一次極其重大的人才流失,但其實這事兒,卻可以說是早已奠定了。納德拉時代的全面改制沈向洋負責研發的產品,大家肯定有所耳聞,例如必應(Bing)搜索、微軟小冰等。現任 CEO 薩蒂亞 · 納德拉(Satya Narayana Nadella)在關於沈向洋離職的內部郵件中就有提到:在沈向洋的領導下,必應成長為一個強大的業務部門,協助微軟構建了關鍵的雲和 AI 技術平臺。沈向洋對微軟打造 AI&R(人工智慧布局和產品落地)戰略發揮了關鍵作用,也推動公司加快將研究投資和 AI 創新運用到產品,交付到用戶手中。