原創 Leo 集智俱樂部
導語以諾貝爾獎得主為代表的精英科學家群體,引領了現代科學的發展方向,其學術生涯路線,對青年學者有啟發意義。近日由國防科技大學李際超與美國西北大學王大順、殷裔安及印第安納大學Santo Fortunato等合作發表的論文,整理了 1900-2016 年間 545 位諾獎得主的論文發表與合作網絡數據,對比發現諾獎科學家與普通科學家之間在論文發表、科研合作及創新研究上的諸多差異。例如被諾獎認可的研究工作往往出現在學者職業生涯早期,獨立或小團隊完成的工作更可能獲得獲獎,精英科學家在獲得諾獎之後的新文章影響力可能下降等。本文是對這項研究的詳細解讀。
論文題目:
Scientific elite revisited: patterns of productivity, collaboration, authorship and impact
論文地址:
https://royalsocietypublishing.org/doi/10.1098/rsif.2020.0135
那些榮獲諾獎的明星科學家們科研工作者不是躲在象牙塔裡終日和瓶瓶罐罐、鍵盤機器打交道的書呆子,他們的研究工作能給社會提供巨大的價值。而其中的科學大牛、明星科學的影響不僅局限在科學界、更對全世界都作出了巨大的貢獻。諾貝爾獎作為一個高含金量、最負盛名的科學獎項,為研究者去追蹤那些明星科學家的學術生涯提供了線索和依據。
近日由國防科技大學的李際超與美國西北大學科學學與創新研究中心的王大順、殷裔安及印第安納大學的Santo Fortunato合作發表的論文融合了諾貝爾獎官網、維基百科詞條、諾獎獲得者個人網站及微軟學術圖譜多源數據,通過姓名消歧獲取了545位1900年至2016年間自然科學(物理、化學、生理學或醫學)領域諾獎獲得者完整的論文發表及引文合作網絡數據,基於此,將諾獎科學家與普通科學家的職業生涯進行對比分析,探究了諾獎科學家論文發表、科研合作及顛覆性創新的工作模式和規律。
數據收集
圖1:數據收集與驗證框架
論文作者首先從多個數據源如諾貝爾獎官網、維基百科詞條、諾獎獲得者個人網站,爬取收集並手動整理了每位諾獎科學家發表的論文,並將這些論文在微軟學術圖譜(MAG)資料庫進行了匹配作為「種子」;然後,通過「種子+個人引文網絡擴展」這一過程收集每個獲獎者的整個論文發表列表;最後將所獲得的數據集的準確性及完備性採用多種方法包括手動收集CV、谷歌學術、單位信息等進行了驗證。
最終,幾位作者收集了545位諾獎科學家的完整發文記錄,共有93,394篇期刊論文,並人工識別了874篇諾獎論文(整個數據收集及驗證過程工作量超過了1000小時)。
今日諾獎科學家,昔時當紅少年郎一個坊間常見的觀點認為:學術大師往往在年輕時就已經展現出了傲人的資質。這一點在該研究的數據集中確實得到了體現,獲得諾獎的科學家在學術生涯的早期——發表第一篇論文後的五年內——發表的論文數和影響力(是否是同時期、同領域被引數量前1%的論文),都遠遠超過同領域的科學家。
圖2:諾獎獲得者在學術生涯早期的表現差異
從上圖我們可以看到無論是發表論文數量(左圖)還是論文的影響力(右圖)物理、化學與醫學領域中的諾獎得主(深藍色)的表現均優於普通的科學家(藍綠色)。其中,論文發表數量是普通科學家的兩倍多,而影響力更是普通科學家的八倍。
但這些天資優異的少年天才並不是獨來獨往的獨行俠,實際上他們與其他科學家合作發文的數量是普通科學家的1.77倍,而獨立發表的論文數量並不是特別突出。
圖3:獲得諾獎的科學家-普通科學家在獨立-合作發文數量上的差異。
雖然從上圖我們可以看到,在獨立發表論文數量上,獲得諾獎的科學家(淺藍色)與普通科學家(綠色)在化學和醫學領域並無顯著區別。但是,他們在學術生涯的早期獨立完成的研究、論文往往更能獲得諾貝爾獎的青睞。
圖4:獲得諾獎的科學家獨立完成的論文(紅色)獲得諾獎的概率是合作論文(紫色)的2.16倍
學術大師與他們的奇蹟年作者通過控制變量法,證明了生長和優先連接兩條假設是產生無標度分布的必要條件。不僅僅是如前文所說,獲獎者學術生涯早期的獨立工作獲獎的可能性更大,而在科學家完整的學術生涯中,被諾貝爾獎認可的研究工作也往往出現在職業生涯的早期。
圖5:研究工作發表的順序(橫軸)與文章影響力(縱軸)的累計分布
從圖中我們確實可以看出獲得諾貝爾的研究論文很有可能出現在研究者研究生涯的早起。但是如果我們考慮到諾貝爾獎頒獎的一個條件:只頒發給在世的學者。以及一個研究者的學術研究可能要經過十幾年才能得到有效的公論。我們會發現這裡存在著選擇效應。如果研究者在晚年做出了重要的工作有可能會被諾貝爾獎排除在外。
就此問題,作者在排除諾獎獲獎論文後重新繪製了上圖,他們得出的結論令人吃驚。
圖6:移去獲得諾獎的論文後,研究工作發表的順序(橫軸)與文章影響力(縱軸)的累計分布
如上圖所示,如果去除了諾貝爾獎帶來的影響,我們發現一位科學家所發表的重要論文(上圖中所示是Top3)其實在其學術生涯中出現的概率是等可能的。換句話說絕對的年齡與優秀的研究成果之間並沒有必然的關係。也許,只有愛因斯坦的奇蹟年發生在他26歲的時候,而對於其他科學家來說,他們的奇蹟年可以出現在其學術生涯中的任何時候。
同樣,我們也知道即便是資質極高學術天才也無法一生都引領著學術界前進的方向,每一名科學家都存在著他的奇蹟年、「熱手期」(hot streak)——一名科學家有影響力的重要論文集中出現的時間段。實際中,從該研究統計的數據來看88%的諾獎工作是在熱手期完成的,這一時間段發表的學術成果獲諾獎的概率是其他時間段發表學術成果的1.4倍。
相關閱讀:
Nature 最新:你的創作高峰即將到來,趕快趁熱打鐵迎接「奇蹟年」!
作者研究就發現,這些獲得諾貝爾獎的科學家的重要研究論文往往是在熱手期內依次接連出現。
圖7:三個學科領域中高影響力論文出現概率相關關係的熱力圖
從圖中我們能夠較為明顯的看到重要研究成果之間的關係。如果打亂論文之間的順序關係,這樣的相關性就會立刻消失。
圖8:在打亂論文發表次序後,三個學科領域中高影響力論文出現概率相關關係的熱力圖(顯然我們無法從圖中看到任何關係)
在熱手期這一現象中,諾獎科學家也確實表現的優於其他的科學家,熱手期的長度是普通科學家的1.93倍。
圖9:諾獎科學家的熱手期持續概率(黃色曲線)與普通科學家(綠色曲線)的對比
誰能摘取璀璨的榮譽桂冠?時至今日我們知道,科研工作者已經不再是某個躲在閣樓裡在危險的邊緣瘋狂試探的「科學怪人」,科研工作往往需要團隊成員的通力合作才能完成。這一趨勢也同樣存在與獲得諾獎的作品中。
圖10:學術論文合作者數量變化趨勢
從圖中我們可以看到,無論是獲得諾貝爾獎的論文還是普通的對照論文,由一名研究者獨立完成的比例大幅減小(深淺兩種綠色所表示的曲線)而合作完成科研工作成為趨勢。
但是諾貝爾獎顯然無法授予每一個人,根據作者的研究發現論文一作獲得諾貝爾獎的可能性更高,而且獲得諾獎的論文也往往是由小團隊撰寫的,該現象同時也支持了2019年Nature文章《Large teams develop and small teams disrupt science and technology》的研究結論:小團隊更容易做出顛覆式創新。
相關閱讀:
Nature 封面文章解讀:團隊規模與顛覆性創新
圖11:獲得諾貝爾獎的研究論文(黃色)與同一時期近似的研究論文(藍色)相比,無論是在團隊規模(左圖)還是在一作比例(右圖)上都存在著明顯的差異。
永恆的學術追求,不變的學術理想獲得諾貝爾獎對與任何一個科學家來說都可謂是極大的榮耀,但這樣的一份榮耀並不一定會像火箭的助推器一般能讓科學家的學術影響得以進一步的發展。而實際上,在一位科學家獲得諾貝爾獎後的兩年內發表的論文影響力反而會下降。
圖12:獲獎前後論文影響力的變化
以獲得諾貝爾獎為時間分界點,與獲獎前幾年相比,獲獎後的兩年內論文的影響力存在著明顯的下降現象,平均降幅為11.1%。對此現象,作者認為:「獲得諾獎後,諾獎獲得者單獨撰寫的論文數量急劇減少,團隊撰寫論文的比例穩步上升,表明在贏得諾貝爾獎之後,團隊合作對於獲獎者的職業生涯變得越來越重要」。
圖13:獲得諾獎前後四年,團隊合作發表論文的比例變化。(黃色是獲獎前,藍色是獲獎後)
此外,該研究也發現有不少的科學家在獲得諾貝爾獎之後,改變了研究方向。以法國化學家讓-馬裡·萊恩(Jean-Marie Lehn)為例,他與美國化學家唐納德·克拉姆和查爾斯·佩德森一道因「發展和使用了可以進行高選擇性結構特異性相互作用的分子」獲得了1987年的諾貝爾化學獎。
圖14:法國化學家讓-馬裡·萊恩(Jean-Marie Lehn)和他的研究主題網絡圖 | 左圖來源:維基百科
在研究主題網絡圖中,每一個節點表示一篇論文;節點間的連邊則表示兩篇論文中存在共同的引用關係。從圖中我們可以看出讓-馬裡·萊恩在七個領域都展開過研究。這些研究並不是讓-馬裡·萊恩在同一時期同步展開的。根據作者的分析,讓-馬裡·萊恩在獲得諾貝爾獎以後,研究方向發生了有趣的變化。
圖15:在1987年讓-馬裡·萊恩獲得諾貝爾獎以後,他的研究主題發生了變化
然而,作者進一步研究發現獲得諾獎後諾獎科學家開展的課題研究並沒有獲獎前的關注度高,獲獎前後新合作者數量、獲得的資助也沒有明顯的區別。值得注意的是,儘管作者發現獲獎後諾獎科學家文章影響力下降這一現象和研究方向轉移都在同一時間發生(被授予諾貝爾獎),但這並不意味著兩者之間存在因果關係。無論如何,這些結果凸顯了諾獎科學家的堅定不移的科學努力,他們積極地尋求新的研究方向,而不受日益增加的職責和責任所帶來的額外負擔的束縛。
我們能找到那些「諾獎預定」科學家麼?
通過前文分析我們發現那些建立了偉大功績的科學家和別的科學家一樣需要與他人合作、也存在著熱手期。但他們往往在年輕時就做出了令人側目的研究成果。我們也會發現有些研究剛剛發表就被以所謂的「諾獎級」來加以形容。拋開媒體炒作、輿論渲染的成份以外,這其實意味著我們可以在一個研究項目的得出成果的早期階段就判斷出該研究團隊的潛在價值和影響力。
本文所提到的研究也許有助於我們去即時地發現科研領域中的無冕之王,而不再是等待著一年一度的學術界春晚——諾貝爾獎頒獎典禮。
參考報導及相關論文:
[1] 諾貝爾獎得主有哪些異於普通科學家的特質?
https://mp.weixin.qq.com/s/md_1UxgjYoJdhIskmBvCmA
[2] Li J, Yin Y, Fortunato S, Wang D. Scientific elite revisited: patterns of productivity, collaboration, authorship and impact. J R Soc Interface 2020, 17.
[3] Li, J., Yin, Y., Fortunato, S. & Wang, D. Nobel laureates are almost the same as us. Nature Reviews Physics 1, 301–303 (2019).
[4] Li, J., Yin, Y., Fortunato, S. & Wang, D. A dataset of publication records for Nobel laureates. Sci Data 6, 33 (2019).
[5] Li, J., Yin, Y., Fortunato, S. & Wang, D. A dataset of publication records for Nobel laureates. Harvard Dataverse, https://doi.org/10.7910/DVN/6NJ5RN (2018).
[6] Liu, L. et al. Hot streaks in artistic, cultural, and scientific careers. Nature 559, 396–399 (2018).
[7] Wu, L., Wang, D. & Evans, J. A. Large teams develop and small teams disrupt science and technology. Nature 566, 378–382 (2019).
作者:Leo
審校:李際超、劉培源
編輯:張希妍
原標題:《獲得諾貝爾獎之後影響力會下降?繪製精英科學家的職業生涯路線圖》
閱讀原文