自新冠肺炎疫情暴發以來,全球科學家們正以驚人的速度開展應對這一全球公共衛生危機的相關研究,各國科研人員圍繞病毒研究、疫情防控和疫苗積極開展科研攻關,產生了海量研究成果。
面對讓人眼花繚亂的新冠科研論文,學術君通過 AMiner 學術平臺進行篩選和分析,發現了一些有趣的結論。
論文發表日期:2019 年 12 月 1 日到 2020 年 5 月 17 日。
論文發表來源:Nature 及其子刊、Science 及其子刊、The Lancet 及其子刊、生命科學預印本平臺 Biorxiv、醫學預印本平臺 Medrxiv、化學預印本平臺 Chemrxiv 和中國科學院科技論文預發布平臺 Chinaxiv。
論文篩選關鍵詞:COVID-19、novel coronavirus。
通過 AMiner 學術平臺,我們篩選出 2019 年 12 月 1 日到 2020 年 5 月 17 日期間,發表在以上 7 個期刊及平臺的 4490 篇新冠科研論文。這 4490 篇論文的作者及其所在單位,涉及 141 個國家。
圖1:2019年12月1日到2020年5月17日全球新冠研究論文發表數最多國家top10(美國和中國分別為發表論文數最多
以論文作者所屬第一機構所在國家為統計標準,計算各個國家發表的論文數量,結果顯示,2019 年 12 月 1 日至 2020 年 5 月 17 日,全世界 141 個國家參與發表了關於新冠疫情的論文。其中參與發表論文數量最多的兩個國家為美國和中國,其次分別是英國、德國、加拿大、義大利、法國等。
具體而言,前十論文數量分別為——美國: 1805, 中國: 1116, 英國: 723, 德國: 274, 加拿大: 270, 義大利: 248, 法國: 248, 澳大利亞: 227, 印度: 223, 西班牙: 165。
進一步分析全部發表了新冠論文的國家分布,我們發現:按照五大洲分類,在參與發表過關於新冠肺炎的論文的 141 個國家中,分別有 42 個歐洲國家、37 個非洲國家和 35 個亞洲國家。
其中,英國是發表論文數量最多的歐洲國家、南非是發表論文數量最多的非洲國家、而中國是發表論文數量最多的亞洲國家。中國發表了超過亞洲總發表論文數 50% 的論文,而非洲和歐洲則分布更加均勻。
圖2:2019年12月1日到2020年5月17日亞洲新冠研究論文發表數國家分布
圖3:2019年12月1日到2020年5月17日歐洲新冠研究論文發表數國家分布
圖4:2019年12月1日到2020年5月17日非洲新冠研究論文發表數國家分布
跨國合作論文的定義:以每一篇論文為一項,依照每篇論文的各個作者所屬第一機構所在國家分類,計算不同國家合作發表的論文數量。
圖5:2019年12月1日到2020年5月17日全球新冠研究論文跨國合作情況
通過分析發現,2019 年 12 月 1 日到 2020 年 5 月 17 日全球總共發表關於新冠疫情論文 4490 篇,其中,大約三分之二的論文中僅有一個國家參與發表,也就是說只有三分之一的科研論文是跨國合作發表的。
此外,在所有發表的論文中,參與國家數量最多的論文,作者單位涉及 31 個國家,其次分別為 23 個國家、21 個國家和 19 個國家。
將 2019 年 12 月 1 日到 2020 年 4 月 30 日發表的論文按照月份分類,對全球發表新冠肺炎論文數量的月度變化進行分析。
2019 年 12 月 1 日到 2020 年 5 月 17 日全球總共發表關於新冠疫情論文 4490 篇,其中,2019 年 12 月發表了 129 篇論文、1 月 153 篇、2 月 386 篇、3 月 852 篇、4 月 1748 篇。
結果顯示,全球發表就新冠疫情論文數量逐月增加,且增速顯著。2020 年 1 月較前一年 12 月比發表論文數量增加了 18.6%,而 2 月較一月比發表論文數量增加 152.3%,此後兩個月的論文數量增長比例均高於 100%。
通過剔除生命科學預印本平臺 Biorxiv、醫學預印本平臺 Medrxiv、化學預印本平臺 Chemrxiv 和中國科學院科技論文預發布平臺 Chinaxiv 來源的相關論文,統計出 2019 年 12 月 1 日至 2020 年 5 月 17 日共有 743 篇相關論文發表,作者單位涉及 115 個國家。
其中,發表論文數量最多的國家分別為——美國: 385, 英國: 281, 中國: 130, 德國: 91, 澳大利亞: 91, 加拿大: 85, 法國: 85, 義大利: 76, 瑞士: 71, 荷蘭: 65。
剔除預印本平臺來源的論文後,2019 年 12 月 1 日到 2020 年 5 月 17 日全球總共發表關於新冠疫情論文 743 篇,其中,2019 年 12 月發表了 111 篇論文、1 月 118 篇、2 月 119 篇、3 月 140 篇、4 月 117 篇。
結果顯示,隨著疫情的全球大流行,經同行評議發表的論文數量,一直把持穩定的數量。這也表明,全球新冠相關論文的大爆發,主要來自於 2020 年 3 月之後的預印本平臺。
2020 年 2 月預印本平臺來源的論文數量,是經同行評議發表論文數量的 2.2 倍,3 月是 5.1 倍,4 月是 13.9 倍。
科學家分享他們研究結果的傳統方式,是憑藉同行評議的學術期刊來發表。
一位科學家或是科研團隊在進行科學研究的過程中,將其研究成果總結成文,並發表到涵蓋某些特定研究領域的期刊,對於影響較大的研究成果,也可以選擇 Nature 或 Science 這樣的綜合期刊出版物。
當期刊收到論文後,會將論文的副本寄給同一領域的三位科學家來審閱,這些審稿人將對論文進行高度批判性的審稿,尋找研究方法和分析中的缺陷,以及其它潛在的問題。如果審稿人沒有發現任何問題,論文就會順利通過,並很快發表出來。
但更為常見的情況是,會有一位或多位審稿人發現他們認為存在的異議或不足的地方。每位審稿人都會將他們的想法發給期刊編輯,通常還會給作者傳遞一些問題或建議,這些問題或建議通常需要在編輯接受研究論文發表之前得到解決。
這些問題和建議對論文有時有益,有時不然。相信很多有過科研經驗的研究生、博士們,都經歷過許多徹夜難眠的 &34; 的故事。
雖然這個過程並不完美,而且耗時較長,從論文初稿提交給期刊到最終發表,往往需要幾周甚至幾個月的時間,還需經歷多次修改,但這就是目前最科學、嚴謹、正規的論文發表流程。
事實上,傳統的同行評議發表模式並不新鮮,已經有著數百年的歷史了。在 20 世紀 90 年代的某個時候,物理學界的研究人員決定對其進行改進。
由於在只有兩三個研究生和一個主要研究人員協助的情況下,研究人員無法真正地運行一個大規模的粒子加速器或實驗核反應堆,因此許多物理學家已經習慣於通過大型合作項目一起工作,並與整個團隊交換論文草稿。在進入網際網路時代後,他們創建了 arxiv - repository 這樣的伺服器,來共享尚未經過同行評議和正式發表的研究論文。
逐漸地,這些研究人員不再只是與他們的團隊分享研究成果,轉而開始與整個研究領域的科學家們分享。其他未參與研究工作的科學家可以在研究結果發表前,閱讀這些研究成果,並與其他科學家們和論文作者討論其中的內容,這就產生了 &34; 這一術語。
隨著時間的推移,新一代心懷不滿的生物學家們也對傳統發表過程的僵化表示出了越來越多的不滿,像他們在高能物理學領域的同行一樣,生物醫學研究也逐漸出現了大型的多學科合作項目,於是,在基因組學研究人員的帶領下,像 bioRxiv 和 medRxiv 這樣的預印本伺服器開始在生物醫學領域被創建出來。
預印本的吸引力是顯而易見的。科學家們可以更迅速地傳播他們的研究結果,年輕的研究人員可以向資助機構和招聘委員會表明,他們在等待草稿通過同行評議的同時,正在提高效率,為這個領域做出貢獻。在預印本伺服器上發表自己的研究結果,還意味著研究結果可以被廣泛訪問,而非只有通過付費才能獲得訪問權限。在短短幾年內,在生物醫學研究中使用預印本伺服器的做法已經迅速流行起來。
一項在 2019 年進行的研究顯示,自 2014 年 bioRxiv 創建以來的前五年裡,上傳到 bioRxiv 的論文數量迅速增加,新論文的投稿速度也在快速增長。在這段時間裡,biorXiv 的下載量也有了同樣驚人的增長。
令人鼓舞的是,該研究還發現,在 bioRxiv 創建後的前四年內,發布在 bioRxiv 服務期上的預印本中,有三分之二的論文後來在同行評議的期刊上發表。但是,如果把最近提交的論文也包括在內,這個數字恐怕會低得多,這也清楚地表明,一篇論文的出版需要很長的時間。
在這次大流行期間,醫學領域預印本平臺 medRxiv 和生物學領域預印本平臺 bioRxiv 的地位得到了極大地提升。
RetractionWatch.org 聯合創始人、紐約大學醫學新聞學教授 Oransky 就表示:「預印本機構在新冠病毒相關領域——籠統來講,在生命科學和臨床醫學領域——比以往任何時候都重要得多。在此之前,他們根本就算不了什麼。」
但是,一項真正完整的研究,理論上是需要刊登在可靠科學雜誌上的,而發表的前提,就必須要這項研究經過一個叫做「同行評審」的過程。
約翰霍普金斯大學(Johns Hopkins University)病理科助理教授凱特·格拉博夫斯基(Kate Grabowski)將「同行評審」過程稱為「審核論文的多雙眼睛」。雖然同行評審並不是萬無一失的,但它通常可以綜合在某一特定領域的許多人的專業知識。「我認為這(同行評審)是發現潛在錯誤的重要一環。通常當我們提交論文的時候,它們就像草稿,然後可能會被修改(幾次),直到它們變得更加嚴謹準確,」Grabowski 說:「這個過程是反覆的。然而,預印本論文的大量湧現讓新聞中報導的科學研究,多多少少跳過了同行評審的環節。」
與過去曾發生過的流行性疾病相比,新冠肺炎(COVID-19)疫情存在一個明顯的不同,就是隨著疫情的傳播,科學家們急於將初步研究數據和分析結果放到網上,希望衛生部門能夠從中受益,在此情況下,大量的學術研究論文在未經同行評議之前發布到可公開訪問的伺服器上。
而當未經審核的科學成果直接向公眾公開發表時,可能會引發一些問題。比如這些未經同行評議的文章可能質量參差不齊,而那些希望引起人們關注的預印本文章,在通過同行評議之後可能會做出重大修改,但這對社會決策的嚴重影響可能已經產生。
學術頭條此前曾寫過一篇題為《一些科學家急於將新冠研究發到網上,未經證實的科研成果「帶偏節奏」讀者難以辨別》的文章,以提醒讀者預印本的精靈已經從瓶子裡出來了,我們當客觀辯證地閱讀科研成果。
卡內基梅隆大學道德與政策中心主任、Clara L. West 的倫理學與哲學教授 Alex John London 和麥吉爾大學生物醫學倫理部教授兼主任 Jonathan Kimmelman 也曾在 Science 雜誌網站發表文章,指出在這場 COVID-19 全球大流行中,首批出爐的許多論文都設計得很糟糕,沒有很好的論據,或者報告的方式有失偏頗。在他們之後發表的大量論文重複率很高,有些研究甚至將目的放在如何受到媒體極大可能的關註上,從而增加了研究結果不可靠的風險。
雖然 bioRxiv 和 medRxiv 兩個預印本伺服器的優點顯而易見,研究結果可以快速傳播,可能為政策研究提供信息支撐,可能加速疫苗研發和治療研究的進度,但它們的受歡迎程度,也讓人注意到這些研究所受到的審查過程存在的問題。
毫無疑問,在新冠全球大流行時局緊迫的大環境下,速度至關重要。科學家們正儘快了解這種病毒、這種疾病以及如何防止人們死亡;衛生官員正儘快制定健全的公共衛生措施,避免社會負擔過重或經濟停滯;而記者們正筋疲力盡地試圖儘快報導這一切。同樣,科學家們和記者們也對於這不停加速的一切表示擔憂,因為很多科研報導都並沒有足夠的時間進行驗證。事實上,許多發表出的所謂論文根本不是研究,而是基於數據和調研方法推測得出的主觀結論,而且文章中的相關數據和調研方法描述隱晦,從而加大了驗證難度。
這也讓關於新冠病毒的相關研究都蒙上了一層迷霧。
數據來源:
https://covid-dashboard.aminer.cn/