《科學引文索引》(SCIence Citation Index,簡稱SCI)是影響世界科學界幾十年的指揮棒,在中國更是評判科研成果的核心指標,成為「信仰級」的指標。國內對SCI的通行評價是: SCI(科學引文索引)、EI(工程索引)、ISTP(科技會議錄索引)是世界著名的三大科技文獻檢索系統,是國際公認的進行科學統計與科學評價的主要檢索工具,其中以 SCI 最為重要。可見SCI在中國科學界的崇高地位。
千千萬萬個中國科研人員、大學教師和專業人士殫精竭慮、皓首窮經,夢想在核心期刊多發文章,結果成為SCI影響因子的「奴隸」。在今年新冠疫情之中,國內學者爭相在海外發表論文,再度引發社會各界對專業人士追逐SCI的討論和懷疑。上海交通大學的江曉原與穆蘊秋所做的研究和歷史梳理,揭示了SCI與影響因子遊戲中的問題。
SCI於1957 年由美國科學信息研究所(Institute for Scientific Information, 簡稱 ISI)在美國費城創辦。SCI創辦人尤金•加菲爾德(Eugene Garfield,1925-2017年)是一位善於玩弄信息的高手。ISI這家聽起來就很像政府科學機構的「研究所」,其實是一家地道的商業公司——ISI曾用名「尤金•加菲爾德學會」,1960年才改為目前的名字,而1992年起又被湯森路透收購至旗下。其創始人加菲爾德曾坦率地承認,以科學信息研究所(ISI)來命名公司,希望的就是這種魚目混珠的效果。
但是,SCI與影響因子本身存在不少的問題。
國內對影響因子的具體計算方法,長期存在誤讀。影響因子的算法如下:「N年度期刊的影響因子=該刊物[(N-1)+(N-2)]年所有源刊文本在第N年度的引用總數/該刊物[(N-1)+(N-2)]年發表的引用項總數」。而國內對此存在普遍誤讀,將「引用項總數」直接替換成了「發表論文數」。國外期刊採取了多種方式來「做高」影響因子,具體思路可以分為兩種:降低分母、擴大分子,ISI並沒有針對這種「數據操縱」做出過系統性、機制性修正。
操縱分母,降低引用項數量,是推高影響因子的第一種思路,主要操作則分兩類。一是稀釋內容、二是直接協商。稀釋內容方面,可以加入大量非學術文本,變「學術」期刊為兩棲期刊。以Nature為例,其每期刊文中有18個欄目,但只有3個欄目屬於學術文本。據SCI資料庫統計,其學術內容僅佔全刊1/3,《柳葉刀》也是如此,其學術內容僅佔1/4-1/5。2007年《皇家醫學會雜誌》曾發表一項研究,發現在1994-2005年間,《內科學年鑑》、《美國醫學會雜誌》、《新英格蘭醫學雜誌》等著名醫學期刊,學術文本數量都在逐年大幅下降,而影響因子則步步高升。
直接協商的方式更加不透明。《柳葉刀》2000年原本計入引用項的數量為821,而經過與ISI「溝通」之後,「糾正」為了684項;而另一著名醫學期刊,美國《公共科學圖書館醫學雜誌》(PLOS Medicine)曾在2006年披露,雜誌2005年首次被SCI收錄時,曾嘗試對ISI展開說服工作,試圖少算分母。PLOS Medicine的分母項如果只算「原創論文」,影響因子為11;如果包含所有文本,影響因子則為3。從其2005年被定位到8的影響因子來看,說服產生了一定效果。雖然每年的JCR都會公布影響因子公式,不過像「分母數值如何計算」等細節,ISI與湯森路透從未公布過。
即使分母不變,也可以用不少的方式來拉高分子。分子的操縱方式相比分母,更是「八仙過海,各顯神通」。
第一種是刊登綜述。由於目前國際上通行的學術論文寫作框架中,要求有一個幾乎固定的「前人工作概述」部分,而在寫這部分時,少不了查引綜述文章,這也就使得綜述成為了引用數字的常青樹。通過玩綜述,使得不少期刊獲得了超高影響因子,比如1950年創刊的《臨床醫師癌症雜誌》(CA: A Cancer Journal for Clinicians)影響因子高達187,已連續12年蟬聯第一,是排名第二的兩倍有餘,Nature的4倍不止。其高引用的來源,主要歸功於兩種報告:逐年發布的《癌症統計報告》和不定期發表的《全球癌症統計報告》。據統計,兩種報告對刊物影響因子的貢獻始終超過70%。
第二種是自引與互引,即期刊文章引用同一期刊之前所發文章,或者數種期刊大規模相互引用。再疊加上綜述,效果會更加奇妙:2008年的「妖刊」《晶體學報A》,由於刊登的一篇《SHELX簡史》,使得其原來僅有2.0的影響因子突然飆升到2009年的49.9,2010年又上漲到54.3,而過了兩年的計算引用時間後,2011年,刊物的影響因子又掉回了2.0。另外,《SHELX簡史》73.6%的引用來自於《晶體學報A》的四個姊妹刊,也就是說,同一家所屬期刊之間的互引,造就了《晶體學報A》影響因子的暴漲神話。
第三種,則歸因於期刊中的非學術內容。非學術內容會對雜誌中學術文章的引用產生正面影響。據相關對比研究發現,《紐約時報》對《新英格蘭醫學雜誌》論文的全文轉載,提升了論文的關注度,也增加了其SCI引用次數,這意味著《紐約時報》對學術傳播有著非常明顯的放大作用。Nature的品牌策略類似:自1869年創刊至今,其從未放棄對通俗科普文本的經營,正是這些通俗文本,造就了其巨大的知名度,這也使得如果在Nature上發表論文,會因為刊物的公眾知名度,獲得不少額外引用。
值得注意的是,在影響因子的背後,早就形成了一門巨大的生意。雖然目前ISI的盈利規模由於涉及商業機密,很難獲得公開數據,但是以一所國內985院校為例,該校目前訂閱ISI的7種信息產品,每年支付超過200萬人民幣。如果推及全中國、全世界的高校,生意規模不小。另外,ISI於1992年就有了30萬客戶,就不難想像其盈利之巨了。另據《科學美國人》在1995年的一篇文章中就曾披露,墨西哥一家期刊為了能夠收錄進SCI,每年被要求花10萬美元訂閱ISI產品。
對於國內科學界的「唯SCI」與影響因子現象,中國政府進行了一定的幹預。2020年2月20日,教育部、科技部印發了《關於規範高等學校SCI論文相關指標使用、樹立正確評價導向的若干意見》,使得SCI與學術評價問題在學術界再次成為焦點。中國政府希望想建立的新的學術評價體系,來替代「唯SCI」和影響因子的學術導向。
最終分析結論(Final Analysis Conclusion):
長期影響中國科學界的SCI及影響因子是一個信仰級的神話,但這個包含很多問題的神話,到了該打破的時候了。