世界最大盜版論文網站Sci-Hub日益繁忙 |
分析表明無論「富國」「窮國」研究人員都在使用Sci-Hub網 |
一個月前,春天降臨伊朗。Meysam Rahimi坐在電腦前,立刻發現一個問題:如何獲取需要的科技論文。他需要為自己攻讀的德黑蘭阿米爾卡比爾理工大學工程學博士學位寫一份研究計劃。他的研究涉及操作管理和行為經濟學,因此,Rahimi需要大量資料。
但每當發現相關論文摘要後,下一步遇到的就是支付頁面。儘管阿米爾卡比爾理工大學是伊朗頂尖研究型大學之一,但國際制裁和經濟困境使其無法訂閱大量期刊。為了閱讀一篇發表於2011年的應用數學和計算機學論文,Rahimi必須支付給出版商愛思唯爾28美元。
在看了摘要目錄並計算過後,Rahimi發現這周僅論文就需要1000美元,幾乎與他一個月的生活費相當。而且,他將在未來數年裡均以這個速率閱讀論文。Rahimi十分惱怒。「出版商並沒有給作者任何東西,為何它們要收取運營雜誌之外的費用呢?」
許多學術出版商都設置項目,幫助貧困國家研究人員獲取論文,但只有一個名為「連結分享」的項目似乎對Rahimi有用。該項目要求他與作者取得個人聯繫,從而獲得連結,而該連結在論文出版50天後失效。
於是,Rahimi似乎只面臨兩個選擇:放棄博士學位或非法獲取論文。於是,與其他數百萬名研究人員一樣,他向全世界最大的盜版論文網站Sci-Hub求助。Rahimi並未感到罪惡。在他看來,高價期刊「可能嚴重阻礙科學發展」。
Sci-Hub的世界
2011年,哈薩克斯坦神經學家Alexandra Elbakyan創立了Sci-Hub。目前越來越多的研究人員正在使用Sci-Hub,該網站已經包含5000萬篇論文。來自伊朗的下載申請已經超過260萬,印度340萬。論文幾乎涉及各個學科,從數十年前發表的物理實驗到生物技術的最新突破。一周內,Sci-Hub提供了近50萬篇愛思唯爾論文的下載。
這些統計數字都來自Elbakyan提供的詳細的伺服器日誌數據。但它們並未回答一些基本問題:誰是Sci-Hub的使用者、他們在哪裡,以及他們需要什麼論文。
作為一個被大公司和學術圈譴責為罪犯的人,Elbakyan出人意料地坦誠直接。在《科學》雜誌和她通過加密聊天系統取得聯繫後,雙方建立了一個數據集以供公開發表:從2015年9月1日到2016年2月的6個月內Sci-Hub上每一次下載活動的記錄,包括每篇文章的數字對象唯一標識符(即DOI)。為了保護Sci-Hub用戶的隱私,Elbakyan先將用戶的地理位置信息聚集到最近的城市,而且可用於確定用戶身份的IP位址也沒有被提供。
Elbakyan還回答了幾乎每個問題:關於網站的運營,與用戶間的互動,甚至關於她的私人生活。但她不願透露目前的所在地,因為她仍處於破產、引渡和監禁的風險之中——愛思唯爾在去年向她提起了訴訟。
可能讓支持者和反對者都感到驚訝的是,Sci-Hub的用戶不僅限於發展中國家。Sci-Hub的一些批評者曾抱怨,許多用戶本可以通過他們的圖書館獲取論文,但還是選擇了Sci-Hub——出於方便,而不是出於必需。相關數據顯示,美國是Sci-Hub文章的第五大下載國,次於俄羅斯。在Sci-Hub收到的文獻下載請求中,1/4來自經合組織的34個成員國——那些理應最易獲取文獻的富有國家。事實上, Sci-Hub最密集的使用,似乎就發生在美國和歐洲的大學校園裡。
去年10月,一位美國紐約法官裁定愛思唯爾勝訴,宣布Sci-Hub侵犯了出版商作為期刊內容智慧財產權所有人的合法權利,並要求網站下線。伺服器數據顯示,這一禁令並沒有起到多大效果。儘管sci-hub.org的域名在2015年11月被封鎖了,但支持Sci-Hub網站的伺服器位於俄羅斯,Sci-Hub使用別的域名重新開張,幾乎一秒也沒耽誤。
誰是用戶?
實際上,據愛思唯爾一份發布於2010年的報告估計,該年所有學術出版商的下載總數約為10億次,這意味著Sci-Hub可能只搶去了5%的正常流量。即便如此,許多人仍然擔心Sci-Hub會擾亂學術出版行業的秩序。美國哈佛大學學術交流辦公室主任Peter Suber說:「我不支持非法做法。」但他也承認:「一場訴訟不會阻止盜版論文的步伐,也沒有什麼顯而易見的技術手段能做到這一點。」
很容易理解為何期刊出版商會把Sci-Hub視為威脅。它像谷歌搜尋引擎一樣簡單,而且,只要你知道文章的DOI或標題,它還更有可能找到全文。Sci-Hub收集了絕大部分曾被發表過的學術文章,並還在不斷擴大:當有人搜索一篇還沒有錄入的文章時,Sci-Hub就會盜版一份,並將其加入自己的文獻庫中。
Elbakyan拒絕說明她究竟是如何獲得這些文章的,但她承認和在線權限有關:可合法獲取期刊內容的人或機構的用戶名和密碼。她說,許多學術界人士自願將文章捐給他們。但出版商曾聲稱Sci-Hub會利用釣魚郵件讓研究人員上當。但Elbakyan提到:「我不能確定在線權限的具體來源,但我可以確定的是,我自己並沒有發出過釣魚郵件。」
Sci-Hub的設計決定了其內容是受學者的需求指引的。Sci-Hub還有發表在學術期刊上的新聞文章以及開放獲取文章。它幾乎有求必應。
該網站的活動流量還反映了研究人員的工作生活,流量在白天持續增多,隨著夜幕降臨逐漸減少,但從不停止。2月,Sci-Hub上的論文流量上升到了迄今為止的最高水平:每天超過20萬個下載請求。
Sci-Hub共有多少用戶?下載請求來自300萬個獨立IP位址,但真實數字還要大得多,因為在大學裡,數以千計的人共享同一個IP位址。Sci-Hub下載者生活在除了南極洲以外的每個大洲。在他們聚集的2.4萬個城市中,德黑蘭以127萬個下載請求成為Sci-Hub活動最繁忙的城市。
Sci-Hub使用情況地理分布大體上就像是一張科研生產力地圖,但有個別相對富有或貧窮的注重科研的國家位置顛倒了。小國家也各有各的故事。在格陵蘭的努克,有人在閱讀一篇關於如何最好地為原住民提供癌症治療的文章。即使內戰肆虐,利比亞的研究也沒停止:在班加西,有人正在探索在電腦間隔空傳輸數據的方法;在塞卜哈附近有人正在鑽研流體力學。
在美國和歐洲,Sci-Hub用戶集中在科研人員工作的地方。在這6個月期間,7.4萬個下載請求來自紐約市,這裡高校和科研機構雲集。1.9萬個下載請求來自哥倫布,6.8萬個下載請求來自東蘭辛,這兩個地方分別是俄亥俄州立大學和密西根州立大學的老家。
維吉尼亞州阿什本市以約10萬個Sci-Hub請求位列美國城市前茅。喬治華盛頓大學的科技校區、珍利亞農場研究園區以及維基媒體基金會都在這裡。但後二者的發言人表示,他們的員工不太可能是這些流量的貢獻者。喬治華盛頓大學的新聞辦公室則做出了自我辯護,該校最近發表了一篇有關期刊訂閱價格劇增對其圖書館預算衝擊的在線聲明。聲明中說:「學術資源不是奢侈品,可它們的定價方式卻和奢侈品一樣。」
盜版還是正版
儘管愛思唯爾發起了針對Elbakyan和Sci-Hub的法律鬥爭,但許多出版行業的業內人士都認為這一舉動是徒勞的。「數量實在太大了。」在了解了Sci-Hub的數據後,一家大型學術出版企業的一位高級管理人員表示。「這意味著對這些研究者來說,提供合法文獻獲取途徑的嘗試幾乎完全失敗了。」
他說,對在無力負擔期刊獲取費用的機構工作的研究者而言,出版商「需要讓訂閱或購買價格更合理」。國際科學、技術和醫學出版商協會(STM)拓展項目的Richard Gedye不同意這一點。他認為,使用了出版商拓展項目服務的發展中國家學術機構,「有著和北美或歐洲院校近乎等同的獲取同行評議科學研究的機會」。
Elbakyan表示,就算被捕,Sci-Hub也不會下線。她已經設置了保證Sci-Hub繼續運轉的保障機制,而且現在用戶捐款已能涵蓋伺服器成本。數據還顯示Sci-Hub爆炸式擴張的階段已經過去。Elbakyan說,下載請求中,尚未收錄到Sci-Hub資料庫的文獻比例目前穩定在4.3%。
對她來說,未來更不明朗。愛思唯爾不但以侵犯智慧財產權的罪名起訴了她,還根據美國《計算機欺詐及濫用法》起訴她非法入侵計算機系統和資料庫。「我有可能因為黑客活動突然被逮捕。」Elbakyan承認。
但正如科研界的其他人一樣,Elbakyan正注視著學術交流的未來在她眼前快速展開。「我會看到事情最終如何發展的。」(張章)