劉小姐是北京一傳媒集團老總的秘書。她工作的一項內容是驗收員工的培訓心得,但隨之而來的網上搜索讓她不勝其苦。
她說,「每次都有上百篇文章交上來,老總要求每篇都在網上搜索一下,看看是不是抄襲的。有時候,老闆自己也親自搜。」上個月,她查出兩份學習心得是一字不改抄襲來的,老闆很生氣,當即開除了這兩個經營部門的人。
劉小姐覺得,對每篇文章都上網搜索,工作量比較大。而且,遇到剪刀加漿糊式的抄襲,也不好判斷人家是不是抄的,總不能把每段都拆開去搜。她希望能有個軟體來自動完成這個工作,「這樣,得罪人的事兒,就不用我來幹了。」她從新聞上看到大學開始使用「反抄襲」軟體檢測學生論文時,很感興趣,也去網上註冊想要使用這個系統,但至今未獲授權。
與劉小姐一樣想找個「反抄襲」軟體的,還有出版社的編輯嚴燕。她主要編輯文學類小說,「抄名著還好發現,但有些抄襲對象不是有名作品,我也不可能都看過,不好發現,一旦出版之後會很被動。」她也希望有個「反抄襲」軟體幫她篩一下書稿,減輕一下工作量。
目前,國內的反抄襲軟體主要有兩套:一套是由中國學術期刊電子雜誌社與清華同方知網共同研製的學術不端行為檢測系統,另一套是武漢大學副教授瀋陽研發的ROST反剽竊系統軟體。這兩套軟體都只對高等院校和科研單位進行檢測服務,而且免費,但並不對公眾開放。
但記者在淘寶網上發現,用這兩種系統提供檢測服務的店鋪為數不少,而且大多生意不壞。在開發這兩家系統還都免費的時候,已經有人從中賺取了「第一桶金」。
「反抄襲」軟體:一天註冊用戶6000個
今年年初,全國各大高等院校使用「反抄襲」軟體檢測畢業論文的新聞見諸報端,,「反抄襲」軟體隨後一直處在輿論的風口浪尖之上。「現在幾乎天天都有人來找我們,要求授權他們使用『學術不端行為檢測系統』。」中國知網科研誠信管理系統研究中心主任孫雄勇告訴中國青年報記者,「每天大量用戶註冊申請使用,年初最高峰時,一天註冊了6000個用戶。」
孫雄勇說,雖然每天都有大量註冊,但目前開放授權的,基本都是學術科研領域——機構用戶和研究生導師,並且要籤保密協議。因為擔心一旦開放給個人用戶之後,會產生不可預料的後果。
這個「學術不端行為檢測系統」,是世界首個用全文文獻為比對資源檢測抄襲行為的軟體系統,由中國學術期刊電子雜誌社與同方知網公司聯合研發。其耗時3年,2008年12月底研製成功,2009年3月研究生院開始使用。據孫雄勇介紹,到6月底,已有3000家期刊編輯部和360多家高校的研究生院在使用,基本上覆蓋了全國重點院校。
雖然用戶很多,但基本都是免費使用。因為這樣的用戶,都是知網的論文供應商。知網的主營業務是數字出版,主要是通過合法渠道收集論文,再把這些論文整合後打包賣出去,但近年收稿質量開始下降,「用戶經常投訴論文庫中有重複,編輯部也為此頭疼。所以要求公司開發一套系統來檢測。」孫雄勇說。
該系統的技術核心使用了「自適應多階指紋特徵檢測技術」,能夠防止抄襲中的一些方法,比如替換一些詞句、顛倒順序、重組段落等等。「指紋」是這篇文章的信息特徵,簡單的手段改變不了這些特徵。每一次檢測,待檢文章首先按照篇章、段落、句子等層級分層處理,然後創建指紋,而比對資源庫中的比對文獻,也採取同樣技術創建指紋索引,根據其重合處的比例,判斷該論文是否存在抄襲行為。目前,這個系統用做比對的資源庫,是有6000萬條學術文獻的資料庫及上百億網頁的網絡資源庫。
反抄襲需求五花八門
目前,上述系統每天增加的用戶,主要是企業的科研機構和各類科研院所。從用戶反饋看,孫雄勇覺得效果挺好,「基本都是要求增加比對範圍。」
「有個知名出版社試用時檢測了兩部準備出版的書,一部60萬字,一部80萬字。其中一部檢測出,作者大量發表過的文章充斥其間。而編輯約稿時明確要求,不能使用發過的文章。」
「還有來檢測公務員出國考察報告的,一次,檢測出了兩篇考察德國和澳大利亞經濟運行模式的報告,都是抄的。」
今年3月,給各高校研究生院做培訓的時候,有一知名大學的老師提出,應該開發跨語言檢測系統,「有些作者不參考中文材料,而是直接拿英文文章翻譯成中文屬上自己名字。」孫雄勇說,目前正在開發跨語言的檢測系統,已經接近完成,可以有效解決此類問題。
還有各種需求找到知網的,都要使用這套「學術不端行為檢測系統」。包括,有的單位人事處要查職稱論文的,也有導師想查學生作業的,還有要查徵文是否為抄襲的。目前,各種行業的這類需求都非常多。
期間,也有各種聲音在質疑這套系統——除了在校等待畢業學生的很多抱怨外,也有專家質疑這套系統治標不治本。有觀點稱,每年研究生畢業好幾萬人,不可能每篇文章都有新觀點。
孫雄勇也認同這樣的判斷。但他認為,是大家誤解了這套系統的目的——不是檢測創新,只是防止抄襲。沒有新觀點和文章抄襲別人文章是有很大區別的。
「這套系統的定位應該是學術成果的驗收輔助工具。」孫雄勇表示,他們最近曾經幫助科技部做過一次重點科研項目的論文檢測,「結果就很好,只有個別文章有部分雷同,相關專家只需要比對這些部分就可以了。」
檢測不可能永遠免費
反抄襲系統無論多優越,可以反剽竊,但是反不了代寫。在這兩家反抄襲系統推出之後,網上代寫論文的標價應聲而漲,而且都聲稱可以通過反抄襲軟體的測試。
「不能相信他們說的。」在一個代寫論文的廣告帖中,一網友留言說,「收到論文之後,最好到淘寶找個檢測論文店鋪看看能不能通過。」而在這個帖子之前,有兩個跟貼詢問,是否真能通過反抄襲檢測。
截至目前,上述系統已經累計檢測了20萬篇次。由於每天檢測數量比較多,伺服器的運算壓力很大。以後是不是還要免費提供檢測,孫雄勇說,雖然公司目前沒有具體的收費計劃,但也不可能永遠免費下去。
而更廣泛的檢測抄襲,跨越「學術不端」到非學術領域,孫雄勇表示,只要擴大比對庫就可以實現,在技術上沒障礙,「但是否把這個需要當作市場來開發,公司目前還沒計劃。」
據悉,目前國外也有類似的檢測系統,早已廣泛應用於多所高校及科研機構。最受歡迎的是反抄襲服務公司Turnitin.com,能夠將學生的論文與網上所有內容以及該公司的論文資料庫進行比較,從而發現問題。目前Turnitin.com的客戶遍及世界51個國家和地區。包括劍橋和牛津等世界名校在內的英國700所公立大學,幾乎都已同反抄襲服務公司籤約要求提供這項服務。據數據顯示,Turnitin到目前已阻止了世界範圍內將近600萬的學生和教育者的剽竊行為。而在這個網站上進行檢測並不免費,他們是向用戶收費的,使用的學校要交數千到數萬美元不等的服務費。
而以此前估算,國內提供同類服務的系統也有相應的贏利空間,而且國內還有大量非學術和科研用戶等待著他們能使用的反抄襲軟體。