反剽竊軟體向論文欺詐者宣戰

2020-12-04 中國科學院

    論文剽竊究竟到了什麼程度現在還無法估計,但是,有疑問的投稿論文數量卻在日益上升,迫使期刊的編輯們採取措施向欺詐者宣戰。

    對付論文剽竊者的戰鬥到了一個決定性的時刻。學術出版商告訴《自然》雜誌說,他們希望專門用於防止學生作假的軟體能很快用於學術論文的審稿中,以揭開剽竊其他研究人員或重複自己研究成果的學者的真面目。

    總部位於荷蘭的Elsevier公司和總部位於英國牛津的Blackwell公司是學術界的兩大出版集團,一共出版了2500多種期刊。因為剽竊正在變成一種普遍情況,兩個集團被迫採取行動。Blackwell的總裁Bob Campbell說:「編輯們越來越頻繁地向我們抱怨這類事情」。

    自我剽竊是指作者將自己已發表的文章內容又冒充成新的內容,這是一種特別的剽竊方式。因為發表論文的記錄對職務任命、晉升和經費申請的影響非常之大,所以研究人員有巨大的壓力需要發表文章,而這時少數人選擇用不誠實的方式來提升自己的履歷。

    剽竊的程度究竟有多嚴重還很難估計。對剽竊進行定義也不是一件容易的事,即使是對情況很清楚的案例發生率進行統計也是很困難的。對某一領域的研究估計,該領域所發表的20%的論文有某種程度的自我剽竊。

    儘管絕大多數的剽竊現象沒有被發現,但幾乎所有接受《自然》雜誌採訪的編輯和出版人都認可這一現象:自我剽竊的案例日益增加。

    類似於美國大學用於檢查學生文章是否作假的軟體——反剽竊軟體的出現,意味著編輯和出版人終於有了一種切實可行的方法來處理這類問題。大學所用的在線服務軟體將論文與大量的文獻資料庫和媒體接口的內容進行比較。管理者可以了解文章中的哪些部分可能是剽竊的、被剽竊的內容來自何處。

    出版界的專家說,將這種技術用於學術論文的檢查並不難,可以將這種軟體在線捆綁到出版人使用的同行評審管理軟體中。這一系統可以在背後工作,當發現重疊到了可疑的程度時,它會發出警告提醒編輯的注意,類似於計算機殺毒軟體的工作原理,這時編輯就會進行仔細的檢查。Campbell說:「我們認為這是一個具有非凡潛力的主意。」

    Arxiv是位於美國康奈爾大學的物理學預印文本庫伺服器。在文獻庫中發現了22篇剽竊論文後,負責Arxiv運行的物理學家Paul Ginsparg決定採取行動:給它安裝上剽竊探測軟體。

    初試牛刀

    Daria Sorokina是康奈爾大學的一名計算機博士生,他對一種已有的算法進行了修改,從而讓這種程序能夠查找一行文字中至少有6個相同單詞的兩份文件。Ginsparg說,這個系統發現了相當多的可怕事情。一次試驗性的運行發現:一篇博士論文的絕大部分與3年前貼在這個文獻庫中的一篇論文是相同的。對該系統後來的試驗還發現,兩篇文章作者不同但內容過分重疊的情況至少出現了有幾千次。

    Ginsparg計劃將凡是內容有過多重疊的兩篇文章都放在Arxiv的網站上,他沒有譴責有不當行為的作者,但要求涉及事件的研究人員做出回應。他希望結果有助於改善這套系統,該系統將用於對新遞交的論文進行檢查,如果論文中有明顯的重疊,它會向編輯發出警告。

    現有的工具正越來越適合於編輯和個人使用。其中一個新的軟體工具是美國亞利桑那州大學的計算機科學家Christian Collberg開發的。2003年,Collberg應邀為一個學術會議評審論文,為了對這篇文章進行研究,他到Google搜索網站去查找資料。他回憶說:「我發現這篇論文與早期發表的一篇文章相比,僅僅只是版式不同而已。」他繼續為這個會議評審論文,他發現一篇論文的大部分內容都是對作者本人早期已發表工作的複製。他說:「這讓我感到極為厭惡,我開始花時間來研究這些論文。」

    論文複印機

    Collberg開始研製可檢查自我剽竊的軟體,這套軟體後來被稱為「自我剽竊偵查工具」(SPlaT)。也許SPlaT還需要經過數年的時間才能為出版人所用,但編輯和審稿人現在已經可以免費使用Collberg的軟體了。

    SPlaT從作者的網站上獲取論文並將它們彼此對比,或與所遞交的論文和正在接受評審的論文進行對比。Collberg拒絕透露將SPlaT安裝在50個計算機系統上的細節,但他在上個月公布的結果摘要顯示:在會議所發表的論文中,SPlaT發現內容重疊超過50%的論文不止兩篇。

    「反學生剽竊服務」是另外一種選擇。這種程序使得檢查自我剽竊成為可能。發行商業版剽竊追蹤工具iThenticate 的公司說,目前有5000多個機構批准使用這一產品,這個軟體能夠將可疑的重疊部分與其資料庫中70億頁的文章進行對比。因為它的收藏部分來自於「網絡捕手」,所以iThenticate含有作者自己的網站和部分免費進入的期刊。如果一所大學訂購這種服務,跟蹤學生的欺詐行為,那麼大學中的研究人員在評審論文時也可以使用它。

    當《自然》雜誌在測試iThenticate時,它清楚地鑑別出合理地出現在不同地方的相同內容,比如作者的網站和參加文獻指引。但是,當一篇已知的剽竊論文被遞交給iThenticate時,它卻未能找出原始文獻,即使這篇原始論文發表在一份具有影響因子的期刊上。

    Campbell說,如果出版集團願意在商業化偵查系統方面合作,那麼就有可能出現全面解決剽竊問題的方案。CrossRef公司曾經討論過這個問題,該公司正與多家出版集團合作,開發研究人員能夠搜索不同公司所出版期刊的軟體。

    儘管建立這樣的系統至少需要幾年的時間,但理論上,這種系統能夠發現幾乎所有的直接剽竊者。與此同時,編輯們說,當少數研究人員不誠實地增加自己的論文數目時,剽竊論文的數目就會持續上升。一位向《自然》雜誌投稿的作者承認,自己有時也會忽略提及與新發表論文有重疊的情況,因為他知道,「院長不會讀論文,但他會數論文」。

相關焦點

  • 反剽竊軟體調查:72%的論文是全文抄襲
    【IT168 軟體資訊】全國學術期刊一年只能發表論文248萬篇,而背有論文發表指標的人數達到1180萬。武漢大學信息管理學院副教授瀋陽昨日披露,濫下論文指示,導致了買賣論文與非法學術期刊等種種亂象。  瀋陽和他的團隊開展了3年多的買賣論文與非法學術期刊專題研究。
  • 各式各樣剽竊刺激「反抄襲」軟體市場?
    她也希望有個「反抄襲」軟體幫她篩一下書稿,減輕一下工作量。    目前,國內的反抄襲軟體主要有兩套:一套是由中國學術期刊電子雜誌社與清華同方知網共同研製的學術不端行為檢測系統,另一套是武漢大學副教授瀋陽研發的ROST反剽竊系統軟體。這兩套軟體都只對高等院校和科研單位進行檢測服務,而且免費,但並不對公眾開放。
  • 海南高校啟用學術反剽竊軟體 論文抄襲一查就知
    海南高校啟用學術反剽竊軟體 論文抄襲一查就知   又一屆高校畢業生開始為寫論文忙活了,據了解,海南大學等高校現已陸續引進「學術不端行為檢測系統」,對參加答辯的碩士、博士的學位論文進行檢測。
  • 武漢大學論文反抄襲軟體遭學生破解
    學生們總結出「漢英互譯」等四招;軟體發明人瀋陽建議取消非研究性的本科生論文  「反抄襲軟體沒用了,我目前還沒有好的辦法。非研究性的本科生論文乾脆取消。」武大信息管理學院副教授瀋陽直呼無奈。歷時6年,瀋陽研究出「ROST反剽竊系統」,意圖遏制學術不端行為。
  • 英國高校大討論:反抄襲軟體是否該開放
    最近,一個軟體是否應向學生開放在英國高校間引起了討論。這個軟體就是檢測作品是否有抄襲行為的「Turnitin」,絕大部分英國高校都是這個軟體的客戶。學生在網上提交的論文都會被這個軟體篩查,但並非文章一旦被軟體警示為有高文義相似率,就被斷定為剽竊。一般情況下,老師都會通過人工查看文獻標註情況來判斷其作者抄襲與否。
  • 高校:我們有論文反抄襲系統
    這兩年,河南不少高校啟用了論文檢測反抄襲系統,防止學生論文「剽竊」。一旦查出後,將影響論文答辯。  道高一尺魔高一丈,一項名為「論文反反抄襲檢測」的服務在網上受熱捧,系統可提前檢測出論文哪些部分涉嫌抄襲,「保證不被查出問題」。
  • "論文測謊儀"登場 "反抄襲"軟體遭遇"反反抄襲"
    與小羅的干著急不同,越來越多的學生已經開動了「腦筋」:畢竟從小就在應試教育中摸爬滾打,大家早就練就了一身超頑強的反偵察功夫,「上有政策,下有對策」,為了對付「反抄襲」軟體,大學生想出了五花八門的「反反抄襲」招術。  「反反抄襲」招數一:改寫  張心彤是北京某重點文科類院校的大四畢業生。
  • 學術不端大討論:自我抄襲算不算剽竊
  • 大學導師剽竊畢業生論文並發表,複製比高達90%,法律上怎麼處理
    畢業季即將到來,大四應屆畢業生們都在認真焦急地準備畢業論文答辯。而如今信息社會通訊發達便利,越來越多的人想藉助網絡,輕而易舉抄寫論文,順利通過畢業論文答辯,甚至想藉此機會獲得想要的榮譽或權利。近日,據微博網友爆料,河南鄭州中原工學院信息商務學院一畢業生在微博實名舉報其導師剽竊她的畢業論文,並且未經允許發表到期刊上,複製比竟達到90%。
  • 用別人觀點寫論文算學術剽竊嗎?
    我們在寫學術論文的時候,時刻要對涉及剽竊的部分謹小慎微,該引用的部分一定要規範註明,然而有一種剽竊行為很少被大家提及,但就嚴重程度絲毫不亞於其他類型的剽竊行為,這就是對他人想法、方法、概念的剽竊,即便將這些想法換一種表述依然屬於剽竊行為。
  • 澳大學將引進分析軟體鑑別代寫論文
    【新華社微特稿】代寫論文等作弊行為在澳大利亞的大學中並不罕見。為打擊這種行為,澳大利亞多所大學計劃在今年內引進高技術分析軟體鑑別代寫,屆時,可能一個標點符號就會讓作弊行為曝光。軟體名為「作者調查」,由美國Turnitin公司推出,其工作模式類似法醫語言學家,可以幫助確認構成個人獨特寫作風格的70個不同因素。這些因素包括逗號、括號、破折號的使用以及作者如何舉例、是否會在句號後留兩個空格。軟體還會計算論文的可讀性評分,並與學生先前提交的論文進行比對。
  • "反學術剽竊"成考題 "論文檢測系統"專防抄襲
    記者了解到,不久前山東省教育廳剛剛出臺了《關於加強高等學校學風建設淨化學術環境的意見》,在17日舉行的省屬事業單位考試試題的最後一個寫作題就是要求就目前存在的學術剽竊、造假等學術不端行為寫一篇反駁「天下文章一大抄」的議論文。  記者從多所駐青高校了解到,由於近來國內接連出現一些學校的教授抄襲論文的情況,作為學術研究的重要機構,目前島城各大高校對論文抄襲現象抓得很嚴。
  • 反剽竊公益基金是否可行?專家:最核心的是公益初心
    何國科向《華夏時報》記者表示,成立反剽竊公益基金最核心的是公益的初心,成立反剽竊公益基金的目的要純粹,不是為了炒作,希望不要拿公益作為遮羞布。夏彧歆則強調,公益,既是一種行為,也是一個行業,更是一份事業。既然選擇投身其中,就要認真對待、履行承諾、負起責任,不能只是一時走走過場、敷衍了事。要確定初心,依法設立,規範運營,積極行事,回報社會,接受監督。
  • 論文防抄襲檢測軟體走俏 教授:取消本科畢業論文
    論文防抄襲檢測軟體走俏 教授:取消本科畢業論文  據中國之聲《新聞縱橫》報導,再有一個月就到了畢業季,目前這個階段有很多的畢業生都在準備論文。為了規範論文管理,提高畢業論文的質量,避免抄襲剽竊,「論文查重」也就是通過軟體來檢測抄襲率,已經成為學校論文檢查審查的重要一環。教育部出臺的「學位論文作假行為處理辦法」於去年1月實施,其中就規定,論文查重率高者,將會面臨取消學位申請資格、註銷學位證書、開除學籍等處分。
  • 國家版權局支持用郭敬明賠償成立「反剽竊基金」
    1月4日,莊羽通過個人社交媒體帳號公布備受關注的「反剽竊基金」的進展情況,表示自己多年前創作的小說《圈裡圈外》的出版收益核算已接近尾聲。本著公開透明的原則,後續進展會定期向大家公布。1月7日,中國文字著作權協會總幹事張洪波向北青-北京頭條記者表示,他已跟莊羽女士取得聯繫,希望以文著協為主體,成立「反剽竊基金」。
  • 如何選擇論文查重軟體
    作者:新風學術網又到了畢業季,畢業一定少不了的就是論文。不同的學校對論文的查重是有要求的,大多數學校的要求都是在百分之三十,極少數學校的查重會高於或低於百分之三十。那麼我們自己寫的論文到底查重在多少呢?這需要通過專業的查重軟體去做檢測。
  • 論文反抄襲軟體「變味」 你有軟體我有攻略
    又到一年博碩士學位論文寫作的緊張時段,截至今年,廣東高校導入論文反抄襲軟體已經進入第三年。然而,記者在一周來的調查採訪中發現,論文反抄襲軟體在不斷成熟的使用過程中已經悄然「變了味」,從最初的單純高科技檢測工具,異化出了了某些佔據資源人士的「賺錢機器」、投機取巧人士的「投機工具」和反反抄襲攻關對象等多個身份。
  • 高校畢業生網檢論文雷同率 反抄襲檢測並不可信
    4月是全國高校畢業生論文答辯的高峰期。為了嚴把質量關,不少大學規定,對申請畢業答辯的碩士、博士研究生畢業論文進行反抄襲檢測。為此,這些高校引進了「學位論文學術不端行為檢測系統」作為檢測手段。近日,有網友反映,為了通過論文檢測,不少學生花錢「自檢」,網上甚至形成了反「論文反抄襲」的檢測市場。網上論文檢測軟體從哪裡來?
  • 知網論文修改秘訣
    「 ROST反剽竊系統」與其他系統最大的不同之處在於覆蓋了188億個網頁以及490萬篇論文。自ROST反剽竊系統2008年4月推出以來, 先後在武漢大學信息管理學院研究生辦公室、CSSCI核心期刊《出版科學》、《圖書情報知識》試用, 在2008年11月舉辦的第二屆數字時代出版產業發展與人才培養國際學術研討會對會議論文進行全面檢測, 並在2008年12月的第三屆中國期刊創新年會向全國期刊界做了全面推介, 取得了良好的效果。
  • 論文反抄襲軟體「變味」:你有軟體我有攻略(圖)
    又到一年博碩士學位論文寫作的緊張時段,截至今年,廣東高校導入論文反抄襲軟體已經進入第三年。然而,記者在一周來的調查採訪中發現,論文反抄襲軟體在不斷成熟的使用過程中已經悄然「變了味」,從最初的單純高科技檢測工具,異化出了了某些佔據資源人士的「賺錢機器」、投機取巧人士的「投機工具」和反反抄襲攻關對象等多個身份。