近日,Nature 雜誌新聞版發布了一篇重磅消息:論文圖片查重軟體研發成功,軟體開發人員在對 3500 篇預印版論文進行的檢測中,找出 24 張涉嫌重複 / 造假的圖像。
這對於論文造假無疑是一記重錘。
瘋狂的論文造假
由於存在巨大的利益,論文造假一直屢見不鮮,甚至在部分國家或地區形成了造假論文產業鏈。
有造假、就有打假;但與龐大的造假數量相比,靠幾個志願者打假,顯然是杯水車薪。
中國是重災區之一
美國 Healsan Consulting LLC 對全球撤稿資料庫的分析顯示,
1、中國 SCI 論文撤稿佔到所有撤稿的 44.0%。
截止到 2020 年 6 月 22 日,世界範圍內共有 23,425 篇 SCI 撤稿,其中中國有 10,303 篇,遠遠高於第二位的美國 4,125 篇。中國論文撤稿佔 44%。
(圖 1. Credit:Healsanconsulting LLC, USA)
2、剽竊仍然是中國 SCI 論文撤稿的首要原因。
近三年中國 SCI 論文共有 1397 篇 SCI 論文撤稿,其中因為剽竊所致的撤稿有 547 篇(39%),另外錯誤所致的撤稿有 330 篇(24%)。
(圖 2. Credit:Healsanconsulting LLC, USA)
圖片查重軟體應運而生
上面數據中提到的佔撤稿原因 39% 的 「抄襲」,主要是指文字抄襲。因為目前的查重系統只能查文字,不能查圖片。
而撤稿第二常見原因 「錯誤」 部分,則主要是圖片 「錯誤」。在目前靠人工檢查的情況下,就已經發現了大量偽造的圖片,可知實際情況多麼嚴重。
所以當論文圖像查重軟體的研發者,美國紐約 Syracuse 大學的機器學習研究人員 Daniel Acuna,遞交了其第一批圖片查重結果時,立即引起學術界的關注。
1、識別原理
其基本原理是,將提取圖片放大以獲得特徵性圖片數字 「指紋」,從而即使圖片做了旋轉、大小調整、截取、改變對比度或顏色,該軟體仍然能夠識別出其相似度。
根據 Acuna 研究團隊之前的檢測結果,他們推測資料庫中 1.5% 論文包含有可疑的圖像,而 0.6% 論文包含有欺詐性圖像。
2、小試牛刀
這款軟體從 2015 年開始研發,歷經 5 年反覆測試、並經過小範圍試用終獲成功。首次正式應用於新冠病毒病(COVID-19)領域預印版論文的識別。因為這個領域論文的爆發程度不亞於病毒傳播,低質量、甚至造假論文也屢見不鮮。
Acuna 研究團隊從 bioRxiv 和 medRxiv 伺服器上下載了 3500 篇論文,總共有 21,000 張圖片。在 4 個小時內,該軟體就找到約 400 張可能重複的圖像。經過人工鑑定後,Acuna 團隊認為,其中的 24 張包含有重複圖片,並在 7 月份將之公布在其網站上。
3、優勢和不足
Acuna 團隊的檢測結果立即引起轟動。
因為是通過軟體自動檢測,可以大規模發現重複的圖像;另外可以發現人工不能識別的圖像。
收到 email 通知後一些論文作者立即回應,承認該軟體找到的是重複圖片,並表示將糾正錯誤。芬蘭赫爾辛基大學病毒學家 Giuseppe Ballistreri 更是建議在 PubMed 資料庫中應用該軟體。
著名學術打假人伊莉莎白?比克(Elisabeth Bik)在讚許之餘,也建議在正式公布軟體識別的造假圖片之前,由她做鑑定。因為該軟體識別出的 「嫌疑圖片」 仍然需要人工確認。
但也有一些收到通知的學者說,Acuna 的軟體搞錯了,標記出來並不匹配的圖像。美國北卡羅來納州的學者則要求 Acuna 刪除其網站公示,因為 Acuna 軟體對其論文圖片做了錯誤識別。
4、進一步處理方法
基於上述反饋,Acuna 已經將其識別出來的 「造假圖片」 由網站公示改為私下訪問。只有從他的 email 通知的學者,才能憑藉給予的密碼進行訪問和回復。
所以設置的 「嫌疑造假圖片」 處理流程也變為:先通知作者,如果作者不回復則將公開。
在初嘗戰果後,Acuna 也計劃擴大軟體篩查範圍。Acuna 特別告誡說:「我希望作者意識到,有人正在對所有的論文圖片進行識別。」