編譯 | 劉如楠
7月23日,據「DeepTech深科技」微信公號報導,北京大學常務副校長詹啟敏在Pubpeer網站上被指涉嫌25篇論文存在實驗圖像重複、實驗方法存在錯誤等問題。
7月24日,署名詹啟敏的作者在「瀟敏ScienceArt」公號上回應稱,已與論文合作者仔細核實相關文章表述和實驗結果,認真開展討論,目前並未發現數據造假和學術不端情況。
「實驗圖像重複」是論文被質疑的常見問題之一。此前,已有數起論文打假瞄準了生物醫學領域,其中的一個關鍵靶點就是「實驗圖像重複」。
近日,Nature報導了美國計算機學者研發的一款圖像查重軟體,似乎為快速解決這一問題帶來了希望。該軟體在4小時內篩查了3500篇論文,並最終發現了400個可能重複的圖像。
不過,有學者認為,這款軟體的缺點也很明顯,因為圖像重複不一定是錯誤。而且,軟體甚至會將相似的圖像標記為重複。
知名學術打假人Elisabeth Bik評價稱,該軟體「仍需要人工監督,以確保它不會出現標記錯誤」。
新冠論文大篩查:4小時、3500篇論文、2.1萬張圖像
今年6月,雪城大學計算機學者丹尼爾·阿庫納(Daniel Acuna)利用開發的圖像查重軟體,提取和比較了預印本網站bioRxiv和medRxiv上的3500篇論文,共2.1萬張圖像。
Daniel Acuna (圖源:Syracuse University)
這一軟體可批量篩查論文,找出重複圖像,即使經過旋轉、裁剪的圖片也難逃它的法眼。Acuna的公司Resis使用這一軟體為期刊和研究機構提供服務,但目前還未公開使用。
他說,在4個小時內,該軟體就發現了約400個可能存在重複的圖像。不過,Acuna認為大多數都沒有問題。
他選擇了24篇包含「有趣」重複圖片的論文,同時公布在他自己創建的網站和PubPeer上。
這引起了不小的轟動。論文作者們也反應不一。一些作者選擇了承認錯誤並立即改正;一些論文的作者則回答說,有些錯誤在經同行評議的論文版本中已經改正。
芬蘭赫爾辛基大學病毒學家Giuseppe Ballistreri對Acuna所做的工作表示感謝。他寫道:「如果這個軟體的運行結果是準確的,我認為應默認在PubMed中實施。」
幫助出版商篩查造假
目前,期刊審稿大多依賴於作者提交的手稿圖像,進行手動篩查。《歐洲分子生物學學會雜誌》主編Bernd Pulverer介紹說,整個過程很耗時,早就應該進行自動篩查以簡化過程。
Acuna表示,如果期刊編輯採用類似軟體,他們也許能更輕鬆地完成審查工作。
荷蘭出版業巨頭愛思唯爾科研誠信負責人IJsbrand Jan Aalbersberg說,為發現圖像重複使用問題,出版商需要創建一個包含所有已出版圖像的共享資料庫,以便進行比較。
2015年,Acuna及合作者就從當時發表在PubMed生物醫學文獻資料庫開放存取的76萬篇文章中提取了260萬張圖像。他們從中抽取約3750張標記圖像進行手動篩查,並根據結果預測,該資料庫中1.5%的論文包含可疑圖像,而0.6%的論文存在圖像造假。
需要人工調整結果
不過,也有人表示,重複不一定是錯誤。Bik認為,該軟體「需要人工監督。」
Acuna同意她的觀點。他說,該軟體尚無法根據上下文判斷重複圖片是否存在問題,需要人為審查。
「但這仍然是有用的,儘管Bik擅長在論文中查找重複的圖像,但計算機可以通過比較數十萬、數百萬篇論文,來找到兩篇論文中的重複之處,這對人類來說是不可能完成的任務。」Acuna說。
一些研究人員則反映,Acuna的軟體將相似的圖像也標記為重複。同時,軟體無法兼容廣為流行的PDF文件格式,也是一個問題。
後來,Acuna從他的網站中刪除了約1/3的重複文章分析,並將其加密。作者只有從他那裡獲得訪問密鑰,才能看到相關結果。
來自德國海德堡的圖像完整性分析師Jana Christopher說,從更廣泛的意義上講,重複圖像查重軟體過於專注查找重複項,從而忽視了圖像的全貌。例如,兩個被判定為重複的圖像,其實只有很小的重複區域,在其他方面完全不同。Acuna認為,改進細微差別是機器學習進步的關鍵。
圖像分析在持續,造假者要小心
即便該軟體存在諸多問題,但Acuna表示,他將繼續分析COVID-19預印本論文。目前已經分析了5500篇,這個數字還在持續上漲。
他還會將預印本中的圖像與資料庫PubMed中的研究論文進行比較,這可能還會引發其他圖像的重複使用。
「我希望作者能意識到,有人正在做這樣的事情。」他說。
參考資料:
1.https://www.nature.com/articles/d41586-020-02161-3
2.https://www.nature.com/articles/d41586-020-01363-z
3.https://www.nature.com/articles/d41586-018-02421-3
4.https://doi.org/10.1080/08989621.2020.1793675
5.https://ischool.syr.edu/people/directories/view/deacuna/
6. https://acuna.io/
7. https://www.thepaper.cn/newsDetail_forward_8416829
8. https://mp.weixin.qq.com/s/99t2qTQ7L_HguJpTb4mHdw