打假神器來了?AI圖像查重4小時篩查3500篇論文

2021-02-18 科學網

編譯 | 劉如楠


7月23日,據「DeepTech深科技」微信公號報導,北京大學常務副校長詹啟敏在Pubpeer網站上被指涉嫌25篇論文存在實驗圖像重複、實驗方法存在錯誤等問題。

7月24日,署名詹啟敏的作者在「瀟敏ScienceArt」公號上回應稱,已與論文合作者仔細核實相關文章表述和實驗結果,認真開展討論,目前並未發現數據造假和學術不端情況。

「實驗圖像重複」是論文被質疑的常見問題之一。此前,已有數起論文打假瞄準了生物醫學領域,其中的一個關鍵靶點就是「實驗圖像重複」。

近日,Nature報導了美國計算機學者研發的一款圖像查重軟體,似乎為快速解決這一問題帶來了希望。該軟體在4小時內篩查了3500篇論文,並最終發現了400個可能重複的圖像。

不過,有學者認為,這款軟體的缺點也很明顯,因為圖像重複不一定是錯誤。而且,軟體甚至會將相似的圖像標記為重複。

知名學術打假人Elisabeth Bik評價稱,該軟體「仍需要人工監督,以確保它不會出現標記錯誤」。

新冠論文大篩查:4小時、3500篇論文、2.1萬張圖像

今年6月,雪城大學計算機學者丹尼爾·阿庫納(Daniel Acuna)利用開發的圖像查重軟體,提取和比較了預印本網站bioRxiv和medRxiv上的3500篇論文,共2.1萬張圖像。

Daniel Acuna (圖源:Syracuse University)

這一軟體可批量篩查論文,找出重複圖像,即使經過旋轉、裁剪的圖片也難逃它的法眼。Acuna的公司Resis使用這一軟體為期刊和研究機構提供服務,但目前還未公開使用。

他說,在4個小時內,該軟體就發現了約400個可能存在重複的圖像。不過,Acuna認為大多數都沒有問題。

他選擇了24篇包含「有趣」重複圖片的論文,同時公布在他自己創建的網站和PubPeer上。

這引起了不小的轟動。論文作者們也反應不一。一些作者選擇了承認錯誤並立即改正;一些論文的作者則回答說,有些錯誤在經同行評議的論文版本中已經改正。

芬蘭赫爾辛基大學病毒學家Giuseppe Ballistreri對Acuna所做的工作表示感謝。他寫道:「如果這個軟體的運行結果是準確的,我認為應默認在PubMed中實施。」

目前,期刊審稿大多依賴於作者提交的手稿圖像,進行手動篩查。《歐洲分子生物學學會雜誌》主編Bernd Pulverer介紹說,整個過程很耗時,早就應該進行自動篩查以簡化過程。

Acuna表示,如果期刊編輯採用類似軟體,他們也許能更輕鬆地完成審查工作。

荷蘭出版業巨頭愛思唯爾科研誠信負責人IJsbrand Jan Aalbersberg說,為發現圖像重複使用問題,出版商需要創建一個包含所有已出版圖像的共享資料庫,以便進行比較。

2015年,Acuna及合作者就從當時發表在PubMed生物醫學文獻資料庫開放存取的76萬篇文章中提取了260萬張圖像。他們從中抽取約3750張標記圖像進行手動篩查,並根據結果預測,該資料庫中1.5%的論文包含可疑圖像,而0.6%的論文存在圖像造假。

不過,也有人表示,重複不一定是錯誤。Bik認為,該軟體「需要人工監督。」

Acuna同意她的觀點。他說,該軟體尚無法根據上下文判斷重複圖片是否存在問題,需要人為審查。

「但這仍然是有用的,儘管Bik擅長在論文中查找重複的圖像,但計算機可以通過比較數十萬、數百萬篇論文,來找到兩篇論文中的重複之處,這對人類來說是不可能完成的任務。」Acuna說。

一些研究人員則反映,Acuna的軟體將相似的圖像也標記為重複。同時,軟體無法兼容廣為流行的PDF文件格式,也是一個問題。

後來,Acuna從他的網站中刪除了約1/3的重複文章分析,並將其加密。作者只有從他那裡獲得訪問密鑰,才能看到相關結果。

來自德國海德堡的圖像完整性分析師Jana Christopher說,從更廣泛的意義上講,重複圖像查重軟體過於專注查找重複項,從而忽視了圖像的全貌。例如,兩個被判定為重複的圖像,其實只有很小的重複區域,在其他方面完全不同。Acuna認為,改進細微差別是機器學習進步的關鍵。

即便該軟體存在諸多問題,但Acuna表示,他將繼續分析COVID-19預印本論文。目前已經分析了5500篇,這個數字還在持續上漲。

他還會將預印本中的圖像與資料庫PubMed中的研究論文進行比較,這可能還會引發其他圖像的重複使用。

「我希望作者能意識到,有人正在做這樣的事情。」他說。

 

1.https://www.nature.com/articles/d41586-020-02161-3

2.https://www.nature.com/articles/d41586-020-01363-z

3.https://www.nature.com/articles/d41586-018-02421-3

4.https://doi.org/10.1080/08989621.2020.1793675

5.https://ischool.syr.edu/people/directories/view/deacuna/

6. https://acuna.io/

7. https://www.thepaper.cn/newsDetail_forward_8416829

8. https://mp.weixin.qq.com/s/99t2qTQ7L_HguJpTb4mHdw

編輯 | 袁小華

排版 | 華    園

不想錯過科學網的推送?

關注並將我們星標吧!

方法如下 ↓

合作事宜:market@stimes.cn

投稿事宜:tougao@stimes.cn

喜歡本文?點讚 + 在看 支持一下!

相關焦點

  • 造假者涼涼: 圖像查重工具來了,4小時狂掃3500篇SCI
    這個算法軟體是紐約雪城大學的Daniel Acuna教授、一位計算機科學家開發的。2018年他首次報告了算法,該算法可一次篩選識別成千上萬張論文匹配圖像,識別的內容包括翻轉,調整大小或旋轉的圖像。目前,Acuna的程序仍處於試驗階段,並受到期刊和研究機構的測試。但是,針對COVID-19的研究似乎也很有用。今年6月,他從兩個用於冠狀病毒研究的關鍵存儲庫bioRxiv和medRxiv伺服器上下載了3500個預印本,並使用他的專有軟體提取和比較了約21,000張圖像。
  • 圖片查重神器來了!原來SCI論文圖片也會有重複率……
    今年以來,青島大學已有4篇研究論文被陸續撤回,其中3篇都存在圖片的重複不規範使用。針對此次學術不端事件,學校也已經進行了調查取證,並上報給上級部門,將對涉事的科研人員做記過處理。由於該文章的數據出現在其他4篇文章裡,雖然發布時間早於其他文章,但是雜誌社認為該文章的數據不可靠,5月28日被撤回。同時,被抄襲的2篇文章也同時被撤稿。
  • 國內論文造假再曝新花樣:不同作者、不同醫院、不同癌種,8篇論文...
    她的特殊技能是,可以用肉眼瀏覽數十篇生物醫學類的論文,並尋找其中重複使用的圖像,這些重複圖像包括通過複製、翻轉、移動或旋轉圖像的一部分來創建「新」的實驗數據。接下來,Bik開始對尋找造假實驗圖著迷了,由於看論文非常耗費時間,所以她辭掉了醫藥公司的研發總監工作,專心進行論文打假。Bik對論文打假比本職工作更有激情,她每次提出質疑不止一篇而是好幾篇,甚至是幾百篇打包式質疑,並及時通過和期刊編輯聯繫,對存在異常的論文進行更正或者撤稿。
  • 北大副校長詹啟敏被疑25篇論文造假,海外打假網站頻出手是否「自身硬」
    在詹啟敏遭到質疑的25篇論文中,大體可分為三類:實驗圖像重複,違反動物實驗倫理以及實驗結果或存在常識性錯誤,還有個別為引物無效或缺失。在PubPeer上,目前詹啟敏團隊對四篇論文進行了回復,另有四篇進行了勘誤。25篇論文中,實驗圖像形似或重複的論文有15篇。對於其中一篇圖像重複的論文,詹啟敏團隊回復稱,是因為不同的實驗錯誤地放置了同一幅實驗圖所致。
  • 神器:中英文論文免費查重,趕快收藏!
    長按左側二維碼關注「醫學人才幫」,回復「查重」免費領取論文查重軟體(終身永久免費版)!正文:說到論文查重,一般中英文論文查重重複率低於20%就可以了(學位論文另外)。所以,小編建議大家投稿之前還是查重一下比較好。下面我就演示一下,作為《Nature》作者,是如何進行中英文論文免費查重的。
  • 法學專家搞不定學術打假 誰來判定論文抄襲?
    原標題:法學專家搞不定學術打假——誰來判定論文抄襲?看到查重報告顯示,論文的文獻複製比超過50%的時候,姚洪軍一度覺得自己要舉報的抄襲是「板上釘釘」的事了。他提供的中國知網查重報告顯示,侯的博士論文除本人已發表文獻複製比達55%,另外5篇期刊文章分別為97.8%、69.1%、55.4%、53.1%、47.6%。依靠這些查重報告,他給上級教育主管部門寫舉報信,跟涉事學校反映情況,一一打電話給期刊和論文原文作者,也在網上發帖,結果是無一例外地碰壁。
  • 日讀論文100+,AI都替代不了!辭去醫藥研發總監後,她成為了一名全職學術警察
    她的特殊技能是,可以用肉眼瀏覽數十篇生物醫學類的論文,並尋找其中重複使用的圖像,這些重複圖像包括通過複製、翻轉、移動或旋轉圖像的一部分來創建「新」的實驗數據。接下來,Bik開始對尋找造假實驗圖著迷了,由於看論文非常耗費時間,所以她辭掉了醫藥公司的研發總監工作,專心進行論文打假。Bik對論文打假比本職工作更有激情,她每次提出質疑不止一篇而是好幾篇,甚至是幾百篇打包式質疑,並及時通過和期刊編輯聯繫,對存在異常的論文進行更正或者撤稿。
  • 研究員開發新算法打擊學術造假 用AI查重論文圖片
    來自美國紐約雪城大學(Syracuse University)的機器學習研究員丹尼爾•阿庫納(Daniel Acuna)等在2018年開發出一套算法,能利用人工智慧(AI)識別學術論文中的圖像造假,對論文圖片進行查重。  他們分析了生命科學領域來自4324本期刊的76萬篇開放獲取(Open Access)論文,並從中提出有效的263萬張圖片。
  • 論文「查重神器」淘寶月銷64萬筆,店主:要是「中超翟天臨」捨得花...
    論文「查重神器」淘寶月銷64萬筆,店主:要是「中超翟天臨」捨得花那7.2元錢…… iwangshang / 寧函夏 毛曉瓊 / 2019-03-13 摘要:現在,就連吃瓜群眾,
  • 誰來判定論文抄襲?
    他提供的中國知網查重報告顯示,侯的博士論文除本人已發表文獻複製比達55%,另外5篇期刊文章分別為97.8%、69.1%、55.4%、53.1%、47.6%。依靠這些查重報告,他給上級教育主管部門寫舉報信,跟涉事學校反映情況,一一打電話給期刊和論文原文作者,也在網上發帖,結果是無一例外地碰壁。
  • 論文查重軟體選哪個比較好
    除此之外就是該系統的運行速度也是我們選擇論文查重系統的一大要素,不可以出現那種提交上去之後還要等上十天半個月才可以拿到檢測成果的,不要相信他們說的什麼檢測需要時間,認真篩查什麼的。都已經很完善了,大部分的檢測都是幾分鐘出結果的,非常的快速精準,因為查重軟體都是非常智能的,除了智能就是他們儲存了非常多的資料庫,只要你逐一提交系統就會立即以一分鐘幾百甚至幾千份的篩查速度來進行比對檢測,根本就用不了太長時間。
  • Milvus 實戰 | 基於 Milvus 的圖像查重系統
    目前大部分論文查重系統只能檢查論文文字,不能檢查圖片。因此,論文圖片查重已然成為了學術論文原創性檢測的重要部分。 本項目主要針對論文圖像進行查重。算法是整個查重系統中的核心。本項目基於深度學習的方法,通過 ResNet 模型推理得到圖像的特徵向量,並利用 Milvus 構建圖像特徵向量庫。同時,Milvus 會自動為向量構建索引。
  • 【博碩文苑】論文查重?查重網站來啦!
    快到畢業季啦,很多同學都被論文寫作與查重所困擾。畢業論文查重對每一個準畢業生來說都很重要,重複率更是直接關係到能否順利畢業。小編為大家整理的七種查重網站,乾貨滿滿快收好吧。查重的本質就是將論文與資料庫中的內容通過算法進行對比,不同的查重平臺有不同的資料庫,查重結果自然也不太相同。
  • 論文查重收費太貴,這款論文潛搜助手,免費查重修改
    論文潛搜助手是一款非常好用的論文查重神器,軟體小巧功能強大,能輕鬆的對所寫論文進行查重,對於快要畢業的大學生,或者正在準備論文的然來說,論文的的撰寫是非常重要的,論文過不過關直接就導致了你能不能順利的畢業
  • 不開玩笑:英國論文查重,論文抄襲要不得!
    對於某些鑽牛角尖兒的同學非說某個想法是自己的原創,前無古人後無來者,即使天地良心確實是這樣,但是落到筆頭的論文上肯定行不通,我和導師也談過這個問題,必須要有足夠的research支撐你的理論才行,對於剛剛來英國讀書的同學們來說,我們的練習實在是太不夠了。
  • 論文免費查重網站+查重快速通過的方法,拿去不謝!!
    還在調劑的同學們可能會辛苦一些,一邊要應對學校這麼雜七雜八的事情,另一邊還要聯繫調劑準備複試,不過今天小編來解救大家來啦,各種實用工具&網站、排版方法、降低查重率攻略、答辯技巧一文搞定,看完別忘了轉給你的小夥伴們哦!
  • 翟天臨論文原文作者黃立華資料 翟天臨遭「學術打假」消息匯總
    論文「不見蹤影」、抄襲,博士學位注水,翟天臨被四川大學官網列入「學術不端案例」公示欄……更為諷刺的是,就在幾天前的央視春晚舞臺上,翟天臨身穿警服,在小品《「兒子」來了》中扮演了一個專門負責打假的警察。沒想到,事業順利的翟天臨栽在了學霸的人設上。  質疑 1  博士後不知「知網」,論文怎麼寫的?
  • Jeff Dean親筆盤點谷歌AI 2019:日均2篇論文,縱橫16大方向
    Jeff Dean總結了16個大方面的AI成果,並透露全年AI論文發表數達754篇,平均每天都有2篇論文發表。涵蓋AutoML、機器學習算法、量子計算、感知技術、機器人、醫療AI、AI向善……樁樁件件,不僅在當前推動了AI作用社會方方面面,而且也是對未來趨勢的小小展示。
  • 如何來挑選論文查重平臺呢?
    #網上有很多不同的論文查重系統,看起來都很規範,也能給出查重報告。然而,每個人都應該知道,自己的論文來之不易。很多人寫了兩三個月的論文,當然不能隨便提交到不知名的網絡平臺。那麼如何選擇論文的查重平臺呢,接下來我們一起分析一下!
  • 如何在知網論文查重檢測系統,免費下載論文?
    生活中,很多人聽說過知網查重檢測系統,但是卻對其並不了解。不過對於學生或者考職稱的人來說,知網查重檢測系統,並不陌生,因為大家通常會在寫完論文後,登錄中國知網免費入口查重。或者在這論文前,到知網查重檢測系統,無限制免費下載中國知網論文資源。