Nature:學術造假者的噩夢!論文圖像查重軟體研發成功,造假圖片,無...

2020-11-22 儀器信息網

近日,Nature 雜誌新聞版發布了一篇重磅消息:論文圖片查重軟體研發成功,軟體開發人員在對 3500 篇預印版論文進行的檢測中,找出 24 張涉嫌重複 / 造假的圖像。

這對於論文造假無疑是一記重錘。

瘋狂的論文造假

由於存在巨大的利益,論文造假一直屢見不鮮,甚至在部分國家或地區形成了造假論文產業鏈。

有造假、就有打假;但與龐大的造假數量相比,靠幾個志願者打假,顯然是杯水車薪。

中國是重災區之一

美國 Healsan Consulting LLC 對全球撤稿資料庫的分析顯示,

  1、中國 SCI 論文撤稿佔到所有撤稿的 44.0%。

  截止到 2020 年 6 月 22 日,世界範圍內共有 23,425 篇 SCI 撤稿,其中中國有 10,303 篇,遠遠高於第二位的美國 4,125 篇。中國論文撤稿佔 44%。

  (圖 1. Credit:Healsanconsulting LLC, USA)

  2、剽竊仍然是中國 SCI 論文撤稿的首要原因。

  近三年中國 SCI 論文共有 1397 篇 SCI 論文撤稿,其中因為剽竊所致的撤稿有 547 篇(39%),另外錯誤所致的撤稿有 330 篇(24%)。

  (圖 2. Credit:Healsanconsulting LLC, USA)

  圖片查重軟體應運而生

  上面數據中提到的佔撤稿原因 39% 的 「抄襲」,主要是指文字抄襲。因為目前的查重系統只能查文字,不能查圖片。

  而撤稿第二常見原因 「錯誤」 部分,則主要是圖片 「錯誤」。在目前靠人工檢查的情況下,就已經發現了大量偽造的圖片,可知實際情況多麼嚴重。

  所以當論文圖像查重軟體的研發者,美國紐約 Syracuse 大學的機器學習研究人員 Daniel Acuna,遞交了其第一批圖片查重結果時,立即引起學術界的關注。

  1、識別原理

  其基本原理是,將提取圖片放大以獲得特徵性圖片數字 「指紋」,從而即使圖片做了旋轉、大小調整、截取、改變對比度或顏色,該軟體仍然能夠識別出其相似度。

  根據 Acuna 研究團隊之前的檢測結果,他們推測資料庫中 1.5% 論文包含有可疑的圖像,而 0.6% 論文包含有欺詐性圖像。

  2、小試牛刀

  這款軟體從 2015 年開始研發,歷經 5 年反覆測試、並經過小範圍試用終獲成功。首次正式應用於新冠病毒病(COVID-19)領域預印版論文的識別。因為這個領域論文的爆發程度不亞於病毒傳播,低質量、甚至造假論文也屢見不鮮。

  Acuna 研究團隊從 bioRxiv 和 medRxiv 伺服器上下載了 3500 篇論文,總共有 21,000 張圖片。在 4 個小時內,該軟體就找到約 400 張可能重複的圖像。經過人工鑑定後,Acuna 團隊認為,其中的 24 張包含有重複圖片,並在 7 月份將之公布在其網站上。

  3、優勢和不足

  Acuna 團隊的檢測結果立即引起轟動。

  因為是通過軟體自動檢測,可以大規模發現重複的圖像;另外可以發現人工不能識別的圖像。

  收到 email 通知後一些論文作者立即回應,承認該軟體找到的是重複圖片,並表示將糾正錯誤。芬蘭赫爾辛基大學病毒學家 Giuseppe Ballistreri 更是建議在 PubMed 資料庫中應用該軟體。

  著名學術打假人伊莉莎白?比克(Elisabeth Bik)在讚許之餘,也建議在正式公布軟體識別的造假圖片之前,由她做鑑定。因為該軟體識別出的 「嫌疑圖片」 仍然需要人工確認。

  但也有一些收到通知的學者說,Acuna 的軟體搞錯了,標記出來並不匹配的圖像。美國北卡羅來納州的學者則要求 Acuna 刪除其網站公示,因為 Acuna 軟體對其論文圖片做了錯誤識別。

  4、進一步處理方法

  基於上述反饋,Acuna 已經將其識別出來的 「造假圖片」 由網站公示改為私下訪問。只有從他的 email 通知的學者,才能憑藉給予的密碼進行訪問和回復。

  所以設置的 「嫌疑造假圖片」 處理流程也變為:先通知作者,如果作者不回復則將公開。

  在初嘗戰果後,Acuna 也計劃擴大軟體篩查範圍。Acuna 特別告誡說:「我希望作者意識到,有人正在對所有的論文圖片進行識別。」


相關焦點

  • Nature:學術造假者瑟瑟發抖,論文圖像查重AI技術重拳出擊
    ,他用這款軟體檢查了3500篇論文的21,000張圖像,在4小時內查出大約400張疑似重複的圖像,這項技術或許將為學術造假亂象的解決帶來曙光。近三年來,剽竊和錯誤是中國SCI論文撤稿的首要原因。其中剽竊主要是指文字抄襲,目前的查重系統只能查重文字,不能查重圖像。而錯誤則主要是指 圖像錯誤,包括經過PS然後重複使用的圖像。學術論文造假手段常用的有四種:1、重複用圖;2、編造數據,用ps塗抹修圖;3、花錢買論文;4、偽造審稿人。其中第一種和第二種最常用,造假成本最低,以重複用圖進行學術造假的案例屢見不鮮。
  • 圖像查重軟體研發成功,4小時查3500篇論文
    7月21日,《Nature》發布了一篇重磅新聞:論文圖片查重軟體研發成功。該軟體的研發者是美國Syracuse大學的機器學習研究者Daniel Acuna。眾所周知,在目前的論文查重系統中,一般只能對文字部分進行查重,無法對圖片部分查重。因此,除了文字抄襲外,最常見「撤稿原因」就是圖片「錯誤」。當前,僅靠人工檢查,就已經發現了大量造假的圖片。
  • AI圖像查重4小時篩查3500篇論文
    近日,Nature報導了美國計算機學者研發的一款圖像查重軟體,似乎為快速解決這一問題帶來了希望。該軟體在4小時內篩查了3500篇論文,並最終發現了400個可能重複的圖像。新冠論文大篩查:4小時、3500篇論文、2.1萬張圖像今年6月,雪城大學計算機學者丹尼爾·阿庫納(Daniel Acuna)利用開發的圖像查重軟體,提取和比較了預印本網站bioRxiv
  • 研究員開發新算法打擊學術造假 用AI查重論文圖片
    有圖無真相  在打擊學術造假的徵途上,學術規範機構又下一城。資料圖:人工智慧機器人。  來自美國紐約雪城大學(Syracuse University)的機器學習研究員丹尼爾•阿庫納(Daniel Acuna)等在2018年開發出一套算法,能利用人工智慧(AI)識別學術論文中的圖像造假,對論文圖片進行查重。  他們分析了生命科學領域來自4324本期刊的76萬篇開放獲取(Open Access)論文,並從中提出有效的263萬張圖片。
  • 中國團隊 Nature 新冠論文被指圖片造假,又是科研「P圖」?
    然而,長期以來,如何更快更準確地發現論文中被修改和複製的圖像一直是學術期刊編輯們的頭等大事。篡改原圖的原因有很多,可能是故意造假,也可能僅僅是為了改善圖像外觀(如對比度或色彩平衡)。2010 年,一些學術出版商同意將研究論文的文本存入一個名為 CrossCheck 的總服務站,這樣期刊就可以使用軟體來檢查提交的論文是否存在抄襲。對此,Fennell 表示:「我們需要在圖像方面進行同樣的合作。
  • 論文圖片處理,哪些能做?哪些算造假?
    然而後來發現,所謂的 c-kit 幹細胞能修復心臟,居然是數據造假、圖片偽造出來的,人體心臟特麼的根本就沒有幹細胞。全世界那麼多的研究機構十幾年來耗費無數金錢和人力,都是在錯誤的方向上打水漂玩兒。而科研圖片處理不端是學術論文造假重災區,因為論文圖片作為科研結果的最終呈現,動手腳無疑是性價比最高的環節。所以,每次爆出學術造假幾乎都少不了圖片處理不端。
  • 論文圖片是不是造假,你心裡竟然沒點數?
    學術造假對於兢兢業業搞科研的人來說,無疑是重磅傷害。且不說造假者竊走本來就不多的科研資源,更可怕的是,造假者可能會把整個小領域帶到溝裡去,讓後來者浪費大量的金錢和精力。比如去年爆出造假的前哈佛醫學院教授、再生醫學研究中心主任Piero Anversa博士。
  • 計算機審查難擋論文造假
    一言為定  學校管理部門一味依賴計算機查重,計算機通過了,管理部門的工作就算完成了,他們所負的責任就解脫了,卻不知破解這一問題對造假者易如反掌。  如果說論文抄襲、成果造假等學術不端行為是高校的陳年頑疾,那麼,近日媒體揭露出論文造假已形成規模化產業鏈,這種觸目驚心的黑幕,則象徵著這一陳年頑疾開始癌變,對教育主管部門及高校治理學術腐敗的努力構成極大的威脅。  近年來,教育主管部門及高校為打擊論文造假等學術不端行為,做了多種努力,採取了種種舉措。
  • 發表的論文造假的後果,中國學術造假從來不缺例子
    自2011年起,教育局開始嚴打學術不端風氣,一時之間,怨聲四起。  即將畢業的時候,我們都會以畢業論文的形式來進行結業的主要條件,這不僅僅是大學生,研究生,碩士生也均有所情況。同時還要痛苦的進行論文查重,不過,值得我們注意的是,論文不僅出現在教育事業中,就是在社會學術上也所有體現。
  • 今日話題 | 南開校長被曝論文造假,再次敲響學術不端警鐘
    ,論文實驗圖片有PS痕跡等消息在網上熱傳。 可見,此次曹雪濤論文造假風波,有著極強的專業門檻和複雜性。就連伊莉莎白·比克也沒有直接給出結論。在採訪中她反覆提到,只是將存在問題的圖像和論文標註出來,至於是不是構成學術不端,還得更權威的調查。 但即便如此,曹雪濤恐怕也難逃論文造假的指控。
  • 「畢業之家」揭秘:大學生知網論文查重的規則及查重原理
    後續會持續為大家更新畢業論文寫作、修改、降重,記得關注喲。說道大學生學位論文查重,大家不得不提起知網。知網真的是強勁的學術軟體和查重軟體。知網的功能很多,僅僅這個名字就可以辨別出那些「渾水」的學術造假者。翟天臨的一句「知網是什麼」就讓他顯出了學術造假來。知網的影響力真是大。
  • 論文抄襲,學術造假為何屢禁不止?
    學術造假,論文抄襲這一現象屢禁不止,本應該是象牙塔的大學卻有那麼多不應該有的現象,這合理嗎。先有讚美師娘,再有實名舉報導師抄襲,還有許多的學二代應該勵志攀巖科學的頂峰,難道做學術就不能堂堂正正嗎?作為一個掌握科研機會的家庭,讓孩子更早的接觸科學,無可厚非,這樣的孩子更有機會在科研上做出成就,可是現在的學二代不用做實驗,躺著就能水論文,仿佛一出生就自帶兩篇scl。網友說的好,真科研,還得看小學生。其次,對於學術造假的事情很難判斷,對於普通人來說舉報個不做事的官員簡單,可是分辨一篇文章的好壞就難了。正經人誰去知網看文獻啊,作為一個大學生除非百度抄不到,要不然誰去翻文獻啊。
  • 論文圖片處理,哪些能做?哪些算造假?-其實你心裡都清楚(嘿嘿)……
    且不說造假者竊走本來就不多的科研資源,更可怕的是,造假者可能會把整個小領域帶到溝裡去,讓後來者浪費大量的金錢和精力。比如去年爆出造假的前哈佛醫學院教授、再生醫學研究中心主任Piero Anversa博士。
  • 如何選擇論文查重軟體
    作者:新風學術網又到了畢業季,畢業一定少不了的就是論文。不同的學校對論文的查重是有要求的,大多數學校的要求都是在百分之三十,極少數學校的查重會高於或低於百分之三十。那麼我們自己寫的論文到底查重在多少呢?這需要通過專業的查重軟體去做檢測。
  • 媒體:靠查重軟體防論文抄襲?只是治標不治本
    (原標題:靠查重軟體防論文抄襲?只是治標不治本) 論文查重率是近年來為防止學生畢業論文和期刊投稿論文發生抄襲現象的一種事前預防措施。查重軟體這些年火了,政府機關、學校、研究所、編輯部都在用,估計會引領軟體行業風騷數年。
  • 如何選擇論文查重軟體(全面介紹)
    這需要通過專業的查重軟體去做檢測。  市面上各式各樣的查重軟體怎麼選擇又是一大困難,下面以「如何選擇論文查重軟體」為例,給大家介紹和推薦一下論文的查重軟體。  1.paperpass  算是使用最多的自查軟體了吧,周圍很多同學都推薦並且使用它來查重,價格還比較便宜,每千字1.5元。
  • 學術不端、學術造假的事件也越來越多
    所有本科畢業論文的質量由各個學生的畢業論文指導老師具體把關,首選知網,畢業之家網今天為大家介紹大學生和研究生兩個系統的區別:對於畢業論文查重。圖片在畢業論文中起到至關重要的作用,維普檢測系統查重之後。
  • 中文論文投稿查重率要低於多少?
    作者:新風學術網 成功投稿發表類期刊論文,對於需要職稱評定的朋友來說非常重要,而雜誌社、學報等為了打擊學術造假行為,都會對投稿論文進行查重,檢測合格者才有機會發表論文,那麼中文論文投稿查重率要低於多少才算合格呢?降低中文投稿論文查重率的方法又有哪些呢?
  • 靠查重軟體防論文抄襲?只是治標不治本
    查重軟體這些年火了,政府機關、學校、研究所、編輯部都在用,估計會引領軟體行業風騷數年。一些學校和期刊甚至對不同論文設定了所謂的容許「重複率」,從5%到30%不等,似乎把防抄襲交給查重軟體就萬事大吉了,即可省了領導、導師、編輯檢查的麻煩,又對論文作者起到一定的約束作用。事實真是如此嗎?非也!浮躁的風氣必然影響到高校每一個人。
  • 西班牙論文查重率的規定是什麼?
    本文由 查重降重中心 sp8080.com 整理分享由於近些年來學業造假的事情頻發,所以每個學校對畢業論文的要求也越來越高,這讓許多畢業生都苦不堪言。但是論文查重不是你不想就不用做的事情,現在我們就來看看論文查重的流程。