日讀論文100+,AI都替代不了!辭去醫藥研發總監後,她成為了一名全職學術警察

2021-02-18 大數據文摘

大數據文摘出品

作者:笪潔瓊、奧🌰vi丫、lin

密集警告!

先來感受下這場地獄級別的連連看:這是16小塊實驗數據圖,你能看出哪些塊存在相似的地方嗎?

       

文摘菌看了一會兒就頭昏眼花,但是,你相信嗎?有人可以用肉眼一下子看出其中相似的地方,而且,這就是她每天的日常工作。

這位「連連看高手」就是Elisabeth Bik,人稱跨國論文打假王,專門尋找論文中的異常,目前已經對超過49個國家的研究學者公開發表的論文提出質疑。

她的特殊技能是,可以用肉眼瀏覽數十篇生物醫學類的論文,並尋找其中重複使用的圖像,這些重複圖像包括通過複製、翻轉、移動或旋轉圖像的一部分來創建「新」的實驗數據。

2019年11月,在PubPeer(可匿名討論論文的網站)上,南開大學的校長曹雪濤教授,有超過40篇論文的實驗圖像數據,被質疑存在重複異常。(事後曹教授被質疑的論文已進行更正)

2020年2月,來自我國三甲醫院的400多篇論文被她質疑是論文工廠代寫,論文中的實驗圖像數據以及寫作邏輯都存在問題。

本月初,Bik質疑中國醫學科學院動物研究所所長秦川團隊,在Nature上發布的論文存在重複圖像,5天後秦川團隊回應:誤用一張病理學實驗數據圖片,已向Nature提交更正。

沒錯,這些異常都是她憑著火眼金睛找到的。

走上打假之路之前,Bik也是一名普通的研究者。

1997年,Bik在荷蘭的烏得勒支大學(Utrecht University)結束了她從理學碩士到博士後的研究學習生涯,並於2002年去史丹福大學做助理研究員,此後15年都在研究人類以及哺乳動物的微生物群方向,直到2019年開始「全職「進行論文打假工作。



Bik論文打假工作開始於2013年的一次小意外。當時Bik出於好奇,去搜索了一下自己已發表論文中引用的參考文獻,沒想到其他人沒有按照學術規範表明,進行引用文獻說明。

接著,她在審核一篇博士論文的時候,發現其中的一張實驗圖像:蛋白質印跡的分布規律十分奇怪,更為奇特的是她在論文的另外一章裡也看到了這張圖像,論文裡是將這張圖像作為兩次不同的實驗結果,但Bik認為該圖像不僅本身存在問題,而且還用在兩個不同的實驗中。

由於該論文已經公開發表了,她為了不讓其他研究者因為這篇有錯誤的論文,而開始錯誤研究的路,就向該期刊的編輯發送郵件說明這個問題,並在同年6月在PubPeer網站上對該論文進行匿名評價。

經過一番調查,相關論文被撤回,而這篇涉嫌篡改數據的論文,讓Bik一戰成名。

接下來,Bik開始對尋找造假實驗圖著迷了,由於看論文非常耗費時間,所以她辭掉了醫藥公司的研發總監工作,專心進行論文打假。

Bik對論文打假比本職工作更有激情,她每次提出質疑不止一篇而是好幾篇,甚至是幾百篇打包式質疑,並及時通過和期刊編輯聯繫,對存在異常的論文進行更正或者撤稿。

 

由於論文數量比較多,她還找到志同道合的朋友一起合作,Bik負責篩查論文,並將篩查出的問題論文結果,傳給兩位朋友:微生物學家Arturo和Fang進行審核,儼然一條論文打假流水線。

他們一共對2萬多篇論文進行抽樣調查,結果發現了782篇論文存在圖像重複的情況。Fang表示:「Bik就像是魔術師,論文中的問題只有經她指出,我們才看得到」。

Bik的日常是從早上開始看論文,一天她收到了來自比利時的科學家的求助信,信中聲稱:請幫忙看看附件裡的實驗圖像是否存在問題?

Bik仔細看了下圖像,發現該蛋白質印跡圖像屬於存在異常的,通常蛋白質印跡條帶分布圖(一種檢測生物樣品中蛋白質的通用測試結果)是模糊,而且類似圓滑的黑色毛毛蟲狀,但圖像上是邊緣非常尖銳,而且像素化的特徵非常明顯。

正常的實驗圖像可能會存在類似的印跡分布,但不大可能出現完全相同的分布。

當然也可能存在圖片被壓縮後的痕跡,或者是研究者在準備圖像數據時不小心上傳了重複圖像,以及舊顯微鏡上的斑點導致每張圖上都有奇怪的斑點。她還需要參考論文的其它地方再來判斷是否存在重複圖像的問題。


雖然她在自傳裡評價自己是直率又刻薄,但她同時又極度內斂。

在她打假成名之後,有非常多的人給她發郵件、發消息,希望她能幫忙看看已發布的論文是不是存在問題。由於數量太多,讓她忍不住發推聲明:因為詢問的人數太多,所以她可能無法及時跟進。並且在這些求助信息裡,還存在團隊或同事之間的不信任,「做一個誠實的科學家真難。」

雖然Bik對於目前的打假工作充滿熱情,但還是會受到威脅和騷擾。比如經常收到私信被罵,推特頻繁被下線,寫郵件給前同事說壞話之類的情況。

要知道,論文打假行業不僅僅只有她一位論文警察,就只有她是公開使用真名發布打假信息。

她開始在每篇文章的開頭寫上:這篇文章不是對學術不端的批評。

由於Bik持續打假,她的粉絲量在一年內翻了三倍。她不僅自己尋找問題,還將發現有問題的論文提前發到推特上,看誰能先找出來問題,並號召大家一起來找茬,第一個答對的人有獎勵,甚至還有粉絲找到了她都沒有找到的隱藏彩蛋。

她自己保守估計至少導致了172次論文退稿,以及超過300次修改。

 

Bik一天可以精讀大約100篇論文,並向她的資料庫中添加1到20個匹配數據。當一張重複的問題圖像反覆出現,以及一張熟悉的問題圖像再次出現時,系統就會出現提示。當收集的圖像數據足夠多時,系統就可以自我總結規律,比如多次出現問題的研究者就會重點審核。(敲黑板警告)

雖然Bik表示她不針對任何人,但資料庫裡問題最多的研究者的國籍是中國和印度,重複的圖像更喜歡低影響力的期刊。

根據這個資料庫,Bik在和計算機科學家合作開發一款自動查重圖片的軟體,希望可以在數百萬篇論文中發現重複使用的圖片。

「很遺憾,我們不能克隆Elisabeth Bik,」紐約雪城大學的計算機科學家Daniel Acuna說,他的小組是專門研究問題圖像檢測算法,儘管Bik擅長在單篇論文裡查找複製的圖像,但計算機可以通過比較數十萬篇或數百萬篇論文,來幫助找到兩篇論文之間的更多的重複,這對人類來說幾乎是不可能的任務。

2018年,Acuna的團隊在bioRxiv預印伺服器上發布了分析的初步結果,該分析結果從760,000篇論文中提取了200萬張圖像。



事實證明,計算量太大,根本無法將每張圖像彼此進行對比,但是該團隊研究了同一作者在論文內部和跨論文的圖像重複,在手動檢查了軟體標記的3,700多個匹配圖像的樣本後,研究人員確認了40篇異常論文,其中幾乎一半涉及同一張圖像,用於在不同的論文中代表不同的結果。

當前的技術擅長檢測複製,翻轉或旋轉的完全相同的副本。Resis 公司有款軟體,可以檢測論文是否使用重複圖像。比較麻煩的是,例如兩張圖像共享一小塊重疊區域,但在其它方面完全不同。這時,軟體就失效了。

Bik給Acuna提供了更多的樣本數據來訓練機器學習算法,其中包含了大量重複的圖像數據。愛思維爾(Elsevier)也在研發同類型的資料庫,現有500個生物醫學方向的樣本數據,主要是來自撤回論文的圖像數據。

Bik對目前能用的軟體都不滿意。她相信未來會有電腦程式來進行篩選,但人們將始終需要審核結果,尤其是要審核在某些情況下的圖像,存在部分相似的情況。

就這樣,Bik倒了一杯咖啡,坐在桌旁繼續看論文,落地窗外是滿滿的果樹和植物。

相關參考:https://www.nature.com/articles/d41586-020-01363-zhttps://scienceintegritydigest.com/https://scienceintegritydigest.com/2020/02/21/the-tadpole-paper-mill/
http://www.inewsweek.cn/society/2019-11-18/7721.shtml
https://mp.weixin.qq.com/s/zDLgvRQ9rgUGu-CPqtEzIQ

相關焦點

  • 浙江農林大學學生學術論文被SCI收錄 替代畢業論文通過審核答辯
    中國教育在線浙江站訊 (記者 趙小倩 通訊員 陳勝偉)12月15日,浙江農林大學林學162班的應屆畢業生陳月婷得到消息:今年年初她和團隊成員在左照江老師指導下,在被SCI收錄地學術期刊《Ecotoxicology and Environmental Safety》(《生態毒理學與環境安全》)上,發表了學術論文《Linalool-and
  • 清華AMiner 與同濟 iDVX 共同研發 AI 視頻神器:帶你秒讀頂會論文
    作為一名科研人員,及時跟蹤業內最新科研成果,快速閱讀文獻了解文章核心要義,是一項必備能力。而隨著科技的進步,每天有越來越多的科研成果發表出來,一句話形容科研人的日常——「寫不完的論文,看不完的文獻」。閱讀英文文獻費時長,文章核心要義抓不住,論文枯燥無味讀不完…… 身處科研重地的你是否正在不時地被這些問題所困擾?
  • 中國學術論文為什麼不靠譜?
    很明顯,這些作者提供虛假審稿信息,違反了投遞論文的慣例和科研規範,而論文的真實性和學術價值也隨之喪失,撤稿成為必然結果。這背後的故事不難推敲:三篇論文是同一個組織寫出來的,三位評審老師也是同一組織編出來的,走這麼一套程序,滿足了「論文必須由同行評審人給出修改意見」這一規定,於是可以順利發表。
  • 國內論文造假再曝新花樣:不同作者、不同醫院、不同癌種,8篇論文...
    而走上打假之路之前,Bik也是一名普通的研究者。1997年,Bik在荷蘭的烏得勒支大學(Utrecht University)結束了她從理學碩士到博士後的研究學習生涯,並於2002年去史丹福大學做助理研究員,此後15年都在研究人類以及哺乳動物的微生物群方向,直到2019年開始「全職「進行論文打假工作。
  • 觀點| 讀博有風險,入坑需謹慎
    但該話題僅聚焦於學術研究,讀博其實是個人發展的一部分,學術研究也是整個 AI 行業的一部分,Rachel Thomas 在這裡就向我們提供了更廣的視角。Rachel Thomas 是致力於 AI 開放教育的 fast.ai 聯合創始人之一,她在本文討論了在考慮讀博之前,如何結合學術界和產業界的視角看待整個行業以及個人發展,並結合自身經驗給出了中肯的建議。
  • 「中國醫藥創新企業100強」榜單公布:科興榮登榜單前十
    10月10日上午,2019』中國醫藥企業家科學家投資家大會在北京雁棲湖國際會展中心舉辦,會上E藥經理人公布了「中國醫藥創新企業100強」榜單,科興榮登「創新100強」榜單第十位,科興控股董事會秘書、投資者關係高級總監楊光女士應邀出席並代表科興領獎。
  • 瞄準近千億CRO市場,他用AI深耕讓醫藥研發進入「自動駕駛」時代
    從人人唾棄的「毒藥」再到抗癌神藥,從眼藥水到「美容神器」,沙利度胺和比馬前列素成為老藥新用最經典的詮釋,而這些都離不開真實世界證據在藥物增加新適應症、新的適用人群等提供的有效性和安全性數據。2018年國內醫藥工業銷售收入達到3.7萬億元,醫藥行業在研發和銷售投入約佔50%,而真實世界研究既能提升研發產出也能提高銷售效率,未來發展前景巨大。再加上國家鼓勵創新藥研發以及「4+7帶量採購」「兩票制」等政策的頒布實施,藥企迫切需要具備真實世界研究能力的CRO企業來滿足「老藥新用」「醫藥營銷轉型」等需求。
  • 斯坦福發布2019全球AI報告:中國論文數量超美國,但論文影響力比美國低50%
    報告顯示中國AI論文數量超美國,但論文影響力美國比中國高50%;AI人才辭去學術界教職進入產業界的速度加快;自動駕駛最受投資者的青睞……現在戳右邊連結上 新智元小程序 了解更多!2019年已經接近尾聲,今年AI發展如何呢?近日,斯坦福聯合MIT、哈佛、OpenAI等院校和機構發布了"2019年度AI指數報告"。
  • 繼往開來,彝醫有方——著名傳統彝族醫藥傳承人阿子阿越
    1974年9月,阿子阿越考入成都中醫藥學院醫學系學習,成為最早的有專業院校學習背景的彝族行醫者。也許是受家學傳統的影響,系統學習了專業醫學知識後,她對自己母族文化中的傳統醫藥產生了更加濃厚的興趣。因此,畢業參加工作後她深入到彝族民間去挖掘、收集彝醫單、驗、秘方、藥材、文獻等。
  • 女大學生寫論文論證:全職太太等於丈夫「僱員」
    昨日獲悉,因觀點新穎,論證方法獨特,這篇論文獲得湖北省「挑戰杯」大學生課外學術科技作品競賽三等獎。  湖北經濟學院大四女生龔晶在名為《全職太太勞動的社會價值研究》一文中提出,社會上把不工作、在家的婦女稱作全職太太,既然在家做太太被以職業視角衡量,那麼就該承認全職太太在從事職業勞動。
  • 世界頂級科學家,辭去美國大學終身教授回國後,如今現狀如何?
    彼時的段路明不僅獲得了中科院院長特別獎,其博士論文更是入選了全國百篇優秀博士論文,甚至於他在讀博期間便在《物理評論快報》上發表了兩篇論文。種種成就,皆預示了他在物理學方面的成就必然斐然。 段路明是一個重感情的人,因而在院長親自邀請其博士畢業後留校時,他便一口應下了。
  • AI技術為科研學術築起高牆,75億學術費用背後是生物醫學論文亂象
    學術不端,靠AI火眼金睛中國科研學者的噩夢,5月12日,世界科研打假領域的前美國史丹福大學的助理研究員BIK教授再次質疑中國學術界的大佬,中國醫學科學院實驗動物研究所所長秦川教授團隊在《nature》上發表的新冠病毒在HACE2轉基因小鼠中的致病性論文存在圖片內容重疊的問題
  • 人工智慧(AI)同行評審的時代來了
    Wizdom.ai 是一家由 Taylor & Francis 出版公司控股的新公司,該公司正在開發一款能夠挖掘論文數據並提取不同學科和概念間關聯的軟體。他認為,正在研發的這個工具不僅能夠在同行評審中起到作用,對於撰寫撥款申請和文獻綜述等都有幫助。
  • 百度微軟谷歌正聯手AI2 將共同研發學術搜索工具
    原標題:百度微軟谷歌正聯手AI2 將共同研發學術搜索工具 據美國科技新聞網站GeekWire 6月20日消息,微軟、谷歌、百度正聯手AI2一同研發學術搜索工具。
  • 考而思留學生學術寫作班課開班啦~出國留學論文輕鬆搞定
    讀和寫是密不可分的,不存在會寫論文但是不會讀論文的同學。,但是就算24小時一直讀,都讀不完。說一個我學生的故事,她讀的是毒理學,碩士學位,後來還去雪梨,讀了一個管理碩士。她想著未來要去中國最大的醫藥企業,做醫藥代表。然後,去面試的時候,她直接就崩潰了。面試官是一個英國畢業的一個藥學博士,是公司的CFO,當時面試她們一組人。
  • 29歲當教授,發表11篇Nature和Science,這位頂尖科學家正式全職回國
    他是中國科大培養的天才科學家,讀博士時就發表40篇論文,並獲選全國百篇博士優秀論文,同時提前一年畢業。   非常值得高興的是,2018年,他正式辭去美國密西根大學費米講席教授職位,全職來清華大學交叉信息院工作。2019年4月24日,他正式獲聘首位「清華大學基礎科學講席教授」。   他就是段路明,一位天才級的科學家。他的全職回國或將大大助力中國量子科學研究進入世界前列。
  • A股「醫藥一哥」恆瑞醫藥捲入受賄案,75億學術推廣費也被質疑!公司...
    公司及公司董事、監事、高管不存在違法違規行為,目前不存在相關訴訟。今後,公司將吸取教訓,加強對子公司的合規管理,杜絕此類事情發生。據e公司記者了解,有媒體日前發布了標題為《恆瑞醫藥一年學術推廣費近75億花哪兒了》的文章。文章稱,近日,浙江麗水一名醫院麻醉科主任雷李培的刑事判決書,再次將電影《我不是藥神》中,關於治病救人還是治病賺錢的討論放在了公眾視野下。
  • 孩子寫喝茶抗癌論文,被饒毅舉報學術造假的李紅良,主動辭去院長
    說到國內的學術環境,外行人自然是覺得高大上,要知道,從事學術研究,學歷上至少都是博士起步。內行人,尤其是經歷了研究生學習階段的學子們,無盡的試驗,無數次的熬夜通宵,在導師很少現場指導的情況下,稍微做出點成績,還不能獨佔論文的署名。
  • 《三十而已》:她是所有全職媽媽的夢想,我卻不想成為她
    最近熱播的電視劇《三十而已》中,童瑤飾演的顧佳這一角色,是一個十佳全能型媽媽,和她的名字一樣,小時候她考試全優,長大後照顧家庭實力一流。身為全職媽媽,對丈夫她體貼周到,穿著上細緻到一雙襪子的搭配,飲食上周全到每一頓早餐;對孩子她奮不顧身,為了入園資格給富太太提鞋,對欺負孩子的人大打出手。
  • 翟天臨涉「學術造假」 原文作者:論文被整段抄襲
    通過與期刊界、出版界及各內容提供商達成合作,中國知網已經發展成為集期刊雜誌、博士論文、碩士論文、會議論文、報紙、工具書、年鑑、專利、標準、國學、海外文獻資源為一體的、具有國際領先水平的網絡出版平臺。中心網站的日更新文獻量達 5 萬篇以上。