NIPS 2018又出事了:審稿信息洩露,雙盲評審失效!

2021-01-08 電子發燒友
NIPS 2018又出事了:審稿信息洩露,雙盲評審失效!

李倩 發表於 2018-08-13 09:57:20

NIPS 2018又出事了:審稿信息洩露,由於論文提交CMT系統的重大漏洞,審稿人可以判斷出單篇論文的姓名和機構,讓雙盲評審失效!不僅如此,本屆NIPS毫無徵兆地砍掉了一個歷史悠久的Workshop,加上此前初審結果怨聲載道,這屆NIPS,真讓人捏一把汗。

如果說2017年的NIPS以一張註冊人數如火箭沖天般的表格創造了記錄,那麼,2018年的NIPS則凸顯了當前火熱不退、幾近高燒的人工智慧/深度學習領域蟄伏的諸多問題。

審稿信息洩露,雙盲評審失效!

8月7日,就在NIPS初審結果rebuttal進行的過程當中,有人發現NIPS 2018的審稿系統出現了嚴重的信息洩露,本就頗受詬病的評審過程,又一次出現問題。

事情是這樣的,跟其他會議一樣,NIPS 2018也採用MS CMT3系統進行論文的提交及審核。

作為這次會議的一位審稿人,sweichwald 發現該系統伺服器中有一個嚴重的漏洞,讓「作者/機構/公司」的雙盲性以及由此造成的評審公正和平等遭到破壞:

問題發生在所有提交論文的列表是不是靜態的,而是根據審稿人的域名(也即姓名/機構/公司)在不斷更新。

當審稿人輸入域名衝突的信息時,CMT系統會自動過濾掉有域名相衝突的論文;因此,審稿人通過輸入或者不輸入某個域名衝突,再根據CMT系統給出的兩個論文列表,就能明確哪些論文是屬於哪個域名,換句話說,也就相當於能夠知道哪些論文是屬於哪位作者或哪個單位的了。

sweichwald指出,儘管會議規定採用雙盲評審,但NIPS論文審稿平臺本身允許這樣主動暴露論文提交人姓名和論文所屬機構/公司的做法,而且還能匹配到特定的單篇論文,屬於重大過失(culpable negligence)。

當系統存在這樣的漏洞時,很可能被人利用,讓雙盲評審機制失效。不僅如此,由於知道了論文的所屬機構,某些審稿人很可能有意選擇特定單位的論文進行評審,進而導致評審結果出現偏差。

實際上,sweichwald是在偶然之下發現了CMT系統的這個漏洞:當時,他因為忘記了,不小心輸入了一個衝突的域名,結果發現返回得到的論文總數變少了。

於是,他對比了一下名單,找出兩份列表中不同的某篇論文,私底下向一位同事確認,在沒有讓對方直接告訴他後者論文題目和摘要的情況下,通過兩人交換的信息,sweichwald完全肯定,他看到的論文就是他同事提交的那一篇。

在寫給NIPS AC的郵件裡,sweichwald表示根據審稿規定,他重新輸入了正確的域名,同時保證自己不會作為那篇論文的評審。

多人連續發現系統漏洞,好在修複比較及時

除了sweichwald以外,還有多位審稿人也發現並舉報了這個系統漏洞,但是卻沒有得到NIPS方面的回覆。

需要指出,這個問題與事先將論文上傳到arXiv等預印本網站或其他意外洩露身份的情況有著根本的不同:這是存在於整個論文提交和審稿底層系統的問題,而且CMT3系統也被其他1000多個使用雙盲和單盲評審的學術會議使用,這就意味著其他會議的評審公正性很可能也遭到了破壞。

根據CMT官網,2016年,CMT系統已用於1000多個國際會議、研討會和各種其他項目的學術論文提交與審核,涉及上萬篇論文和上千名審稿人。使用CMT的會議包括:

國際機器學習大會(ICML)

神經信息處理系統進展大會(NIPS)

國際人工智慧和統計會議(AISTATS)

人工智慧不確定性會議(UAI)

IEEE計算機視覺模式識別會議(CVPR)

國際計算機視覺會議(ICCV)

歐洲計算機視覺會議(ECCV)

亞洲計算機視覺會議(ACCV)

英國機器視覺會議(BMVC)

IEEE國際數據工程大會(ICDE)

ACM數據管理特別興趣小組(SIGMOD)

超大型資料庫國際會議(VLDB)

國際IEEE數據壓縮會議(DCC)

IEEE多媒體與博覽國際會議(ICME)

CMT最初是為ACM SIGKDD 1999開發的。從那時起,CMT經歷了幾次重大改進和擴展,迄今已在數千個會議中使用過。

5月29日,sweichwald 向NIPS 2018的領域主席和CMT系統管理員匯報這一系統漏洞。5月31日,NIPS會務組給出了回復,表示他們已經注意到這個問題,並建議前者在系統完全處理好之後,再將此事公布。

NIPS會務組的回覆,表示已經有多人提醒他們這一漏洞,會儘快修復系統,並讓sweichwald在事情解決前先不要聲張

8月2日,包括其他使用CMT的會議在內系統全部得到修復。

現在,對於雙盲評審的會議,CMT系統讓任何人都不能更新他們的衝突域名,而審稿人在見到任何論文前,只有一次輸入域名的機會。 

根據官方反饋,目前沒有發現其他CS/AI學術會議的審稿信息遭到洩露。

砍掉舉辦連續10年唯一的計算生物學Workshop

NIPS 2018的事件還沒說完。

同樣在8月7日,有學者反映本屆NIPS無故砍掉了ML for Compbio(MLCB)workshop,這是一個有關機器學習領域中計算生物學的研討會,也是NIPS唯一有關計算生物學的研討會,已經連續舉辦了10年,而且2017年的論文提交數量創下了歷史記錄。

計算生物學是生物學的一個分支。根據美國國家衛生研究所(NIH)的定義,它是指開發和應用數據分析及理論的方法、數學建模和計算機仿真技術,用於生物學、行為學和社會群體系統的研究的一門學科。

計算生物學定義廣泛,是包括計算機科學,應用數學,動畫,統計學,生物化學,化學,生物物理學,分子生物學,遺傳學,基因組學,生態學,進化,解剖學,神經科學和科學可視化的基礎。

諷刺的是,當向NIPS提交論文的時候,「Combio」仍然屬於子領域之一。

有人在Twitter上感嘆,究竟有多少學計算機的人知道計算生物學與「AI醫療」或「AI臨床應用」是完全不同的概念?

如果說領域日漸凋零也就算了,但正如前文所說,2017年該workshop的論文提交數量創下了歷史記錄,當時workshop參會還排起了長隊,展示和討論一直很活躍。

由此,Twitter上出現了很多表示遺憾的聲音。

往好處想,這或許也是MLCB自己獨立出來,成為一個單獨學術會議的機會。

不然又該怎麼辦呢?

新增非洲、拉丁美洲、同性戀和猶太人 AI Workshop

但是,這屆NIPS也不全是壞消息。

根據「機器學習包容性」這個帳號,本屆NIIPS變得更加包容和多樣——除了此前已有的女性機器學習workshop(WIML),還新增了非洲AI、拉丁美洲AI、同性戀AI 和猶太人AI 這幾個workshop。

NIPS將變得更加包容和多樣,這當然是好事一樁。但同時也忍不住讓人去想,或許這就是計算生物學workshop被砍掉的原因?

畢竟場地只有那麼大,而2017年的NIPS註冊人數已經高達8500人。

在四川,8000多人因高溫擠進泳池。來源:四川在線

當然,NIPS 2017上也有寂寞的身影,圖靈獎得主、貝葉斯網絡之父Judea Pearl的演講聽眾就寥寥無幾。

NIPS 2017圖靈獎得主Judea Pearl落寞的身影。圖片來源:周志華

但是沒問題,現在Judea Pearl也在Twitter等社交網絡上活躍起來,關注人數也漲到9100多,大家對因果學習/模型的熱情重新燃起,這次如果他再有講座,應該也會座無虛席吧。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 英國生態學會發起一項大規模研究,「雙盲審稿」能否減少偏見?
    英國生態學會發起了一項大規模研究,劍指「雙盲審稿」是否能減少科學出版中的偏見英國生態學會旗下雜誌Functional Ecology進行了一項為期兩年的隨機對照試驗,這是同類試驗中迄今為止規模最大的一次,目的是評估在同行評審中隱藏作者信息的細節,是否會減少科學出版過程中對特殊群體的偏見
  • ICLR 2018截稿:取消公開評審改為雙盲引人關注
    International Conference on Learning Representations 2018 (國際學習表徵會議 ,ICLR 2018) 的論文投遞已於美國東部時間10月27日下午5:00結束。
  • 社交媒體和arXiv存在,讓雙盲評審形同虛設 | Reddit熱議
    白交 發自 凹非寺量子位 報導 | 公眾號 QbitAI雙盲評審機制真的雙盲嗎?最近,Reddit上有這樣一個討論:社交媒體與arXiv是否損壞了頂會雙盲的機制?
  • 學界| ICLR 2018截稿:取消公開評審改為雙盲引人關注
    2018 (國際學習表徵會議 ,ICLR 2018) 的論文投遞已於美國東部時間10月27日下午5:00結束。除了專注於表徵學習以及兩位學術大牛的光環外,大會引人注目的一點是前幾屆大會推行的 Open Review 評審制度。與諸多學術會議通行的單盲、雙盲評審制度不同,所有提交的論文都將會公開姓名等信息,並且接受所有同行的評價及提問(open peer review),任何學者都可或匿名或實名地評價論文。而在公開評審結束後,論文作者也能夠對論文進行調整和修改。
  • 社交媒體和arXiv存在,讓雙盲評審形同虛設|Reddit熱議
    白交 發自 凹非寺量子位 報導 | 公眾號 QbitAI雙盲評審機制真的雙盲嗎?最近,Reddit上有這樣一個討論:社交媒體與arXiv是否損壞了頂會雙盲的機制?而此時,這些大會的評審工作還沒有完全結束。這樣做不僅會給雙盲評審人員巨大壓力,還損壞了頂會雙盲評審機制。還沒有通過同行評審就放arXiv和社交媒體上,那雙盲豈不是在搞笑?影響力or接收,哪個更重要?先不論雙盲機制是否真的雙盲。對於一個研究團隊而言,每年頂會放榜,論文會被錄用?錄用幾篇?都是他們關注的問題。
  • ACL 禁止投稿論文提交 arXiv,雙盲評審真的有效嗎?
    ACL會議的提交、評審和引用政策:為ACL會議(ACL、NAACL、EACL)和TACL期刊採用以下政策,以維護雙盲評審,同時不犧牲預印出版的積極效果。這些政策實際上適用於所有的ACL會議,從2018年1月1日的提交截止日期開始。我們推薦與ACL會議關聯的其他會議和研討會也採用相同的政策,除非這與他們本來的政策相衝突。
  • ACL新政禁止投稿論文在arXiv公開,我們到底需要什麼樣的雙盲評審?
    這一要求顯然再次引發了對於「雙盲評審的必要性」和「如何高效率地執行雙盲評審」的討論,畢竟一段時間之前 ICLR 2018 的匿名論文投稿在評審結果出爐前就大批量暴露了論文作者,已經出現了一些批評的聲音。剛好 ACM 通訊近日的一篇文章就研究了論文接受率和匿名的關係,雷鋒網 AI 科技評論先帶大家重新認識一下前一個話題。
  • 單盲還是雙盲?Nature旗下25本期刊的審稿模式分析
    該研究是第一個根據作者選擇的審稿模式(雙盲vs.單盲同行評議)來分析、比較涵蓋廣泛學科的科學期刊對投稿接收情況的研究。他們按審稿模式和通訊作者的特徵,對2年內向25本自然旗下期刊投稿的資料庫進行了分析。他們的目的是了解作者的特徵,並推斷出與通訊作者的性別、國家或所屬機構國際地位相關的任何潛在的隱性偏見。該研究為作者在向高影響力期刊投稿時的行為提供了新的見解。
  • 同行評議:單盲還是雙盲,這是一個問題 | BMC Journal
    utm_source=WeChat&utm_medium=Website_linksSocial_media_organic&utm_content=CelZha-MixedBrand-multijournal-Multidisciplinary-China&utm_campaign=ORG_AWA_CZH_BMCWechat_dailyposts_blogs
  • 關於開展2018年上半年研究生學位論文相似度檢測和雙盲送審工作的...
    未被抽到參加校級雙盲評議的研究生,學位論文的雙盲送審全部由學院來安排,研究生的學位論文必須送3位專家評審,其中校外專家至少2名同等學力、跨專業以及新增碩士點研究生的論文全部由校外專家評審。8.雙盲評議結果的使用專家評審結論分為「同意答辯」、「修改後答辯」、「重大修改半年後答辯」和「重新撰寫一年後答辯」四種。(1)專家評審結論分為「同意答辯」,學位論文無需修改,申請者可直接申請答辯;(2)專家評審結論分為「修改後答辯」,申請者須根據專家意見,逐條進行認真修改。修改後的論文須經導師認可後申請答辯。
  • 2020年下半年MBA/EMBA國家班論文雙盲評審結果判定及答辯前後相關...
    2020年下半年MBA/EMBA國家班論文「雙盲評審意見及結果判定」已出,現根據>研究生院《關於做好2020年下半年專業學位研究生申請學位通知》要求,作如下安排:一、雙盲評審結果判定及答辯前準備研究生院專業學位辦判定結果如下:
  • 翟天臨曾很擔心博士論文「盲審」,然而「雙盲」評審順利通過?
    至關重要的問題是,翟天臨的博士論文到底在哪裡,這篇論文是何人所寫,又是如何寫的,最後是怎樣通過「雙盲」評審的?顯然,教育部注意到了這個問題,「調查……也涉及到了工作的其他各個環節是否有問題」。博士論文「雙盲」評審,是指評審人不知道論文是何人所寫,被評審人也不知道何人在評審自己的論文。北電《北京電影學院博士學位論文雙盲評審辦法》(院發研字〔2019〕1 號)規定:「雙盲評審,是指將評閱人姓名對學位論文作者及其導師隱去,同時將學位論文作者及其導師姓名對評閱人隱去而進行的學位論文評審工作。」「每篇博士學位論文由 3 位專家雙盲評審。」
  • 「2018年國際自然語言處理及中文計算會議」開始徵文!
    NLPCC 2018 將旨在探討大數據和人工智慧下的自然語言處理和理解的研究和應用,包括語言計算的基礎研究、多語言處理、Web挖掘/文本挖掘、NLP機器學習、知識圖譜、信息提取、問題解答、信息檢索、聊天機器人、社交網絡 NLP 以及語言計算的應用等。
  • 南開大學推出研究生學位論文「雙盲」評審制
    南開新聞網訊(記者 平揚)繼優秀博士學位論文培育基金設立,南開大學又推出研究生學位論文「雙盲」評審制度,為提升人才培養質量再加一支「助推劑」。據悉,這一制度執行範圍不僅為全校博士學位申請者,還選擇經濟學院作為試點,嚴格應用於碩士學位論文審核中。
  • 同行評議要不要"雙盲"?
    儘管作者通常並不知道是誰在審稿,但是審稿人一般都知道論文的作者是誰。但是,上周發表在《保護生物學》(Conservation Biology)雜誌的上一篇文章指出,該雜誌正考慮引入「雙盲」同行評議。在雙盲同行評議中,無論是論文作者還是審稿人都不知道對方的身份。這種評議方法在人文社科領域被廣泛採用,但很少被應用在科學期刊中。
  • 器官捐受理當「雙盲」
    原標題:器官捐受理當「雙盲」  秦 丹   「為救人,減肥11公斤」,最近金山區一個造血幹細胞捐獻者的感人事跡和他的名字,久久流傳。卻不料專家對此警醒地指出,這樣會洩露捐獻者的隱私。如何讓器官捐獻供方和受方的個人隱私得到有效保護,近日在全國兩會上,月初才成立的「中國人體器官捐獻和移植委員會」引發關注。
  • 同行評審的演變和編輯的角色:來自Nature Communications主編的...
    微信連結:https://mp.weixin.qq.com/s/hiUCCAVp-5gfNHSwwvFApQ 為了幫助我們更多地了解同行評審、編輯所扮演的角色,以及問責制和透明度如何在此過程中促進道德規範和公正,我們邀請了 Nature Communications 的主編Elisa De Ranieri與我們分享她的想法。
  • NIPS 2018人工智慧假肢挑戰賽結束,百度Firework團隊奪得第一
    雷鋒網 AI 科技評論消息,距 NIPS 2018 召開還有不到一個月的時間,NIPS 2018 上的各種技術挑戰賽也接近尾聲。關於挑戰賽的詳細信息,請參見:距 NIPS 2018 還有小半年,會上的各種挑戰賽已經開始啦在上周結束的 2018 人工智慧假肢挑戰賽(AI for Prosthetics Challenge)中,來自中國百度的技術團隊 Firework 一舉擊敗全球 400 多支參賽團隊,以 9980.46 的得分奪得冠軍,領先第二名高達 30 多分。
  • 微信發原圖會洩露位置信息?官方回應!
    稀鬆平常的事情可是如果你喜歡給別人發照片原圖那就要小心了因為這樣極有可能會告訴別人你本人在哪裡或者你在哪裡拍的照片昨天(1日)下午#微信發原圖或洩露位置信息#衝上微博熱搜引發關注和熱議據媒體報導,近日有消息稱微信發照片時選擇「發送原圖」可能會洩露拍攝定位有專家表示的確如此但需同時滿足3個條件手機GPS定位已打開拍照設置保存了地理位置
  • 開機就會洩露信息,竟連關機都沒用?我們的手機是如何被追蹤的?
    手機除了洩露信息還能被定位雖然手機產業發展了,可是相關服務卻一直沒有到位。在今年315大會上爆料出來的「APP信息洩露」和所謂的「探針盒子」更是讓每個人捏了一把汗。可是就在大家關注信息洩露時,卻忽略了一個更重要的事情,那就是你的手機會被定位。