社交媒體和arXiv存在,讓雙盲評審形同虛設 | Reddit熱議

2021-01-11 澎湃新聞

白交 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

雙盲評審機制真的雙盲嗎?

最近,Reddit上有這樣一個討論:社交媒體與arXiv是否損壞了頂會雙盲的機制?

13個小時,熱度超過300…

起因是一位研究人員分享了他的經歷:

NeurIPS 2020會議提交截止之後,他在Twitter上看到有人分享他們的arXiv研究成果,並得到了很好的反饋。

關鍵是,這些人一般都是Twitter上的大V,大多都來自谷歌、Facebook等著名機構的研究人員。

一旦發出,就會一呼百應,受到大家的點讚和轉發。

比如,就像這位Facebook AI研究員。

甚至還有一些機構直接下場發推——DeepMind的新研究,自監督模型BYOL刷新ImageNet記錄。

而此時,這些大會的評審工作還沒有完全結束。這樣做不僅會給雙盲評審人員巨大壓力,還損壞了頂會雙盲評審機制。

還沒有通過同行評審就放arXiv和社交媒體上,那雙盲豈不是在搞笑?

影響力or接收,哪個更重要?

先不論雙盲機制是否真的雙盲。

對於一個研究團隊而言,每年頂會放榜,論文會被錄用?錄用幾篇?都是他們關注的問題。

畢竟這意味著你們這個團隊在領域有多大的影響力,還有利於之後的研究進行。

就像這位來自小型研究室的成員說的那樣,幾年前在ML和CV領域的認可度幾乎為0,而被這些大會接收以後,原本毫不起眼的實驗室也就有了一定的影響力。

這樣來看,影響力與論文接收其實並不衝突。

但是對於一些團隊而言,卻有一個誰在前在後的問題,尤其是對於那些已經在領域內有一定影響力的人。

被更多人認可、討論、運用似乎就比被一個會議接收來的更重要。

就像這位網友提到的那樣:

現實情況是,社交媒體上宣傳對一篇論文的成功,遠比是否被會議接收更重要。

等到會議真正放榜的時候,大部分的論文已經過時不受關注了。它只是為了讓你的簡歷更加好看。

但是對於一般的團隊而言,是否要提前發布在arXiv,甚至發表在社交媒體上呢?

有的人作為一個旁觀者的角度,認為自己從arXiv了解到很多棒的idea,當一篇論文還在審核的時候,就已經讀過了,而最終是否會被會議錄用,與我們毫無關係。

這樣來看,arXiv確實能夠提供了更為廣泛的交流機會。

但是林子大了,什麼樣的論文也就有了,arXiv論文魚龍混雜也不是一天兩天的事情了。

那麼對於一些沒那麼大影響力的團隊而言,擔心自己的idea被人竊取,也估計收不到那麼多的關注,也就不會提前在arXiv上發表,更別說在Twitter上發表了。

同行評審也一直飽受爭議

而落回會議的同行評審制,其實也一直飽受爭議。最關鍵的原因,就在於它的不透明性。

如何審?有多少人審?這些審稿人的身份是什麼?

僅僅因為少數人甚至可能只有3-4人的評審觀點,就能判斷這個論文的好壞?

GAN的發明人,現為蘋果AI負責人Ian Goodfellow 就曾炮轟同行評審機制,認為是這一制度導致了如今AI會議論文下降。其中,「評審人質量參差不齊」是主要原因,浮誇的論文被選中,真正的好論文反而被埋沒。

那麼如何解決這個問題呢?

既然如此,arXiv和社交媒體會一直存在,審稿也會繼續,那麼該如何解決這個問題呢?

此前,就曾有過一個會議解決這個問題,KDD 、ACL就曾要求,在論文結果出爐之前不允許發表在arXiv上。

在這裡,有一些網友提供了自己的建議:

arXiv可以為正在審閱的論文添加匿名模式,發布的同時不會透露其身份。

修改會議規則,取消可以通過合理方式(比如,網際網路搜索)識別作者的論文的資格。

而如果在審稿途中,已經知曉了論文作者是誰,該如何做呢?

有這樣一個建議:

啟動一個關於論文的Reddit線程,或者問問朋友們對論文的arxiv版本有什麼看法。

如果你已經在Twitter上知道了論文作者,那麼為何不更進一步,利用Twitter尋找論文的缺陷—這反而還會抵消知道作者很有名的偏見。

你覺得呢?有什麼更好的建議嗎?歡迎與我們分享~

參考連結:

https://www.reddit.com/r/MachineLearning/comments/hbzd5o/d_on_the_public_advertising_of_neurips/

作者系網易新聞·網易號「各有態度」籤約作者

— 完 —

原標題:《社交媒體和arXiv存在,讓雙盲評審形同虛設 | Reddit熱議》

閱讀原文

相關焦點

  • 社交媒體和arXiv存在,讓雙盲評審形同虛設|Reddit熱議
    白交 發自 凹非寺量子位 報導 | 公眾號 QbitAI雙盲評審機制真的雙盲嗎?最近,Reddit上有這樣一個討論:社交媒體與arXiv是否損壞了頂會雙盲的機制?一旦發出,就會一呼百應,受到大家的點讚和轉發。比如,就像這位Facebook AI研究員。甚至還有一些機構直接下場發推——DeepMind的新研究,自監督模型BYOL刷新ImageNet記錄。而此時,這些大會的評審工作還沒有完全結束。這樣做不僅會給雙盲評審人員巨大壓力,還損壞了頂會雙盲評審機制。
  • 新智元專訪CVPR2019程序主席微軟華剛 :arXiv讓雙盲評審形同虛設...
    華剛博士在肯定arXiv加速學術交流的同時,一針見血地指出,「arXiv讓學術會議的雙盲評審形同虛設」,arXiv上的論文質量也是「魚龍混雜」。他在訪談中分享了地計算機視覺研究情況的觀察,認為預期3個方向近兩年會有發展:一是基於圖像、視頻建模的無監督學習;二是基於任務的視覺建模機制;三是基於知識和小樣本學習進行視覺建模。
  • ACL 禁止投稿論文提交 arXiv,雙盲評審真的有效嗎?
    匿名評審的有效性如何,應該怎樣保證這種政策的公平性,值得重新思考。近日,ACL(計算語言學協會)更新了其會議論文的投稿、評審和引用政策。其中最受爭議的一項要求是,為了雙盲評審的有效性,禁止投稿論文在截止日期前的1個月時間裡在 arXiv 等平臺公開預印本,直到論文評審結果公布。這些新要求引起一些質疑雙盲評審有效性的聲音,不過,多數研究人員表示支持新政。
  • ACL新政禁止投稿論文在arXiv公開,我們到底需要什麼樣的雙盲評審?
    這一要求顯然再次引發了對於「雙盲評審的必要性」和「如何高效率地執行雙盲評審」的討論,畢竟一段時間之前 ICLR 2018 的匿名論文投稿在評審結果出爐前就大批量暴露了論文作者,已經出現了一些批評的聲音。剛好 ACM 通訊近日的一篇文章就研究了論文接受率和匿名的關係,雷鋒網 AI 科技評論先帶大家重新認識一下前一個話題。
  • NIPS 2018又出事了:審稿信息洩露,雙盲評審失效!
    NIPS 2018又出事了:審稿信息洩露,雙盲評審失效! 李倩 發表於 2018-08-13 09:57:20 NIPS 2018又出事了:審稿信息洩露,由於論文提交CMT系統的重大漏洞,審稿人可以判斷出單篇論文的姓名和機構,讓雙盲評審失效!
  • 在社交媒體上「自我宣傳」,會使科研論文發表變得更容易嗎
    因為在嚴格的雙盲同行評議制度面前,論文作者的名氣和公關行為根本無用武之地,這也是對發表論文質量的有力保障。然而,如今隨著社交媒體的日益發達和預印本平臺的興起,這種情況會有改變嗎?論文作者在社交媒體上的「自我宣傳」,會影響審稿人的判斷、提高論文接收率,甚至對雙盲評審制度造成破壞嗎?最近,在美國社交新聞網站Reddit上一條有關這個話題的帖子,迅速引發了眾多討論。
  • 翟天臨曾很擔心博士論文「盲審」,然而「雙盲」評審順利通過?
    博士論文「雙盲」評審,是指評審人不知道論文是何人所寫,被評審人也不知道何人在評審自己的論文。北電《北京電影學院博士學位論文雙盲評審辦法》(院發研字〔2019〕1 號)規定:「雙盲評審,是指將評閱人姓名對學位論文作者及其導師隱去,同時將學位論文作者及其導師姓名對評閱人隱去而進行的學位論文評審工作。」「每篇博士學位論文由 3 位專家雙盲評審。」
  • ICLR 2018截稿:取消公開評審改為雙盲引人關注
    在2013年舉辦的第一屆ICLR大會官網上, Yann LeCun 和 Yoshua Bengio曾這樣介紹舉辦這一會議的初衷:「儘管表徵學習對於機器學習及包括視覺、語音、音頻及 NLP 領域起著至關重要的作用,目前還缺乏一個場所,能夠讓學者們交流分享該領域所關心的話題。ICLR 的宗旨正是填補這一鴻溝。」
  • 2020年下半年MBA/EMBA國家班論文雙盲評審結果判定及答辯前後相關...
    2020年下半年MBA/EMBA國家班論文「雙盲評審意見及結果判定」已出,現根據>研究生院《關於做好2020年下半年專業學位研究生申請學位通知》要求,作如下安排:一、雙盲評審結果判定及答辯前準備研究生院專業學位辦判定結果如下:
  • Arxiv網絡科學論文摘要20篇(2020-11-12)
    動態網絡中的自適應社區搜索;用低資源語言檢測社交媒體操縱;衡量歐洲和美國COVID-19死亡率的巨大突然變化;描述在線社會網絡中用戶動態的基本方程的閉式解;基於自發對稱破缺概念的在線社會網絡極化模型;考慮外部刺激共鳴的在線社會網絡中火紅現象的新模型;通過社交媒體進行實時知識聚合
  • 學界| ICLR 2018截稿:取消公開評審改為雙盲引人關注
    在2013年舉辦的第一屆ICLR大會官網上, Yann LeCun 和 Yoshua Bengio曾這樣介紹舉辦這一會議的初衷: 「儘管表徵學習對於機器學習及包括視覺、語音、音頻及 NLP 領域起著至關重要的作用,目前還缺乏一個場所,能夠讓學者們交流分享該領域所關心的話題。ICLR 的宗旨正是填補這一鴻溝。」
  • Reddit熱議:一道看似簡單的分類基礎問題,為何難倒一大片人?
    這個看似簡單的基礎問題著實難倒了reddit上的一位網友,他在17次面試中,有15次被這個問題問倒,只好發到reddit上求助,結果引發熱烈討論。在機器學習領域,二元分類器問題可以說是一個非常基礎的領域,基於二元分類器的模型,已經成為目前多個常見分類模型應用構建的基礎。但就是這樣一個基礎問題,最近卻難住了一位Reddit網友。
  • 社交媒體加劇了「沉默的螺旋」理論?
    《紐約時報》今日發表題目為「社交媒體如何抑制辯論」(How Social Media Silences Debate)的文章稱,Facebook和Twitter等社交媒體不但沒有強化政治參與,反而削弱了人們暢所欲言的意願。
  • 錄取率21%、Oral取消、評審出現Bug、Reddit上...
    審稿過程不易 Kevin表示: 每篇主track的第二階段的論文都至少收到3篇評審;超過93%的論文獲得4+分。每篇快速track論文都至少收到兩篇新的AAAI評審;超過95%的人獲得3+的評審。
  • arXiv無償捐贈170萬篇論文給Kaggle,BERT版審稿人要來了!
    那餵給GPT-3會發生什麼? 南大周志華老師曾發微博指出,不要把arXiv當做正式文章,當成BBS即可,沒經過同行評審,連跳大神都是有可能的。
  • Arxiv網絡科學論文摘要10篇(2020-10-14)
    雖然反向入侵的存在並沒有完全削弱原始捕食者物種的演化優勢,但是這種減弱的有效入侵率有助於相關的獵物物種收集更大的初始區域,以便在它們之間進行最後的戰鬥。這些過程的競爭決定了系統終止統一狀態的可能性。緩解錯誤信息的流行策略包括眾包,機器學習和媒體素養程序,這些程序要求社交媒體用戶將新聞以二進位術語分類為真或假。但是,對同伴影響力的研究表明,以二進位術語構成決策可能會放大判斷錯誤並限制社會學習,而以概率術語構成決策則可以可靠地改善判斷。在此預先註冊的實驗中,我們比較了在線對等網絡,這些網絡通過交流二進位或概率判斷來協作評估新聞的準確性。
  • Arxiv網絡科學論文摘要11篇(2020-08-05)
    COVID-19限制對二氧化氮和臭氧的大氣濃度的全球影響;通過多視圖聚類表徵2020年COVID-19大流行期間Twitter上的標籤使用社團;電網中停電的分布以及Motter和Lai模型;將圖像納入社交媒體的消息準確性評估;隨機幾何圖的Ollivier-Ricci曲率收斂;相互作用的非線性強化隨機過程
  • 國際媒體和各國網友熱議抗擊疫情「中國速度」和央企擔當
    國際主流媒體和各國網友對中國應對新型冠狀病毒疫情的進展高度關注,多家主流媒體推出了新型冠狀病毒肺炎的專題報導,火神山、雷神山醫院在短時間內建設完成,中國速度得到了國際社會的廣泛讚譽。主流媒體熱議「中國速度」,聚焦企業有序復工國際主流媒體高度關注中國企業「超高速」建設應急醫院,已相繼交付使用的武漢火神山和雷神山兩所「小湯山模式」醫院成為報導熱點。