機器之心報導
參與:張倩、蛋醬、小舟
PR or Not PR,結果可能真的不一樣。
中國有句古話,叫「酒香不怕巷子深」。而在學術界,論文就是研究者釀出的酒。只要你的「酒」足夠醇,總會得到大家的關注與認可。
但在社交網絡影響日益擴大的今天,這句話的力量似乎越來越弱了。在論文水平差距不大的情況下,大家真正比拼的可能會是 PR 能力。
這個問題最近在 Reddit 上被提了出來。發帖者表示,ta 擔心社交網絡上越來越熱的「自我宣傳」行為會影響到審稿人的判斷,導致宣傳效果好的論文更易被接收,對盲審制度造成很大的破壞。
NeurIPS 2020 論文的提交截止日期是兩周前。從結束提交開始,幾乎每天我都會遇到來自機器學習研究人員的 Twitter 長文。這些帖子公開宣傳他們的研究工作(顯然是 NeurIPS 提交的研究內容,從 arXiv 預印本的格式和日期來看),其作者通常是來自谷歌、Facebook 的著名研究人員。他們有成千上萬的粉絲,因此他們的 Twitter 也有很高的瀏覽量、點讚量和轉發量。
我很高興看到新的令人興奮的研究,但同時也對這種宣傳給論文審核過程帶來的影響表示擔憂。我知道 NeurIPS 並不禁止提交 arXiv 預印本,但是這種非常吸引人的廣告將對盲審的衝擊提高到了一個新的層次。
除了有損雙盲審查程序以外,我還擔心這樣的做法會給審稿人增加社會壓力。如果一篇論文在社交媒體上收穫了整個社區的讚揚,審稿人就很難去拒絕甚至批評這篇論文。如果該論文來自著名研究者或著名機構,情況會變得更糟。
但是,在最近 Twitter 的討論中,特別是在對這些帖子做出回應的頂級研究人員中,我沒有發現關心這些問題的人。難道你會認為這無所謂嗎?
發帖者提出的這個問題得到了很多人的共鳴。
有人表示,ML 和 CV 會議中的雙盲審稿就是個騙局。
「實質上,它是一個打著雙盲幌子的單盲系統。整個社區都生活在一個自欺欺人的世界裡,他們假裝這個世界上沒有 arXiv 和社交媒體。」
在他看來,身處大型實驗室的研究者在社交媒體上極力宣傳自己的研究會帶來更多呼聲,這恰恰就是偏見的來源。在沒有社交媒體影響的時代,審稿人的偏見可能是「哦,這是來自大型實驗室的論文」,但在如今這個時代,審稿人的偏見就變成了「哦,這是一篇推特上點讚量很高的論文」。
他還舉例來說明自己的觀點,拿論文《End to End Object Detection with Transformers 》來說,它來自著名的實驗室,第一作者也是業內知名的研究者,並且在 Reddit 上有著很多的討論。此外,這篇論文身後也站著一貫強大的 Facebook 公關勢力。當然,這裡並不是說這篇論文不夠好,而是想說明,在這種情況下,你很難判斷 PR 對於論文的接收起到了多大的作用。
但在這種偏見上,審稿人需要負全部的責任嗎?
有人認為這是審稿人的問題,他不該逛 arXiv,不該看到推特上的論文。這種要求就有點強人所難了:畢竟我們都不是活在 2000 年,沒有智慧型手機,沒有社交媒體,論文都由知名的博士研究者審閱。
時代變了,規則當然也要改變。
「我們現在遵守的還是 20 多年前的規則,審稿系統需要作出改變了,否則廣大研究者將失去信心。」
也就是說,如果要將社交媒體、預印本平臺的影響降到最低,大會組織方必須規定在論文接收結果公布之前禁止論文預印本的上傳和 PR 行為。否則就很難做到真正的雙盲。
發推能否提高論文被接收率還沒有得到研究證實,但在人工智慧領域裡宣傳自己的研究幾乎已經成為了工作的標配。每到 AI 頂會截稿日期,知乎上總會出現「某某大會有哪些值得關注的研究」這樣的問題,引來人們的討論。
不過,宣傳自己的論文可以提高引用量,這事兒肯定沒跑了。來自不列顛哥倫比亞大學的一項研究表明,發推文宣傳的確可以提高論文的被引用量和全球影響力。
這篇論文發表在本月的醫學期刊《The Annals of Thoracic Surgery》上。在論文中,研究者將 112 篇有代表性的論文隨機分成兩組進行對照試驗(發推宣傳和不發推宣傳)。結果表明,一年之後,發推宣傳的論文所增加的引用量要遠遠高於未發推的論文,而且,Altmetric 得分也更高(該指標反映論文在全球範圍內的傳播、討論程度)。
最後,宣傳自己研究最高級的形式,可能是在論文還沒有發表的時候就開始著手。
本周四,圖靈獎獲得者 Geoffrey Hinton 的一篇推文成為了人工智慧領域裡最熱的話題:
「我認為自己在感知學習領域發現了一個很好的 idea,於是接受了一些邀請,要在下個星期討論它。但我剛剛發現這個 idea 有致命的缺陷,所以取消了計劃中的所有討論,抱歉。」
不知 Hinton 之後是否會撰寫一篇文章介紹他的新想法及其「致命缺陷」——即使是有錯誤的方向,或許對於我們來說也很有指導意義。我們都很期待 Hinton 大神的新研究。
參考連結:https://www.reddit.com/r/MachineLearning/comments/hbzd5o/d_on_the_public_advertising_of_neurips/