ACL開幕式最全解讀:大會的三個「最」和三個「第一次」都是什麼...

2020-12-25 雷鋒網

溫哥華時間 7 月 31 日早上九點,ACL 2017 正式開幕。在開幕儀式上,包括大會主席在內的多位組委會代表上臺發表致辭,並邀請了 ACL 現任主席、瑞典烏普薩拉大學的 Joakim Nivre 做報告。雷鋒網 AI 科技評論第一時間發來現場報導。

三個「最」和三個「第一次」

本屆 ACL 的規模創下了歷史高峰:不論是論文的投遞數,或是作為贊助商來到現場的企業數量都是前所未有的。ACL 大會主席先公布了一系列數字,在雷鋒網 AI 科技評論看來,可以描述為三個「最」和三個「第一次」。

根據現場公示的信息與大會會刊提供的數據,雷鋒網(公眾號:雷鋒網) AI 科技評論結合此前的報導綜合總結,第一「最」莫過於今年的 ACL 共收到了 751 篇長文和 567 篇短文的投遞,共計 1318 篇。其中:

  • 長文有 195 篇被錄用,包括 117 篇口頭報告論文和 78 篇 poster,錄取率 18%;

  • 短文有 104 篇被錄用,包括 34 篇口頭報告論文和 73 篇 poster,錄取率 25%;

  • 此外,還有 22 篇傑出論文,包括 15 篇長文和 7 篇短文,錄取率 1.6%。

因而 ACL 2017 的第二「最」便是,整個會議期間共有 367 個大大小小的報告,長文將展示 14 分鐘,短文 12 分鐘,包括提問時間。由於要在短短幾天內安排如此多的議程,同一時段最多將進行五個演講,這也是前所未有的。

ACL 的第三「最」則是贊助商的數量也達到了史上最多,達 36 家(外加 NSF),其中不乏中國廠商,包括 BAT、搜狗搜索、華為、CVTE、今日頭條等多家企業。根據雷鋒網在現場的了解,包括騰訊、阿里、百度在內的一些贊助廠商在這次會議上發表了論文,而也有一些企業抱著學習的心態來到現場,並比較含蓄地表達了自己的招人需求。與 CVPR 激烈爭奪人才、線下活動多如牛毛的情況不同,ACL 的線下活動相對較少,以會場內當面的交流和溝通為主。

由於展位位於一樓大廳的茶歇處,因此參會者在休息時段也將各個展位圍得水洩不通。

而至於三個「第一次」,一個是昨天雷鋒網提及的 WiNLP,這個關注女性研究群體的 workshop 是第一次舉辦;另一個則是「KiddleCorp」,便於已為人父母的研究者們也能帶著小孩來參會。在會場的三樓,不僅有專門的哺乳室,還有專門供 12 歲以下的小朋友玩耍的遊戲間。而除了會場的貼心準備外,還會有增加親子互動的水族館參觀環節,這種更加人性化的細節更加增進了研究者對 ACL 的好感。

另一個「第一次」則是,本次活動首次增設了「PC Blog」這一環節,組委會的成員們在籌辦會議期間,在 ACL 官網的博客上記錄下了從論文投遞到論文評審的點點滴滴,共發布 36 篇。

比如去年年底的《LAST CALL FOR AREA CHAIRS—A CALL FOR DIVERSITY!》就是其中一篇經典分享,在本次開幕式上,ACL 2017 程序委員會主席、新加坡國立大學的 Min-Yen Kan 教授再次針對區域主席的提名數據做了分享。從被提名成員的來源、性別、領域、所在機構及職稱上,我們可以從圖表中看出一些有意思的地方。

  • 比如,自薦的比重達到 68%,也有31%是他人推薦;

  • 男性依然佔絕大比重,佔比 78.4 %;女性只佔 21.6%;

  • 來自美國的研究者佔據了提名池的半壁江山,佔比約 57%,而歐洲則以 32% 的百分比位列其後,可見兩地的成員比重佔據主導地位;而亞洲及泛太平洋地區則與非洲和中東比重一致,均約為 5%。

  • 此外,有 83.8 % 的被提名者來自學術界,而產業界則佔比 16.2%。

  • 高級研究員的比重則達到了 59.5%。

論文投遞如何不踩雷?這是主席的肺腑之言

接下來,另一位 ACL 2017 程序委員會主席、MIT 教授 Regina Barzilay 又給在場的觀眾們分享了論文投遞的一些注意事項。

比如,她提及有 10% 的論文沒有經過評審就直接被拒,常見的原因包括,長度不符合要求、論文領域不符合 ACL 的調性、字體問題、匿名投遞等。她建議,在提交論文之前可以採用在線格式檢查器進行最後核實,避免與心儀的會議失之交臂。

與此同時,會議組織者組重要的任務是合理分配論文給對應的審稿人,審稿質量也影響者會議的水準和研究領域的方向。由於今年的投遞數量過多,Barzilay 教授也坦誠在評審環節上存在諸多挑戰,因此組委會採用了 Toronto Paper Matching System(TPMS),將所有投遞的論文進行合理分配,並且創建了一個實時更新的評審資料庫。

關於 TPMS 的詳細介紹可參考:https://mila.umontreal.ca/en/publication/the-toronto-paper-matching-system-an-automated-paper-reviewer-assignment-system/

在評審過程中,組委會採取了「期刊式」(journal-like)的評審方法,即儘可能讓每位區域主席經手儘可能少的論文,並縮短論文的初審時間,但增加爭議論文的討論時間。

在組委會的努力下,有 78% 的論文基於首次評審的結果被錄用。而有爭議的論文在經過二度評審後,增加和降低的分數分別為 3.14 和 3.4。

Barzilay 教授根據本次的評審結果,總結出兩個結論,

她認為,應該將更多的時間留給有爭議的論文,而不是兩頭(很快能確定是否錄用)的論文上。

非常有意思的是,Barzilay 教授也提及了論文評語常見的一些關鍵詞(如下圖所示),不難看出,將論文寫得清晰明白,論據翔實,並且有獨到的觀點,是論文篩選的重要標準。(敲黑板!論文下一次能不能中,就看同學們能不能記住這三點了!)

最後,Barzilay 教授動情地回憶了她 20 年前第一次參加 ACL 1997 時的經歷,她表示,在參加完那次會議後,她確定了接下來要走的路——繼續在計算機語言學和自然語言處理領域深耕,並且 20 年如一日,一直到今天。以此,她勉勵在座的同學們在大會期間也能有更多的思考,或許這些啟示甚至能影響自己未來的職業生涯。

ACL 最關注的三個議題是什麼?

在開幕式的最後環節,ACL 2017 主席 Joakim Nivre 做了大會主題報告,他以生動幽默的語言描述了 ACL 上三個值得高度關注的問題。

Equity and Diversity——公平性和多樣性

在會上,Nivre 教授引用了兩段話來闡述公平性和多樣性的重要程度。

  • 不論是接受或是拒絕進入科學的大門,這並不取決於對方的個人或社會屬性……種族,民族,宗教,階級和個人素質等都無關緊要。——Robert K. Merton

  • 科學家,心理學家,社會學家、經濟學家和人口學家們數十年的研究表明,社會多樣化的群體(即具有不同人種、民族、性別和性取向的種族)比同類群體更具創新性。——Katherine W. Phillips 在 2014 年 10 月的《科學美國人》上所發表的文章《多樣性如何讓我們變得更加聰明》

ACL 全稱為國際計算機語言學協會(Association for Computational Linguistics),在 ACL Fellow 和組委會成員的甄選上,協會採取了全新的標準,以避免可能存在的偏見,並且增加了人群的多樣性。此外在議程的設置上,正像前文雷鋒網 AI 科技評論所提及的 KiddleCorp 以及 WiNLP 一樣,都是凸顯公平性與多樣性的活動。

Publishing and Reviewing——出版與評審

ACL 協會為了促進公平性,在論文的篩選上採用的是雙盲同行評審的模式。但由於類似 arXiv 這樣的平臺出現,實際上雙盲評審也不總是能夠奏效。例如在 EMNLP 2017 所做的一項研究發現,在接受調查的 701 位評審中,有 30% 的受訪者表示他們能夠正確判斷出一篇論文的作者是誰(很有可能在投遞會議前,這篇論文就在學術圈刷屏了)。

這一討論在官網的 PC Blog 上也有提及,詳見:https://chairs-blog.acl2017.org/2017/03/02/arxiv-and-double-blind-reviewing-revisited/

在演講中,Nivre 教授也總結了同行評審所帶來的三個問題及對應的解決方案:

  • 首先,不斷增加的論文投遞數讓評審人不堪重負,可能會對論文評審質量造成影響;

  • 其次,隨著 arXiv 的出現,會議不再成為討論最新想法的平臺,時效性變差;

  • 再者,期刊相比起會議而言權威性更加高,那麼期刊是否依然是科學領域的掌門者?

因此,組委會希望從以下三點入手:

arXiv 平臺具有開放性和同行評審的特點,那麼對於論文作者而言,這一平臺給他們帶來了多大的便利?針對這一問題,ACL 進行了一次預印論文與評審的調查。

對參與調查的 623 名受訪者中,研究者發現有 22% 的論文作者會講自己的論文先提交在 arXiv 上;而且有 27% 的受訪者(非常)經常引用 arXiv 平臺上的論文。

調查的結論如下:

Good Science——好的科學

Nivre 教授這裡所謂的「Good」,他用兩個關鍵詞總結它所表達的含義。

一個是可複製性(replicability),也就是說,實驗的復現性要強,能夠通過同樣的測量手段實現同樣的效果,具備基準和公平比較的條件(fast science);

另一個是復現性(reproducibility),即能夠在相似實驗上得到相似的結果,可以構建有效的假說,並且經得起反覆測試和比較分析(slow science)。

最後,Nivre 教授也勉勵大家,前途是光明的,「Keep up and good work!」

精彩紛呈又信息量滿滿的開幕式就此落下帷幕,在縱覽 ACL 2017 大會情況外,在座的老師和同學們也更好地了解了國際計算機語言協會所作出的努力和思考。接下來的幾天,將會有超過 300 個報告展示陸續進行,更多精彩內容敬請關注雷鋒網 AI 科技評論。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • ThoughtWorks連續榮獲三「最」僱主品牌獎
    2018年底到2019年初ThoughtWorks連續獲得三個僱主品牌獎:「2018 年度關懷僱主獎」、「王者之舟 · 最愛人才僱主獎」、「2018 中國最愛僱主 20 強」2018年12月25日,大街網第五屆「非常僱主」頒獎典禮在深圳舉辦。
  • 「國王-男人+女人=皇后」背後的詞類比原理究竟為何?| ACL 2019
    雷鋒網 AI 科技評論按:在近些年的自然語言處理研究中,「詞類比」是一個十分有趣的現象,最經典的例子莫過於「國王-男人 女人=皇后」。然而,如何將神經網路的黑盒拆開從而解釋這一神奇的現象,一直都是有待探索的有趣的科學問題。
  • 人生,過「七個七年」,看「三個平凡」
    年底總有年底的總結,人生總有人生階段的總結,有人喜歡幹總結的事兒,比如最近看到的一個日本版的《人生七年》,英國BBC那個片子火了之後,日美南非都出了自己的七年。不知道中國啥時候也能出個自己的七年。估計變化最大的中國版本《人生七年》一定會是最震撼的七年。人多不說,變化也是最大的。人生有幾個七年?中國的這些連起來的七年真不一般。
  • 天津市「推薦美食」:三個漁夫蒸汽海鮮(梅江店)
    具體地址:友誼南路珠江道口龍水園3號(緊鄰上島咖啡)優質點評:吃海鮮論新鮮就是三個漁夫了,吃了好幾家分店,都是超級新鮮乾淨,這回來梅江總店吃就更不用說了!這次的一筐蛤蜊好像量更大,黃蜆子也是個大、肉多、汁甜,難怪是每桌必點的招牌菜。服務員介紹的扇貝的吃法也很獨特,用貝殼很方便地夾掉了沙袋,學了一招。朋友點的小黃魚,第一次吃,居然意外的鮮美,白細的蒜瓣肉入口鮮甜,下次還點!豉椒拌鮮貝裡的小嫩黃瓜也很特別,算是個小驚喜由於趕上母親節,人超級多,店門口增加了露天餐位,還蠻有情調的,天熱了我也要試試。
  • 「工匠·洗車」如何追求「無損」洗車?9個步驟,全攻略
    上期回顧:「工匠·洗車」或許你不知道,車漆都是洗壞的!時隔5個多月,我終於有時間來編寫「工匠·汽車美容」的第二篇了。上期我們詳細講解了「極致洗車」的工具配置,今天我們就來看看如何發揮這些「利器」最大的作用。
  • 申請指南|香港「中學」入學申請最全乾貨!—申請解讀篇
    這個階段,全港每所參加派位的中學(包括官立、資助、及部分直資中學),會把大約三成的學位作為自行分配,學校自行決定收生準則及取錄學生。☆統一派位在中學「統一派位」這個階段,全港每所參加派位的中學(包括官立、資助、及部分直資中學),扣除在「自行分配學位」時已派出的及預留給該校重讀生的學額後,會把剩餘的學額用作統一派位。這些學額約佔每所中學學額的65%。
  • 「千言」最容易說出口的三個字是我愛你,最難說的三個字是對不起
    為了一個人,我們都曾死皮賴臉的糾纏,然後傾盡著無處安放的溫柔,再毫無保留的付出所有,到了最後,卻還要拋棄自己的底線,一次又一次的選擇原諒。世界上,最容易說出口的三個字,是「我愛你」,最難說的三個字,是「對不起」。
  • ACL2019正會開幕:會議狀況全覽,周明大會演講
    在第一部分中,周明談到「ACL 學會的發展史就印證了 NLP 領域的發展史」,如今隨著 NLP 領域的發展壯大,ACL 也已經有了 EACL、NAACL、AACL 三個分會,都積極推動著 NLP 整個領域的進步。
  • 「三階」到底是「さんかい」還是「さんがい」?
    日語中有著大量的數量詞(助數詞),除了記憶方面的困難之外,相信有很多小夥伴會被發音所困惑,因為總有些數量詞不按照正常套路來,比如「三階」這個單詞到底是讀什麼呢?可能看到這個問題很多人會不假思索的說是「さんかい」因為身邊有很多日本人是這麼讀的。而且去日本的時候可能看到電梯裡面甚至還有標註讀音的。
  • 「バカ」和「アホ」除了表示笨蛋,還可以表示什麼?
    其中,「バカ」漢字寫作「馬鹿」,而「アホ」漢字寫作「阿呆」。兩者雖然都可以表示「傻瓜」、「笨蛋」但是日語中還是有一定的區別的?今天,我們就一起來探討下兩者的區別。但是隨著時間的推移使用上也得到普及,也不是說關東就不說「アホ」。備註:關東地區通常指本州以東京、橫濱為中心的關東地方。包括東京都、神奈川縣、千葉縣、埼玉縣、茨城縣、櫪木縣、群馬縣,位於日本列島中央。關西包括大阪、京都、滋賀、三重、奈良、和歌山、兵庫2府5縣的地區。
  • 「小目標」是什麼,怎麼投?|「小目標」最全介紹
    來源:基金豆二、「小目標」的投資理念A股市場存在長期向上、牛短熊長、結構行情波動劇烈三大特徵,投資者如果目標太宏大,投資過程會漫長而痛苦,結果不是半途而廢就是收益坐了過山車。「小目標」是把長期投資拆解成一個個小目標,步步止盈逐個達成,保持紀律不焦慮不貪婪,長期複利賺取可觀收益。投資過程也更快樂,更享受。
  • 「文倀」是個什麼鬼
    「倀」字在《說文解字》裡還是「猖狂」的意思,大概到了唐朝,就變成了鬼了。比如《北夢瑣言》說的「江河多倀鬼,往往呼人姓名,應之者必溺,乃死魂者誘之也」,是淹死鬼;《廣異記》裡有個故事:「天寶末,宣州有小兒,其居近山。每至夜,恆見一鬼引虎逐己,如是已十數度。小兒謂父母云:『鬼引虎來則必死。世人云:為虎所食,其鬼為倀。我死,為倀必矣。若虎使我,則引來村中,屯中宜設阱於要路以待,虎可得也。』
  • 「食不厭精,膾不厭細」被誤解千年,正確的解讀是……
    很多人都聽過「食不厭精,膾不厭細」這句話,它被認為是孔子的飲食之道,備受後人推崇,後人是怎麼理解?一、後人對「食不厭精,膾不厭細」的理解後人對這句話的理解多是「食物精製細做才養人」,所以很多人只吃精米白面,並力求各種精緻做法。而美食界更是把這句話踐行到了極致,一道菜從選材、搭配、刀工、火候、調味、擺盤都追求極致,做道菜費個半天一天的功夫都很正常。
  • 在剛剛結束的ACL 2019上,知識圖譜領域都發生了哪些大事?
    因此,既然大會主席都提到了基於 KG 的對話系統,那麼確實應該在這個領域做一些工作,對吧?而 Sydorova 等人(https://www.aclweb.org/anthology/P19-1488)在具有「圖」和「文本段落」兩類知識源的 TextKBQA 任務上取得了很好的效果。
  • 「利用Anki快速背單詞」最全攻略
    詞彙量的重要性無需多言,沒有它作為基礎,一切能力提升和考試技巧都是空中樓閣。我在之前的文章 聰明人怎么正確地背單詞?(左邊藍色的意思是可以點擊哦)中詳細解釋了如何有策略地提升自己的詞彙量。後來,我安利了我認為最棒(沒有之一)的背單詞工具——Anki,並且提供了麥克米倫7000高頻詞彙表的下載連結。
  • ...中「S」和「R」到底是什麼意思?蘋果終於給了個解釋 | 愛範兒
    iPhone 名字中「S」和「R」到底是什麼意思?蘋果終於給了個解釋 今年蘋果公司推出的新款 iPhone,不僅在定價上創新高,名字也是前所未有的複雜。
  • 有獎徵集 | 尋找最最可愛的「倍貝高成長之星」
    」一經問世以它獨有的5G N+全營養配方可口宜人讓孩子迷戀的味道已經俘獲了無數寶媽萌娃的心作為一款幫助兒童成長發育的奶粉它支持3-15歲孩子的營養補給越來越多的小朋友都喜歡上了「倍貝高」他們長得越來越高了他們胃口越來越好了
  • 淺析日語助數詞「回」和「度」的區別
    小編在之前的一篇文章裡介紹了助數詞「本」的用法,今天我們來聊一聊助數詞「回」和「度」。「回」和「度」在日語中都可以用來表示次數,有的時候二者可以互相替換,有的時候替換後又感覺不合適,那麼二者到底有什麼區別呢。
  • 甲骨文解《道德經》之三,老子「心智系統轉換」方法、原理、要點
    一、「虛」字的含義我們現在解讀「虛」字都是從哲理性去理解的,其實,這個「虛」字在甲骨文的造字者以及老子的意識中,都是非常具體的,屬於物理性的具象,就是「心智系統轉換」具體操作方法的圖示。甲骨文「虛」字的字形是上、中、下的結構,最下面是個「土」字,中間是個的「北」字,最上面是是一個符號,這個符號的具體意思我們在後面講,這裡先講下面的「土」字。1、「土」字的含義:上圖,這兩個字都是甲骨文「土」字。
  • 著名的「詞類比」現象可能只是一場高端作弊
    :「詞類比」可謂是自然語言處理領域最為人津津樂道的經典案例之一。目前,NLP 領域最著名的算法莫過於「Word2Vec」,幾乎所有該領域的從業者都知道它(甚至許多對機器學習感興趣,但不研究 NLP 的人也知道它)。WordVec 有幾種不同的實現方式,非常易於使用。在許多機器學習/人工智慧或 NLP 入門課程中,往往會將其作為一個教學示例。人們喜歡它的一個主要原因是:它似乎非常直觀。