EMNLP 2021獎項公布,劍橋劉方宇、哥大楊子小帆一作論文分獲最佳長、短論文獎

2022-01-03 機器之心
最佳長論文、最佳短論文的一作都是正在讀博的華人學者。

EMNLP 是自然語言處理領域的頂級會議,EMNLP 2021 將於 11 月 7 日 - 11 日在多米尼加共和國蓬塔卡納和線上聯合舉行。前段時間,大會公布了接收論文列表,包括長論文、短論文和 demo 論文。接收列表:https://2021.emnlp.org/papers剛剛,大會官方又公布了今年的論文獲獎情況,包括最佳長論文(1 篇)、最佳短論文(1 篇)、傑出論文(4 篇)、最佳 Demo 論文(1 篇)。其中,最佳長論文、最佳短論文的一作都是正在讀博的華人學者。

論文:Visually Grounded Reasoning across Languages and Cultures

作者:Fangyu Liu、Emanuele Bugliarello、Edoardo Maria Ponti、Siva Reddy、Nigel Collier、Desmond Elliott

機構:劍橋大學、哥本哈根大學、Mila - 魁北克人工智慧研究所、麥吉爾大學

論文連結:https://arxiv.org/abs/2109.13238

論文摘要:如今,應用廣泛的視覺和語言數據集以及預訓練編碼器都是直接採用 ImageNet 的概念和圖像,或從中獲得靈感。但人們很難指望這種基準對計算機視覺做出多大貢獻,因為它的數據來源主要是英文的詞彙資料庫和圖像查詢,會帶有北美或西歐的數據偏見。為了克服這些偏見,來自劍橋大學等機構的研究者設計了一種新的 protocol 來構建一個代表更多語言和文化的 ImageNet 風格的層次結構,讓概念和圖像的選擇完全由母語人士驅動,而不是自動抓取它們。具體來說,他們關注的是一組不同類型的語言,即印尼語、簡體中文、斯瓦希裡語、泰米爾語和土耳其語。我們通過要求注釋者比較和對比圖像對來引出母語描述,任務是確定這些基礎描述是真是假。藉助這種方法,他們創建了一個基於視覺、語言多元文化推理(Multicultural Reasoning over Vision and Language,MaRVL)的多語言數據集。

研究者使用 SOTA 模型創建了一系列基線並發現他們的跨語言遷移表現明顯落後於英語的監督表現。這些結果促使研究者跳出一個狹窄的領域,重新評估當前 SOTA 模型的穩健性和準確性,但也為真正多語言和多元文化系統的發展帶來了新的令人興奮的挑戰。本文一作劉方宇是來自劍橋大學語言技術實驗室的一名博士二年級學生,主攻 NLP,目前主要關注多模態、自監督、可解釋性等方面的研究。在得知獲獎後,劉方宇獲得了人們的掌聲。他表示:希望繼續努力,讓多模態技術通向所有人。

論文:CHoRaL: Collecting Humor Reaction Labels from Millions of Social Media Users

作者:Zixiaofan Yang, Shayan Hooshmand and Julia Hirschberg

機構:哥倫比亞大學

論文介紹:https://underline.io/lecture/37879-choral-collecting-humor-reaction-labels-from-millions-of-social-media-users

論文摘要:幽默檢測近年來受到越來越多的關注,因為人們希望理解用戶用比喻語言生成的內容。然而,幽默感知的個體和文化差異非常大,使得收集具有可靠幽默標籤的大規模幽默數據集變得非常困難。該研究提出了一個在 Facebook 帖子上生成感知幽默標籤的框架,稱為 CHoRaL。該框架使用自然可用的用戶對帖子的反應,無需手動注釋。CHoRaL 針對幽默和非幽默提供了二元標籤和連續分數。該研究了提出了迄今為止最大的帶有幽默標籤的數據集,其中的數據來源於與 COVID-19 相關的 78.5 萬篇帖子。此外,該研究通過從帖子中提取詞彙語義和情感特徵來分析社交媒體中與 COVID 相關的表達信息,並構建了性能與人類相似的幽默檢測模型。CHoRaL 可以開發任何主題的大規模幽默檢測模型,為社交媒體上的幽默研究開闢了一條新的途徑。

本文一作楊子小帆是來自哥倫比亞大學口頭語言處理組的博士生,本科就讀於北京大學。她的研究興趣主要集中在計算副語言學和跨語言自然語言處理。

論文 1:MindCraft: Theory of Mind Modeling for Situated Dialogue in Collaborative Tasks

作者:Cristian-Paul Bara、Sky CH-Wang、Joyce Chai

機構:密西根大學、哥倫比亞大學

論文連結:https://arxiv.org/abs/2109.06275

論文摘要:理想的自主智能體意味著它們能夠以人類的方式進行協作。特別是「心智理論(theory of mind)」在人類的協作和交流中發揮著重要作用。為了在情境交互中實現心智理論建模,該研究通過讓成對的人類主體在「我的世界」中玩遊戲,提出了一個細粒度的協作任務數據集。隨著遊戲中互動的展開,該研究捕捉了合作夥伴對世界和彼此的信念的相關信息,為研究情境語言交流中的人類協作行為帶來了豐富的機會。為了未來開發出能夠推斷協作夥伴信念狀態的 AI 智能體,該研究針對幾種心理任務理論構建並展示了計算模型及其結果。

論文 2:SituatedQA: Incorporating Extra-Linguistic Contexts into QA

作者:Michael Zhang、Eunsol Choi

機構:德克薩斯大學奧斯汀分校

論文連結:https://arxiv.org/abs/2109.06157

論文摘要:對同一問題的答案可能會根據語言外的語境(例如時間地點)而變化。為了研究這一挑戰,該研究提出了一個開放式檢索 QA 數據集 SITUATEDQA,其中系統必須在給定具體時間和地點等語境的情況下為問題生成正確答案。為了構建 SITUATEDQA,該研究首先在現有的 QA 數據集中找出一些問題。研究者發現很大一部分信息搜索問題的答案取決於語境。對於此類依賴語境的問題,該研究眾包可替代語境及其相應答案。該研究表明,現有模型難以生成經常更新或不常見問題的正確答案。因此該研究進一步量化了現有模型是如何根據過去收集的數據進行訓練的,即使提供了更新的語料庫,也無法泛化地回答當前提出的問題。該研究的分析表明,開放檢索 QA 基準應該包含語言外的語境,以保持與全局和未來的相關性。由於計算時間和成本的增加,大型語言模型變得越來越難以訓練。該研究提出了一種名為 SRU++ 的高效架構,結合了快速循環和序列建模的注意力。SRU++ 表現出強大的建模能力和訓練效率。在 ENWIK8、WIKI-103 和 BILLION WORD 等數據集上的標準語言建模任務中,該模型獲得了更好的 bpc(bits-per-character)和困惑度 ppl(perplexity)。同時,與表現最好的 Transformer 模型相比,該模型的訓練成本僅為前者的 1/10 到 1/3。例如,該模型在 8-GPU 的機器上,在 ENWIK8 數據集上得到 SOTA 結果只用 了 1.6 天進行訓練。該研究進一步證明了 SRU++ 達到接近 SOTA 的性能僅需要極少的注意力。該研究的結果表明聯合利用快速循環和少量注意力將是用於加速模型訓練和推理的一個重要方向。論文摘要:常識是一種典型的人類能力,自人工智慧誕生以來,它一直是對人工智慧的核心挑戰。Transformer 神經語言模型在自然語言處理任務(包括常識推理)中取得了令人印象深刻的結果,甚至在某些基準測試中超過了人類的表現。最近,其中一些進展受到質疑:訓練數據中所謂的數據偽影已經明顯表現為虛假相關性和 shallow shortcuts,某種程度上造成了這些出色的結果。在本文中,研究者試圖將這種分析進一步深入到常識相關的語言處理任務領域,對涉及常識推理的各項基準進行了研究,並進行了一些關鍵的壓力實驗,從而深入了解模型是在學習問題內在的可遷移能力,還是僅僅利用數據中偶然的 shortcuts。結果表明,大多數試驗過的數據集都是有問題的,模型採用了非穩健特徵,似乎沒有學習和歸納到數據集傳達或舉例說明的整體任務。

論文:Datasets: A Community Library for Natural Language Processing

作者:Quentin Lhoest, Albert Villanova del Moral, Yacine Jernite, Abhishek Thakur, Patrick von Platen, Suraj Patil, Julien Chaumond, Mariama Drame, Julien Plu, Lewis Tunstall, Joe Davison, Mario Šaško, Gunjan Chhablani, Bhavitvya Malik, Simon Brandeis, Teven Le Scao, Victor Sanh, Canwen Xu, Nicolas Patry, Angelina McMillan-Major, Philipp Schmid, Sylvain Gugger, Clément Delangue, Théo Matussière, Lysandre Debut, Stas Bekman, Pierric Cistac, Thibault Goehringer, Victor Mustar, François Lagunas, Alexander Rush and Thomas Wolf

機構:Hugging Face

論文連結:https://arxiv.org/pdf/2109.02846.pdf

論文摘要:隨著新任務、大模型、新基準的不斷提出,公共 NLP 數據集的規模、類型和數量正在迅速增長。但數據集的增長也帶來了重大挑戰,包括接口標準化、版本化和文檔化。
為了克服這些挑戰,Hugging Face 創建了一個名為 Datasets 的 NLP 社區庫,旨在將終端用戶接口、版本和文檔標準化,同時提供輕量級前端,該前端對於小型數據集和網際網路級別的資料庫來說是差別不大的。該庫的設計採用了分布式、社區驅動的方法來添加數據集並記錄使用情況。經過一年的開發,該庫已經擁有了 250 多個貢獻者,還支持了很多新穎的跨數據集研究項目和共享任務。參考連結:https://2021.emnlp.org/blog/2021-10-29-best-paper-awards

2021 NeurIPS MeetUp China

受疫情影響,NeurIPS 2021依然選擇了線上的形式舉辦。雖然這可以為大家節省一筆註冊、機票、住宿開支,但不能線下參與這場一年一度的學術會議、與學術大咖近距離交流討論還是有些遺憾。

我們將在NeurIPS官方支持下,於12月4日在北京麗都皇冠假日酒店舉辦線下NeurIPS MeetUp China,促進國內人工智慧學術交流。

2021 NeurIPS MeetUp China將設置 Keynote、圓桌論壇、論文分享和 Poster 等環節,邀請頂級專家、論文作者與現場參會觀眾共同交流。

歡迎 AI 社區從業者們積極報名參與,同時我們也歡迎 NeurIPS 2021 論文作者們作為嘉賓參與論文分享與 Poster 展示。感興趣的小夥伴點擊「閱讀原文」即可報名。

© THE END 

轉載請聯繫本公眾號獲得授權

投稿或尋求報導:content@jiqizhixin.com

相關焦點

  • UC伯克利拿下EMNLP最佳論文,復旦黃萱菁當選下一屆程序主席
    其中最佳論文獎由加州大學伯克利分校的David Gaddy、Dan Klein兩人獲得,愛丁堡大學華人博士生 Yanpeng Zhao 獲得了最佳論文榮譽提名獎(共4篇)。另外,本屆大會的最佳 Demo 獎由大家所熟知的 Hugging Face 團隊摘得。
  • 大三生獲最佳短論文獎,清華狂攬信息檢索頂會SIGIR2020多個獎項
    昨日,大會公布了最佳論文等獎項。來自清華大學的研究人員獲得最佳論文榮譽提名獎、最佳短論文獎獎項。ACM SIGIR 是信息檢索領域的頂級學術會議,今年是第 43 屆。據統計,SIGIR 2020 會議共收到投稿 1180 篇,接收 340 篇,接收率為 28.8%。
  • 大三生獲最佳短論文獎,清華狂攬信息檢索頂會SIGIR2020多個獎項
    昨日,大會公布了最佳論文等獎項。來自清華大學的研究人員獲得最佳論文榮譽提名獎、最佳短論文獎獎項。ACM SIGIR 是信息檢索領域的頂級學術會議,今年是第 43 屆。據統計,SIGIR 2020 會議共收到投稿 1180 篇,接收 340 篇,接收率為 28.8%。
  • SIGIR 2020最佳論文公布,清華大學大三學生摘得最佳短論文獎
    7月29日晚,第43屆國際 「信息檢索研究與發展」 年會(SIGIR - The International ACM SIGIR Conference on Research and Development in Information Retrieval)最佳論文正式公布。
  • NeurIPS2020獎項出爐:GPT-3等三項研究獲最佳論文獎,華人一作論文...
    北京時間 12 月 8 日凌晨,正在線上舉行的全球人工智慧頂會 NeurIPS 2020 公布了最佳論文等獎項。在一千八百餘篇論文中,三篇論文獲會議最佳論文獎項,OpenAI 等機構的 GPT-3 研究名列其中,可謂實至名歸。
  • 大三本科生獲最佳短論文獎,清華大學狂攬信息檢索頂會SIGIR 2020多個獎項
    昨日,大會公布了最佳論文等獎項。來自清華大學的研究人員獲得最佳論文榮譽提名獎、最佳短論文獎獎項。ACM SIGIR 是信息檢索領域的頂級學術會議,今年是第 43 屆。據統計,SIGIR 2020 會議共收到投稿 1180 篇,接收 340 篇,接收率為 28.8%。其中長論文投稿 555 篇,接收 147 篇,接收率約為 26%;短文投稿 507 篇,接收 152 篇,接收率約為 30%。
  • SIGIR 2020最佳論文公布,清華大學攬多個獎項,大三學生摘得最佳短論文獎
    7月29日晚,第43屆國際 「信息檢索研究與發展」 年會(SIGIR - The International ACM SIGIR Conference on Research and Development in Information Retrieval)最佳論文正式公布。
  • ACL 2019最佳論文出爐:華人團隊包攬最佳長短論文一作
    剛剛,自然語言處理領域的頂會ACL 2019公布最佳論文,本次共頒布了4個獎項,共有8個獲獎名額,分別是:最佳長論文最佳短論文最佳DEMO論文5篇傑出論文獎今年,華人一作團隊拿下了最佳長論文、最佳短論文和2篇傑出論文,中科院、中國科學院大學、騰訊、華為諾亞方舟實驗室、南京理工大學、香港理工大學等榜上有名。
  • EMNLP 2017 最佳論文揭曉,「男人也愛逛商場」獲最佳長論文
    近幾年的 EMNLP 會議都吸引了來自學術界和企業界的近千人參加,論文投稿數目也有上千篇。今年 EMNLP 共接受論文323篇,其中216篇為長論文,107篇為短論文。EMNLP 2017 也於昨日公布了最佳論文獲獎論文名單,四篇論文分獲兩個最佳長論文獎、一個最佳短論文獎和一個最佳資源論文獎。
  • 剛剛,ACL2019最佳論文獎出爐,劉群團隊獲最佳長論文獎
    雷鋒網 AI 科技評論按:剛剛,ACL2019最佳論文出爐,共八篇文章獲獎。其中包含一篇最佳長論文、一篇最佳短論文、五篇傑出論文、一篇最佳 Demo 論文。值得注意的是,最佳長論文獎、最佳短論文獎以及兩篇傑出論文獎(共5篇)一作皆為華人。其中最佳長論文獎由張文(計算所)、馮洋(計算所)、孟凡東(騰訊)、Di You(Worcester)和劉群(華為諾亞方舟)獲得。最佳短論文由俄亥俄州立大學的Nanjiang Jiang獲得。南京理工大學夏睿團隊和港科大的 Pascale Fung 團隊分別獲得了傑出論文獎。
  • SIGIR 2020最佳論文公布,清華大學攬多個獎項,大三學生摘得最佳短...
    本屆會議最佳論文獎由康奈爾大學Thorsten Joachims團隊獲得,共同一作是Marco Morik和Ashudeep Singh。 清華大學本次獲得了多個獎項:最佳論文榮譽提名獎由清華大學張帆(一作)等獲得,智源學者劉奕群也是作者之一;兩個最佳短論文獎也都被清華大學摘取,第一作者分別是常健新和於是。值得一提的是,於是目前是大三學生,智源學者劉知遠是指導老師之一。
  • 最佳論文最佳學生論文一作均為華人,清華最高產機構
    在剛剛結束的CVPR 2020 開幕式上,悉數公布了本屆CVPR最佳論文、最佳學生論文等獎項。值得一提的是,兩個獎項的論文一作均為華人。最佳學生論文今年的最佳學生論文獎是《BSP-Net: Generating Compact Meshes via Binary Space Partitioning》,作者為來自西蒙弗雷澤大學和谷歌研究院的三位研究者。
  • ACM MM 2020大獎項出爐!南開獲最佳論文獎,西安交大獲最佳學生論文獎
    第28屆ACM國際多媒體會議(ACM MM)最佳論文獎、最佳學生論文獎、最佳demo獎、 最佳開源軟體獎在內的所有多媒體領域大獎都已出爐。其中最佳論文的一作是來自南開大學Hongru Liang,最佳學生論文的一作是來自西安交大的Wenbo Zheng。
  • EMNLP 2019 參會小結及最佳論文解讀
    今年中國也已經成為emnlp投稿量最大的國家,美國成為大會被接收論文最多的國家,大概有260篇。中國位居第二,約有200篇論文被錄用。最佳論文解讀轉載選自新智元(AI_era)公眾號 最佳論文獎: Specializing Word Embeddings (for Parsing) by Information Bottleneck
  • ICLR 2021最佳論文放榜!清華宋颺等3位一作華人學生獲最佳論文獎!
    來源:iclr編輯:LRS、yaxin【新智元導讀】ICLR2021 今天在官網公布了最佳論文獎
  • CVPR 2020最佳學生論文線上分享:一作親自解讀,速來圍觀
    自 4 月份開始,機器之心 CVPR 2020 線上論文系列分享已經進行到了第八期,為大家介紹了多篇優質論文,提供了與論文作者們溝通交流的機會。如今,CVPR 2020 已正式開幕,線上會議也在火熱進行中。
  • ACL 2020:微軟最佳論文,Bengio論文獲時間檢驗獎,大陸論文量第二
    機器之心報導參與:魔王、小舟、杜偉在陸續放出時間檢驗獎、終身成就獎和傑出服務獎之後,ACL 2020 終於公布了今年的最佳論文獎。該獎項由來自微軟研究院、華盛頓大學和加州大學歐文分校的研究者摘得,主題是與任務無關的 NLP 模型測試方法。
  • ICML 2019最佳論文出爐 ETH、谷歌、劍橋分獲大獎
    新智元原創來源:Twitter、Reddit等編輯:金磊、小芹【新智元導讀】今日,國際機器學習頂會ICML公布2019年最佳論文獎:來自蘇黎世聯邦理工大學、谷歌大腦等的團隊和英國劍橋大學團隊獲此殊榮。另外,大會還公布了7篇獲最佳論文提名的論文。
  • 華人斬獲最佳Demo論文,Bengio獲時間檢驗獎丨ACL2020
    蕭簫 發自 凹非寺量子位 報導 | 公眾號 QbitAINLP領域頂會ACL 2020頒獎剛剛結束,今年的最佳論文獎也塵埃落定。在昨天的議程中,共頒布了最佳論文獎、最佳Demo論文獎、最佳主題論文獎三大獎項。
  • 31位學者聯手,GPT-3原作獲NeurIPS 2020最佳論文獎!
    【新智元導讀】NeurIPS 2020最佳論文公布!Open AI 的 GPT-3論文與米蘭理工大學、卡內基梅隆大學和加州大學伯克利分享 NeurIPS 2020年度最佳論文獎。大會還公布了「時間檢驗獎」,一篇10年前的華人一作論文摘得大獎。剛剛,NeurIPS 2020在官網公布了2020年度最佳論文獎和時間檢驗獎。