論文:Visually Grounded Reasoning across Languages and Cultures
作者:Fangyu Liu、Emanuele Bugliarello、Edoardo Maria Ponti、Siva Reddy、Nigel Collier、Desmond Elliott
機構:劍橋大學、哥本哈根大學、Mila - 魁北克人工智慧研究所、麥吉爾大學
論文連結:https://arxiv.org/abs/2109.13238
論文摘要:如今,應用廣泛的視覺和語言數據集以及預訓練編碼器都是直接採用 ImageNet 的概念和圖像,或從中獲得靈感。但人們很難指望這種基準對計算機視覺做出多大貢獻,因為它的數據來源主要是英文的詞彙資料庫和圖像查詢,會帶有北美或西歐的數據偏見。為了克服這些偏見,來自劍橋大學等機構的研究者設計了一種新的 protocol 來構建一個代表更多語言和文化的 ImageNet 風格的層次結構,讓概念和圖像的選擇完全由母語人士驅動,而不是自動抓取它們。具體來說,他們關注的是一組不同類型的語言,即印尼語、簡體中文、斯瓦希裡語、泰米爾語和土耳其語。我們通過要求注釋者比較和對比圖像對來引出母語描述,任務是確定這些基礎描述是真是假。藉助這種方法,他們創建了一個基於視覺、語言多元文化推理(Multicultural Reasoning over Vision and Language,MaRVL)的多語言數據集。研究者使用 SOTA 模型創建了一系列基線並發現他們的跨語言遷移表現明顯落後於英語的監督表現。這些結果促使研究者跳出一個狹窄的領域,重新評估當前 SOTA 模型的穩健性和準確性,但也為真正多語言和多元文化系統的發展帶來了新的令人興奮的挑戰。本文一作劉方宇是來自劍橋大學語言技術實驗室的一名博士二年級學生,主攻 NLP,目前主要關注多模態、自監督、可解釋性等方面的研究。在得知獲獎後,劉方宇獲得了人們的掌聲。他表示:希望繼續努力,讓多模態技術通向所有人。論文:CHoRaL: Collecting Humor Reaction Labels from Millions of Social Media Users
作者:Zixiaofan Yang, Shayan Hooshmand and Julia Hirschberg
機構:哥倫比亞大學
論文介紹:https://underline.io/lecture/37879-choral-collecting-humor-reaction-labels-from-millions-of-social-media-users
論文摘要:幽默檢測近年來受到越來越多的關注,因為人們希望理解用戶用比喻語言生成的內容。然而,幽默感知的個體和文化差異非常大,使得收集具有可靠幽默標籤的大規模幽默數據集變得非常困難。該研究提出了一個在 Facebook 帖子上生成感知幽默標籤的框架,稱為 CHoRaL。該框架使用自然可用的用戶對帖子的反應,無需手動注釋。CHoRaL 針對幽默和非幽默提供了二元標籤和連續分數。該研究了提出了迄今為止最大的帶有幽默標籤的數據集,其中的數據來源於與 COVID-19 相關的 78.5 萬篇帖子。此外,該研究通過從帖子中提取詞彙語義和情感特徵來分析社交媒體中與 COVID 相關的表達信息,並構建了性能與人類相似的幽默檢測模型。CHoRaL 可以開發任何主題的大規模幽默檢測模型,為社交媒體上的幽默研究開闢了一條新的途徑。本文一作楊子小帆是來自哥倫比亞大學口頭語言處理組的博士生,本科就讀於北京大學。她的研究興趣主要集中在計算副語言學和跨語言自然語言處理。論文 1:MindCraft: Theory of Mind Modeling for Situated Dialogue in Collaborative Tasks
作者:Cristian-Paul Bara、Sky CH-Wang、Joyce Chai
機構:密西根大學、哥倫比亞大學
論文連結:https://arxiv.org/abs/2109.06275
論文摘要:理想的自主智能體意味著它們能夠以人類的方式進行協作。特別是「心智理論(theory of mind)」在人類的協作和交流中發揮著重要作用。為了在情境交互中實現心智理論建模,該研究通過讓成對的人類主體在「我的世界」中玩遊戲,提出了一個細粒度的協作任務數據集。隨著遊戲中互動的展開,該研究捕捉了合作夥伴對世界和彼此的信念的相關信息,為研究情境語言交流中的人類協作行為帶來了豐富的機會。為了未來開發出能夠推斷協作夥伴信念狀態的 AI 智能體,該研究針對幾種心理任務理論構建並展示了計算模型及其結果。論文 2:SituatedQA: Incorporating Extra-Linguistic Contexts into QA
作者:Michael Zhang、Eunsol Choi
機構:德克薩斯大學奧斯汀分校
論文連結:https://arxiv.org/abs/2109.06157
論文摘要:對同一問題的答案可能會根據語言外的語境(例如時間地點)而變化。為了研究這一挑戰,該研究提出了一個開放式檢索 QA 數據集 SITUATEDQA,其中系統必須在給定具體時間和地點等語境的情況下為問題生成正確答案。為了構建 SITUATEDQA,該研究首先在現有的 QA 數據集中找出一些問題。研究者發現很大一部分信息搜索問題的答案取決於語境。對於此類依賴語境的問題,該研究眾包可替代語境及其相應答案。該研究表明,現有模型難以生成經常更新或不常見問題的正確答案。因此該研究進一步量化了現有模型是如何根據過去收集的數據進行訓練的,即使提供了更新的語料庫,也無法泛化地回答當前提出的問題。該研究的分析表明,開放檢索 QA 基準應該包含語言外的語境,以保持與全局和未來的相關性。由於計算時間和成本的增加,大型語言模型變得越來越難以訓練。該研究提出了一種名為 SRU++ 的高效架構,結合了快速循環和序列建模的注意力。SRU++ 表現出強大的建模能力和訓練效率。在 ENWIK8、WIKI-103 和 BILLION WORD 等數據集上的標準語言建模任務中,該模型獲得了更好的 bpc(bits-per-character)和困惑度 ppl(perplexity)。同時,與表現最好的 Transformer 模型相比,該模型的訓練成本僅為前者的 1/10 到 1/3。例如,該模型在 8-GPU 的機器上,在 ENWIK8 數據集上得到 SOTA 結果只用 了 1.6 天進行訓練。該研究進一步證明了 SRU++ 達到接近 SOTA 的性能僅需要極少的注意力。該研究的結果表明聯合利用快速循環和少量注意力將是用於加速模型訓練和推理的一個重要方向。論文摘要:常識是一種典型的人類能力,自人工智慧誕生以來,它一直是對人工智慧的核心挑戰。Transformer 神經語言模型在自然語言處理任務(包括常識推理)中取得了令人印象深刻的結果,甚至在某些基準測試中超過了人類的表現。最近,其中一些進展受到質疑:訓練數據中所謂的數據偽影已經明顯表現為虛假相關性和 shallow shortcuts,某種程度上造成了這些出色的結果。在本文中,研究者試圖將這種分析進一步深入到常識相關的語言處理任務領域,對涉及常識推理的各項基準進行了研究,並進行了一些關鍵的壓力實驗,從而深入了解模型是在學習問題內在的可遷移能力,還是僅僅利用數據中偶然的 shortcuts。結果表明,大多數試驗過的數據集都是有問題的,模型採用了非穩健特徵,似乎沒有學習和歸納到數據集傳達或舉例說明的整體任務。論文:Datasets: A Community Library for Natural Language Processing
作者:Quentin Lhoest, Albert Villanova del Moral, Yacine Jernite, Abhishek Thakur, Patrick von Platen, Suraj Patil, Julien Chaumond, Mariama Drame, Julien Plu, Lewis Tunstall, Joe Davison, Mario Šaško, Gunjan Chhablani, Bhavitvya Malik, Simon Brandeis, Teven Le Scao, Victor Sanh, Canwen Xu, Nicolas Patry, Angelina McMillan-Major, Philipp Schmid, Sylvain Gugger, Clément Delangue, Théo Matussière, Lysandre Debut, Stas Bekman, Pierric Cistac, Thibault Goehringer, Victor Mustar, François Lagunas, Alexander Rush and Thomas Wolf
機構:Hugging Face
論文連結:https://arxiv.org/pdf/2109.02846.pdf
論文摘要:隨著新任務、大模型、新基準的不斷提出,公共 NLP 數據集的規模、類型和數量正在迅速增長。但數據集的增長也帶來了重大挑戰,包括接口標準化、版本化和文檔化。2021 NeurIPS MeetUp China
受疫情影響,NeurIPS 2021依然選擇了線上的形式舉辦。雖然這可以為大家節省一筆註冊、機票、住宿開支,但不能線下參與這場一年一度的學術會議、與學術大咖近距離交流討論還是有些遺憾。
我們將在NeurIPS官方支持下,於12月4日在北京麗都皇冠假日酒店舉辦線下NeurIPS MeetUp China,促進國內人工智慧學術交流。
2021 NeurIPS MeetUp China將設置 Keynote、圓桌論壇、論文分享和 Poster 等環節,邀請頂級專家、論文作者與現場參會觀眾共同交流。
歡迎 AI 社區從業者們積極報名參與,同時我們也歡迎 NeurIPS 2021 論文作者們作為嘉賓參與論文分享與 Poster 展示。感興趣的小夥伴點擊「閱讀原文」即可報名。
© THE END
轉載請聯繫本公眾號獲得授權
投稿或尋求報導:content@jiqizhixin.com