EMNLP 2020即將召開,中國學者最高產:單人9篇主會論文!

2020-12-19 騰訊網

作者 | 陳大鑫

今晚開始,EMNLP 2020就將於線上召開啦!(11月16日-11月20日)

EMNLP 是由國際語言學會(ACL)下屬的 SIGDAT 小組主辦的自然語言處理領域的頂級國際會議,在計算語言學類別下影響力排名全球第二。EMNLP 每年舉辦一次,去年則與 IJCNLP 聯合,在香港舉辦,今年由於疫情轉為線上舉辦。

今年9月份,EMNLP 2020 錄取結果出爐:接受論文754篇,接收為Findings論文520篇,被拒論文1840篇,總體接收率為24%。

近日,EMNLP 2020 錄取論文完整列表已在官方放出,據AI科技評論不完全統計,達摩院自然語言智能實驗室邴立東博士,在本年度EMNLP大會上有9篇論文入選正會,成為中國工業界入選論文最多的作者。

與此同時,在全球範圍內,邴立東博士同清華大學劉知遠、Salesforce AI的 Xiong Caiming 並列為本次大會最高產作者,同時,哈工大劉挺教授此次也有7篇主會論文入選。

以下AI科技評論對這四位作者本次EMNLP 2020論文錄取情況做簡單介紹。

1

達摩院邴立東

邴立東博士目前在達摩院自然語言智能實驗室,他於香港中文大學獲得博士學位,曾是卡耐基梅隆大學機器學習博士後研究員。他的研究興趣包括低資源自然語言處理、情感分析、文本生成/摘要、信息提取、知識庫等。

個人主頁:https://lidongbing.github.io/

邴立東博士團隊主導的8篇投稿論文,實現了100%錄取率(大會主會平均錄取率為22.4%)。

入選的論文集中於四個領域,包括論辯挖掘及情感分析(Argument & Sentiment)、低資源命名體識別(Low-resource NER)、表示學習及應用(Representation Learning & Application)、文本生成(Text Generation),在任務、數據、方法和模型上有顯著的貢獻。

比如,新任務包括:論辯對挖掘、知識庫增強的實體描述生成,兩個任務均提供了新數據集。

新方法/模型包括:基於生成的數據增強、無監督句子表示學習、動態輕量圖神經網絡、跨語言跨領域的預訓練特徵遷移、端到端的細粒度情感三元組抽取。

論辯對挖掘任務:邴博士團隊首次提出了從構成辯論關係的兩篇文檔中,抽取論辯對的任務。現有論辯挖掘的任務是基於單一文本進行抽取,如法律文件、論文等。辯論對挖掘任務第一次探索從兩篇文檔中,挖掘互相構成論辯關係的文本片段。舉例來講,司法訴訟中的起訴狀和答辯狀構成一個文檔對,論辯對挖掘技術可以從起訴狀中抽取原告觀點,從答辯狀中識別被告的答辯。作者公開了一個大規模的數據集,包括5000+個文檔對,和全部文檔對內的論辯對標註。

基於生成的數據增強:提出了一種全新的 NLP 數據增強技術,可以應用於各種序列標註任務。相比於計算機視覺和語音,在自然語言處理的序列標註任務上,當前並沒有有效的數據增強技術,以往提出的同義詞替換等方法過於簡單且效果不佳。而其他的數據增強方法如反向翻譯等僅適用於翻譯或者分類任務,並不適用於序列標註任務。

邴博士團隊提出的基於語言模型的數據增強方法,先對原有的序列標註數據進行線性化,把文本數據和序列標註轉化為語言模型的訓練數據,再通過訓練好的語言模型,生成更多的可用於序列標註訓練的數據,以此達到數據增強的目的。

以下是邴立東博士團隊所有主會錄取論文:

1、《ENT-DESC: Entity Description Generation by Exploring Knowledge Graph》Liying Cheng, Dekun Wu, Lidong Bing, Yan Zhang, Zhanming Jie, Wei Lu and Luo Si.

2、《APE: Argument Pair Extraction from Peer Review and Rebuttal via Multi-task Learning》Liying Cheng, Lidong Bing, Qian Yu, Wei Lu and Luo Si.

3、《DAGA: Data Augmentation with a Generation Approach forLow-resource Tagging Tasks》BOSHENG DING, Linlin Liu, Lidong Bing, Canasai Kruengkrai, Thien Hai Nguyen, Shafiq Joty, Luo Si and Chunyan Miao.

4、《Lightweight, Dynamic Graph Convolutional Networks for AMR-to-Text Generation》Yan Zhang, Zhijiang Guo, Zhiyang Teng, Wei Lu, Shay B. Cohen, ZUOZHU LIU and Lidong Bing.

5、《Feature Adaptation of Pre-Trained Language Models across Languages and Domains with Robust Self-Training》Hai Ye, Qingyu Tan, Ruidan He, Juntao Li, Hwee Tou Ng and Lidong Bing.

6、《Partially-Aligned Data-to-Text Generation with Distant Supervision》Zihao Fu, Bei Shi, Wai Lam, Lidong Bing and Zhiyuan Liu.

7、《Position-Aware Tagging for Aspect Sentiment Triplet Extraction》Lu Xu, Hao Li, Wei Lu and Lidong Bing.

8、《An Unsupervised Sentence Embedding Method by Mutual Information Maximization》Yan Zhang, Ruidan He, ZUOZHU LIU, Kwan Hui Lim and Lidong Bing.

9、《Aspect Sentiment Classification with Aspect-Specific Opinion Spans Lu Xu, Lidong Bing, Wei Lu and Fei Huang》Lu Xu, Lidong Bing, Wei Lu and Fei Huang.

2

清華大學劉知遠

劉知遠是清華大學計算機科學與技術系長聘副教授。他分別於2006年和2011年從清華大學計算機科學與技術系獲得工學學士學位和博士學位。他的研究興趣包括自然語言處理與社會計算。他已經在國際期刊與會議上發表了超過90篇論文,包括ACM Transactions、IJCAI、AAAI、ACL和EMNLP等 。

個人主頁:http://nlp.csai.tsinghua.edu.cn/~lzy/

以下介紹其中一篇題為《Dynamic Anticipation and Completion for Multi-Hop Reasoning over Sparse Knowledge Graph》的論文。

近年來,為了尋求一種有效的、可解釋的知識圖譜生成方法,多跳推理得到了廣泛的研究。以往的推理方法大多是針對實體間有足夠路徑的稠密知識圖譜而設計的,但對於那些只包含稀疏路徑的稀疏知識圖譜,卻不能很好地進行推理。

一方面,稀疏知識圖譜包含的信息較少,使得模型難以選擇正確的路徑。

另一方面,缺乏指向目標實體的證據路徑也使推理過程變得困難。

為了解決這些問題,本文提出了一種基於稀疏知識圖譜的多跳推理模型DacKGR,並應用了新的動態預測和完成策略:

(1)預測策略利用基於嵌入模型的潛在預測,使模型在稀疏知識圖譜上進行更多的潛在路徑搜索。

(2)在路徑搜索過程中,完成策略根據期望信息動態添加邊作為附加動作,進一步緩解了知識圖譜的稀疏性問題。對Freebase、NELL和Wikidata中五個數據集的實驗結果表明,本文的方法優於SOTA baseline。

開原始碼:https://github.com/THU-KEG/DacKGR.

以下是劉知遠團隊EMNLP 2020錄取論文:

1、《Coreferential Reasoning Learning for Language Representation》Deming Ye, Yankai Lin, Jiaju Du, Zhenghao Liu, Peng Li, Maosong Sun and Zhiyuan Liu.

2、《Dynamic Anticipation and Completion for Multi-Hop Reasoning over Sparse Knowledge Graph》

Xin Lv, Xu Han, Lei Hou, Juanzi Li, Zhiyuan Liu, Wei Zhang, YICHI ZHANG, Hao Kong and Suhui Wu.

3、《Learning from Context or Names? An Empirical Study on Neural Relation Extraction》Hao Peng, Tianyu Gao, Xu Han, Yankai Lin, Peng Li, Zhiyuan Liu, Maosong Sun and Jie Zhou.

4、《Exploring and Evaluating Attributes, Values, and Structures for Entity Alignment》Zhiyuan Liu, Yixin Cao, Liangming Pan, Juanzi Li, Zhiyuan Liu and Tat-Seng Chua.

5、《MAVEN: A Massive General Domain Event Detection Dataset》Xiaozhi Wang, Ziqi Wang, Xu Han, Wangyi Jiang, Rong Han, Zhiyuan Liu, Juanzi Li, Peng Li, Yankai Lin and Jie Zhou.

6、《Partially-Aligned Data-to-Text Generation with Distant Supervision》

Zihao Fu, Bei Shi, Wai Lam, Lidong Bing and Zhiyuan Liu.

7、《Train No Evil: Selective Masking for Task-Guided Pre-Training》Yuxian Gu, Zhengyan Zhang, Xiaozhi Wang, Zhiyuan Liu and Maosong Sun.

8、《Denoising Relation Extraction from Document-level Distant Supervision》Chaojun Xiao, Yuan Yao, Ruobing Xie, Xu Han, Zhiyuan Liu, Maosong Sun, Fen Lin and Leyu Lin.

9、《Adapting Open Domain Fact Extraction and Verification to COVID-FACT through In-Domain Language Modeling》. Zhenghao Liu, Chenyan Xiong, Zhuyun Dai, Si Sun, Maosong Sun and Zhiyuan Liu.

3

Xiong Caiming

目前,Xiong Caiming是Salesforce AI的高級研究總監。2014年6月至2015年9月,他於加州大學洛杉磯分校(UCLA)擔任博士後研究員。2014年他在紐約州立大學布法羅分校計算機科學與工程系獲得博士學位(由Jason J. Corso教授指導)。他分別於2005年和2007年在華中科技大學獲得計算機科學學士學位和碩士學位。

個人主頁:http://cmxiong.com/

以下是Xiong Caiming團隊EMNLP 2020錄取論文:

4

哈工大劉挺

劉挺,哈爾濱工業大學教授,現任哈工大計算學部主任兼計算機學院院長,國家「萬人計劃」科技創新領軍人才 。中國計算機學會理事,中國中文信息學會常務理事/社會媒體處理專委會(SMP)主任 ,曾任國際頂級會議ACL、EMNLP領域主席。

主要研究方向為人工智慧、自然語言處理和社會計算。2012-2017年在自然語言處理領域頂級會議發表的論文數量列世界第8位(據劍橋大學統計)。

以下是劉挺團隊本次EMNLP 2020主會錄取論文:

1、《Discourse Self-Attention for Discourse Element Identification in Argumentative Student Essays》. Wei Song, Ziyao Song, Ruiji Fu, Lizhen Liu, Miaomiao Cheng and Ting Liu.

2、《Pro le Consistency Identi cation for Open-domain Dialogue Agents》. Haoyu Song, Yan Wang, Wei-Nan Zhang, Zhengyu Zhao, Ting Liu and Xiaojiang Liu.

3、《Recall and Learn: Fine-tuning Deep Pretrained Language Models with Less Forgetting》. Sanyuan Chen, Yutai Hou, Yiming Cui, Wanxiang Che, Ting Liu and Xiangzhan Yu.

4、《Counterfactual Off-Policy Training for Neural Dialogue Generation》. Qingfu Zhu, Wei-Nan Zhang, Ting Liu and William Yang Wang.

5、《Combining Self-Training and Self-Supervised Learning for Unsupervised Disfluency Detection》. Shaolei Wang, Zhongyuan Wang, Wanxiang Che and Ting Liu.

6、《Multi-Stage Pre-training for Automated Chinese Essay Scoring》. Wei Song, Kai Zhang, Ruiji Fu, Lizhen Liu, Ting Liu and Miaomiao Cheng.

7、《Is Graph Structure Necessary for Multi-hop Question Answering?》. Nan Shao, Yiming Cui, Ting Liu, Shijin Wang and Guoping Hu.

5

大會展望

首先回顧一下EMNLP-IJCLPN 2019年錄取情況:

從投稿國家看,EMNLP 2019中國提交了近1000篇論文,美國也有近900篇論文提交。最終,美國成為本屆大會被接收論文最多的國家,大概有260篇。中國位居第二,約有200篇論文被錄用。

這也意味著中國學者無需在論文數量上犯愁,其實進入2020年後,國內最優秀的人工智慧研究團隊,都在暗暗地調整自己的目標——頂會論文數量已不是最終目標,逐鹿 Best Paper 成為關鍵。

在SIGDIAL 2020上,清華黃民烈教授所帶領的COAI小組拿到了最佳論文獎。

在ICML 2020上,北理工的魏愷軒等人獲得了傑出論文獎。

在SIGKDD 2020 上,清華大學唐傑團隊發表於2008年的論文被評為時間檢驗獎。

在ECML-PKDD上,中科院計算所的程學旗團隊拿下了「數據挖掘最佳學生論文獎」。

在ACM MM 2020上,南開大學獲得最佳論文獎,西安交大獲最佳學生論文獎。

這裡,AI科技評論祝中國學者在EMNLP 2020上也獲得好的成績~

相關焦點

  • 學術活動預告|2020中國電影學新銳學者論壇即將召開
    近些年來,北京電影學院在中國電影研究方面推出了諸多富有成效的舉措, 除多次申領到國家社科基金藝術學重大項目,也積極加強與國際學術動態的交流合作,曾組織召開了多次重要的國際、國內學術會議,如「中國藝術傳統與當代中國電影的創新發展」學術研討會、「國際視野下的中國電影與中國電影研究」 學術論壇、「電影學理論大師課:湯姆•甘寧系列講座」、中國電影學新銳學者論壇等。
  • 2019學術年會暨中國電影學派新銳學者論壇即將召開
    北京電影學院中國電影學派研究部於2018年召開了第一屆以「中國藝術傳統與當代中國電影的創新發展」為主題的學術年會。    本屆論壇自今年3月發布徵稿啟事以來,共收到來自全國50餘所高校和學術科研機構青年學者的論文80餘篇。經嚴格評審,入圍會議正式發言的論文共25篇。
  • 本市3篇論文入選《中國 長城文化學術研究會論文集》
    日前,《中國長城文化學術研究會論文集》出版,我市有3篇論文收入該文集。2019年10月30日,由中國長城學會、《文明》雜誌社、北京市延慶區人民政府主辦的中國長城文化學術研討會在北京延慶召開。研討會後,主辦方將參會學者提交的論文和部分代表發言彙編而成《中國長城文化學術研討論文集》,收錄了57篇文章。其中,我市袁建琴的《媒介視角下長城保護與利用研究-以大同李二口長城為例》,李海林的《大同得勝堡邊貿地位》,吳天有的《明代大同鎮大邊的設置與棄守時間探析》3篇文章入選論文集。3位作者均為我市長城文旅協會會員,近年來在推動長城文化保護、傳承、弘揚方面做了許多工作。
  • 199 篇中國學者論文被批量撤稿,幾乎都涉嫌學術不端......
    近日,據公眾號「艾普蕾 iplagiarism」爆料,期刊 European Review for Medical and Pharmacological Sciences 在其 24 卷批量撤稿了 199 篇中國學者的論文
  • 劉春蕊、田軒合著論文獲「第十五屆(2020)中國管理學年會優秀論文...
    近日,我院博士生劉春蕊與金融學講席教授、博士生導師田軒合作的論文《專利的可質押性對創新的影響》獲評「第十五屆(2020)中國管理學年會優秀論文」。獲獎論文主要研究了中國專利質押市場的發展現狀以及專利的可質押性對公司創新的影響,豐富了文獻中專利質押影響公司創新的渠道探究,同時提出了相應的政策建議以促進專利質押市場更好的發展。
  • 撤稿199篇中國論文的國際期刊 被質疑是文章灌水重災區
    來源:第一財經原標題:撤稿199篇中國論文的國際期刊,學術質量究竟如何該雜誌給出的撤稿原因是「論文作者涉嫌學術不端並且沒有回覆編輯部的質詢」。然而,《歐洲醫學藥理學評論》也是被質疑文章灌水的重災區之一。
  • EMNLP官方:不要因為沒超越SOTA就拒人家的稿子
    郭一璞 發自 凹非寺量子位 報導 | 公眾號 QbitAI你的論文可能更容易發頂會了。
  • 199 篇中國學者論文被批量撤稿,涉及多家知名醫院,幾乎都涉嫌學術不端……
    >近日,據公眾號「艾普蕾 iplagiarism」爆料,期刊 European Review for Medical and Pharmacological Sciences 在其 24 卷批量撤稿了 199 篇中國學者的論文。
  • 《自然》一年發了106篇「國產」論文
    長江日報訊(記者胡義華 熊詩琪 蔡木子)12月24日,最新一期英國《自然》雜誌出版,其中中國作者主導的論文有2篇,這把《自然》2020年刊發的「國產」論文的數量定格在106篇,刷新了歷史紀錄。
  • 中國法學會律師法學研究會2020年年會成功召開
    12月20日,中國法學會律師法學研究會2020年年會在北京召開。本次年會的主題是「全面依法治國新時代的律師與律師法」。中國法學會副會長、中國法學會律師法學研究會會長、中華全國律師協會會長王俊峰,中國法學會律師法學研究會副會長、中國人民大學律師學院院長劉瑞起,中國法學會律師法學研究會副會長、《民主與法制》雜誌總編輯劉桂明,中國法學會律師法學研究會副會長、中國政法大學法學院律師法學教研室主任王進喜,中國法學會律師法學研究會副會長、華中科技大學法學院院長汪習根,中國法學會律師法學研究會副會長、廣西民族大學地方法治研究中心主任廖斌
  • 中國法學會立法學研究會2020年學術年會召開
    11月7-8日,由中國法學會立法學研究會主辦,西南政法大學承辦的中國法學會立法學研究會2020年學術年會在重慶召開。本屆年會以「中國立法的理論與實踐」為主題,來自全國各地高等院校、科研機構和立法實務部門的專家學者近400人參會,收到學術論文260餘篇,論文數量創下立法學研究會年會之最。
  • 走過2020:一個財經學者眼中的2020年終盤點
    來源:學者劉璐來源:筆者根據網絡綜合處理製作文:劉 璐頻道:財經 | 房產 | 城市 | 人居================2020 has been a year like no other.筆者安慰他說,中國對於疫情的防控已經是全球最好的了,疫情對國內經濟的影響也只是暫時的。生意會再好起來,錢也可以再掙。正所謂留得青山在,不怕沒柴燒。下車時筆者本來想多給一點小費,後來一想自己也不容易,就算了。除了這個筆者親身經歷的案例,2020年底傳遍全網的「北京34歲男子考研確診」的案例,也讓人非常感慨。網上的相關討論已經比較多了,此處就不贅述。
  • 2020年第十一屆中國國際軟體質量工程(iSQE)峰會即將召開
    10月23日,2020年第十一屆中國國際軟體質量工程(iSQE)峰會將在重慶隆重召開。本屆峰會著眼於軟體質量保障的方法、技術和實踐,將為軟體質量保障領域的專家、學者搭建一個極具影響力的交流互動平臺。本次峰會主論壇將是國內外知名專家、學者齊聚一堂的行業前沿新動態分享盛會。
  • 核醫學科2020年發表的SCI論文大數據分析
    導言:在我們做大數據分析時,很少能夠看到像核醫學領域這樣,中國學者在其中佔有重要位置。1,核醫學科論文概況核醫學反應科領域已經發表了76,465篇Medline收錄文獻,其中2020年發表了10,282篇,我們對其做一大數據分析。
  • 西華大學這個跨學科團隊2年發表20多篇高質量論文!
    除了研討會,研究院內每個團隊、團隊與團隊之間還會不定期召開組會和討論會。團隊內的組會一般由導師按照課題的進度來召集,在組會上,大家會就課題中的內容進行討論,也會積極地提出自己的意見。不同的聲音使老師和同學們有了更多不同的想法。
  • 中國工業經濟學會2020年學術年會暨「十四五」中國產業經濟發展...
    記者陸航 實習記者 趙立凡)10月17日,中國工業經濟學會主辦,西北大學經濟管理學院承辦的「中國工業經濟學會2020年學術年會暨『十四五』中國產業經濟發展展望研討會」在西安召開。西安市人民政府市長李明遠,國家統計局原局長、清華大學教授許憲春,中國工業經濟學會常務副會長兼理事長、中國社會科學院工業經濟研究所所長史丹,西北大學校長郭立宏同來自中國社會科學院、中國人民大學、南京大學、南開大學、武漢大學、浙江大學、吉林大學、山東大學、蘭州大學、東北大學、中央財經大學、大連理工大學、上海財經大學、省級社科院、經濟管理出版社等90餘所單位專家學者,以及中國工業經濟學會的理事及入選論文代表近
  • 國際綜合頂會WWW2020落幕,帶你全面解讀百度入選論文
    近日,國際頂級綜合學術會議WWW2020 (The Web Conference 2020)在中國臺灣如期舉辦。本次會議,百度研究院共有6篇論文入選,位居國內科技企業前列。而且其中大部分論文的全部作者均來自百度,展現出百度公司超高的科研水準和領先的技術實力。
  • 七張圖告訴你,2020年出版了多少篇新冠論文
    疫情還推動了預印本論文的增加,讓男性作者的產出超過了女性作者,並且影響了審稿時間——一些主題的審稿變快了,另一些則變慢了。新冠洪流2020年,科研人員發表的有關新冠疫情的論文遠超10萬篇。根據Dimensions資料庫的統計,這些論文可能在12月初就超過了20萬篇。
  • 逐鹿最佳論文!程學旗團隊獲ECML-PKDD最佳學生論文獎
    在SIGDIAL 2020上,清華黃民烈教授所帶領的COAI小組拿到了最佳論文獎。 在ICML 2020上,北理工的魏愷軒等人獲得了傑出論文獎。 在SIGKDD 2020 上,清華大學唐傑團隊發表於2008年的論文被評為時間檢驗獎。
  • 關於召開首屆全國方志論壇暨中國地方志學會方志學分會2020年年會...
    關於召開首屆全國方志論壇暨中國地方志學會方志學分會2020年年會的預通知 2020-10-20 11:09 來源:澎湃新聞·澎湃號·政務