國內最頂級的NLP會議,600多位國內外學者參與,NLPCC會議於敦煌古鎮...

2020-12-16 手機鳳凰網

月牙泉旁,NLPCC會議成功召開(圖片來源於網絡)

雷鋒網AI科技評論按:十一長假後第一周,由中國計算機學會中文信息技術專委會舉辦的 NLPCC 及系列學術活動在敦煌古鎮成功舉辦。

NLPCC從2011年開始舉辦,至今已成功舉辦 8 屆;儘管舉辦時間很短,但成長卻很迅速,在今年4月最新的CCF推薦國際學術會議和期刊目錄中 NLPCC被評選為 C類會議,這說明其已經在NLP領域具備國際影響力,已然成為國內(甚至國際)中文 NLP領域最為重要的會議之一。

本次會議參會人數達610人,匯聚了眾多國內外NLP領域的知名學者。

一、錄取情況及研究趨勢

NLPCC 2019正會開始於10月13日,在此之前與會師生已經經過了為期3天的前沿科學講習班ADL 107期(這也是CCF長期舉辦的一個特色活動)以及1 整天的workshop。

在開幕式上,作為主辦方之一,敦煌研究院副院長張先堂首先簡單介紹了莫高窟的基本歷史情況和研究情況。

隨後大會聯合主席 Ken Church發表了大會開幕致辭。Ken指出NLPCC雖然歷史並不如敦煌那麼悠久,但無論是在國內還是國外都具有重要的影響力。

聯合PC Chair 靳民彥 & 唐傑來自新加坡國立大學的Min-Yen Kan(靳民彥)教授作為本屆會議的聯合程序主席,介紹了本屆會議的基本情況。

雷鋒網了解到,本屆會議總投稿數是550篇,有效總投稿492篇;主會有效投稿451篇、workshop投稿41篇。

本屆主會投稿數量相較去年增加了46%;其中英文投稿343篇(增長75%),中文投稿108篇(增長2%)。如此規模的投稿數量無論在國內還是國際上都屈指可數。

在451篇主會投稿中,接收長文(Full paper) 92篇,錄用率為20.40%;接收短文(short paper)38篇,錄用率8.4%。包括workshops投稿在內的NLPCC 2019投稿的長文錄用率為20.93%;短文10.98%。從錄取比例可以看出,NLPCC會議為保證會議質量,在文章錄取上有非常嚴格的篩選過程,如下所示:

下圖是從領域的角度來看論文錄取情況,

從中可以看出哪些研究方向更為熱門。有意思的是,在NLP應用等領域論文投稿論文數量非常多,而像機器翻譯、知識圖譜等卻相對較少。對於論文投稿分析的高潮在於靳民彥教授根據關鍵詞的分析。

從圖中可以看出近段時間,國內NLP的研究趨勢分別為:

1、Attention

2、data and copora

3、Embeddings and Representations

值得一提的是,除了主會論文外,另有workshop投稿50多篇,其中由西湖大學張嶽教授和中科院自動化所張家俊研究員組織的student workshop接收了4篇論文,由北大孫薇薇副教授和微軟段楠研究員組織的Evaluation workshop 接收了14篇論文,另外Explainable AI workshop接收了9篇論文。

二、講了什麼

本屆會議分為前後兩個階段。

在NLPCC正會開始之前,從9日至11日在莫高窟研究院,由百度自然語言處理部首席科學家吳華、復旦大學張奇教授、北京大學萬小軍教授主持舉辦了為期三天的前沿科學講習班ADL 107期。這也是CCF長期舉辦的一個特色活動,

京東AI研究院何曉冬博士

本次ADL共有6個報告,每個報告各半天。報告人分別為字節跳動AI實驗室的周浩博士和李磊博士、微軟亞洲研究院劉樹傑研究員、伊利諾伊大學芝加哥分校的劉兵教授、京東AI研究院何曉冬博士、清華大學劉知遠副教授、清華大學張敏副教授。詳細的授課資料可關注「AI科技評論」微信公眾號,並回復「NLPCC2019」下載。

隨後 12日在敦煌華夏國際酒店中進行了為期 3 天的 NLPCC 會議。12日,分別進行了Evaluation Workshop、Student Workshop、Explainable AI workshop。其中哈工大車萬翔教授的《What is the core competence of NLPer?》:

車萬翔報告

中科院自動化所宗成慶研究員的《Distributed Representations and Neural Decoding》:

宗成慶報告

以及蘇州大學張民教授的《Natural Language Processing and Sentiment Analysis》:

張民報告

給聽眾極大的啟發。13日-14日,共進行了四場keynote演講、四場工業演講以及口頭會議報告。

蘇克毅Keynote演講

作為首場報告,來自臺北中央研究院信息科學研究院的蘇克毅教授做了關於《 On Integrating Domain Knowledge into DNN》,在演講中蘇克毅教授指出了DNN存在的局限性,並針對給定任務提出了增強DNN的方法。

Mark Liberman Keynote演講

賓夕法尼亞大學的Mark Liberman教授做了主題為《 Clinical Applications of Human Language Technology:Opportunities and Challenges》,介紹了利用NLP技術進行醫療數據挖掘的研究,以及一些非常具有啟發性的初步結果,並討論了未來研究的機遇和挑戰。

夏飛 keynote 演講

華盛頓大學的夏飛教授演講的主題為《NN is great, but NLP is not equal to NN》。在演講中,夏飛教授集中討論了神經網絡(NN)很少解決的兩個問題:數據標註和專家知識的重要性,並用臨床NLP為例進行了說明。她指出,僅靠神經網絡並不能解決NLP的所有問題,因此對於NLP領域的研究者來講,在順應神經網絡大潮的同時不應當放棄其他基礎研究方向。

宋大為 keynote 演講

來自北理工的宋大為教授的報告則更為新穎的角度,其主題為《A quantum cognitive perspective for informationaccess and retrieval》,即量子認知,借用量子力學的方法和語言來進行認知、信息獲取等的研究。值得一提的是,宋大為以及天津大學的張鵬也是目前國內少數幾位將量子力學與NLP結合起來研究的學者。

三、最佳論文獎

本屆最佳論文獎共 3 篇,其中英文最佳論文獎 2 篇,中文最佳論文獎 1 篇。

1、Group-constrained Embedding of Multi-fold Relations in Knowledge Bases

這篇文章是華中科大的工作。主要討論了知識庫的表示學習問題。

摘要:知識庫的表示學習旨在將實體和關係都嵌入到連續的向量空間中。大多數現有模型(例如TransE,DistMult,ANALOGY和ProjE)僅考慮知識庫中涉及的二進位關係,而將多重關係轉換為三元組並視為二元關係的實例,從而導致結構信息丟失。M-TransH是最近提出的用於多重關係直接建模的框架,但卻忽略了某些事實屬於同一關係的關係級信息。本文提出了一種組約束嵌入(Group-constrained Embedding)方法,該方法將實體節點和事實節點從實體空間嵌入到關係空間中,將與同一關係相關的嵌入事實節點限制為具有零約束、半徑約束或餘弦約束的組。這個方法提供了一個新模型,即Gm-TransH。我們在連結預測和實例分類任務上評估了我們的模型,實驗結果表明,Gm-TransH明顯優於以前的多重關係嵌入方法,並取得了出色的性能。

2、Fast and Accurate Bilingual Lexicon Induction via Matching Optimization

摘要:近期最優的進行雙語詞典歸納的方法一般是利用預訓練詞嵌入。然而,詞嵌入會給常見詞和稀有詞帶來噪音。尤其是在稀有詞的情況下,由於其嵌入在訓練數據中的出現率較低,因此其嵌入始終無法很好地學習。為了減輕上述問題,我們提出了BLIMO,這是一種簡單而有效的自動詞庫歸納方法。它並沒有引入詞嵌入,而是將詞典歸納問題轉換為最大加權匹配問題,這可以通過貪婪搜索的匹配優化來有效解決。經驗實驗進一步證明,我們提出的方法在兩個標準基準上大大優於最新的基準。

3、基於情感信息輔助的多模態情緒識別

摘要:近年來,多模態情感分析成為自然語言處理的熱點研究領域,挖掘多模態內容(如視頻和語音等)包含的情緒或情感信息具有十分重要的現實意義。基於多模態特徵的情緒分類和情感分類作為情感分析的兩個子任務,已有大量工作對兩者進行單獨研究,但是在多模態領域,還沒有相關研究利用情感信息幫助識別說話人的情緒。不同於純文本的情緒分析,本文面向多模態數據(文本和語音)進行情緒識別研究。為了同時考慮多模態數據特徵,我們提出一種新穎的聯合學習框架,將多模態情緒分類作為主任務,多模態情感分類作為輔助任務,通過情感信息來輔助提升情緒識別任務的性能。具體而言,通過私有網絡層對主任務中的文本和語音模態信息分別進行編碼,以學習單個模態內部的情緒獨立特徵表示。接著,通過輔助任務中的共享網絡層來獲取主任務的輔助情緒表示以及輔助任務的單模態完整情感表示。在得到主任務的文本和語音輔助情緒表示之後,分別與主任務中的單模態獨立特徵表示進行結合,得到主任務中單模態情緒信息的完整表示。最後通過自注意力機制捕捉每個任務上的多模態交互特徵,得到最終的多模態情緒表示和情感表示。實驗結果表明,我們的方法在多模態情感分析數據集上可以通過情感輔助信息大幅度提升情緒分類任務的性能,同時情感分類任務的性能也得到了一定的提升。

四、傑出貢獻獎、青年科學家獎

CCF NLPCC 傑出貢獻獎和青年科學家獎是NLPCC的特色之一,從2017年開始頒發。

CCF NLPCC 傑出貢獻獎是授予給對中國自然語言處理作出極大貢獻的個人。本屆傑出貢獻獎授予給了中國NLP領域的泰鬥人物東北大學姚天順教授。姚教授出生於1934年,是中國NLP領域的第一位博士生導師,從1980年在東北大學創建東北大學自然語言處理實驗室至今,培養了一大批知名學者,包括東北大學朱靖波教授、大連理工大學林鴻飛教授、中科院計算所程學旗研究員、李沐博士等,姚氏弟子遍布世界各地,可謂桃李滿園。

專委會主任周明博士向姚天順頒發獎牌和證書,朱靖波教授代領

(從左到右依次:周明、朱靖波、姚天順)

姚天順教授多年來秉持一個觀點,即「人的一生很短,一輩子做成一件事就很了不起」,因此從80年代直至2005年退休,20多年一直堅持只做機器翻譯。也正是由於他的這種精神,現在由朱靖波教授所帶領的東北大學自然語言處理實驗室已然成為國內外最強大的機器翻譯研究團隊之一,他們所開發的小牛翻譯能夠高質量完成140多種語言的翻譯任務。

周國棟教授向馮洋、段楠頒發獎章(左二,段楠;左三,周國棟;左四,馮洋)

青年科學家獎每屆兩人。本屆NLPCC 青年科學獎獲得者分別為中科院計算所馮洋研究員和微軟亞洲研究院段楠研究員。

馮洋發表獲獎感言

馮洋研究員是中科院計算所自然語言處理課題組負責人,是當前NLP領軍人物劉群教授的學生,在今年ACL上發表的《Bridgingthe Gap between Training and Inference for Neural Machine Translation》曾獲2019年ACL最佳論文獎。目前研究領域為系統融合和低資源語言翻譯。

段楠發表獲獎感言

段楠研究員目前是微軟亞洲研究院的首席研究經理(Principle Research Manager),是微軟亞洲研究院副院長、2019年ACL主席周明博士的學生。段楠研究員曾先後在ACL、EMNLP、NAACL、COLING等頂級會議上發表論文50多篇,其開發的基於知識的QA/NLU和基於視頻的QA/summarization曾獲得Bill Gates的重視,許多研究工作都曾應用在微軟的產品當中,例如小冰、Cortana等。目前研究領域為QA和自然語言理解。

五、換屆及來年舉辦地

由於CCF 中文信息技術專委會每四年一換屆,因此本年度也將成為該專委會的換屆年,同時專委會也將更名為「自然語言處理及中文計算專委會」。

微軟研究院常務副院長周明博士從2016年起擔任專委會主任以來,在專委會秘書長趙東巖等人的支持下,短短數年將NLPCC會議提升到了一個新的高度,在今年年初成功進入CCF列表C類會議,為NLPCC會議作出了巨大的貢獻。此外,在周明等人的牽頭下,CCF 中文信息技術專委會與中國中文信息學會從2016年起聯合舉辦了「語言與智能高峰論壇」,每年一次,已經成功舉辦了四屆,這也迅速成為當前國內 NLP 領域最前沿思想交流與碰撞的一個大舞臺。

上圖從左向右依次為:劉群、宗成慶、趙鐵軍、周明、周國棟、趙東巖、呂雅娟、徐睿峰、黃萱菁、唐傑

據雷鋒網了解,接棒周明和趙東巖,CCF 中文信息技術專委會下一屆專委會主任是蘇州大學周國棟教授,專委會秘書長是北京大學萬小軍教授。

周國棟教授在1989、1992、1997曾先後畢業於西安交通大學、上海交通大學和新加坡國立大學,隨後一直在新加坡工作至2006年。隨後在蘇州大學的邀請下擔任蘇州大學特聘教授,僅用短短幾年的時間便組建起了蘇州大學自然語言團隊。目前蘇州大學自然語言團隊在其帶領下已經成為國內NLP領域的一個重鎮。

萬小軍教授,是計算機漢字雷射照排技術創始人王選院士和北大王選計算機所前任所長肖建國教授的學生。從1996年入學北大至今二十多年時間一直都在北大讀書和工作。從2005年起,萬小軍教授便是國內能夠在IR和NLP領域頂級會議和期刊上持續發表論文的學者之一。目前,萬小軍教授是國際範圍內文本摘要領域最優秀的研究學者之一。萬小軍教授在2016年聯合今日頭條研發的寫稿機器人xiaomingbot曾轟動一時。

去年經過專委會無記名投票決定NLPCC 2020在鄭州舉辦,由鄭州大學承辦。此外,今年經過專委會投票,選擇 NLPCC 2021 在山東青島舉辦。歡迎大家參加NLPCC 2020,期待明年的胡辣湯。

【封面圖片來源:網站名馬蜂窩,所有者:無】

相關焦點

  • 專訪北大趙東巖研究員:NLPCC 會議如何引領中國 NLP 走向世界?
    趙東巖研究員向我們詳細講述了 NLPCC 作為一個新興會議為何有如此朝氣。他認為隨著中國綜合國力的增加,中文的世界化,將會有越來越多的人學習中文、研究中文,中國人在中文的自然語言處理的會議應當成為這個領域世界上最頂級的,我們有必要也有能力辦這樣頂級的會議。以下為趙東巖研究員的深入講解,雷鋒網根據採訪內容作了不改變原意的精簡和編輯。
  • ACL2018現場見聞 | 在墨爾本參加NLP頂級會議是怎樣的體驗?
    今年筆者有兩篇文章被ACL2018錄用,同時也是這次會議的學生志願者。今年的計算語言學會年會(ACL2018)於7月15~20日在墨爾本會展中心MCEC召開,這是自然語言處理領域一年一度的頂級學術會議。參會者不僅能在此展示自己的科研成果,關注各研究方向的發展動態,還能和許多優秀的學者親密交流。
  • 80多位國內外專家學者集聚龍巖學院研討反演問題
    會議現場我國著名數學家、中國科學院袁亞湘院士以及來自中國、美國、俄羅斯、澳大利亞、日本、挪威、瑞典等國內外80多位專家學者參加了會議。副校長楊小燕出席會議並致辭。開幕式由中國科學院地質與地球物理研究所王彥飛研究員主持。
  • 2019年雁棲湖會議開幕—新聞—科學網
  • 計算機領域頂級科學家、學術會議、期刊影響力排名(附國內排名)
    其中最右邊的一列為他們在整個計算機領域內的 H-index 分值排名計算機科學 Top Scientists H-index 排名(中國)根據 Google Scholar Metrics 的標準,在頂級科學家類別中美國佔了 938 位,因此該排名完全是按照 H5-Index 值排列。
  • 20多場「高端會議+重磅活動」持續引爆 古鎮燈博會再次引領產業風潮
    秋收十月,行業回暖,第22屆中國•古鎮國際燈飾博覽會(以下簡稱古鎮燈博會https://www.jiagle.com/dengshi_dengbohui/)進入緊羅密布的籌備階段,將於10月22-26日在廣東中山古鎮(主會場:燈都古鎮會議展覽中心;分會場:利和燈博中心、華藝廣場、星光聯盟、燈都時代廣場、佰盛燈飾廣場、華裕廣場、燈都國際路燈城)打響新一輪的燈飾行業頭炮
  • 集結號吹響,國內NLP最高水平會議CCL/NLP-NABD下月南京召開!
    」(The Sixteenth China National Conference on Computational Linguistics, CCL 2017)將於 2017 年 10 月 13 日至 15 日在南京師範大學舉行。
  • 李文棟: 頂級學術會議之科研小白心裡話
    美國應用語言學協會是應用語言學領域規模和影響最大的國際性學術組織,其國際年會是領域內頂級的學術會議。2019年3月9日至12日,美國應用語言學學會年會在美國喬治亞州亞特蘭大召開。今年大會由語料庫語言學、語言與意識形態、語言與科技、二語習得等22個論壇組成,集結了眾多享譽盛名的學者,共同探討當前備受國際關注的應用語言學問題,旨在博採眾長,引領學術前沿。
  • 眾學者敦煌覓「良方」
    眾學者敦煌覓「良方」 2016-10-13 16:24:03來源:中國新聞網作者:${中新記者姓名}責任編輯怎樣吸引更多青年人參與其中?這是當下博物館普遍面臨的挑戰。13日在敦煌莫高窟舉行的中國博物館協會2016年年會上,「博物館教育的行動與思考」成為內地文博系統170餘位專家學者熱議的話題。  由中國博物館協會主辦,中國博物館協會社會教育專業委員會、敦煌研究院、甘肅省博物館協會承辦的此次會議為期三天。
  • 國雙NLP論文被國際頂級會議EMNLP收錄
    最新消息,在3篇NLP論文被中文自然語言處理權威會議NLPCC收錄之後,國雙數據科學團隊再創佳績,登上更大的學術舞臺,撰寫的一篇論文被國際頂級會議EMNLP 2019收錄。
  • 「要聞」市政府常務會議首次邀請5位公眾代表列席,他們參與審議了...
    作為上海市信息安全協會會長,他參加過不少會議,但列席市政府常務會議還是頭一次。其實,對市政府常務會議來說,今天(16日)這樣的形式和安排也是「第一次」——首次打開「大門」,邀請了人大代表、政協委員、高校學者、律師、企業負責人等公眾代表列席,參與《上海市公共數據開放暫行辦法(草案)》的審議。
  • 國內學術會議被指漸成雞肋 部分會議變身旅遊
    本世紀初,我國學術交流活動逐漸跨入繁榮期,每年舉行的學術會議數以千計,與之相伴的則是一些學術會議泥沙俱下,偏離學術會議的本義。  天津大學一項專門針對經常參加學術會議的專家學者和學生的調查表明,只有38.89%被調查者對會議質量滿意,國內舉辦的國際會議質量相對較高,在很多人看來,國內的學術會議更是漸成「雞肋」。
  • 自動駕駛領域頂級會議有哪些?
    (RAS,機器人和自動化學會)主辦,該領域規模(千人以上)和影響力最大的頂級國際會議。而會議的組織方是一個循環的志願群體,通常在某次會議召開的三年之前通過遴選產生。CVPR的審稿一般是雙盲的,也就是說會議的審稿與投稿方均不知道對方的信息。通常某一篇論文需要由三位審稿者進行審讀。最後再由會議的領域主席(area chair)決定論文是否可被接收。 在各種學術會議統計中,CVPR被認為有著很強的影響力和很高的排名。
  • 這一會議由東財承辦,收到清華、北大等國內外60多所高校投稿
    此次研討會是中國會計學會2020年主辦的第一場學術會議,也是中國會計學會的首場線上學術會議。、北京大學、復旦大學、中山大學、廈門大學、上海財經大學、中央財經大學、中南財經政法大學、西南財經大學等國內外60多所高校的104篇中英文論文投稿,經專家匿名評審共遴選出28篇論文進行分會場交流。
  • 教員風採 | 李文棟老師帶你走進頂級學術會議
    下面讓我們跟著小李老師一起走進他在2019年上半年參加並宣讀論文的領域內頂級學術會議——美國應用語言學學會年會,感受一下學術世界的魅力吧!下文轉載自「上外英院分團委學生會」公眾號美國應用語言學協會是應用語言學領域規模和影響最大的國際性學術組織,其國際年會是領域內頂級的學術會議。
  • 第六屆神經管理學與神經經濟學國際會議(ICNN 2018)成功舉辦
    、中國科學院、清華大學、北京大學、上海交通大學、復旦大學、中國科技大學、中國人民大學等頂尖學府的近300位研究者們參與會議。哥倫比亞大學Eric J.Johnson教授作為經濟與管理領域中被引最高的學者之一,谷歌學術被引量高達40450次,其中有7篇論文被引量超過1000次。他多篇論文發表於Science、PNAS、Management Science以及營銷、金融、心理學等領域頂級期刊。
  • CCF-NLP走進高校之「華南理工大學」站
    本次活動邀請了三位NLP領域的資深權威學者進行分享,分別是:華為諾亞方舟實驗室首席科學家劉群、北京大學王選計算機研究所研究員趙東巖、天津大學張梅山副教授。承擔或參與眾多中國、愛爾蘭和歐盟大型科研項目。在國際會議和期刊發表論文300餘篇,被引用8000多次。培養國內外博士碩士畢業生50多人。
  • 集錦| 亞太社工會議第二天,國內外參會嘉賓齊贊大會
    9月28日,第24屆(2017)亞太地區社會工作區域聯合會議進入第二天,國內外參會嘉賓對於會議各項議程仍抱有極大的興趣與熱情,除在會議現場進行交流討論外,大家在休息間隙也一直在談論此次會議的相關主題。來自中國、澳大利亞、韓國、馬來西亞等社會工作領域的專家學者就相關話題展開了研討。下午,大會按議程舉行了高風險社會中的災害預防與救助、城鎮化進程中的流動問題與社會工作服務、企業社會責任與社會工作服務、社會公益倡導與反貧困、社會工作促進社區與環境可持續性、社會工作專業教育與人才培養六個平行論壇。晚間,一場正式晚宴再度把氣氛推向高潮。
  • 北大應用物理中心組織的第四屆高能量密度物理國際會議舉行
    2018年10月21-25日,第四屆高能量密度物理國際會議(The 4th International Conference on High Energy Density Physics)在寧波香格裡拉國際酒店舉行, 來自美、英、德、法、日、捷克等國的30餘位著名學者,國內150餘位專家學者和學生共同參會,會期四天。
  • 會議扎堆開,「泡沫」知多少!學術會議的井噴與亂象
    當前國內學術會議究竟存在哪些亂象或泡沫?它們如何產生?又應怎樣應對?《中國科學報》就此採訪了多位專家學者。來自中國科學院大學的徐步青、常國偉和中國人民大學教育學院的劉湉禕等多位博士研究生向記者表示,學術會議可以展示自己的科研成果,結交新的科研夥伴。