來自一位參與了acl2019討論的學者的論點

2021-01-12 傻傻惹人愛韓

近期,nlp領域發生了一些重大變化,其中包括:來自瑞典、丹麥和波蘭的頂級學者開始在研究頂刊acl上發表基於最新cnn的corpus和machinereadingcomprehension,以及其他一些有趣的project。據立博諮詢公司統計,2019年將產生2.06萬篇文章,其中頂級期刊發表將在2.07萬篇,約佔全球5%,比如去年的比例是2.07%。而且需要注意的是,去年產生的文章中只有一半是基於cnn的。

在統計初步情況下,2021年的情況仍不確定,因為許多兩性研究近期發表的文章都可能是cnn作者。nlp系列文章可見:本篇綜述來自一位參與了acl2019討論的學者,這個討論從去年3月開始。文章簡介中文語言只能通過現有詞袋模型無法接觸到更複雜、更廣泛的概念,對此,作者構建了corpustfg。該系列文章主要集中於概念主要內容以及命名實體識別和句法分析(sentenceextraction)相關問題。

該研究的特點主要有:每一篇文章都能夠在作者的researchpage看到,不會缺失系列文章中沒有被報導的內容。另外一點就是作者使用pytorch進行分布式訓練,因此更有效。一些作者在一開始的研究時沒有考慮到實體識別和句法分析兩個相關問題,因此他們直接從自動編碼器中推出。因此對他們而言,實體識別和句法分析之間是無關的。在系列文章中,大部分的文章都是基於句法分析的,這主要是由於實體識別問題往往已經有了可以用的實體識別模型,就連目前行之有效的人工詞袋模型在實體識別問題上也不甚理想。

大部分作者在實驗中都採用了sen ten ceextra ctiontfg,雖然目前來看,這個問題目前離用在taskover-supervi sedlea rning或者paper-as-contributor還有很長的路要走。受到其他研究的啟發,作者在一些方面進行了擴展,比如對無監督的cnn和tfg進行了更多的擴展,也建立了長短期記憶(lstm)模型,從而可以用來進行實體識別,以及實體的詞向量。除此之外,作者在系列文章中還嘗試了許多其他的重要方法,主要包括cnn-lstm(lstm+cnn,也稱為dcnt,last voca bsizet rained)、language model、participating vocabulary以及quer ypre-trained vocabulary等等。

在這篇綜述中,我們會對以上幾個方法做一個概述。本文中還首先介紹了acl2019的文章,這篇綜述主要涉及corpustfg、cnn-lstm、tfg相關概念。接下來的幾篇文章都是針對cnn-lstm做一些重點介紹,其中最為重要的就是participatingvocabulary的文章,該篇綜述聚焦於cnn-lstm如何將語料中不同的feature添加到participatingvocabulary中,並且做出預測。

相關焦點

  • ACL2019正會開幕:會議狀況全覽,周明大會演講
    更多的論文需要更長的審稿時間,針對這一點,ACL2019 也採取了一些措施來加快審稿過程,包括取消論文選擇過程(不再讓 AC 選擇自己自己感興趣的論文來審)、取消作者回復階段(這當然也引起了一些爭議,ACL2019 中做出的權衡是讓 AC 花更多時間參與到審稿和討論過程中,也讓 PC 更多參與討論)、採用了更簡潔快速的審稿流程。
  • ACL 2019 知識圖譜的全方位總結
    會後總結是優秀學者的必要行動。隨著ACL會議的結束,在網上已經先後出現了多篇關於ACL大會上各細分領域的總結文章。例如來自德國Fraunhofer IAIS的研究科學家Michael Galkin近日便在Medium上發表了一篇關於知識圖譜@ACL2019的總結文。
  • 技術動態 | ACL 2019 知識圖譜的全方位總結
    ACL 2019 已經結束,但其空前的規模仍然震撼人心:2900多篇提交論文,660篇被接收,3000多名會議註冊人員,以及4個超過400人的研討會(比一些國際CS會議都大)。會後總結是優秀學者的必要行動。隨著ACL會議的結束,在網上已經先後出現了多篇關於ACL大會上各細分領域的總結文章。例如來自德國Fraunhofer IAIS的研究科學家Michael Galkin近日便在Medium上發表了一篇關於知識圖譜@ACL2019的總結文。
  • 在剛剛結束的ACL 2019上,知識圖譜領域都發生了哪些大事?
    ACL 2019 盛況空前,研究者們向本屆大會提交了 2900 份論文,其中的 660 份論文被接受,大會共有 3000 多名註冊參會者,並設有 4 個研討會,約 400 名與會者參與到這些研討會中(研討會規模比一些國際計算機科學會議還大)。
  • ACL 2019最佳論文出爐:華人團隊包攬最佳長短論文一作
    △ 圖片來自ACL官方統計數據ACL官方數據統計:http://acl2019pcblog.fileli.unipi.it/?p=152增長的除了投稿數量,還有接收數量。接收論文列表:http://www.acl2019.org/EN/program/papers.xhtml最近幾年ACL的投稿數量也是逐年上升,不過論文接受並沒有放寬要求,接收率和前幾年差不多。
  • 從ACL 2019 看 NLP 未來發展趨勢
    本文中的引用必然是不完整的,所以我建議,想要了解其它有趣的工作的讀者請查看完整的會議論文集:http://www.acl2019.org/EN/program.xhtml如何在 NLP 社區中做到一碗水端平?
  • ACL2019最佳論文獎出爐,華人包攬眾多獎項
    ACL2019最佳論文出爐,共八篇文章獲獎。
  • ACL 2019年度回顧:自然語言處理發展趨勢
    學者們也深入討論了NLP研究中潛在的歧視、偏差問題。畢業於史丹福大學,目前就職於亞馬遜Alexa AI的Mihail Eric小哥在參會之後寫下了ACL 2019的詳細回顧。讓我們跟著他一起回顧一下今年ACL大會的精彩瞬間!
  • ACL 2021投稿避坑指南
    近日,ACL 2021大會官方發布了第二次徵稿通知。
  • ACL 2019 所有獲獎論文將出自這32篇,多所國內高校、機構入選
    機器之心報導參與:路、張倩自然語言處理領域頂級會議 ACL 將於 7 月 28 日至 8 月 2 日在義大利佛羅倫斯舉行。今天,ACL 2019 官方網站公布了入圍論文獎項的候選名單。ACL 2019 也毫無爭議地成為了目前規模最大的一場 NLP 學術會議。今日,ACL 2019 網站公布了入圍「最佳長論文」、「最佳短論文」、「最佳 demo 論文」和「傑出論文獎」的論文列表。據了解,將有 8 篇論文最終獲得這四大獎項,其中最佳長論文、最佳短論文、最佳 demo 論文各一篇,傑出論文 5 篇。
  • 中科院、華為等斬獲最佳長論文,ACL 2019獎項全部揭曉
    不久之前,ACL 2019 官方網站公布了入圍論文獎項的 32 篇候選論文。剛剛,ACL 2019 最終獲獎論文公布,多所國內高校及眾多華人學者獲得榮譽。值得一提的是,來自中科院、華為諾亞方舟實驗室等機構的論文獲得了最佳長論文;一篇來自南京理工大學論文獲得了傑出論文獎。除此之外,還有很多華人學者都是獲獎論文的作者。
  • 2020 ACL Fellow名單出爐!繼王海峰、李航之後,又有兩位華人學者當選!
    當地時間11月26日,ACL 在其官網上公布了2020年度的ACL Fellow名單,共計 9 位學者入選,其中華人學者有兩位,分別是香港科技大學馮雁教授、香港中文大學黃錦輝教授 ,他們二人也由此成為ACL史上第六/七位當選的華人Fellow。
  • ACL 2021投稿即將截止,請收好這份避坑指南
    溫馨提示:不要都等到最後時刻再提交,按往年情況來看,最後一刻很可能會非常非常卡,到時候有可能提交不上去。另外,官方嚴令禁止 「佔坑」 方法來提交摘要。具體來說,按照官方的描述,截稿日期 3 個月以內的論文可以被認為是「同期論文」,你不需要在論文中描述或者對比這些論文。
  • ACL 2019 接收論文榜單發布,我們做了可視化分析
    今天,ACL 2019 官方網站公布了接收論文列表,機器之心對今年接收論文的關鍵詞等信息進行了可視化分析。接收論文列表:http://www.acl2019.org/EN/program/papers.xhtml在論文接收列表中,我們可以看到清華大學的孫茂松組共有 9 篇論文被接收,來自加州大學聖芭芭拉分校(UCSB)的王威廉組(William Yang Wang)有 8 篇論文被接收,全組共有 7 長兩短;哈工大劉挺教授也有
  • ACL 2020:微軟最佳論文,Bengio論文獲時間檢驗獎,大陸論文量第二
    最佳主題論文獎此次會議的最佳主題論文獎由來自美國華盛頓大學和德國薩爾大學的研究者摘得。論文連結:https://www.aclweb.org/anthology/2020.acl-main.463/簡介:大型神經語言模型在許多 NLP 任務上獲得成功。但是,該研究發現這些成功有時會被過度誇大。這些模型經常被描述成「理解」語言或者捕獲語言的「意義」。
  • acl 3.0.8 版本發布!
    BUG,同時伴隨一些模塊的性能提升,以及針對 master 伺服器框架的功能擴展,內容如下:acl 3.0.8 (2013.6.25) 一、lib_acl 1) feature: acl_master 框架支持在一個配置文件中監聽多個地址(可以為 TCP 套接口與域套接口混用) 2) feature: acl_master 框架支持在 reload
  • ACL-IJCNLP 2021 第一次正式徵稿通知
    我們將特別關注討論和反映NLP對於社會福利的影響和NLP可能會造成危害以及處理危害的方法。我們歡迎研究者投稿關於以下方面的立場、意見、建模以及資源類型的論文。需要注意的是論文需要提供相關方法在真實世界中的應用證據,至少應提供模擬真實世界的應用環境反映當前NLP社區解決真實世界或有社會價值問題的進展,以及如何以可見未來為目標作出有意義的改變討論如何對齊NLP研究與真實世界社會福利相關的問題更多關於本屆主題論文的信息可參考:https://2021.aclweb.org/downloads
  • 數通NA-ACL配置實例
    ACL:access list 訪問控制列表acl 兩種:基本acl(2000-2999):只能匹配源ip地址。高級acl(3000-3999):可以匹配源ip、目標ip、源埠、目標埠等三層和四層的欄位。
  • ACL 2018 公布四篇最佳 demo 候選論文,三篇論文第一作者來自中國
    論文作者:Yilin Shen, Avik Ray, Abhishek Patel,Hongxia Jin論文地址:http://aclweb.org/anthology/P18-4018Out-of-the-box Universal Romanization Tool
  • IT咖啡-ACL應用筆記
    匹配ACL的規則:採用首次匹配,思科設備ACL最後都隱藏一句deny any 注意:路由表,最長匹配(最精確匹配)4、思科設備ACL的分類標準ACL:檢查源地址,只檢查來自哪裡1-99,1300-1999 擴展ACL:檢查源地址和目標地址,檢查來自哪裡去網哪裡做什麼?