賽爾推薦 | 第12期

2021-03-01 哈工大SCIR

本欄目每周將推薦若干篇由師生精心挑選的前沿論文,分周三、周五兩次推送。

本次推薦了關於信息檢索、生成式摘要、開放域問答的三篇論文。


推薦組:CR

推薦人:劉元興(研究方向:推薦)

論文題目:IRGAN: A Minimax Game for Unifying Generative and Discriminative Information Retrieval Models

作者:Jun Wang, Lantao Yu, Weinan Zhang, Yu Gong, Yinghui Xu, Benyou Wang, Peng Zhang, Dell Zhang 

出處:SIGIR 2017 (Best Paper Award Honorable Mention)

論文主要相關:信息檢索

簡評:在現代信息檢索領域中主要存在兩種思維流派。經典思維流派假設在文檔和信息需求(由查詢可知)之間存在著一個獨立的隨機生成過程。而現代思維流派則充分利用機器學習的優勢,將文檔和搜索詞聯合考慮為特徵,並從大量訓練數據中預測其相關性或排序順序標籤。本篇論文首次提出將兩種思維流派的數據模型通過一種對抗訓練的方式統一在一起,使得兩方面的模型能夠相互提高,最終使得檢索到的文檔更加精準。與傳統的GAN不同,IRGAN直接將 Query 做輸入,利用 Generative和Discriminative IR Models分別作為GAN的生成器(generator)和判別器(discriminator)。除此之外,為了應對離散的數據,作者引入了強化學習的Policy Gradient代替常用的SGD方法,使得 GAN 更具有推廣意義。文章的實驗分別在網絡搜索、推薦系統以及問答系統三個應用場景中實現並驗證了IRGAN的優越性。

論文連結:

https://dl.acm.org/citation.cfm?doid=3077136.3080786

原始碼連結:

https://github.com/geek-ai/irgan

推薦組:LA 

推薦人:趙懷鵬(研究方向:抽取式摘要、中文順滑)

論文題目:A Deep Reinforced Model for Abstractive Summarization

作者:Romain Paulus, Caiming Xiong, Richard Socher

出處:ICLR 2018

論文主要相關:生成式摘要,強化學習

簡評:近些年,seq2seq框架在生成式摘要任務上得到了廣泛的應用。這些模型在生成比較短的摘要時能夠取得較好的效果,但在生成長句子摘要時會產生重複和不連貫的短語。產生這種現象的主要原因是單純採用有監督訓練會產生「exposure bias」。為此,作者提出了一個新的摘要模型來解決上述問題。本文的主要貢獻有兩點:①採用了Intra-temporal attention和Intra-decoder attention兩種Attention機制能夠避免生成重複內容,同時也能夠使得生成的信息覆蓋原文內容。②僅使用有監督學習來擬合真實摘要會導致訓練和測試的不一致性。因此在目標函數中引入了強化學習,將評價指標ROUGE作為其reward,然後根據reward對模型進行獎勵和懲罰並更新參數。本文提出的新模型在CNN/DailyMail和NYT數據集上均達到了SOTA的結果。

論文連結:

https://arxiv.org/pdf/1705.04304.pdf


推薦組:QA

推薦人:齊樂(研究方向:問答系統)

論文題目:R3: Reinforced Ranker-Reader for Open-Domain Question Answering

作者:Shuohang Wang, Mo Yu, Xiaoxiao Guo, Zhiguo Wang, Tim Klinger, Wei  Zhang, Shiyu Chang, Gerald Tesauro, Bowen Zhou, Jing Jiang

出處: AAAI 2018

論文主要相關:開放域問答

簡評:由於開放域問答系統需要從大規模語料中抽取答案,因此現今的系統往往由兩個模塊組成:信息檢索(IR)模塊和閱讀理解(RC)模塊。前者從大規模語料中抽取相關的段落,後者則從相關段落中進一步抽取答案。本文在其基礎上,提出了一種新的端到端的問答系統框架,稱為增強型排序-閱讀模型(Reinforced Ranker-Reader, R3)。該框架包含兩個模塊Ranker和Reader,其中Ranker根據段落包含答案的可能性對檢索到的段落進行排序,並選擇最有可能包含答案的段落,將其傳遞給Reader;Reader則從相關段落中抽取答案。最值得一提的是該框架利用強化學習,聯合訓練Ranker和Reader,將兩部分有機地結合起來,同時對兩者進行優化和訓練,而非將兩部分作為獨立的模型進行單獨訓練。本文在多個開放域問答數據集上進行了實驗,並達到了state-of-the-art的結果。

論文連結:

https://arxiv.org/abs/1709.00023

往期連結:

點擊文末「閱讀原文」即可查看完整賽爾推薦目錄

賽爾推薦 | 第11期

(句子表示學習、描述生成、遷移學習)

賽爾推薦 | 第10期

(自然答案生成、問句重新表述和問答系統)

賽爾推薦 | 第9期

(事件抽取、image caption、對象級情感分析)

賽爾推薦 | 第8期

(自然語言推理、文本蘊含識別、句子表示、文本摘要、序列標註、數據稀疏、多任務學習)

本期責任編輯:  張偉男

本期編輯:  崔一鳴

「哈工大SCIR」公眾號

主編:車萬翔

副主編: 張偉男,丁效

責任編輯: 張偉男,丁效,趙森棟,劉一佳

編輯: 李家琦,趙得志,趙懷鵬,吳洋,劉元興,蔡碧波,孫卓

長按下圖並點擊 「識別圖中二維碼」,即可關注哈爾濱工業大學社會計算與信息檢索研究中心微信公共號:」哈工大SCIR」 。

相關焦點

  • 賽爾雙語實驗班體驗活動 | 腦力與體能的雙重極限挑戰,看賽爾少年如何乘風破浪?
    2020年9月,平潭賽爾雙語學校開設雙語實驗班
  • 寧波大學商學院走訪校友企業寧波賽爾集團
    12月2日下午,寧波大學商學院學工辦龔昆朋、就業指導中心幹部及學院31名學生代表走訪校友企業寧波賽爾集團,受到我院校友、賽爾集團副總裁方永強和集團培訓經理章潔的熱情接待。在方永強的帶領下,一行人首先參觀了賽爾集團的企業展廳。
  • 琅岐將建教育綜合體,賽爾雙語學校意向進駐
    針對上述諮詢,福州市琅岐經濟區12月3日回復表示,琅岐賽爾雙語學校:意向合作項目為琅岐橋頭國際雙語學校用地173畝。設高端國際初高中46班中學,項目功能分區包括雙語學校、陪讀公寓,綜合藝術培訓,研讀基地等教育綜合體。
  • CELLFOOD(賽爾復得)成功出攤進博集,嗨翻全場|CELLFOOD|賽爾-企業...
    川北在線核心提示:原標題:CELLFOOD(賽爾復得)成功出攤進博集,嗨翻全場 品進博、逛國展、賞燈會,6月13日下午14:00-22::00,來自美國的CELLFOOD(賽爾復得)受邀亮相主題本周末兩天的進博國展集市。
  • 威斯康星州立大學與賽爾教育共促中美教育交流
    2011年12月6日,北京已經是深冬時節,空氣中的寒意卻影響不了中美雙方在教育領域開展交流合作的熱情。在北京市海澱區中關村東路賽爾大廈28層,從大洋彼岸遠道而來的威斯康星州立政府及教育界代表正與賽爾教育舉行一場隆重的籤約儀式。
  • 百聞不如一見,平潭賽爾雙語學校豪華師資團隊重磅亮相!
    平潭賽爾雙語學校是一所面向未來,培養具有未來競爭力,兼具民族精神和國際視野學子的國際化學校。學校秉持「關注每一位學生的健康成長,促進每一位學生的全面發展」的育人理念,面向海內外招賢納士,廣聘來自五湖四海名師加盟,組成了強大多元的師資陣容。
  • 小說推薦第131期
    這是十一新增的一個板塊,就叫私聊時間吧,主要就是把一些書友給我的推薦和反饋集中整理一下,同時也能跟書友們聊聊~重要提醒:分數僅作參考,並不權威!下面跟大家簡單介紹下這個號的內容情況,主要大致分為:1.潛力新書推薦:主要推薦100萬字以內有潛力的新書或者小眾書,特別是一些大神開的新書速遞。
  • 平潭高校 | 賽爾雙語學校管理團隊介紹
    平潭賽爾雙語學校秉持「關注每一位學生的快樂學習,促進每一位學生的健康成長」的育人理念,面向海內外招賢納士,廣聘來自五湖四海名師加盟,組成了強大多元的師資陣容,使不同教學方法相互借鑑,中西思維方式相互交融,為把賽爾雙語學校辦成一流名校奠定了堅實的基礎。
  • [彩樂樂網]大樂透第10096期分析膽拖及後區推薦
    搜狐體育訊  上期回顧:第10095期大樂透開獎結果:12、14、16、19、25 + 01 06,奇偶比:2:3,大小比:2:3,和值:86  大樂透第10096期預測:  區間分析:  從最近11期區間走勢可以看出,1區近期整體出號較多,因
  • 數碼論壇第12期:iPhone SE 2,你的推薦指數為?
    歡迎來到「數碼論壇」,在這裡你可以分享數碼產品使用體驗,並在文末給出你的推薦指數,首先進行的是手機板塊。第12期:iPhone SE 2iPhone SE(第二代)是蘋果公司最新款小屏智慧型手機,於2020年4月15日發布,搭載目前最先進的A13仿生處理器,採用4.7英寸Retina HD顯示屏,支持觸控 ID,後置1200萬像素相機,支持人像模式和新一代智能HDR照片。
  • 《Lily國際教育說》孫麗:賽爾留學後服務走過的十年
    賽爾在國際教育領域精耕細作十餘年來,始終堅持在「積累並創新」的道路上行走著。此前,在獨立主辦的春季發布會上,賽爾教育首次發布了海外系列產品升級的最新成果。而這恰恰印證了賽爾從未停止過探索與創新的步伐。賽爾Total-Care低齡留學後服務模式升級到2.0版本2012年,賽爾教育在海外投資組建了威斯康星國際學院(WIA)和大芝加哥國際學院(GCIA)兩大實體教學基地,首創了Total-Care低齡留學後服務模式。
  • 賽爾為會計資格考試網絡輔導課程學員提供服務
    賽爾網絡有限公司(CERNET—中國教育與科研計算機網)、北京賽爾在線通訊技術有限公司全力支持並配合國家會計學院會計遠程教育中心的「會計專業技術資格考試」免費網絡輔導課程的推出,為方便廣大學員的學習,現提供兩項專用服務:    詳情請見:    http://www.cer.net     http:
  • [藍調]雙色球第18004期:藍球膽碼05 08 12
    福彩雙色球第18004期推薦:回顧:上期雙色球開出號碼:01、14、16、17、20、31,藍球04。
  • 小說推薦第125期
    這是十一新增的一個板塊,就叫私聊時間吧,主要就是把一些書友給我的推薦和反饋集中整理一下,同時也能跟書友們聊聊~重要提醒:分數僅作參考,並不權威!下面跟大家簡單介紹下這個號的內容情況,主要大致分為:1.潛力新書推薦:主要推薦100萬字以內有潛力的新書或者小眾書,特別是一些大神開的新書速遞。
  • 《槐鄉大地》電子版 2020年12月 總第2881期
    《槐鄉大地》電子版 2020年12月 總第2881期 2020-12-20 20:52 來源:澎湃新聞·澎湃號·媒體
  • 小說推薦第123期
    這是十一新增的一個板塊,就叫私聊時間吧,主要就是把一些書友給我的推薦和反饋集中整理一下,同時也能跟書友們聊聊~重要提醒:分數僅作參考,並不權威!下面跟大家簡單介紹下這個號的內容情況,主要大致分為:1.潛力新書推薦:主要推薦100萬字以內有潛力的新書或者小眾書,特別是一些大神開的新書速遞。
  • [彩樂樂網]福彩3D第10221期預測:精選號碼推薦
    搜狐體育訊 福彩3D第10220期開獎號碼:672,跨度5,和值15。  第10221期福彩3D預測:  1、和值分析:上期和值開出15,近十期和值為15-16-9-18-23-22-12-13-19-15。
  • 大師第14034期雙色球推薦:看好重碼走熱
    上期開獎號為:05 13 23 28 32 33+12 雙色球第2014033期開出的紅球號碼為05、13、23、28、32、33,紅球三區比為1:1:4,;奇偶比4:2,4奇2偶的形態;大小比4:2,近期內大小號走勢平均,下面為您帶來
  • 廣東海哥 重慶時時彩第131212025期預測推薦
    廣東海哥 重慶時時彩第131212025期預測推薦 2013-12-27 09:23:59來源:愛彩網作者:彩大仙已瀏覽: 次 重慶時時彩第131212024期開獎結果為
  • 小說推薦第124期
    這是十一新增的一個板塊,就叫私聊時間吧,主要就是把一些書友給我的推薦和反饋集中整理一下,同時也能跟書友們聊聊~重要提醒:分數僅作參考,並不權威!下面跟大家簡單介紹下這個號的內容情況,主要大致分為:1.潛力新書推薦:主要推薦100萬字以內有潛力的新書或者小眾書,特別是一些大神開的新書速遞。