高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

2020-07-30 電子科技大學

近日,以電子科技大學未來媒體研究中心高聯麗研究員為第一作者的論文《Video Captioning with Attention-based LSTM and Semantic Consistency》獲得多媒體領域頂級期刊《IEEE Transaction on Multimedia》(IEEE TMM)雜誌2020年最佳論文獎(2020 Prize Paper Award)。

這是電子科技大學首次獲得此獎項。該論文作者及作者單位為:高聯麗(電子科大)、郭招(電子科大)、張含望(新加坡南洋理工大學)、徐行(電子科大)、申恆濤(電子科大)。

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

創刊於1999年的IEEE多媒體彙刊是多媒體領域最具影響力的頂級期刊,期刊影響因子6.051。IEEE Transaction on Multimedia最佳論文獎是由國際多媒體領域資深專家組成的IEEE TMM評獎委員會,根據論文創新性、實用性、時效性、寫作表達等方面,從過去三年發表的所有論文中推薦評選出的唯一最佳論文獎。

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

高聯麗研究員的論文自2017年發表以來,得到國內外同行廣泛關注,入選ESI高被引論文,獲Google學術引用241次。

該論文研究主題為視頻描述生成(Video Captioning),屬於計算機視覺和自然語言處理的交叉領域,目的是通過算法能夠總結視頻當中發生的一些事情或者記錄一下人類的某些信息,並生成一些符合人類語言規則的描述。

作者發現,當前的大多數方法都是將整個視頻的幀或者片段均等得輸入到算法模型當中,從而忽略了有些視頻幀或者片段其實對視頻內容起著至關重要的作用,有些幀或者片段對整個視頻的影響微乎其微。此外一些方法還因為忽略了句子語義和視覺內容之間的相關性的情況,導致翻譯錯誤,視頻內容和生成句子內容不一致的問題。

為了解決這個問題,作者提出了一個基於注意力長短時記憶網絡的一致性模型,它能夠發掘視頻當中顯著的一些視頻片段來輔助獲取更加具有代表性的視頻內容,同時還能構建語言和視覺信息的一致性,使得生成的句子語義和視頻當中的語義保持一致。

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

該工作設計了一種基於注意力機制的長短時記憶單元,如上圖所示,在每一次解碼生成單詞的時候,基於注意力的長短時記憶單元都會根據每一幀圖像或者每一個片段視頻的重要性賦予其一個權重,最終加權之後的視覺特徵被作為最終的視覺表徵來幫助預測下一個單詞。這樣的注意力單元能夠幫助模型定位具有特徵表示能力的片段,更加準確的挖掘到重要的視頻內容信息。

為了保證生成句子和視頻內容的一致性,除了現有的從視頻轉化為句子的損失函數之外,該工作又引入了一個視覺和語言的一致性損失函數,以保證兩者表達的語義保持一致,不會出現語義上的偏差,同時創建了一個兩種模態數據交叉關聯的映射函數,將語言和視覺兩種模態的數據通過線性變換映射到一個高維語義空間:

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

為了構建兩種模態之間的互相關聯,該工作通過一個左乘操作確保統一實例的視覺和單詞特徵在A空間中一致:

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

  其中,

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

因此能夠通過最小化語義相關度的二範數得分,保證生成的單詞與視頻視覺上下文之間的語義一致性,使句子具有豐富的語義上下文信息。

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

在實驗驗證階段,工作組分別測試了長短時記憶視覺編碼模塊和語義一致性模塊在模型當中的具體效果,實驗結果如下表所示:

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

能夠看出兩者對於最終模型都有非常大的貢獻,兩者也是缺一不可。

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

作者將該工作模型結果和當時最好的一些方法的結果進行了比較,從MSVD數據集的實驗結果來看,該工作模型在各項指標中都取得了當時最好的結果,這也驗證了模型的有效性。

高聯麗研究員榮獲IEEE Transaction on Multimedia最佳論文獎

除了量化指標之外,論文作者還展示了一些模型生成句子的一些結果,圖中SA表示的是soft attention方法,GT表示的是groundtruth,是人類針對這些視頻數據進行的標註。從這個可視化圖來看的話,首先表示了該工作增加的語義一致性思想是有效的,它能生成更加準確的句子描述,能更加準確的把握視頻當中的關鍵信息,例如「road」,「singing」等動作。和其他的方法相比的話它的預測也更加準確,更加接近人類的語言描述習慣。


相關連結:

高聯麗研究員累計發表高水平國際論文100餘篇(一作/通訊53篇),Google Scholar引用2289次。在國際頂級期刊和會議(如CCF A類會議、IEEE/ACM彙刊等)上發表論文共計50餘篇,如IEEE T-PAMI、IJCV、 IEEE T-IP、 IEEE T-MM、CVPR、ACM Multimedia、AAAI/IJCAI等。其中入選ESI高被引論文4篇(一作/通信),並獲得IEEE TMM最佳論文獎、國際會議ADC最佳學生論文獎。主持多項國家級和省部級項目,主研國家科技部重點項目一項,自然科學基金面上項目一項等。曾擔任CCF-B會議的ISWC研討會的程序委員會主席,SCI期刊JCVIR特刊的客座編委,APWEB-WAIM會議研討會(workshop)主席(chair)等學術兼職,以及擔任CCF推薦的多個會議和期刊的審稿人。獲2019年阿里巴巴「達摩院青橙獎」(全國僅10名),2020年IEEE TCMC學術新星獎(Rising Star Award),入選2020年四川省「三八紅旗手」。

相關焦點

  • 中國科大一論文獲ACM Multimedia 2009最佳論文獎
    以中國科學技術大學博士生查正軍為第一作者的論文Visual Query Suggestion榮獲本次會議的最佳論文獎。  在這篇論文中,作者針對目前基於文本的圖像檢索技術存在的檢索模糊問題,將「一圖勝千言」的思想融入到圖像檢索技術中,首次提出了一種聯合文本和圖像信息的圖像檢索方法(Visual Query Suggestion, VQS)。
  • 【CVPR2018最佳論文重磅出爐】斯坦福伯克利折桂,何愷明獲TPAMI年輕研究員獎
    最佳論文最佳論文題目:Taskonomy: Disentangling Task Transfer Learning論文地址:https://arxiv.org/pdf/1804.08328.pdf作者來自史丹福大學和加州大學伯克利分校,包括計算機視覺領域的著名教授Jitendra
  • 數學院研究員戴彧虹榮獲第十六屆「陳省身數學獎」
    數學院研究員戴彧虹榮獲第十六屆「陳省身數學獎」 2017-10-23 數學與系統科學研究院 其中,中國科學院數學與系統科學研究院研究員戴彧虹榮獲「陳省身數學獎」。
  • 中歐國際工商學院教授方二論文榮獲《營銷學雜誌》最佳論文獎
    原標題:方二教授論文榮獲《營銷學雜誌》Shelby D. Hunt/Harold H.Maynard最佳論文獎  【MBA中國網訊】近日,中歐國際工商學院市場營銷學教授方二參與合著的論文榮獲《營銷學雜誌》Shelby D. Hunt/Harold H. Maynard最佳論文獎,該獎項旨在表彰論文作者對營銷學領域的貢獻。
  • 電子系教師再獲IEEE國際通信會議最佳論文獎
    電子系教師再獲IEEE國際通信會議最佳論文獎    清華新聞網6月25日電 日前,IEEE國際通信會議(IEEE International Conference on Communications,簡稱IEEE ICC)在澳大利亞雪梨召開。
  • 宋國聰獲得IEEE萊斯論文獎
    日前,清華大學電子工程系1997屆校友宋國聰博士榮獲IEEE通信學會授予的2010年Stephen O.
  • 清華-騰訊聯合實驗室團隊獲ACM Multimedia大會最佳論文獎
    在剛剛結束的第20屆ACM Multimedia多媒體學術會議頒獎晚會上,清華大學-騰訊網際網路創新技術聯合實驗室團隊獲得「最佳論文獎」和兩項技術挑戰獎共三項大獎。其中博士生王智與指導教師楊士強教授、朱文武教授、孫立峰副教授聯合發表的論文《基於社會感知的網絡視頻內容分發方法》(Propagation-Based Social-Aware Replication for Social Video Contents)獲得大會唯一的「最佳論文獎」(Best Paper Award)。
  • 信息科學技術學院本科生獲IEEE通信國際會議最佳論文獎
    北京大學信息科學技術學院2011級本科生廖昀、博士研究生王天宇、副教授邊凱歸、「百人計劃」特聘研究員宋令陽和美國休斯頓大學電子與計算機工程系副教授韓竹合作完成的論文《全雙工認知無線電中的分布式動態頻譜接入協議》(Decentralized dynamic spectrum access in full-duplex cognitive
  • 交大斬獲唯一最佳學生論文獎!
    喜 報2019年度IEEE車載技術大會最佳學生論文獎花落交大!我校博士生馬張楓榮獲該獎項!艾渤教授和何睿斯教授指導的電子信息工程學院2018級博士生馬張楓作為第一作者的論文《 三維寬帶非平穩的空對空無人機信道模型 》(A 3D Air-to-Air Wideband Non-Stationary Channel Model of UAV Communications)榮獲大會 唯一最佳學生論文獎
  • 【ICCV2017視覺盛宴概況】何愷明博士包攬最佳論文和最佳學生論文獎!Facebook成大贏家!
    大會公布了各獎項包括最佳論文獎(Marr Prize)、最佳學生論文獎、Honorable mentions、Azriel Rosenfeld lifetime achievement award、Distinguished researcher award 、Everingham prize 、Helmholtz prize.
  • TBSI課題組獲IEEE ICOCN國際會議最佳學生論文獎
    Adiabatic Silicon Photonic Edge Coupler Based on Silicon Nitride/Silicon Trident Structure獲得最佳學生論文獎(Best Student Paper Award)。
  • 中國科大王青松研究員榮獲第十一屆「侯德榜化工科學技術獎...
    我校火災科學國家重點實驗室王青松研究員在鋰離子電池火災安全領域取得了系列成果,榮獲「侯德榜化工科學技術獎——創新獎」。王青松研究員針對鋰離子電池的火災安全問題,經過近在Progress in Energy and Combustion Science等期刊上發表第一及通訊作者SCI論文
  • 中國科大一論文獲2013年IEEE全球通信會議最佳論文獎
    中國科學技術大學副教授朱祖勍課題組的論文《利用分層方法為彈性光網絡中的組播服務設計集成式的路由與頻譜分配算法》獲得了大會頒發的最佳論文獎(Best Paper Award)。本次大會從2272篇投稿中根據研究領域評選出12篇最佳論文,朱祖勍團隊的論文獲得了光網絡系統領域唯一的最佳論文獎。   該文研究了彈性光網絡中全光組播服務的路由與頻譜分配問題,提出了一種新穎的基於分層式輔助圖的算法,並運用仿真驗證了其性能。
  • 工學院宋潔課題組成果獲年度IEEE TASE最佳論文獎
    with Patient Preference Learning」獲得了年度IEEE TASE Best Paper Award(最佳論文獎)。該獎的評選範圍是IEEE TASE 2019年發表的所有論文,獲獎結果於6月6日在2020年IEEE世界機器人與自動化大會(2020 IEEE International Conference on Robotics and Automation,簡稱IEEE ICRA)上宣布。
  • CoRL2020獎項公布,斯坦福獲最佳論文獎,華為等摘得最佳系統論文獎
    來自史丹福大學和維吉尼亞理工的研究者摘得本屆 CoRL 會議的最佳論文獎,華為諾亞方舟實驗室和上海交大等機構學者榮獲最佳系統論文獎,南加州大學研究獲得最佳 Presentation 獎。昨日,第四屆機器人學習大會(CoRL)公布了最佳論文獎、最佳系統論文獎等獎項。
  • CoRL 2020獎項公布,斯坦福最佳論文,華為等獲得最佳系統論文獎
    來自史丹福大學和維吉尼亞理工的研究者摘得本屆 CoRL 會議的最佳論文獎,華為諾亞方舟實驗室和上海交大等機構學者榮獲最佳系統論文獎,南加州大學研究獲得最佳 Presentation 獎。昨日,第四屆機器人學習大會(CoRL)公布了最佳論文獎、最佳系統論文獎等獎項。
  • 網絡空間安全學院孫文教授獲得IEEE GLOBECOM 2019最佳論文獎
    「MACH:Movement Aware CoMP Handover in Heterogeneous Ultra-Dense Network」喜獲大會頒發的最佳論文獎(Best Paper Award)。
  • 極鏈科技最新研究成果獲IEEE多媒體國際會議最佳論文獎
    近日,在2019年度IEEE International Conference on Multimedia and Expo(ICME)國際會議上傳來喜訊,由極鏈科技AI研究院與復旦大學、華為諾亞方舟實驗室聯合完成的論文獲大會最佳論文獎。
  • 戴彧虹等合作論文獲2011年國際通信大會最佳論文獎
  • 我所魏勇研究員榮獲2020年「科學探索獎」
    魏勇研究員榮獲2020年「科學探索獎」9月25日,第二屆「科學探索獎」獲獎名單正式揭曉,共50位青年科學家進入榜單。我所魏勇研究員獲此殊榮。「科學探索獎」(XPLORER PRIZE)由騰訊基金委聯合楊振寧、毛淑德、何華武、鄔賀銓、李培根、陳十一、張益唐、施一公、高文、謝克昌、程泰寧、謝曉亮、潘建偉等科學家家於2018