近日,電子科技大學信息與通信工程學院2016級本科生王譚在計算機科學與工程學院楊陽教授和徐行副教授的指導下,以第一作者撰寫的論文「Matching Images and Text with Multi-modal Tensor Fusion and Re-ranking」(基於多模態張量融合和重排序的圖像文本檢索)被第27屆國際多媒體會議(The 27th ACM International Conference on Multimedia) 接受為Oral(大會演講)論文。該會議於10月21-25日在法國尼斯召開,王譚同學在會議上報告並交流其發表的論文。
該論文針對現有跨模態檢索技術存在的時間資源佔用大的問題,對現有的主流兩種方法(Classification-based, Embedding-based) 的優點進行整合,在2個數據集上取得當前最好檢索效果的同時,將訓練過程縮短近一半的時間。同時,作者進一步考慮了文本自有的相似度信息在跨模態檢索中的作用,提出了一個簡單已用的檢索結果改進算法,對目前主流的方法均適用且能在短時間內進一步提升檢索的準確率。

ACM國際多媒體會議(ACM MM)是多媒體領域世界頂級會議,也是中國計算機學會推薦的A類國際學術會議(計算機圖形學與多媒體方向僅有三個CCF A類會議)。本屆ACM MM收到來自世界各地的有效論文投稿近950篇,其中口頭報告錄取率約為5%。
王譚是電子科技大學信息與通信學院2016級本科生,在校前3年期間榮獲國家獎學金,唐立新獎學金。大三開始進入電子科技大學未來媒體研究中心實驗室,師從楊陽教授以及徐行副教授開展研究,目前受阿里巴巴-新加坡南洋理工大學聯合實驗室的全額資助,在南洋理工大學進行科研實習。
素材來源:電子科大本科招生