2020-06-15 10:36 來源:澎湃新聞·澎湃號·政務
6月14日上午,由喬治亞理工學院,史丹福大學,Deepmind,Facebook AI研究院等單位聯合舉辦的CVPR 2020 the 2nd VizWiz-VQA Challenge(Visual Question Answering Challenge)公布了大賽獲獎名單。由西安電子科技大學人工智慧學院焦李成教授指導,2019級人工智慧學院智能感知與圖像理解教育部重點實驗室研究生郭志成、趙嘉璇、張豔組成的學生隊伍—Sudoku在這一國際計算機視覺領域最高水平大賽中斬獲亞軍,並受邀在CVPR 2020-Visual Question Answering and Dialog Workshop(線上)作專題報告。
比賽結果公布網站截圖
CVPR 2020線上研討會
根據官方公布的結果,本屆 VizWiz-VQA Challenge賽道中Sudoku隊以AA:56.2%的成績獲得了本次比賽的亞軍。本次大賽任務具有數據集圖片質量差且數量多,圖片對應的問題及答案複雜多樣等難點,Sudoku團隊創新性地提出使用不同的主幹網絡,不同的自然語言模型並融合豐富的圖像特徵的方法逐一攻克以上難點。大賽於北京時間5月16日早8點結束,賽程的大部分時間中團隊都處於疫情隔離在家期間,在師長的指導和幫助下,團隊克服無法面對面交流,遠程控制等重重困難,以高度自律的精神進行多次方法改進,直到比賽結束最後一刻都沒有鬆懈,用自己的實際行動踐行了西電精神。據悉,來自以色列理工學院、FacebookAI、麻薩諸塞大學阿默斯特分校、北京航空航天大學、西北工業大學、浪潮科技等高校和科研單位也參加了本次大賽。
團隊比賽效果展示
據悉,VizWiz-VQA Challenge旨在設計能夠回答視障人士提出的視覺問題的算法,其數據集為VizWiz-VQA數據集。該數據集由每個視障人士所拍攝的圖像並語音記錄有關該圖片的語音問題,以及關於每個問題的10個眾包答案組成。該比賽針對該數據集解決以下兩個任務:預測視覺問題的答案;預測視覺問題是否可以回答。賽事希望能夠引導更多的人了解視障人士的技術需求,同時為研究人員提供新的研究方向,以開發輔助技術,為視障人士打造更加無障礙的生活。CVPR是IEEE Conference on Computer Vision and Pattern Recognition的縮寫,即IEEE國際計算機視覺與模式識別會議。CVPR是IEEE一年一度的學術性會議,會議的主要內容是計算機視覺與模式識別技術,是世界頂級的計算機視覺會議(三大頂會之一,另外兩個是ICCV和ECCV)。
新聞連結:http://cvpr20.com/visual-question-answering-and-dialog/
https://visualqa.org/workshop.html
https://www.youtube.com/watch?v=GqfzEKHO2Yc&feature=youtu.be
(來源:西電新聞網)
特別聲明
本文為澎湃號作者或機構在澎湃新聞上傳並發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。