上海交通大學ECCV 2018四篇入選論文解讀

2020-12-05 雷鋒網

7 月 3 日,國際人工智慧及計算機視覺頂級會議 ECCV 2018 論文接收列表公布,今年的 ECCV 大會將在德國慕尼黑舉行。據雷鋒網了解,上海交通大學 SJTU-UCLA 機器感知與推理聯合研究中心有 4 篇論文入選,研究方向涉及自動駕駛、視頻理解、視覺跟蹤以及新型神經網絡。本文對這幾篇論文做了簡介,更多詳細內容可通過論文網盤連結下載查看。

ECCV 2018 論文接收列表:

https://docs.google.com/document/d/1FuKeKgTxm_Vt8cH3HbNxaYuU8T4NnhjAm6xVGetKXgA/edit?usp=sharing

Paper 1:《Deep Regression Tracking with Shrinkage Loss》

基於收縮損失函數的目標跟蹤

網盤連結:https://pan.baidu.com/s/1GnwYrzI5NNL-1ONy-z8jsQ

目標跟蹤任務旨在給定某視頻序列初始幀的目標大小與位置的情況下,預測後續幀中該目標的大小與位置。目標跟蹤在視頻監控,人機互動,無人駕駛等領域有著極大的應用價值。由於目標姿態、外觀、光照、遮擋等因素的影響,目標跟蹤仍然是一個極具挑戰的任務。為了解決目標跟蹤算法訓練樣本不均衡的問題,作者在這篇 ECCV 的工作中提出了一個基於收縮損失函數的深度回歸跟蹤算法,針對基於深度回歸的目標跟蹤中樣本不平衡問題,本文提出的收縮損失函數顯著提升了性能。

基於深度回歸的目標跟蹤算法,通常在目標周圍的上下文區域中利用一個高斯熱圖(圖 1 b)來訓練一個正比於目標尺寸的卷積層作為跟蹤器。在這個訓練過程中,卷積核採用密集滑窗的方式產生樣本(圖 1 a 所示)。這樣導致大量冗餘的易分樣本(圖 1 d 所示),進而導致訓練樣本的不平衡問題。

圖 1. 給定搜索區域 (a) 以及對應的標籤 Y (b)。圖 (c) 表示回歸相應圖,圖 (d) 是預測與標籤數值之間差值的分布直方圖

傳統的基於深度回歸的網絡採用的是 L2 損失函數,對所有參與訓練的樣本的懲罰力度是一樣的。這樣導致網絡訓練的時候,集中在了容易訓練的樣本,也就是冗餘的負樣本上。為了解決這個問題,在這項工作中,作者提出了收縮損失函數 (Shrinkage loss) 的端到端目標跟蹤算法。作者提出的收縮損失函數,對於容易訓練樣本的損失輸出進行壓縮同時保證難分樣本的損失數值,進而影響到梯度對網絡的學習,這樣獲得深度回歸網絡更加關注正樣本以及難分的負樣本的學習,緩解了網絡的過擬合問題。此方法在 OTB-2013、OTB-2015,Temple-128 以及 VOT-2016 數據集上實現了和當前最優的 ECO 跟蹤算法相當的結果。圖 2 可視化了不同損失函數下的結果,可以看出我們的方法實現了更好的跟蹤結果。

圖 2. 不同損失函數下的跟蹤效果

Paper 2:《Geometric Constrained Joint Lane Segmentation and Lane Boundary Detection》

基於幾何約束的車道分割與車道邊界檢測

網盤連結:https://pan.baidu.com/s/1wxu3BT_1ONsHkO_Gzx1VYw

在智能駕駛問題中,環境感知是極其重要的一環。車道檢測目的在於檢測車輛可行駛道路,為智能駕駛決策提供支持。目前已有的車道檢測工作大多集中於使用卷積神經網絡直接進行語義分割,而沒有考慮到車道固有的幾何信息。針對車道檢測中的魯棒性問題,本文提出了一個多任務神經網絡,引入車道本身與邊界之間的幾何先驗知識進行車道檢測,並得到了良好的實驗結果。 

圖 1. 相較於現有方法,我們的方法使得兩個具有幾何相關性的任務,即 Lane segmentation sub-network 與 Lane boundary detection sub-network 在特徵提取層與決策層上有效互補,同時提升兩個網絡的性能

網絡首先採用傳統的多任務網絡結構,同時進行車道分割、車道邊界檢測。在得到初步的檢測結果後,網絡將通過對其中一個任務輸出結果重新卷積,形成補充信息,對另一任務的結果進行修正。由於兩個任務之間存在一定的內在關係,因此修正能顯著地提高了網絡的性能,使網絡同時關注輸入圖片中的關鍵特徵與互補特徵。同時,根據兩個任務之間的幾何先驗知識,網絡引入不同的損失函數,一方面通過車道的外邊界一致性約束車道分割的訓練,另一方面通過車道線內部區域一致性約束車道邊界檢測,進一步提升網絡精度。 

圖 2. 性能對比。左圖為本文結果。其中綠色區域代表 True Positive,藍色區域代表 False Positive,紅色區域代表 False Negative。可以看出與其他 state-of-art 方法對比,本文在精度上有極大的提高

Paper 3:《Quaternion Convolution Neural Networks》

四元卷積神經網絡

網盤地址:https://pan.baidu.com/s/1oAX_SqtGzyENa35BPcbE0g

在計算機視覺領域,卷積神經網絡可謂是近年來最為流行的算法,受到了非常廣泛的關注。目前,絕大多數的相關工作都局限於實數域的卷積神經網絡,而針對計算機視覺中最為常見的多通道彩色圖像卻缺乏針對性的矢量卷積處理方式。為了解決這一問題,作者在這篇文章中首次提出四元卷積神經網絡,構建了基於四元數運算的卷積和全連接等操作。針對卷積神經網絡對彩色圖像各通道分別處理而忽略它們之間相關性的問題,本文提出了四元卷積神經網絡,利用四元數運算直接對三維顏色矢量進行處理,在一系列任務上取得了良好的實驗結果。

 

圖 1. 四元卷積操作與實數卷積基本操作的對比

如圖所示,實數卷積核利用三個濾波器對三個顏色通道的數據分別卷積並相加,即在三個通道上進行獨立的標量拉伸,通過網絡訓練生成單通道的特徵圖。相比之下,四元卷積核則直接對顏色矢量進行旋轉和拉伸,通過網絡訓練直接生成彩色的特徵圖。作者提出,四元卷積應當實現以下兩點要求:

1. 對每個顏色矢量,能夠在整個顏色空間中進行變換以尋求最優表示。

2. 對於灰度圖像輸入,能夠與實數卷積完成等價的操作。

為此,本文引入雙邊四元數乘法來實現三維空間中顏色矢量旋轉的性質,提出將滑窗內的顏色矢量旋轉和放縮後相加,可期望每個顏色矢量能充分遍歷顏色空間。同時,將旋轉軸限定為灰度軸。當輸入的圖像為灰度圖像,此時等價於僅對輸入像素的灰度值進行了放縮變換,這和實數卷積中的操作是相同的。也就是說,實數卷積神經網絡是本文所提出的四元卷積神經網絡的一個特例。

對於全連接層,可以將其看作特殊的 1*1 卷積,這樣就可以構建出完整的四元卷積神經網絡。作者對四元卷積神經網絡中各層的正向與反向傳播過程進行了推導,並探索了參數的初始化方法及激活函數的設置,成功利用四元卷積神經網絡完成了彩色圖像分類和去噪的任務。實驗結果表明在這些任務中四元卷積神經網絡能夠取得優於相同結構的實數卷積神經網絡的結果,尤其是對於色彩鮮豔紋理豐富的圖像優勢較為明顯。

 

圖 2. 在 COCO 的一個子集的去噪任務上使用同一個 Encoder-Decoder 結構的四元卷積神經網絡與實數網絡效果對比 

圖 3. 在 Cifar-10 的分類任務上使用同一個淺層網絡結構時四元卷積神經網絡和實數網絡的準確度對比

Paper 4:《Egocentric Activity Prediction via Event Modulated Attention》

基於異步事件注意力的第一人稱視頻預測

網盤連結:https://pan.baidu.com/s/1wyjQuL0zxj-dkfTO6K_bRw

第一人稱視頻行為預測問題是一個極具研究價值的問題。其應用場景包括生活輔助(Assist living)、機器人行為研究等。目前,基於第一人稱視頻的行為分析技術大多適用於行為識別,而不能夠應用於行為預測問題。其原因在於,大多數現有的方法,使用了時序同步的特徵處理框架,因而不能夠有效地對時序異步事件來進行建模。本文針對這一問題,創造性地提出了 Gaze-事件驅動的異步/同步網絡模型,再結合注意力模型,取得了良好的實驗結果。

 

圖 1. 相較於目前已有方法,我們的方法不但能夠對同步特徵進行建模,還能夠充分地利用異步事件信息,同時注意力模型能夠對視頻序列包含的冗餘幀信息進行修剪,從而提升網絡的行為預測性能

本文提出的網絡框架包括同步和異步兩個模塊。同步模塊以 hand-mask 和 gaze-point 為輸入特徵,經過一個 FCN 網絡和 LSTM 模塊得到同步特徵。異步模塊以異步事件信號和 Object-gaze 特徵序列為輸入特徵,並經過 LSTM 模型得到異步特徵。輔以注意力模型進行特徵融合,最終得到行為預測結果。實驗結果表明,模型結合異步信息後能夠顯著提高模型對行為的預測能力,在數據集 Gaze(Gaze+)分別比 baseline 提升 5.6%(11.8%),同時,注意力模型的引入也能夠進一步提高模型的精度,在數據集 Gaze(Gaze+)分別提升 1.6%(1.3%)。

註:上海交通大學 SJTU-UCLA 機器感知與推理聯合研究中心主任為長江學者張文軍教授,由倪冰冰教授、徐奕教授指導多個研究小組。該聯合中心主要研究方向為:新一代人工智慧基礎理論、智能視頻理解及創意互動媒體、智能醫療影像分析。聯合中心於 2018 年 6 月正式成立,聯合中心的外方專家有國際計算機視覺與圖像學權威、著名的 SNAKE 模型發明人,Demetri Terzopoulos 教授,以及圖靈獎獲得者、概率推理理論的奠基人 Judea Pearl 教授。截止到目前,聯合中心已發表 30 餘篇 CCF-A 類頂級論文。

雷鋒網報導,更多學術內容敬請關注雷鋒網(公眾號:雷鋒網)AI科技評論。

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • ECCV 2020 目標檢測論文大盤點(49篇論文)
    >作者單位:香港中文大學, 南洋理工大學, 商湯科技, 浙江大學, 中科大論文:https://www.ecva.net/papers/eccv_2020/papers_ECCV/html/2272_ECCV_2020_paper.php代碼:https://github.com/open-mmlab/mmdetectionAABO
  • 2018上海交通大學學術之星出爐:做科研、發論文,都是頂尖學霸!
    劉方輝電子信息與電氣工程學院2014級博士研究生劉方輝,本科畢業於哈爾濱工業大學航天學院自動化專業,同年保送至上海交通大學攻讀博士學位,師從楊傑教授。研究方向為統計機器學習與計算機視覺。讀博以來,連續三年獲得博士生國家獎學金,並獲得2018年度電院優博培育基金資助。博士期間共發表了20餘篇期刊會議論文,其中中科院2區及以上期刊9篇。
  • 上海交大12位學者入選2018全球高被引科學家榜單
    上海交通大學王如竹教授等12位學者入選(其中1位為第二單位),與2017年度相比,增加9人,排名較2017年上升11位,居全國高校第8。現任上海交通大學特聘教授,上海交通大學低維物理與界面工程實驗室學術帶頭人,博士生導師。在SCI收錄的雜誌上發表文章230多篇,其中Science 4篇,Nature Phys. 3篇,Phys. Rev. Lett. 20篇,Adv. Mater. 5篇,APL/PRB 40多篇,綜述文章3篇。文章被引用6000多次。
  • 史上最火 ECCV 已開幕,這些論文都太有意思了
    雖然今年的疫情打亂了人們的很多計劃,但是大家對科研以及論文投稿的熱情卻依然有增無減。據統計,ECCV 2020 共收到有效投稿 5025 篇,是上一屆(2018 年)投稿量的兩倍還多,因此被認為是「史上最火 ECCV」。最終被接收發表論文 1361 篇,接收率為 27%。
  • 上海交通大學:硬核學霸來了!研究生「學術之星」名單出爐!
    曾獲得四次國家獎學金,唐立新獎學金,金屬基複合材料國家重點實驗室獎學金;入選交大優秀博士生海外訪學計劃,入選第八屆新加坡全球青年科學家峰會等。  本科畢業於吉林大學,保送至上海交通大學進行碩博連讀培養,期間獲得研究生國家獎學金、上海交通大學SMC一等獎學金,機械與動力工程學院研究生「學術之星」。  博士期間在Mater. Horizons, Sens. Actuator B-Chem., Appl. Phys.
  • 他是上海交通大學直博生,博士期間共發表SCI論文17篇!
    吳天昊,上海交通大學材料科學與工程學院2016級直博生,師從韓禮元教授,致力於高效穩定鈣鈦礦太陽能電池的研發,博士期間共發表SCI論文17篇,其中以第一作者身份在Adv. Mater., Adv. Energy Mater., J. Mater. Chem. A等高水平期刊上發表論文6篇(3篇入選ESI高被引論文),論文總影響因子超過300。
  • 上海交通大學賈金鋒、嚮導教授入選美國物理學會會士
    近日,2020年美國物理學會會士(APS Fellow)增選結果揭曉,上海交通大學物理與天文學院賈金鋒、嚮導兩位教授名列其中。現任上海交通大學講席教授,上海交通大學低維物理與界面工程實驗室學術帶頭人,博士生導師。
  • ECCV 2020 論文匯總:遙感與航空影像處理識別
    ,總計 5 篇。下載包含這些論文的 ECCV 2020 所有論文:衛星圖像,圖像合成Synthesis and Completion of Facades from Satellite Imagery作者 | Xiaowei Zhang, Christopher May, Daniel Aliaga單位 | 普渡大學論文 | https://www.ecva.net
  • EMNLP 2018 | 騰訊AI Lab解讀16篇入選論文
    今年是騰訊 AI Lab 第 2 次參加 EMNLP,共有 16 篇文章入選,涵蓋語言理解、語言生成、機器翻譯等多個研究主題。以下為摘要解讀。此外,在今年的多個頂級學術會議中,騰訊 AI Lab 也入選多篇論文,位居國內企業前列,包括機器學習領域頂會 NIPS(20 篇)和 ICML(16 篇)、計算機視覺領域頂會 CVPR(21 篇)和 ECCV(19 篇),以及語音領域頂會 Interspeech(8 篇)等。
  • 2020上海交通大學醫學院附屬仁濟醫院腫瘤科王理偉-博士後招聘通知
    《2018年度中國醫院科技量值評價(腫瘤學)》,綜合性醫院中列第5位。已建立12個腫瘤MDT,在全國率先成立MDT專家委員會,完善集腫瘤預防、診斷、治療及康復一體化服務平臺,構建的腫瘤全程管理體系,其中泌尿、消化、婦科腫瘤為優勢學科。建立了上海的腫瘤日間化療中心。
  • Cell Research 年度最佳論文出爐,共4篇論文入選
    2019年11月5號,Cell Research雜誌公布了2018年度優秀論文,共有4篇論文入選。,其中杜雪相為這兩篇文章的第一作者; 杜克大學王小凡團隊的:Switching off IMMP2L signaling drives senescence via simultaneous metabolic alteration and blockage of cell death論文。
  • 2020上海交通大學基礎醫學院高小玲課題組博士後招聘公告
    課題組長:高小玲,2007年畢業於復旦大學藥學院,獲藥劑學博士學位;2007年7月至今,任職於上海交通大學醫學院,現任藥理學與化學生物學系PI、系副主任;在Adv Sci、Nat Commun、ACS Nano、Biomaterials、J Control Release等期刊發表論文60餘篇,代表性成果獲美國化學會周刊報導,Sci Trans Med、ACS Nano雜誌述評;獲國家自然科學基金青年基金資助
  • 2020上海交通大學、東華大學合作團隊聯合招聘博士後公告
    上海交通大學化工學院邱惠斌教授、東華大學功能材料研究所葛鄧騰研究員因合作課題需要,聯合招聘(1)光熱調控材料與器件、(2)智能及高性能複合材料、(3)微納加工及增材製造方向的博士後研究人員。一、合作導師簡介邱惠斌:上海交通大學化學化工學院,教授、課題組長、博士生導師。
  • 上海交通大學全能學霸:3年3篇SCI論文,數學全部滿分,還愛寫作
    本科三年3篇SCI論文,他是全能學霸;美國、全國大學生數模,他是獎項達人;熱心公益、愛好寫作……他用實力詮釋大學多彩生活,展現交大青年學子風採!他是2017-2018學年交大三好學生標兵電子信息與電氣工程學院2015級本科生楊超琪!
  • ECCV 2020 論文大盤點-光流篇
    本文盤點 ECCV 2020 所有光流(Optical Flow)相關論文,總計 7 篇,值得一提的是來自普林斯頓大學的論文『RAFT:
  • 石河子大學25篇SCI論文入選ESI高水平論文
    9月10日,ESI最新數據更新檢索結果顯示,石河子大學有25篇SCI論文入選ESI高水平論文。  本次檢索到的25篇被引論文總被引頻次為1715次。這些論文分布在ESI的11個學科中,分別為農業科學6篇、化學3篇、工程學3篇、植物與動物科學3篇、物理學2篇、材料科學2篇、臨床醫學2篇、分子生物與遺傳學1篇、社會科學1篇、環境科學與生態學和地質學學科各1篇。
  • 專業解讀1:朋友孩子被上海交通大學錄取,問我這個專業怎麼樣?
    昨天,老家同學的兒子被上海交通大學錄取,給我發過來大紅的錄取通知書照片,非常的高興。這是老家同學孩子中第二個考到上海交通大學的學生。去年就有一位朋友,也被上海交通大學錄取。今天,我們就在專業系列解讀中,第一個解讀生物醫學工程專業。生物醫學工程學科是以解決醫學中的有關問題,保障人類健康,為疾病的預防、診斷、治療和康復服務的一門學科。是一門具有高度綜合的交叉學科,這是它最大的特點。
  • 名校名專業:上海交通大學凱原法學院,連續9年入選世界百強法學院!
    英國教育組織QS發布最新世界大學專業排名,上海交通大學凱原法學院連續第九年入選世界百強法學院。QS世界大學排名是參與機構最多、世界影響範圍最廣的排名之一,與泰晤士高等教育世界大學排名、U.S.News世界大學排名和軟科世界大學學術排名一起被稱為四大世界大學排名,其主要評價內容為全球權威學者對學科的全面評估,頂尖僱主對大學畢業生全球就業力的綜合評價,以及對最大文摘資料庫Scopus中2250萬篇研究論文以及1.62億條引文數據的分析。上海交通大學的法學教育可以上溯到20世紀之初南洋公學時期的政治特班。
  • 騰訊AI Lab 20 篇論文入選 NIPS2018,含 2 篇 Spotlight
    騰訊 AI Lab 第三次參加 NIPS,共有 20 篇論文入選,其中 2 篇被選為亮點論文(Spotlight),涵蓋遷移學習、模仿學習、半監督學習等多個研究主題,而去年他們入選論文8篇,含1篇口頭報告(Oral)。
  • 福州小夥2篇論文入選國際頂級學術會議
    東南網6月5日訊(福建日報APP-新福建記者 張穎)日前,由國際機器學習學會(IMLS)主辦的年度機器學習國際頂級會議——ICML (International Conference on Machine Learning,即國際機器學習大會)2020公布了1088篇入選論文名單。