看過CVPR 2018 workshop 後,發現有一個我不認識的 Lady Gaga

2020-11-27 雷鋒網

雷鋒網(公眾號:雷鋒網) AI 研習社按,當地時間 6.18-22 日,CVPR 2018 將在美國鹽湖城舉辦。目前距離大會開幕還有四個月,隨著春節期間大會主辦方公布接收論文名單,引來大家對 CVPR 的討論狂潮(詳情可參見 CVPR 2018 收錄論文名單全公布,默默看各路大神公布喜訊)。除了對接收論文的討論和學習,其實還有一個議程也不容大家錯過,那就是 workshop 上各式各樣的比賽了。

從大會官網上可以看到,今年的 workshop 涉及到多個議題,比如偽裝人臉識別、低功耗圖像識別、圖像壓縮、系統魯棒性分析、自動駕駛、嵌入式視覺等等多個方面,而針對這些議題,也湧現出許多有意思的比賽。這些 workshop 上的比賽,或是有多個大公司贊助,或是極具新意,或是極具實用價值,雷鋒網 AI 研習社在篩選之後,為大家介紹如下幾個比賽。

以下是兩個極有新意的比賽,在偽裝人臉識別比賽和大規模地標識別競賽上,主辦方都提供全新的大規模公開數據集,大家可以利用系統識別偽裝後的明星,識別景點。

偽裝人臉識別比賽

在「First International Workshop on Disguised Faces in the Wild 」workshop上,來自馬裡蘭大學、IBM 和印度國際信息學院(IIIT)的幾位主辦方推出偽裝人臉檢測比賽。

隨著近年來深度學習的進步,自動人臉識別能力得到了顯著提升。然而,在不受約束的環境中,面對不是很配合的用戶,想要進行精準的人臉識別仍然極具挑戰。

目前對姿勢、表情、光照、老化程度和低解析度等幾個因素的研究頗多,但「偽裝」仍然是人臉識別中一個很難解決的問題。

如下圖所示,偽裝包括有意和無意的改變面容來混淆自己的身份,或者模仿別人的身份。你能猜出下面誰是Lady Gaga,誰是 Neil Patrick Haris 嗎?

偽裝在什麼樣的環境下都有可能發生,因此對這種問題的識別會更加困難。此外,由於沒有可用的數據集,人們並沒有對真實場景下的偽裝進行全面研究。

針對現狀,在此次研討會上,主辦方舉辦了這場偽裝人臉識別競賽,參賽者將被要求展示他們在自然環境資料庫中對偽裝後的人臉的識別情況。優秀的算法組將被受邀提交論文,選中的論文會在 workshop 上進行演示。此外,沒有參加比賽的相關研究人員也可以提交論文。

喬裝人臉數據集(Disguised Face Dataset)

主辦方準備了一個喬裝人臉數據集(Disguised Face Dataset),包含了 1.1 萬多張涵蓋 1000 種主題的各種經過不同偽裝的圖片。主題文件夾由喬裝過後的藝人的圖片組成,此外主辦方還提供從 Faster RCNN 中生成的臉部文件。

數據集地址:http://iab-rubric.org/databases/DFW_Data.zip

比賽主要包括如下幾個方向:

  • 在偽裝的情況下識別人臉

  • 通過偽裝冒充其他身份

  • 檢測各種不同的偽裝方法

  • 檢測化妝之後的人臉

  • 識別遮掩之後的人臉

關於該比賽的詳細信息,可以參見:

http://iab-rubric.org/DFW/dfw.html

大規模地標識別競賽(Large-Scale Landmark Recognition: A Challenge)

當你在瀏覽旅遊之後的照片時,有沒有問過自己:我在中國訪問過的這座寺廟叫什麼名字? 我在法國看到的這個紀念碑是誰建造的? 想不起來沒關係,地標識別系統能幫到你。地標識別技術可以直接通過圖片像素預測地標標籤,從而幫助人們更好地理解和分類自己的照片。

如今,地標識別研究面臨一大障礙——缺乏大型的帶標註的數據集。

在這次競賽中,主辦方公開了迄今為止最大的全球性數據集,以促進解決這個問題。此次比賽在 Kaggle 平臺上舉辦,極具挑戰性。

此次共分為兩個賽事:

地標識別

Kagglers 需要建立模型,在測試集中識別出正確的地標 (如果圖中有地標)。

許多 Kagglers 對諸如 ImageNet LSVRC 大規模視覺識別挑戰賽很熟悉,ILSVRC 的目標是識別一千種常規的對象類別。地標識別與這有些許不同:它包含了更大的類 (這次比賽中有一萬五千個類),並且每個類的訓練樣例的數量可能不是很大。地標識別本身也極具挑戰。

這一挑戰與地標檢索挑戰賽同時進行,兩個比賽的測試集相同,以鼓勵參賽者兩個都參加。

地標檢索

圖像檢索是計算機視覺中的一個基礎問題:給定一個圖像,你能否在大型資料庫中找到類似的圖像? 這個問題對於含有地標的圖像來說非常重要,因為人們大都喜歡以特定的地標作為背景拍照。

在這場競爭中,主辦方會為參賽者提供查詢的圖像,並且,對於每個給定的圖像,都希望參賽者能檢索出資料庫中包含相同地標的所有圖像 (如果存在的話)。

主辦方也鼓勵參賽者使用識別比賽中的訓練數據來訓練檢索賽中的模型,這可能也會有用。但是請注意:這兩個挑戰賽的訓練/檢索集中沒有共同的地標。

比賽提供的全新數據集是世界上最大的圖像檢索研究數據集,由一百多萬張圖片組成,包含一萬五千個獨特的地標。主辦方表示,希望這一數據集將加速對這類研究的進展。

地標識別比賽地址:https://www.kaggle.com/c/landmark-recognition-challenge

地標檢索比賽地址:https://www.kaggle.com/c/landmark-retrieval-challenge

除了以上兩個代表性的極具新意的比賽,會上也有很多較為傳統的比賽,例如 LPIRC。

低功耗圖像識別挑戰賽(Low-Power Image Recognition Challenge)

該比賽為 IEEE 主辦,今年是第四屆。比賽贊助方包括 IEEE Rebooting Computing、谷歌和 Facebook。

舉辦該比賽的背景如下:目前,許多移動系統 (智慧型手機、電子設備、自動機器人) 都具有拍照功能,這些系統都需要使用電池,因此降低能耗極其重要。

這一競賽旨在發掘出兼顧圖像識別和節約能耗的最佳技術。參賽選手的方案將會根據兩個維度來評估:一是高識別率,二是低功耗。

圖像識別涉及到許多任務。這一挑戰集中於對象檢測,這是許多識別方法的基本路徑。

下面有兩個例子,舉例說明了此次任務。

在第一個例子中,有兩個物體:一隻鳥和一隻青蛙。


在第二個例子中,有若干物體:汽車、人、摩託車和頭盔。


LPIRC 的訓練和驗證數據來自於 ImageNet 大規模視覺識別挑戰賽。測試數據是專門針對此次比賽準備的。

比賽分為三個不同挑戰:

Track 1:參賽隊伍在 CVPR 2018 之前,將他們的模型提交為 TfLite 格式,這裡重點關注模型在確定計算平臺上的準確率和執行時間。

Track 2:參賽隊伍在 CVPR 2018 前提交程序,主辦方將會在英偉達 TX2 上執行程序,衡量準確率和能耗。

Track 3:與 2017 年的一樣,參賽者在現場用他們寫好的程序比賽,這裡對硬體和軟體都沒有限制。(注意:不能使用英偉達 TX2)

關於比賽的更多信息,接下來會陸續公布,大家可以關注:

https://rebootingcomputing.ieee.org/lpirc

除了這些或極具新意,或傳統的比賽,也有比賽既涉及到由來已久的賽事,又專注於未來的實用性價值,例如下面要介紹的魯棒性視覺挑戰賽。

魯棒性視覺挑戰賽(Robust Vision Challenge)

過去十年間,帶標註的大數據集日益增多,如 Middlebury、PASCAL VOC、ImageNet、MS COCO、KITTI、Cityscapes,這些數據集的出現使得計算機視覺和機器學習取得巨大進步。

有了公共排行榜,大家只需要比較多種方法的結果,就很容易追蹤到這一領域的最先進技術。雖然目前在每個數據集上都取得了穩定的進展,但許多都只限於特定領域。例如,KITTI 專注於真實世界的城市駕駛場景,而 Middlebury 考慮的是室內場景。

因此,在一個數據集上頂尖的方法通常在另一個數據集上表現很差,或者需要對模型參數進行大量修改。

這個 workshop 的目標是促進視覺系統的發展,找到能在各種具有不同特徵的數據集上均表現良好的穩健系統。

為了實現這一目標,主辦方推出 Robust Vision Challenge 挑戰賽,通過一系列具有不同特徵的、極具挑戰性的基準(例如室內 VS 室外,真實 VS 合成,晴朗 VS 惡劣天氣,不同的傳感器),測試系統在若干個任務 (如:重建、語義/實例分割、單一圖像深度預測) 上的性能。此外,主辦方也鼓勵大家提交的系統中包括新的算法、目前正在審核的技術和已經發表的方法。

如上圖所示,主辦方為這 6 個挑戰中的冠軍和亞軍提供獎項,並邀請他們在這次的 workshop 上展示其方法,參加 workshop 晚宴。此外,主辦方還計劃在 TPAMI 論文上發表優勝者方案。

而從大的方向上來看,也有諸多比賽關注城市現狀,旨在利用計算機技術,找出針對於交通問題、城市發展問題的更好的應對方法,例如下面將要介紹的兩項比賽:

英偉達 AI 城市挑戰賽(NVIDIA AI CITY CHALLENGE)

英偉達在 CVPR 2018 上舉辦了一場英偉達 AI 城市挑戰賽。他們表示,到 2020 年將有 10 億臺相機。交通運輸是相機最大的細分市場之一,因為它可以從這些相機捕捉到的數據中受益。在交通、信號系統、運輸系統、基礎設施中,分析從這些攝像頭中獲得的信息,有助於交通系統更安全、更智能。

然而,目前因為一些原因,他們還沒能利用到這些潛在的信息。首先是數據質量很糟糕,此外缺乏數據標籤,最後缺乏能夠將數據轉化為有用信息的高質量模型,另外還需要支持從端到雲分析的平臺來加速模型的開發和部署。

而此次的 NVIDIA AI City Challenge workshop 將特別關注這些問題,例如分析交通流量特徵(如車速),大力開展使用無人監督的方法來檢測車輛相撞、停車引起的異常現象等等。

雖然目前計算機視覺,特別是深度學習已經在大規模的實際部署上有所貢獻,這將有助於使城市變得更聰明、更安全,但英偉達希望徵求大家更多的點子。

為了減少對監督式方法的依賴,而更多的關注於遷移學習、非監督和半監督的方法,他們在這次 workshop 上組織此次競賽,優秀成果將在 workshop 上進行展示。

參賽者可以在以下三個挑戰中選擇參加一個或多個,想獲得獎品的參賽隊伍需要提交代碼,以便於主辦方驗證。

Track 1: 交通流量分析(Traffic Flow Analysis)

參賽隊伍需要提交預估車速。測試集是 27 個 1 分鐘的視頻。

Track 2:異常檢測(Anomaly Detection)

參賽隊伍將提交檢測到的前一百個異常情況,這可能是由於汽車相撞或車輛停滯造成的。異常情況不包括正常的交通堵塞。

Track 3: 多場景車輛檢測和鑑定(Multi-camera Vehicle Detection and Reidentification)

參賽隊伍需要在 15 個視頻中,識別出在 4 個不同地點中均至少出現過一次的車輛。

而他們為參賽選手提供的獎品也很英偉達:

Track 1 中,冠軍和亞軍獎品是 Jetson TX2;

Track 2 中,冠軍獎勵是 Titan Xp1,亞軍獎勵是 Jetson TX2;

Track 3 中,冠軍獎勵是 Tesla V100,亞軍獎勵是 Jetson TX2。

比賽詳細信息:https://www.aicitychallenge.org/

DeepGlobe 衛星圖像理解挑戰

據主辦方介紹,與傳統圖像相比,衛星圖像非常強大,它包含更多的結構化、一致的數據。儘管計算機視覺社群目前已經在利用深度學習,基於日常圖像數據集,完成了一些極具挑戰的任務,但衛星圖像最近才獲得關注,基於衛星圖像可以對地圖和人口進行分析。

這個 workshop 旨在將不同研究人員聚集與此,以推進衛星圖像分析頂尖技術的進展。

為了讓更多人關注這些技術,主辦方推出 DeepGlobe 衛星圖像理解挑戰(DeepGlobe Satellite Image Understanding Challenge),該挑戰賽基於三種不同的衛星圖像理解任務。

為這次競賽準備的數據集可以作為未來分析研究衛星圖像的參考基準。此外,由於挑戰任務將涉及到實拍圖片(in the wild)中的經典計算機視覺問題,這些數據集極具價值,有可能成為產生健壯視覺算法的溫床,而不僅僅只是局限在遙感技術的範圍。

DeepGlobe 包含如下三種挑戰:

在災區,特別是發展中國家,地圖和可獲得的信息對於危機應對至關重要。這項挑戰是從衛星圖像中自動提取道路和街道網絡。這是一個二元分割問題,需要檢測每一區域所有道路的像素。對這項競賽的評估將基於道路像素的準確度。

人口動態建模對災害響應和恢復具有重要意義,而對建築物和城市區域的檢測是實現建模的關鍵。這項挑戰的目的是從衛星圖像中自動探測建築物。這一問題也是二元分割問題,需要找出每個區域所有不同建築的位置。評估是基於檢測到的建築邊緣與地面實況的重疊情況。

對地表自動分類和切割對可持續發展、農耕和城市規划具有重要意義。這一挑戰是個多類分割任務,需要探測城市、耕地、牧場、森林、水源、荒地和未知區域。評估是基於類別標籤的準確性。

參賽者可提交一個或多個挑戰的結果。主辦方呼籲大家提交的結果包括新的技術、正在審查的方法和已經出版的方法。每項挑戰的前三名都將獲得獎勵,獲勝者將會在 DeepGlobe CVPR 2018 workshop 上進行口頭陳述,每一挑戰的前五名將受邀請進行海報展示。主辦方還將在 workshop 上發表一些選定的論文。

當然了,上面介紹的那些比賽並不是全部,大家可以點擊:http://cvpr2018.thecvf.com/program/workshops,查看更多 workshop 比賽信息,看看是否有你感興趣的主題。

(完)雷鋒網 AI 研習社編譯整理

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 《歡樂合唱團》終極決戰 齊秦助挑戰lady gaga
    >齊秦助陣        搜狐娛樂訊 經過三個多月的層層選拔後,更有臺灣著名歌星齊秦傾情加盟,首次嘗試與合唱團一起演繹自己的經典曲目。《超級瑪麗》、《植物大戰殭屍》、《喜羊羊》等動畫主題歌經典改編,更有lady gaga、王菲等超級明星熱門歌曲震撼翻唱,為觀眾呈現精彩絕倫的視聽盛宴。
  • 託Lady gaga的福!19種蕨類植物因她而得名
    杜克大學的研究者使用Lady gaga的名字命名19種新發現的蕨類植物。至於原因我們不得而知,難道這些人也是她的粉絲?也許是因為她穿著的禮服,看起來與某種蕨類植物結構類似?
  • 科學家發現一種長相奇怪的角蟬 以Lady Gaga命名
    【環球網科技綜合報導】據外媒報導,日前,伊利諾伊大學厄巴納-香檳分校(University of Illinois at Urbana-Champaign)的一名研究生發現了一種新的角蟬,其外形古怪,特徵突出,形狀看起來像鹿角又像枯葉,並且它們能夠通過振動植物莖來「唱歌」。
  • 你所不知道的尚雯婕,她有發覺優質音樂人的能力!對自己還特狠!
    其實整容這個事呢,娛樂圈是非常普遍的了,為什麼咱們尚雯婕的整容就那麼不受人待見呢?可能是因為她整容前後的變化太明顯了,看看兩張對比圖:雖然大家說整容之後是殭屍臉,但個人認為,其實整容後的畫風還是更時尚一些,更像娛樂圈的畫風。話說回來,整容雖然不是天生麗質,但整容也是要承受心理生理痛苦滴,也是有風險滴,不得不說尚雯婕對自己夠狠!
  • 你知道嗎 中國北方有座城市叫Two Gaga Mountain
    你知道嗎,中國北方有座城市叫Two Gaga Mountain……這麼洋氣的名字,可能當地人自己都不知道!  那麼腦筋急轉「翻」來了,先讓我們「翻譯」一下Two Gaga Mountain是啥意思,兩個gaga山?二ga高峰?gaga這個英文單詞也沒學過呀,莫非是……擬聲詞?難道這是……雙鴨山?!  未見其城,先聞其名。
  • 看世界 | 「一個巨星的誕生」,Lady Gaga越來越美了!
    地點:北海道,日本日本北部的Atsuma鎮,地震後引起的山體滑坡,形成了一幅延綿起伏的「藝術品畫作」地點:巴斯拉,伊拉克伊拉克抗議者示威反對政府對基本建設的缺失,新的暴力抗議活動爆發後,伊拉克南部城市實施宵禁,其中還導致了一人死亡,35人受傷綠皮     2018.09.09
  • 歷年 CVPR 最佳論文盤點(2000 年——2018 年)
    (接收論文列表:http://cvpr2019.thecvf.com/files/cvpr_2019_final_accept_list.txt)正當學界紛紛議論各單位獲接收論文多寡的當兒,雷鋒網 AI 科技評論為大家精心整理了一份從 2000 年——2018 年的 CVPR 最佳論文清單,藉此對這批計算機領域的重要論文進行複習。
  • Lady Gaga籌辦抗疫慈善音樂會,這會是又一次LIVE AID嗎?
    新冠肺炎疫情下的歐美娛樂圈最近又有了新動向。在4月6號的世界衛生組織線上會議上,Lady Gaga宣布自己與世界衛生組織已在7天內籌集了3500萬美元善款。緊接著,她又表示,自己將帶頭舉辦一場抗疫慈善音樂會。
  • 「CVPR 2018」機器也能感知時間,AI系統可預測5分鐘內的未來!
    相關的研究論文已經被CVPR 2018接收。Juergen Gall團隊展示他們的預測未來系統超越單步預測Gall和他同事們的研究目標——教會計算機預測未來——並不是現在才有,實際上,這是機器學習和計算機視覺領域的一個主要課題,有大量的研究人員都在從事相關的工作。
  • 看完梁龍的造型才知道,lady Gaga真的不辣眼睛
    估計能把Lady Gaga的作品如數家珍的網友不多。但是看過Lady Gaga的造型的網友,應該不在少數。 Lady Gaga的造型,以大膽、前衛著稱。 當年還沒有完全紅起來的時候,也就是在和李晨分手後最難熬的時光裡,張馨予曾經穿著一身大花被面去了外國的紅毯。
  • 西電學子獲國際頂會CVPR2020 -VQA比賽亞軍
    新聞連結:http://cvpr20.com/visual-question-answering-and-dialog/https://visualqa.org/workshop.htmlhttps://www.youtube.com/watch?
  • 航宇嘉泰戰略研討會 開展workshop式頭腦風暴
    通過會議討論,與會人員對公司的現狀進行了剖析,對公司未來的發展目標進行了展望,基本形成了統一的認識:確立了進入行業前三的戰略目標不動搖,同時在「十四五」期間實現銷售收入的飛躍團委開展了一場團建活動,進行了「猜猜我是誰」和「投壺」趣味活動,每組組員積極為小組出謀劃策,增分添彩,活躍了氣氛。
  • 圖鴨科技 CVPR 2018 圖像壓縮挑戰賽奪冠,獲獎論文全解讀
  • 英語名人名言:Lady Gaga 經典語錄2(中英文)
    —我的祖母幾乎是已經失明了,但是她人能看到亮的地方,比如我的皮膚和頭髮。她說:「我能看到你,因為你沒有穿褲子」所以我就繼續不穿褲子咯這樣祖母就能看到我了。   ——The Fame is about how anyone can feel famous. Pop culture is art.
  • 為什麼楊振寧看過《三體》後說:我曾經看過《三體》,卻看不下去
    但是在採訪過程中,當記者提到科幻小說巔峰巨作《三體》時,楊振寧卻說道:「我曾經看過《三體》,卻我看不下去。眾所周知,《三體》是我國著名科幻作家劉慈欣的作品,此前劉慈欣憑藉《三體》,獲得了素有「科幻界諾貝爾獎」之稱的雨果獎,而且是亞洲範圍內首次獲獎。
  • Lady Gaga的造型師Nicola與優衣庫合作
    他和公司的設計總監Naoki Takizawa,還有創意總監 Kashiwa Sato共同設計了一個新的生產線Uniqlo Innovation Project。 Mugler的創意總監兼Lady Gaga的造型師Nicola Formichetti 最近幾天都忙壞了。
  • 怎樣理解It's not over till the fat lady sings?關胖女人啥事
    運動比賽時經常會用到這個有趣的說法,不了解其中含義的人常常會聽得一頭霧水。那個胖女人是誰?又是什麼東西沒結束?其實胖女人指的是歌劇中典型的女高音,想像一個很胖的女子戴著有角的帽子,手拿盾牌跟矛。以前的歌劇總會安排一位這種 體型的女士在劇終時,唱一首既洪亮又拉長音的歌曲來謝幕。但是為何會形成這個說法呢?
  • The EMBO workshop: Chromatin structure organizati…
    The EMBO workshop: Chromatin structure organizati… 2021-01-14 17:02 來源:澎湃新聞·澎湃號·政務