ICCV-2017參會碎碎念+Referring Expression論文解讀

2021-01-15 大數據與多模態計算

深度學習提出以來,人工智慧熱潮持續升溫,AI研究的重要拼圖計算機視覺也越發火爆。2017年10月下旬,兩年一度的計算機視覺頂級會議ICCV (International Conference of Computer Vision) 相約世界第一水城威尼斯。揣著一半對學術的熱忱,一半對威尼斯的期待,我來到這座歷史悠久的義大利名城。

大大小小的教堂塔樓,隔三差五的石橋河道,無拘無束的紅頂房宇,時而狡黠時而糊塗的威尼斯商人,和不讓遊客使用的「公廁」,構成了我對這個城市的主要印象。


本次ICCV選擇的會場也是誠(bi)意(ge)十(man)足(man),直接選在了威尼斯電影節的舉辦地點,Lido島上的Palazzo del Cinema電影中心,面朝大海,又星味十足。由於我們住的旅館在旁邊的Venezia主島,必須乘坐當地的公交船來回會場。於是,早霞出海晚霞歸來,體會碼頭的沉靜與喧囂就成了日常項目。

10月22日註冊完會議,正好趕上了Ross, Kaiming, Jifeng, Justin等人做的從object recognition到beyond object instances的tutorial報告。不禁感嘆Kaiming等人讓計算機視覺真正實用越來越成為可能,而Feifei高徒Justin的研究一步步探索著計算機視覺的想像力邊界, visual reasoning好複雜讓人感慨臥槽這都可以

10月23日,趁著主流程main conference還沒開始,小夥伴一行幾人決定把威尼斯的主要景點遊覽一番。清晨的碼頭很美,聖馬可廣場還很空曠,我們早早買票進入了總督府,一路經過法院,監獄和二者連接的嘆息橋,體驗了一下囚犯從審判到入獄的感受。然後去了久負盛名的聖馬可大教堂和高聳的時鐘塔樓,在塔樓上可以一覽威尼斯的全貌。下午,坐船前往周邊的幾個小島,有亦可賽艇的彩色島,把房子塗成了五顏六色;也有因吹思艇的玻璃島,販賣各種精緻的玻璃藝術品。

10月24日,main conference開始,上午先頒發了幾個重要獎項,best paper和best student paper,獲獎人大家都熟,流水的intern鐵打的他




在頒發了傑出研究者和久經考驗論文獎之後,第一個oral session就開始了,轉播團隊也很專業,在合適的時候會切換到報告人的大特寫,特別帶感。幾天下來,發現還是華人和印度口音的報告人最多,但論自信程度,我還是服一個歐洲大叔,講解自帶廣告效應,臨了霸氣的說,你們要是不信哥說的,那咱就在poster見吧

主會議一共四天,我的poster在最後一天,前三天觀摩了好多poster,和同行的交流獲得了很多收穫,也認識了好多小夥伴。大廳的公司展臺被國內的公司佔據了半壁江山,真是大國崛起,AI當先。

時間來到10月27日,哥準備登場講poster,然而前一天接到組委會通知,說今天9點之後船家會罷工,你在逗我嗎。一早起來,梳洗罷,穿上特意準備的襯衣和緊身褲,登上準備罷工的船,前往Lido島。來到會場,提前把海報一掛,心裡就開始默默過解說詞了。時間迫近10點半,觀眾絡繹不絕而來,儘管是第一次講poster,還是儘量裝作不是的樣子,但終究免不了捉急的時候,實在沒法了來一句Youknow what I mean你懂我意思吧


最後,經過了2個多小時的交流,得到了一些同行的認可,深感欣慰,可真的只是一點微小的工作,很慚愧。10月29日,一行人收拾行李,踏上歸途,發現義大利也存在中國式過馬路,畢竟歐洲中國隊,世界盃都能被帶出局,我還能說啥。據說威尼斯哪天可能就沉了,AI也曾經沉淪過,但是現在迎來了華麗重生,所以還是祝威尼斯一直都在吧。

 


----帥帥的分割線--

 

這裡簡單介紹一下此次ICCV錄用的工作Referring expression generation and comprehension via attributes。先放上維基百科的定義:Referring expression is any noun phrase, or surrogate for a nounphrase, whose function in discourse is to identify some individual object. 指代性表達經常出現在人們的日常對話中,用來確認或識別某些特定目標(物體),表現形式通常為名詞性短語。設想如下情景,20年後的某一天,作為老司機的你去某商場逛街,碰巧進入一個仿真娃娃商店,貨架上擺著各種相貌服飾的仿真娃娃。


機器人服務員小A熱情的說:「客官,您想要哪款娃娃?」

老司機犀利的目光停留在一款娃娃身上,說:「那個黑色長髮的娃娃。」

小A:「大叔,那幾個都是黑色長髮,您說的哪個啊?」

老司機:「不好意思,沒說清,左數第二,戴蝴蝶結那個。」

小A:「大叔您的眼光真犀利!都說這款神似當年島國某老師。」

老司機:「滾犢子,我送給我女兒當生日禮物,現在這AI咋都這德行了...」

說罷小A長手一伸,把那個娃娃拿了下來,遞給虛偽的老司機

  

以上,老司機和小A分別作為對話中的speaker說者listener聽者,老司機第一次對娃娃的描述存在歧義(ambiguity),導致小A無法理解(comprehension),並給了老司機一次反饋feedback/reward,老司機得到反饋後重新描述,採用了更詳盡的描述,包括方位序數詞(location word):左數第二,以及屬性特徵(attribute):戴蝴蝶結。這下終於沒有歧義(disambiguity)了,小A最後直接定位(localize)目標物體,代表自己真的理解了。這事兒現在看著還有點科幻,但以後遲早是要實現了。

回到學術上,現在的任務有兩個,第一個是referring expression generation,要求計算機根據給定的圖中物體,給出一個沒有歧義的描述,要達到人類能理解的地步;第二個是referring expression comprehension,要求計算機根據給定圖片和目標的描述,定位出目標物體。相關工作包括較早的[1][2],和後來的[3],特別感謝UNC製作的RefCOCO和RefCOCO+的datasets[3],成為了今後的標準資料庫;以及後來CVPR17的兩篇佳作[4][5],都引入了listener對speaker的監督調整,進一步減少了speaker產生的歧義;[4]還首次將兩個任務joint learning,得到了進一步提升。


我們的工作[6]首次將attribute屬性引入了兩個任務,預先訓練好屬性學習模型,並將屬性作為額外信息送入兩個任務的模型之中。屬性集合事先從訓練樣本中的描述referring expression中提取,並採用多標籤分類模型進行訓練和學習。上圖展示了兩個任務的pipeline。另外,我們還對attribute進行了更深入的分析,包括一些適用場景和失敗場景,並對屬性根據類別進行了分類和分析,相信可以對以後的研究者提供幫助。實驗結果表明attribute對於referring expression的生成和理解都具有顯著的提升。下左圖是referring expression comprehension的一些結果,下右圖是referring expression generation的一些結果。


【參考文獻】

[1]Mao et al, Generation and Comprehension of Unambiguous Object Descriptions, CVPR 2016.

[2]Hu et al, Natural Language Object Retrieval, CVPR 2016.

[3]Yu et al, Modeling Context in Referring Expressions, ECCV 2016.

[4]Yu et al, A Joint Speaker-Listener-Reinforcer Model for Referring Expressions, CVPR 2017.

[5]Luo et al, Comprehension-guided referring expressions, CVPR 2017.

[6]Liu et al, Referring expression generation and comprehension via attributes, ICCV 2017.



相關焦點

  • 無聊碎碎念 20190120
    點讚數多者優先採用微信碎碎念 20190110簡單碎碎念 20190111控制碎碎念 20190112幸福碎碎念 20190113 注意碎碎念 20190114洞察碎碎念20190115成長碎碎念 20190116期望碎碎念 20190117 遊戲碎碎念 20190118焦慮碎碎念20190119
  • 拖了很久的碎碎念
    被窩是青春的墳墓,寫下這一段的時候,春節已經結束了,我也已經坐在了節後開工的工位上了,而這篇還沒寫完的碎碎念也算是跨了年了,囉裡囉嗦的從去年寫到了今年,也不知道自己都寫了些啥玩意。以上,是我不知所云可能也不合邏輯的碎碎念,辛丑年第一篇作業已完成。
  • 司馬茶術碎碎念001~ 味覺地圖
    以下1~3部分內容,主要是度娘信息解讀,對於真實性和科學性,不予評價,各位看官只需要關注我的分析解讀是否合理即可。在下一次碎碎念之前,初學者可以嘗試,喝任何飲料的時候,即便是喝水,都做一下體驗:在感覺舒適的溫度下含在嘴裡,用口腔的不同部位去感知它,找一下味覺在不同部位的體現。至於這些味道代表了什麼意義,我們且不去理會。當然,你也可以嘗試一下能否找到對應的答案,不過,茶齡不足的初學者是很難理解的,不要灰心,你的每一次思考,最後都會有收穫。
  • 解讀騰訊優圖ICCV2017 12篇論文:全球首個AI卸妝效果的算法等
    優圖實驗室創立於2012年,專注在圖像處理、模式識別、機器學習、數據挖掘等領域開展技術研發和業務落地,至今已有近5年的歷史。一直以來,我們都在創新;所以我也會給大家看到新的有趣的應用,同時撥開雲遮霧繞,還原視覺AI的技術真實水平。最後我也會和大家介紹騰訊優圖實驗室視覺AI的發展。點擊閱讀原文參會,到現場領略一代計算機視覺大師的風採。
  • ICCV 2017 spotlight論文解讀:如何提高行人再識別的準確率
    例如ICLR2016年的Reducing Overfitting in Deep Networks by Decorrelating Representations(arXiv:1511.06068),以及同樣ICCV2017年的一篇工作arXiv:1511.06068。
  • 原來任嘉倫是小話癆,雖然碎碎念,但卻正能量滿滿,喜歡你沒道理
    昨天《嚮往的生活》中,任嘉倫完全吸引了我的眼球,他真得很愛碎碎念,但是碎碎念之中又沒有諸多抱怨,反而正能量滿滿。差點忘記任嘉倫是出過文集的人,《國超文集2.0》在《嚮往的生活》成功出圈。兩人進蘑菇屋的過程中,我真正領略到了任嘉倫碎碎念的功力,一時間竟有些同情同行的譚松韻了。任:你是說敲敲門,還是靜悄悄啊。任:沒事吧,進人家裡也不敲敲門,直接換鞋進是吧,當自己家啊,一看你就是來過,你看輕車熟路的,我已經看到黃老師了,也可能是我的頭大。
  • 有個愛碎碎念的爸爸是啥體驗 網友:超可愛!
    有個愛碎碎念的爸爸是啥體驗 網友:超可愛!
  • ICCV 2017獎項公布:最大贏家何愷明獲最佳論文,參與最佳學生論文
    當地時間 10 月 22 日,兩年一度的計算機視覺國際頂級會議 International Conference on Computer Vision(ICCV 2017
  • 從20 篇ICCV 2017錄用論文,看商湯科技四大攻堅領域|ICCV 2017
    根據組委會公開的數字,會議 40% 的論文投稿來自中國的研究者。在中國的人工智慧浪潮中,商湯科技以及它與港中文的聯合實驗室無疑是其中最有代表性的力量。在這一方向上,有 4 篇論文被 ICCV 2017 錄用,包括一篇 Oral。Towards Diverse and Natural Image Descriptions via a Conditional GAN (Oral).
  • 【ICCV2017視覺盛宴概況】何愷明博士包攬最佳論文和最佳學生論文獎!Facebook成大贏家!
    【導讀】當地時間 10月 22 日到10月29日,兩年一度的計算機視覺國際頂級會議 International Conference on Computer Vision(ICCV 2017在參會人數方面,今年的參會人數為3107人,突破3000大關,是上一屆ICCV 2015人數的兩倍多,可以看出計算機視覺這個領域這幾年有多麼火熱。
  • 貓咪亂抓紙箱,店員忍不住和它碎碎念,貓咪一臉疑惑:你在說啥
    貓咪亂抓紙箱,店員忍不住和它碎碎念,貓咪一臉疑惑:你在說啥。沒事的時候還可以和貓咪聊天,雖然說,貓咪的語言和我們不通,而且也不一定會回應,但貓咪就像是和小孩子一樣,和它們說話也是有趣的。但有的時候,貓咪不回應自己,不說話,也是讓人有點煩惱的。
  • 關於家庭主婦腦迴路的碎碎念
    可是,關於家庭主婦腦迴路的碎碎念卻像「野火燒不盡,春風吹又生」一樣,一波又一波湧向我的腦海,在一波又一波推波助瀾之下,我只好無恥的坐在電腦前安撫一下混亂的腦迴路,湊成這一篇不成文的文字。     柴米油鹽醬醋茶。每一天的日常生活裡都蘊含著家庭主婦們博大精深的思維內涵和獨特縝密的腦迴路曲線。        民以食為天。
  • 家長批評有分寸,請停止無休止批評,碎碎念只有反作用
    為什麼孩子犯錯父母為什麼碎碎念沒完?家長一直說不停,其實根本就是這兩個方面的原因。一是家長過度依賴於孩子,孩子的喜怒哀樂全部掛在心上,當然,孩子做錯一件事,佔據家長所有的心扉,家長不說個不停,能心裡痛快?
  • 騰訊優圖的 ICCV 2017:12篇論文入選 CV 頂會,3篇Oral|ICCV 2017
    被譽為計算機視覺領域三大頂級會議之一的ICCV(另外兩個為CVPR、ECCV)近日揭曉收錄論文名單,騰訊優圖共有12篇論文入選,其中3篇被選做口頭報告(Oral),該類論文僅佔總投稿數的2.1%(45/2143)。本屆 ICCV 共收到2143篇論文投稿,其中621篇被選為大會論文,錄用比例29%。
  • 王者榮耀:張大仙開全麥碎碎念隊友哈哈大笑,老粉脫口而出:大姐
    王者榮耀:張大仙開全麥碎碎念隊友哈哈大笑,老粉脫口而出:大姐 眾所周知,各平臺有著不少知名主播,大多數主播打遊戲技術還都是可以的
  • 漫長的夏休,終於劃上不完美的句號——summerpockets全通碎碎念
    漫長的夏休,終於劃上不完美的句號——summerpockets全通碎碎念 2018-07-01 01:53  溼帝-錢包君暴斃中
  • 2017(第二屆)天然藥物研討會免費參會名額,等你來拿!
    轉發本文至朋友圈,把截圖發給「生物谷」微信公眾號,並留下您的手機號碼,即有機會免費獲取參會名額!2017(第二屆)天然藥物研討會將於8月10-11日在杭州召開!你造這個會上可以看到多少大牛嗎?
  • 老公成植物人,我想離開這個家,無意聽到婆婆碎碎念,我放棄離婚
    我卻沒心思再去照顧老公,只想離開他,不過一次無意中,我聽到,婆婆碎碎念,說老公出事後保險公司賠了80萬,而錢都在婆婆那。我心中一動,這麼多錢在,我不能現在離婚,怎麼也得把錢拿到再離婚。婆婆年紀也大了,平時身子不好,體弱多病,我估計著再要個幾年,這一筆錢就會給我們的。
  • 格式塔視覺規律-我在實戰中的碎碎念
    今天小編給大家帶來的文章是格式塔視覺規律,本篇文章作者如是說:「這篇文章是寫給大多數人看的關于格式塔心裡學規律我在項目裡面的碎碎念。當然這會是全網最容易看懂的格式塔原理。」
  • CVPR 2017論文解讀:特徵金字塔網絡FPN
    近日,CVPR 2017獲獎論文公布,引起了業內極大的關注。但除了這些獲獎論文,還有眾多精彩的論文值得一讀。因此在大會期間,國內自動駕駛創業公司 Momenta 聯合機器之心推出 CVPR 2017 精彩論文解讀專欄,本文是此系列專欄的第二篇,作者為 Momenta 高級研發工程師李俊。