阿德萊德大學在讀博士陳昊:高質高效的實例分割模型BlendMask:公開...

2020-12-16 智東西

實例分割,是機器自動從圖像中用目標檢測的方法框出不同的實例,然後用語義分割的方法在不同的實例區域內進行逐像素標記的過程。簡單的理解就是:在同一個類的實例中區分不同的實例。在計算機視覺的任務中,由於實例分割是像素級識別輪廓任務,因此與其他類似的視覺任務相比,實例分割屬於最困難的視覺任務之一。

實例分割兼具目標檢測和語義分割的特點,因此逐漸演化出基於語義分割的down-top apporach與基於目標檢測的top-down apporach兩種方法。top-down模型是先通過一些方法獲取box區域,然後對區域內的像素進行mask提取,這種模型會面臨以下幾個問題:1)特徵和mask之間的局部一致性會丟失;2)特徵提取的冗餘性,不同的bbox會重新提取mask;3)由於使用縮小特徵圖卷積而造成的位置信息丟失。bottom-up模型則會先對整圖進行逐像素預測(per-pixel prediction),每個像素生成一個特徵向量,然後通過一些方法來對像素進行分組。由於進行的是逐像素級預測且步長很小,局部一致性和位置信息可以很好的保存,但會面臨以下幾個問題:1)嚴重依賴逐像素預測的質量,容易導致非最優的分割;2)由於mask在低維提取,對於複雜場景(類別多)的分割能力有限;3)需要複雜的後處理方法。

因此綜合top-down和bottom-up的策略,利用instance-level信息(bbox)對per-pixel prediction進行裁剪和加權輸出的方法,成為了一種趨勢。而目前雖然FCIS和YOLACT已有類似的思想,但都沒有很好的處理top-level和bottom-level的特徵,高維特徵包含整體的instance信息,而低維特徵的則保留了更好的位置信息,如何合併高低維特徵,8月7日晚8點,智東西公開課邀請到阿德萊德大學在讀博士、BlendMask一作陳昊參與「CV前沿講座」第13講,陳博士將圍繞《BlendMask-高質高效的實例分割模型》這一主題進行直播講解。

陳博士將從實例分割問題的定義與研究出發,詳解二階段實例分割方案的特點與局限,並對BlendMask模型的原理及BlendMark模型在實例分割、全景分割等任務上的應用進行深入的講解。

陳昊是澳大利亞阿德萊德大學在讀博士,指導老師為沈春華教授。陳博的研究方向為計算機視覺,包括實例檢測分割、網絡結構搜索和文字檢測識別等。他的研究成果發表於CVPR、IEEE等頂級會議,其中包括4篇CVPR2020。

課程內容

主題:BlendMask:高質高效的實例分割模型

提綱:1、實例分割問題的定義與研究2、二階段方案的特點與局限3、BlendMask模型的框架與原理解析4、BlendMask模型在實例分割、全景分割等任務上的應用

講師介紹

陳昊,澳大利亞阿德萊德大學博士生,指導老師為沈春華教授。研究方向為計算機視覺,包括實例檢測分割、網絡結構搜索和文字檢測識別等。其研究成果發表於CVPR、IEEE等頂級會議,其中包括4篇CVPR2020。

直播信息

直播時間:8月7日20:00直播地點:智東西公開課小程序答疑地址:智東西公開課討論群

加入主講群

本次課程的講解分為主講和答疑兩部分,主講以視頻直播形式,答疑將在「智東西公開課討論群」進行。加入討論群,除了可以免費收看直播之外,還能認識講師,與更多同行和同學一起學習,並進行深度討論。掃碼添加小助手糖糖(ID:hitang20)即可申請,備註「姓名-公司/學校/單位-職位/專業」的朋友將會優先審核通過哦~

相關焦點

  • CVPR 2020 論文大盤點-實例分割篇
    下面這張經典圖片,簡單明了地說明了實例分割與其他視覺三大任務的區別:圖像分類是對整幅圖像給出一個類別,目標檢測將感興趣的物體框出來,語義分割將相同類別的物體分割出來,實例分割則要分割出感興趣類別物體的個體,既是對圖像的像素級分割,又是實例級理解。
  • 魚與熊掌可以兼得:何愷明等人一統語義分割與實例分割
    ,它結合語義和實例分割的優勢構建更強大的方案。但目前大多數頂尖方法都分別用兩個模型建模語義和實例分割兩種任務,並最後將預測結果組合在一起。這種方法並不能利用兩者間的交互信息提供更準確的預測,這樣也就沒什麼意義了。在何愷明等研究者的這篇論文中,他們結合 Mask R-CNN 與 FCN 構建出一種新型的全景分割模型,這個統一的模型在兩種任務間共享計算,並實現非常好的性能。
  • Facebook 最新論文:Mask R-CNN實例分割通用框架,檢測,分割和特徵...
    近日, FAIR部門的研究人員在這一領域又有了新的突破——他們提出一種目標實例分割(object instance segmentation)框架Mask R-CNN,該框架較傳統方法操作更簡單、更靈活。研究人員把實驗成果《Mask R-CNN》發布在了arXiv上,並表示之後會開源相關代碼。以下為AI科技評論據論文內容進行的部分編譯。
  • ...R-CNN實例分割通用框架,檢測,分割和特徵點定位一次搞定(多圖)
    近日, FAIR部門的研究人員在這一領域又有了新的突破——他們提出一種目標實例分割(object instance segmentation)框架Mask R-CNN,該框架較傳統方法操作更簡單、更靈活。研究人員把實驗成果《Mask R-CNN》發布在了arXiv上,並表示之後會開源相關代碼。以下為AI科技評論據論文內容進行的部分編譯。
  • 新加坡國立大學在讀博士張景鋒:基於對抗學習的模型魯棒性研究...
    此公式被證明在提升模型魯棒性方面表現優異,但由於此算法的「悲觀性」,也導致了學習過程中的諸多問題。如在最大化損失函數的過程中,此算法並不在意模型對數據的分類是否正確,因此魯棒性的提升是以犧牲準確率為巨大代價的。除此之外,因為每次尋找對抗數據都需要多次反向傳播,所以學習過程十分耗時。那麼是否有可能對極小極大公式進行改進優化,使得模型能兼顧對抗魯棒性與準確性,並降低計算複雜度呢?
  • 代替Mask R-CNN,BlendMask欲做實例預測任務的新基準?
    在今天要為大家介紹的工作中,作者通過有效地將實例級信息與具有較低級細粒度的語義信息結合起來,提升了掩碼預測精度。本文的主要貢獻是提出了一個Blender模塊,該模塊從自上而下和自下而上的實例分割方法中汲取了靈感。由於該方法簡單且有效,作者希望本文的BlendMask可以作為各種實例預測任務的基準。
  • Talk預告 | Hawkes process模型新研究: 約翰霍普金斯大學在讀博士...
    北京時間12月24日(周四)晚8點,約翰霍普金斯大學計算機科學系在讀博士—梅洪源的Talk將準時在將門TechBeat技術社區開播!  Talk·信息  ▼  主題:用一個"神經"了的Hawkes process  對事件序列建模  嘉賓:約翰霍普金斯大學  計算機科學系在讀博士
  • 動態生成掩膜預測網絡生成模型CondInst,助力FCN重奪實例檢測顛峰
    Mask R-CNN作為一種性能優異的算法,在實例分割領域取得了巨大成功,這種兩階段的方法主要依賴於ROI操作來獲取最終的實例掩膜。而在這篇文章中,作者從全新的角度解決了實例分割問題,來自澳大利亞阿德萊德大學的研究人員在實例條件下提出了動態實例生成的網絡模型,代替了先前逐個實例的ROI區域作為預測的輸入。
  • 多倫多大學在讀博士朱子寧:如何利用語言探針檢測深度神經模型性能...
    語言模型編碼在神經模型中的評估越來越受到科研人員的關注。語言探針(linguistic probe)是最近比較流行的一種可以探測深度神經模型裡面編碼了哪些特徵的「診斷性分類器」算法,分類器效果的好壞直接體現深度模型包含信息的好壞,也就是模型性能的好壞。「探針」的選擇是對模型性能的解釋,因此如何選擇「探針」成為了一個難點。
  • 滑動窗口也能用於實例分割,陳鑫磊、何愷明等人提出圖像分割新範式
    他們提出一條新的道路,即將密集實例分割看成一個在 4D 張量上進行的預測任務,這也就是 TensorMask 通用框架。該論文是 FAIR 實驗室完成的,除了何愷明外,一作陳鑫磊博士也非常厲害。陳鑫磊本科畢業於浙江大學,博士在 CMU(2012-2018)完成,他從 2011 年開始就在 AAAI、ICCV 和 CVPR 發過 13 篇頂會論文,其中有 8 篇是一作。
  • 光學精密工程 | 實例特徵深度鏈式學習全景分割網絡
    TASCNet注重兩種分割任務結果的一致性研究,通過全局二值化掩模來調整跨任務一致性,減弱全景分割模型中實例分割和語義分割兩任務的差異性;AUNet把重點放在對前、後景信息的交互利用上。通過注意力機制模塊,該算法實現了實例和語義兩種分割結果與對方網絡的雙向傳遞,將分割結果互為參考,共同作用提高分割精度。
  • 極市直播回放丨第74期-田值:BoxInst,實例分割創新式突破!僅用Box標註,實現COCO 33.2AP!
    實例分割是計算機視覺中最重要的問題之一。實例分割可以提供像素級別的結果, 因此相比目標檢測有更廣泛的應用場景。
  • CondInst:性能和速度均超越Mask RCNN的實例分割模型
    對於實例分割來說,主流的做法還是基於先檢測後分割的流程,比如最流行的Mask RCNN模型就是構建在Faster RCNN基礎上。目前基於one-stage的物體檢測模型已經在速度和性能上超越two-stage模型,同樣地,大家也希望能找到one-stage的實例分割模型來替換Mask RCNN。
  • 一文讀懂語義分割與實例分割
    而基於深度學習的圖像分割技術則是利用卷積神經網絡,來理解圖像中的每個像素所代表的真實世界物體,這在以前是難以想像的。基於深度學習的圖像分割技術主要分為兩類:語義分割及實例分割。語義分割和實例分割的區別又是什麼?
  • 實例分割與物體檢測的統一——Mask-RCNN
    a.實例分割 (Instance Segmentation)在圖像領域,有比較多的分割類型,比如使用閾值來對圖像的明暗,色差進行分割,但在人工智慧與圖像分割結合的部分人們主要探討的是實例分割以及語義分割(semantic segmentation)。
  • 華科團隊發布 OVIS 遮擋視頻實例分割基準數據集
    在實例分割這一研究命題裡,解決遮擋帶來的幹擾,一直是重要的研究方向。為了解決這一難點,來自華中科技大學、阿里巴巴、康奈爾大學、約翰霍普金斯大學以及牛津大學的團隊,收集了一個用於遮擋視頻實例分割的大規模數據集 OVIS(Occluded Video Instance Segmentation ),可用於同時檢測、分割和跟蹤遮擋場景中的實例。
  • 豐田工業大學芝加哥分校在讀博士石昊悅:基於自然監督信號的句法...
    在「NLP前沿講座」第1講的講座中,智東西公開課邀請到豐田工業大學芝加哥分校的在讀博士石昊悅,為大家帶來主題為《基於自然監督信號的句法結構學習》的講座。隨著深度學習在NLP領域的應用,特別是本身攜帶句法關係模型的推陳出新,句法分析似乎不那麼受到關注了。
  • 突破AI和機器理解的界限,牛津博士論文學習重建和分割3D物體
    牛津大學計算機科學系博士生 Bo Yang 在其畢業論文中詳細解讀了如何重建和分割 3D 物體,進而賦予機器感知 3D 環境的能力,突破了人工智慧和機器理解的界限。賦予機器像人類一樣感知三維真實世界的能力,這是人工智慧領域的一個根本且長期存在的主題。考慮到視覺輸入具有不同類型,如二維或三維傳感器獲取的圖像或點雲,該領域研究中一個重要的目標是理解三維環境的幾何結構和語義。
  • 學生為博士學位與澳大利亞阿德萊德大學死磕十幾年!曠日持久的拉鋸...
    但是你們見過一篇論文死磕十幾年的操作嗎……阿德萊德大學的一位學生,為了他的博士論文,與阿大相愛相殺十幾年!一位名叫Pierre Ablingue Ahoure的男子,於1999年在阿德萊德大學註冊了PHD,並在2005年提交了他的博士論文!
  • 《求職高手》陳昊獲「最高效老闆」稱號
    在9月1日(本周日)播出的第四期節目中,上海見解文化傳媒董事長杜子建、考拉閱讀創始人兼CEO趙梓淳、優勝教育創始人兼董事長陳昊、喜馬拉雅副總裁李海波、新片場集團副總裁馬睿亮相節目現場,帶來了包括運營專家、藝人統籌、產品助理、課程顧問、招商加盟經理等在內的多種職位。首席推薦官劉惠璞、張雪峰、耿偉、孫靜博精挑細選出八位優秀的求職者,與老闆們進行了一場精彩絕倫的「對決」。