港中文李弘揚:物體檢測最新進展

2020-12-25 讀芯術

人工智慧論壇如今浩如煙海,有硬貨、有乾貨的講座卻百裡挑一。由中國科學院大學主辦,中國科學院大學學生會承辦,讀芯術作為指定合作自媒體的「AI未來說·青年學術論壇」第三期「計算機視覺」專場已於2019年3月24日下午在中科院舉行。港中文李弘揚博士為大家帶來報告《物體檢測最新進展》。

李弘揚,香港中文大學多媒體實驗室(MMLab)博士生,微軟亞洲研究院實習生。博士期間導師為王曉剛教授。主攻計算機視覺和深度學習方向,尤其對物體檢測、人體姿態估計、CNN網絡結構設計、少樣本學習(few-shot learning)、膠囊網絡(capsule networks)等熱點問題做了一些初步探索。在機器學習和計算機視覺六大頂級會議和兩大頂級期刊中,共發表文章9篇,其中一作6篇(包含1篇口頭報告)。多次擔任頂級會議審稿人、AI教育公司兼職顧問。

報告內容:物體檢測(object detection)作為計算機視覺中最基礎、最核心的任務,多年來備受學術界、工業界關注。一方面檢測任務涉及機器學習中最根本的分類、回歸問題,另一方面,隨著深度學習、大規模數據集的興起,很多視覺任務(語義分割、圖像描述、圖像問答等等)的基石都是由物體檢測框架構建起來的。本次報告首先會簡要回顧以R-CNN為框架的一系列經典方法;然後重點介紹我們發表在ICLR2019 上的最新工作--利用相同類別中大物體的特徵幫助小物體的學習,從而解決RoI-pooling操作中小物體上採樣時特徵不準的瓶頸;同時最優運輸(optimaltransport)理論也被用來選擇最合適的大物體特徵圖。我們的方法在COCO和Pascal數據集上都取得了顯著的提升。最後,本次報告會和觀眾們探討物體檢測領域下一階段的發展方向。

物體檢測最新進展

香港中文大學多媒體實驗室博士生、微軟亞洲研究院實習生李弘揚博士報告的主要內容包括物體檢測的介紹、Feature Intertwiner Module 和關於物體檢測的未來發展趨勢的展望。

李弘揚博士首先介紹了物體檢測的背景和研究意義。物體檢測中存在諸多的挑戰,比如形狀(shape)、外貌(appearance)、大小(size)的變化,以及混亂場景中的模糊現象。有兩種可能的解決方案,一種是在圖像上鋪儘可能多的錨點框(anchor),另一種是使網絡的層數儘可能地深。

並介紹了為什麼有固定的 ROI 輸出和大小anchor 的放置的問題。ROI 之後要求 size都是固定大小,是因為後面要經過 Global Pooling,並且把 Global Pooling 的特徵都映射到同一特徵空間中,所以 Pooling 必須是預先設計好的,即 ROI 之後的 size 必須是一致大小的這是 ROI 設置的最本質的問題。關於大小 anchor 的放置問題,要把小的 anchor 放在網絡的前端,而把大的 anchor 放在網絡的後端。這是由於在網絡中如果卷積的 stride 大於1,或者有pooling 的操作,會把 anchor 變得越來越小,使小物體檢測變得越來越難。由於卷積的前幾層 stride 比較小,小物體的 feature 信息不容易丟失。對於大的 anchor,要變化到 ROI Pooling 要求的 size 的大小通常是一個 downsample 的下採樣過程,在經過 downsample 的下採樣的過程後特徵會變得更加準確,這是一個優中選優的過程,而小的 anchor 變化到 ROI Pooling 要求的大小通常時一個 upsample 的採樣過程,一個直觀的印象是在編造的過程,經過 ROI Pooling之後的特徵可能會不準。所以要把小的 anchor 放在網絡的前面,而把大的anchor 放在網絡的後面。

然後講了二步法存在的一些問題,並介紹了 FeatureInterwiner 的模塊,由於大物體的 feature 比較準確,而小物體的 feature 不太準確,可以把大物體的 feature 作為一個 soft target 來指導小物體特徵的學習,在小物體特徵提取時加一個 Makeup Layer來學習丟失的 local details,通常使用 L2 loss 來用大物體的特徵來彌補小物體的特徵。並使用 buffer 來記錄訓練時比較準確的特徵,其中buffer不需要進行梯度的更新。介紹了 Feature Interwiner 的模塊之後又介紹了使用該模塊的實驗結果。

最後對物體檢測的未來進行了展望,當前物體檢測的方法(一步法檢測器和二步法檢測器)都是基於 anchor 的,bounding box 在檢測物體時有時不是很準確,是否可以使用 bottom-up 的方法來檢測物體,如像素級別的分割,使用pose的方法來預測bounding box 的左上角點(top-left corner)和右下角點(bottom-right corner)。還有是否可以不僅使用上下文信息,而且可以使用真實世界的 3D 結構來解決檢測的問題。更多精彩的內容請關注視頻的分享。

相關焦點

  • 超越何愷明等組歸一化 Group Normalization,港中文團隊提出自適配...
    雷鋒網(公眾號:雷鋒網) AI 科技評論:港中文最新論文研究表明目前的深度神經網絡即使在人工標註的標準資料庫中訓練(例如 ImageNet),性能也會出現劇烈波動。至今已有 5000+次引用,在學術界和工業界均被廣泛使用。港中文團隊提出的 SN(Switchable Normalization)解決了 BN 的不足。SN 在 ImageNet 大規模圖像識別數據集和 Microsoft COCO 大規模物體檢測數據集的準確率,還超過了最近由 Facebook 何愷明等人提出的組歸一化 GN(Group Normalization)。
  • 撕「港獨」海報,英語單挑「港獨」,內地女生威武!(最新進展)
    9月5日晚,香港中文大學發生了一件令人意外的事。一名內地女生撕下「港獨」宣傳海報,卻被蹲點的記者和「港獨」學生圍住。
  • 香港中文大學陳愷:物體檢測算法的近期發展及開源框架介紹 | 大...
    :物體檢測是計算機視覺的基礎任務之一。分享主題:物體檢測算法的近期發展及開源框架介紹分享提綱:1. 深度學習背景下物體檢測算法的發展2. COCO 2018 Instance Segmentation 冠軍團隊算法分享3.
  • 細粒度物體檢測算法的升級揭秘
    在眾多模型使用場景中,小目標物體的檢測比較常見,一般的目標檢測算法往往效果不理想;因此,EasyDL團隊針對小目標物體的檢測進行了專項優化,並取得了令人矚目的效果提升。自AlexNet在2012年ImageNet比賽上展露頭角以來,計算機視覺各個方向和神經網絡的聯繫變得越發緊密,物體檢測也不例外。
  • 實探合肥利港銀河廣場最新進展 新東方、京東便利店已經開業
    我愛鋪網訊利港銀河廣場何時開業?新東方、京東便利店已經開業金仕堡因裝修問題多次延遲營業橫店影城正在裝修中商業街開業店鋪已近半我愛鋪網小編實探項目最新進展!壹實探利港銀河廣場最新進展利港銀河廣場除去大型住宅區之外,商業部分包括購物中心、商業街、小戶型和酒店等多種業態。我愛鋪網小編近日實地探訪了利港銀河廣場,為您展現該項目的最新進展。
  • 港中文,你是真的離譜!
    圖/DBC港中文學員提供先問問,港中文的校車具體有多少條線,港中文的同學知道嗎?要說山有山的美,但也有別的無奈...就算不上山上課,港中文的同學總有要穿梭在學校裡的時候。佔地面積這麼大,港中文給學生提供的設施倒是差不了,禮堂請過張學友,食堂能吃全球飯。除了上課,在港中文生活的體驗感也是很強的。港中文足足35座食堂,有普通的雙拼飯,也有世界各地的美食。另外,地鐵站出口的美心等也是港中文學子的備選。
  • 李飛飛團隊最新研究,真實場景中識別物體具體屬性,連表面紋理都...
    白交 發自 凹非寺 量子位 報導 | 公眾號 QbitAI 現在,細微到物體表面的紋理,AI都可以識別。 這就是李飛飛團隊新研究。
  • 卷積神經網絡 物體檢測 FPN
    2017年,kaiming和rbg再次合作(一作Tsung-Yi Lin),提出了FPN解決小物體檢測的問題FPN(feature pyramid network)從rcnn到fater rcnn,物體的分類都是在最後conv層的feature map上做的,而此時feature map每個點對應的是原圖的一個區域,如果我們要檢測的物體比較小,很容易漏檢;所謂低層的特徵淺但是位置精細,高層的特徵深但是位置粗糙,因此如何加入多尺度特徵是本篇要解決的問題,如下是幾種方案:(a)通過多尺度圖片分別獲取多尺度特徵
  • SenseTime聯合港中文囊括兩項世界第一
    在美國東部時間2015年12月10日結束的第六屆ImageNet圖像識別大賽上,由香港中文大學多媒體實驗室歐陽萬裡教授和SenseTime(商湯科技)閆俊傑等多位科學家聯合組成的CUvideo團隊在視頻物體檢測競賽中取得了檢測數量、檢測準確率兩項世界第一的成績。SenseTime與AMAX中國聯合研發的SenseBox並行計算平臺為CUvideo團隊提供了卓越穩定的性能支持。
  • 7種用於物體檢測的傳感器
    打開APP 7種用於物體檢測的傳感器 gzww2018 發表於 2020-05-13 11:20:19 有許多不同的物體感測技術。下面將討論七個最常見的類型,以及它們的操作,優點和約束條件的簡要說明。 1. 機電 最基本的傳感器是機電限位開關。這些設備包含一個敏感的微開關,當一個機械驅動器被檢測到的物體取代時,它的狀態會發生變化。滾軸、觸鬚和槓桿是許多不同製造商提供的致動器版本。由於這些設備是由運動部件組成的,所以容易磨損和損壞。
  • 近日,「港獨」書籍事件的新進展,結果讓人們拍手稱快!
    今年6月份,香港的公共圖書館出現了涉及「港獨」及暴力的相關書籍。香港立法前議會員王國興表示:對於這些分裂國家,宣傳港獨思維的相關書籍,全部要一律下架!「港獨」書籍的存在,將會導致港獨事件進一步惡化。書籍的內容會影響學生的思維。
  • SSD物體檢測算法詳解
    物體檢測算法,按算法結構,可以分為one-stage和two-stage兩類。
  • 物體檢測的過去、現在和未來
    本報告分為4個部分,物體檢測的簡介、物體檢測的過去、現在以及未來,每個部分都從學術和工業兩種角度進行分析介紹。上圖簡單描述了物體檢測的發展歷程時間軸。2012年深度學習熱潮興起,接著2013年有學者將深度學習應用到檢測領域,開啟了傳統方法向深度學習的過渡轉變。我將2019年之前的發展視為物體檢測的過去,2019年至2020年看作檢測的現在,2020年以後屬於檢測的未來。
  • 兩屆CVPR最佳論文得主何愷明新作:利用焦點損失提升物體檢測效果
    何愷明博士,2007年清華大學畢業之後開始在微軟亞洲研究院(MSRA)實習,2011年香港中文大學博士畢業後正式加入MSRA,目前在Facebook人工智慧實驗室(FAIR)實驗室擔任研究科學家。這次,何愷明博士的新論文名為「Focal Loss for Dense Object Detection」,利用焦點損失提升物體檢測效果,以下是雷鋒網根據論文摘要進行的編譯。
  • 實探合肥利港銀河廣場最新進展 下半年開業打造濱湖商業新地標
    A座商業最新實拍—壹—實探利港銀河廣場最新進展近日,我愛鋪網小編來到了利港銀河廣場,發現這裡一座新的商業綜合體已經初具規模,未來這裡或將成為濱湖新區又一個商業熱門地標!C座、D座最新實拍湖北路和紫雲路交口位置的商業是E座商業,外立面已經完工,電梯、一樓店鋪等都已經接近完工,不少工作人員正在加緊施工中。
  • 港大、港中文不再承認英語6級了?!!
    今年最新的消息是:香港中文大學和香港大學不再承認大學英語六級成績,統一要求用雅思申請。ps:他們說,「內地申請的人數太多了,近年來被港校錄取的成功率一直不高。」 內地大學英語六級考試成績不被承認 多數港校都不承認內地大學英語六級成績,例如,香港中文大學和香港大學對於申請2015年9月入學的學生,均不承認內地大學的英語六級成績,統一接受雅思成績,要求在雅思6.5以上,對某些專業的單項也有要求。
  • 曠視發布通用物體檢測數據集 Objects365,開啟 CVPR 物體檢測挑戰賽
    日前,曠視發布最大通用物體檢測數據集 Objects365,並基於該數據集以及去年公布的 CrowdHuman 數據集,發起三項物體檢測挑戰賽,並將在 CVPR 2019 上舉辦 workshop,邀請優勝隊伍在現場進行比賽分享,共同探討檢測問題的瓶頸及優化方向。
  • 卷積神經網絡 物體檢測 SSD
    2015年,YOLO之後,另外一個直接回歸的方法SSD,以state-of-the-art的檢測效果和檢測效率橫空出世;SSD,single shot multibox detector準確率上:VOC達到最高80%,COCO這個小物體也是最高26.8%;2. 速度上,500尺寸下,SSD和YOLO基本持平,20幀,但是mAP高10點;另外,16年的YOLOv2在檢測效果和速度上更高一層,在效果保持state-of-the-art的基礎上,FPS能達到50+,是SSD的2倍+,但是!
  • 放棄機器學習,Python 如何進行物體檢測?
    學習在不使用機器學習或任何框架的情況下,如何在Python中進行物體檢測。作者 | Ravindu Senaratne譯者 | 彎月,責編 | 屠敏頭圖 | CSDN 下載自視覺中國以下為譯文:每當我們聽說「物體檢測」時,就會想到機器學習和各種不同的框架。
  • 蛋白質檢測和定量方法和最新進展
    然而,蛋白質定量的最新創新已存在超過25年。小編將概述當前的蛋白質檢測和定量方法,並討論一種新的基於紅外的技術,用於快速準確地測量痕量蛋白質。該方法可以檢測大多數胺基酸,檢測範圍為1 mg苯基硫代氨基甲醯基(PTC)和5 mg至10 mg茚三酮。該方法不像其他測定那樣廣泛使用,因為它昂貴,緩慢且需要技術專業知識。因此,胺基酸分析實驗室經常被用作核心設施。紫外光譜法紫外光譜法測量樣品中芳香族胺基酸的吸光度,是用於蛋白質檢測和定量的最常用方法。