港中文開源視頻動作分析庫MMAction,目標檢測庫算法大更新

2021-01-10 機器之心Pro

機器之心報導

參與:李亞洲、杜偉

昨日,香港中文大學多媒體實驗室(MMLab)OpenMMLab 發布動作識別和檢測庫 MMAction,同時也對去年發布的目標檢測工具箱 mmdetection 進行了升級,提供了一大批新的算法實現。

OpenMMLab 計劃是香港中文大學多媒體實驗室(MMLab)2018 年啟動的計劃,由香港中文大學教授、商湯科技聯合創始人林達華老師負責,初衷是「為計算機視覺的一些重要方向建立統一而開放的代碼庫,並不斷把新的算法沉澱其中。」

2018 年 10 月,在 OpenMMLab 的首期計劃中,商湯和港中文正式開源了 mmdetection,這是一個基於 PyTorch 的開源

目標檢測

工具包。該工具包支持 Mask RCNN 等多種流行的檢測框架,讀者可在 PyTorch 環境下測試不同的預訓練模型及訓練新的檢測分割模型。

昨日,林達華發表知乎文章,發布 OpenMMLab 第二期內容:

MMDetection(目標檢測庫)升級到 1.0,提供了一大批新的算法實現。MMAction(動作識別和檢測庫)全新發布。MMDetection 1.0

Github 地址:open-mmlab/mmdetectiongithub.com

最新的 MMDetection 是 MMLab 聯合商湯科技以及十多個研究團隊合作完成的。據介紹,相較於其他開源資料庫,MMDetection 1.0 的優勢如下:

高度模塊化的設計。通過不同檢測算法流程的分解,形成一系列可定製的模塊。然後對這些模塊進行隨機組合,可以迅速搭建不同的檢測框架。多種算法框架支持。MMDetection 直接支持多種主流的目標檢測與實例分割的算法框架,包括 single-stage、two-stage、multi-stage 等多種典型架構,以及各種新型模塊。此外,MMDetection 還提供了 200 多個預訓練的模型。高計算性能。MMDetection 所支持的主要模塊均能在 GPU 上運行。整體的訓練速度優於 Detectron、maskrcnn-benchmark、以及 SimpleDet。特別值得一提的是,MMDetection 還直接支持混合精度訓練以及多卡聯合訓練,這些技術的引入都能顯著提高訓練的效率。先進算法。MMDetection 提供了在 MSCOCO 2018 比賽中奪冠的 HTC 算法。隨著越來越多研究團隊加入到 mmdetection 的開發中,MMLab 研究團隊將持續保持和最新算法的同步。此外,MMLab 也發布了一份技術報告,對 MMDetection 進行了詳細介紹。

從機構名稱中,我們可以發現 MMDetection 的發布聯合了國內外 13 所機構。

報告連結:https://arxiv.org/abs/1901.11356

該報告還提供了 MMDetection 與其他開源庫的對比,可以看到 MMDetection 提供的算法遠比其他開源庫豐富:

MMDetection 與其他開源庫的對比

MMLab 的研究團隊還在 MMDetection 的基礎上對相關算法進行了全方位的對比試驗。他們比較了損失函數、歸一化策略、訓練尺度等一系列設計參數的選擇對於檢測性能的影響。

視頻動作分析庫 MMAction

林達華介紹道,「在深度學習剛剛開始進入計算機視覺領域的時候,MMLab 已經開始了對使用深度學習進行視頻動作分析的研究,提出了一系列有影響的算法框架。比如,我們在 ECCV 2016 提出的時序分段網絡(Temporal Segmental Network)已經被廣泛運用於實際系統中,並影響了很多新的算法設計。」

基於過去幾年的探索,MMLab 建立了專門用於視頻動作分析的統一代碼庫 MMAction。

項目地址:https://github.com/open-mmlab/mmaction

據介紹,MMAction 有以下重要優點:

全面支持視頻動作分析的各種任務,包括動作識別(action recognition)、時域動作檢測(temporal action detection)以及時空動作檢測(spatial-temporal action detection)。支持多種流行的數據集,包括 Kinetics、THUMOS、UCF101、ActivityNet、Something-Something、以及 AVA 等。已實現多種動作分析算法框架,包括 TSN、I3D、SSN、以及新的 spatial-temporal action detection 方法。MMAction 還通過 Model Zoo 提供了多個預訓練模型,以及它們在不同數據集上的性能指標。採用高度模塊化設計。用戶可以根據需要對不同模塊,比如 backbone 網絡、採樣方案等等進行靈活重組,以滿足不同的應用需要。林達華知乎文章:https://zhuanlan.zhihu.com/p/69830582

相關焦點

  • ...檢測與單目標、多目標跟蹤,港中文開源一體化視頻感知平臺MM...
    新年伊始,香港中文大學多媒體實驗室(MMLab)OpenMMLab 又有新動作,發布了一款一體化視頻目標感知平臺 MMTracking。該框架基於 PyTorch 寫成,支持單目標跟蹤、多目標跟蹤與視頻目標檢測,目前已開源。GitHub 地址:https://github.com/open-mmlab/mmtracking
  • 融合視頻目標檢測與單目標、多目標跟蹤,港中文開源視頻感知平臺
    機器之心報導編輯:魔王香港中文大學多媒體實驗室(MMLab)OpenMMLab 開源一體化視頻目標感知平臺 MMTracking。新年伊始,香港中文大學多媒體實驗室(MMLab)OpenMMLab 又有新動作,發布了一款一體化視頻目標感知平臺 MMTracking。
  • PyTorch實現,GitHub4000星:微軟開源的CV庫
    機器之心報導編輯:魔王、陳萍本文介紹了微軟開源的計算機視覺庫,它囊括了計算機視覺領域的最佳實踐、代碼示例和豐富文檔。近年來,計算機視覺領域突飛猛進,在人臉識別、圖像理解、搜索、無人機、地圖、半自動和自動駕駛方面得到廣泛應用。而這些應用的核心部分是視覺識別任務,如圖像分類、目標檢測和圖像相似度。
  • mmdetection使用目標檢測工具箱訓練,測試
    公眾號:datayx香港中文大學-商湯科技聯合實驗室開源了基於 PyTorch 的檢測庫——mmdetection。商湯科技和港中大組成的團隊在 2018年的COCO 比賽的物體檢測(Detection)項目中奪得冠軍,而 mmdetection 正是基於 COCO 比賽時的 codebase 重構。https://github.com/open-mmlab/mmdetection這個開源庫提供了已公開發表的多種視覺檢測核心模塊。
  • GitHub上6個超強開源機器學習庫盤點
    實際上,這個機器學習庫包含一個基於開源遊戲Gameplay Football的強化學習環境。該強化學習環境由谷歌研究團隊打造,並且僅用於科學研究。以下就是在此環境中模擬出來的部分場景:其中,智能體被訓練在一個先進的、基於物理的3D模擬環境中踢足球。過去幾年裡我也有見到一些強化學習環境,然而相比之下,這個的效果最好。
  • 整合全部頂尖目標檢測算法:FAIR開源Detectron
    昨天,Facebook AI 研究院(FAIR)開源了 Detectron,業內最佳水平的目標檢測平臺。Detectron 目前包含以下目標檢測算法的實現:Mask R-CNN (https://arxiv.org/abs/1703.06870)—Marr Prize at ICCV 2017RetinaNet (https
  • 這款Python 庫 4行代碼搞定!
    大數據分析OCR是什麼?OCR本質是圖像識別,其包含兩大關鍵技術:文本檢測和文字識別。先將圖像中的特徵的提取並檢測目標區域,之後對目標區域的的字符進行分割和分類。EasyOCR支持超過80種語言的識別,包括英語、中文(簡繁)、阿拉伯文、日文等,並且該庫在不斷更新中,未來會支持更多的語言。
  • OpenCV 2.4.5 發布,開源計算機視覺庫
    OpenCV 2.4.5 發布了,該版本增加了完全功能的 Java 桌面綁定,兼容任意 JVM;此外關於 CUDA gpu 模塊的多項改進;基於OpenCL 的硬體加速模塊已成熟,修復了不少 bug, 實現了 CLAHE 算法
  • 2019年必知的10大頂級Python庫
    如果你目前正在使用 python 進行機器學習項目,那麼你可能聽說過這一個流行的開源庫,那就是 TensorFlow。這個庫是由 Google 與 Brain Team 合作開發的,幾乎每一個 Google 的機器學習應用程式都用到了 TensorFlow。
  • 分享一個PyTorch醫學圖像分割開源庫
    分享一位52CV粉絲Ellis開發的基於PyTorch的專注於醫學圖像分割的開源庫,其支持模型豐富,方便易用。其可算為torchio的一個實例,作者將其綜合起來,包含眾多經典算法,實用性比較強。地址在這裡:https://github.com/MontaEllis/Pytorch-Medical-Segmentation該庫特點:支持2D和3D醫學圖像分割,可以修改hparam.py文件來確定是2D分割還是3D分割以及是否可以進行多分類
  • 大盤點|性能最強的目標檢測算法
    本文便對mAP最高的目標檢測算法進行了盤點。趁最近目標檢測(Object Detection)方向的論文更新較少,趕緊做個"最強目標檢測算法"大盤點。要知道衡量目標檢測最重要的兩個性能就是 精度和速度,特指mAP 和 FPS。
  • 香港中文大學陳愷:物體檢測算法的近期發展及開源框架介紹 | 大...
    雷鋒網 AI 科技評論按:物體檢測是計算機視覺的基礎任務之一。香港中文大學多媒體實驗室博士生陳愷在 AI 研習社的公開課上,為大家總結了深度學習背景下物體檢測算法的發展,分享 COCO 比賽冠軍團隊所使用的算法,並介紹由港中大多媒體實驗室開源的物體檢測算法框架 mmdetection。
  • 目標檢測與行為跟蹤 智能分析三大應用
    1目標檢測技術  傳統視頻監控系統只提供視頻的捕獲、保存、傳輸、顯示畫面等功能,而視頻內容的分析識別等需要人工實現,工作量巨大且容易出錯。智能監控系統是指在特定的監控區域內實時監控場景內的永久或是臨時的物體,通過對視頻傳感器獲取的信息進行智能分析來實現自動的場景理解、預測被觀察目標的行為以及交互性行為。
  • 您必須在2019年知道的十大Python庫
    如果您目前正在使用Python進行機器學習項目,那麼您可能已經聽說過這個流行的開源庫,即TensorFlow。該庫是由Google與Brain Team合作開發的。TensorFlow幾乎在每個Google應用程式中用於機器學習。
  • 數據科學和機器學習的最佳Python庫
    以下是Seaborn的功能列表:提供用於分析和可視化單變量和雙變量數據點以及將數據與其他數據子集進行比較的選項。支持針對各種目標變量的線性回歸模型的自動統計估計和圖形表示。TensorFlow是用於深度學習的最佳Python庫之一,是一個用於跨各種任務進行數據流編程的開源庫。
  • 以VON CHAIN為例,技術小白怎麼看懂黑貓Github開原始碼庫?
    其實啊,要判斷一個項目是不是真的有技術實力並沒有大家想像中那麼難,你只要在它們公開的Github開原始碼庫中查看幾個數據,項目大概的開發水平也心裡有數了。今天,我以VON CHAIN為例,教大家怎麼以5個數據去判斷一個項目的技術基本面:1)代碼更新頻率任何技術都必定是長期不停更新的,即使其團隊技術強如IOS系統、安卓系統、微信、支付寶等等超級大公司,它們也需要不斷更新應用版本推出道市場當中。同樣的道理,任何真正的區塊鏈技術項目都不可能停止開發更新,除非這個項目倒閉了,或者它根本就沒有什麼技術含量。
  • 翻譯必備術語庫推薦
    中國核心詞彙  https://www.cnkeywords.net/index  「中國核心語彙」涵蓋政治、經濟、科技、文化等12個熱門分類,17種語言,100萬詞條,由中國出版集團公司、中國翻譯研究中心匯聚了全球資深翻譯家與漢學家的權威智慧,利用最先進的大數據技術與語義分析搜索技術,更加系統的展現出中國關鍵語彙形成的時間脈絡與語境全貌。
  • 谷歌推出開源 Python 庫「Tangent」,支持前向模式自動微分
    推出開源 Python 庫「Tangent」。據介紹,這個庫與現有的機器學習庫相比,存在諸多優勢,可以大大改善了用戶的使用體驗。雷鋒網 AI科技評論編譯整理如下:Tangent 是一個全新的免費開源 Python 庫,可以用於自動微分。與其他現有的機器學習庫相比,Tangent屬於源到源(source-to-source)系統,可以用 Python f 函數調用新的 Python 函數,計算出 f 的梯度。
  • 2017,最受歡迎的 15 大 Python 庫有哪些?
    因此,我根據近來的使用體驗,在本文中列出了對數據科學家、工程師們最有用的那些庫。由於這些庫都開源了,我們從Github上引入了提交數,貢獻者數和其他指標,這可以作為庫流行程度的參考指標。核心庫1.scikit-learn給常見的機器學習算法公開了一個簡潔、一致的接口,可簡單地將機器學習帶入生產系統中。該庫中集成了有質量的代碼和良好的文檔、簡單易用並且十分高效,是使用Python進行機器學習的實際行業標準。
  • 一文總結數據科學家常用的Python庫(下)
    所以,我已經提到了兩個Python庫,可以幫助您解釋模型的性能。/* LIME */LIME是一種算法(和庫),可以解釋任何分類器或回歸量的預測。LIME如何做到這一點?通過一個可解釋的模型來近似它。靈感來自「為什麼我應該相信你?」:解釋任何分類器的預測「,這個模型解釋器可用於生成任何分類算法的解釋器。