「港中文開源」「CVPR2020」3DSSD 性能SOTA,比PointRCNN快兩倍

2021-01-09 CNNer

本文首發於公眾號:CNNer 。實時分享CVPR、ECCV等會議,關注深度學習、自動駕駛領域,我們期待你的加入。關注「CNNer」,選擇加「星標」或「置頂」精選乾貨,當日達。

論文地址:https://arxiv.org/abs/2002.10187來源:香港中文大學原文標題:3DSSD: Point-based 3D Single Stage Object Detector原文作者:Zetong Yang

當前有很多種single-stage的(single-stage:一次完成檢測步驟,two-stage: 候選區域提取+分類兩步完成檢測)基於體素的3D目標檢測器,但是基於Point的single-stage檢測算法仍然有很大的優化空間。本文首先提出了一種輕量級和高效的基於Point的3D single-stage 目標檢測器,並命名為3DSSD,該算法很好的平衡了精度和效率上的取捨。傳統的基於點的算法為了更好的執行效果,都會存在上採樣和細化網絡層結構,而本文算法為了降低計算量去掉了這種結構。本文創新性的提出了一種融合採樣策略可以檢測到少量的具有代表性的點用於實現降採樣。為了滿足我們對精度和速度的要求,本文提出了一個盒預測網絡,包含一個通過anchor-free regression head的3D非中心複製策略構建的候選區域生成層。我們的算法是一個簡練的single-stage anchor-free框架,與其他算法相比我們的算法有被不可比擬的優勢。我們分別在被廣泛使用的Kitti數據和更具挑戰性的nuScenes上,對3DSSD算法進行了測試。本文的算法比當前所有的基於體素的single-stage檢測算法取得了更好的效果,同時性能達到與two-stage point-based的算法相當的水平,但是推理速度可以超過20Hz,比當前最好的point-based算法快2倍。

為了提高執行效率本文去除了傳統方法中的FP曾和細化模塊,並提出了一種新的融合採樣策略作為改進。同時為了進一步提高性能提出了一個基於anchor-free regression head的3D非中心複製策略構建的候選區域生成層。論文在算法精度和性能上都有了較高的額提升。

下面是論文具體框架結構以及實驗結果:

聲明:文章來自於網絡,如有侵權請聯繫,管理員。

相關焦點

  • 港中文開源視頻動作分析庫MMAction,目標檢測庫算法大更新
    OpenMMLab 計劃是香港中文大學多媒體實驗室(MMLab)2018 年啟動的計劃,由香港中文大學教授、商湯科技聯合創始人林達華老師負責,初衷是「為計算機視覺的一些重要方向建立統一而開放的代碼庫,並不斷把新的算法沉澱其中。」
  • 「瘋狂原始人2」發布中文版終極預告
    「瘋狂原始人2」發布中文版終極預告 動漫 178動漫整編 ▪ 2020-11
  • 「好棒」的日文怎麼說?6種誇讚他人的日文,不要只會「鼠勾以」
    例如樂團巡迴表演時,最後謝幕時會說「最高の夜でした!」(最棒的夜晚!);2013年日劇《最高の離婚》,翻成中文就是「最棒/最完美的離婚」。此處的「最」並非客觀比較而來,而是帶有更多說話者主觀的情緒在裡頭!例①:「君は最高だ!」(你是最棒的!)
  • 中文的「暴雨」與日語的「豪雨」是一回事嗎?
    受辭典的影響,中文的「暴雨」經常被翻譯為「豪雨」,但問題是,中文的「暴雨」和日語的「豪雨(ごうう)」真的是一回事嗎?
  • 免費中文字體:「思源宋體」支持簡、繁、日、韓四種語言
    事隔三年,終於迎來了 Adobe 聯合 Google 發布的「思源宋體」新款免費開源字體,該字體支持4種東亞語言
  • 【馬不停蹄】「爪皇」與「爪黃」
    「爪皇」為名。不過,一代馬皇的名字,原來源於一時的手民之誤…聽說1995年周南首次當上馬主,本想借用《三國演義》曹操的坐騎「爪黃飛電」為名,豈料秘書一時手民之誤,把名字寫成「爪皇飛電」,自此周氏名下馬匹的名字順勢以「爪皇」開首,包括「爪皇烈風」、「爪皇奔雷」、「爪皇凌雨」等等。後來,同樣愛馬、曾協助父親相入「爪皇凌雨」的周永健把另一匹馬命名為「爪黃飛電」。
  • 蔡冠深:打造「世界的中總」
    蔡冠深(左四)擔任「內地-香港一帶一路工商專業委員會」香港方的主席。針對全港年輕一代,中總將開展《我最想送給國家的生日禮物》小學生中文徵文比賽。聯繫內地與國際市場如何打通「中美貿易戰」下香港的橋梁作用?蔡冠深說:「中總的定位曾經是香港的、國家的中總,之後我們想將中總打造為『世界的中總』。」
  • 【香港要聞】「港人港地」3萬元一呎
    香港文匯報訊 (記者 顏倫樂) 在政府不斷加辣下,樓市依然高燒不退,專供港人置業的「港人港地
  • 20周年劇場版「數碼寶貝:最後的進化」中文海報公開
    20周年劇場版「數碼寶貝:最後的進化」中文海報公開 動漫 178動漫整編 ▪
  • SegmentFault 發布「 2020 最受開發者歡迎的技術活動」,七牛雲連...
    【天極網IT新聞頻道】近日,中國領先的新一代開發者社區 SegmentFault 思否陸續發布《2020 中國技術品牌影響力企業 30 強》,《中國開源先鋒 33 人之心尖上的開源人物》,《2020 最受開發者歡迎的技術活動》榜單,七牛雲公司、CEO 許式偉、以及技術活動 ECUG Con 獲得 3 項榮譽。
  • 韓漫「裝備我最強」公開最新官方中文PV
    韓漫「裝備我最強」公開最新官方中文PV 動漫 178動漫整編 ▪ 2021-01-07 13:54:03
  • 獎金比諾貝爾獎還高兩倍的「呂志和獎」,票選獲獎者傳遞正能量
    【百年呂獎】上線 票選 一百年前 的 「呂志和獎」 獲獎者 一百年,對個體來說是漫長的一生,對人類文明史來說,卻不過彈指一瞬。 鑑於此,以「為世界建立善美」為願景和目標的「呂志和獎」,於日前發起【百年呂獎】候選人線上評選活動。立足「呂志和獎」「持續發展、人類福祉、正能量」三個獎項核心領域,穿越近代一百多年的人文科學史,遴選三個領域內成就卓著的歷史名人,重溫他們惠澤後人的偉大功績,以期在 2020 年這個全球疫情肆虐的特殊年份,繼續傳遞社會正能量。
  • 「超級高鐵」到底是不是一個「超級騙局」?
    「超級高鐵」到底是什麼?「超級高鐵」的概念來自於伊隆·馬斯克。為此,相當不滿的馬斯克,親自畫了一張超級高鐵的草圖,還公開了一份《Hyperloop Alpha》的開源論文。靠譜的「超級高鐵」理論超級高鐵的核心是它的真空管道。傳統交通工具會碰到空氣阻力和摩擦力,但超級高鐵不會。超級高鐵採用物理學家 Richard Post 提出的「被動磁懸浮技術」。通過使用磁懸浮技術,超級高鐵的膠囊可以用推進電機驅動,管道接近真空,磁力可以讓膠囊懸浮於薄片之上,這樣超級高鐵可以實現更快的速度。
  • 一個照片「隱身衣」,讓微軟曠視人臉識別系統100%失靈|開源
    給照片穿上「隱身衣」這項研究的目的,是幫助網友們在分享自己的照片的同時,還能有效保護自己的隱私。因此,「隱身衣」本身也得「隱形」,避免對照片的視覺效果產生影響。也就是說,這件「隱身衣」,其實是對照片進行像素級別的微小修改,以蒙蔽AI的審視。
  • 「2020最新」東京「迪士尼樂園」煙火、遊行、歌舞秀完整攻略
    ▋「迪士尼樂園」必看① 大型遊行花車超精彩!日間遊行「奇想騰飛!」日間遊行「奇想騰飛!」是迪士尼樂園最大型的必看活動,即使和遊樂設施時間相撞,也絕對值得抽身前往!由多組迪士尼人氣明星組成的遊園花車,路線從夢幻樂園開始,經過城堡前圓環廣場,再到明日樂園、卡通城,全長45分鐘。
  • EVB:為你的樂高機器人換一個「大腦」
    來自中國的團隊 FATCATLAB 為 樂高 MINDSTORMS EV3 開發出了一個更加強大的「大腦」EVB,讓我們一起來看看它怎麼樣。有趣的是,視頻中出現的「肥貓」就是 FATCATLAB 的 CEO 兼創始人。
  • 「最終幻想」曾被翻譯為「太空戰士」,這些讓人笑尿的臺灣譯名你...
    「史密斯夫婦」,臺譯「史密夫大戰史密妻」喂喂,這個譯名會讓人想歪的啊!「肖申克的救贖」,臺譯「刺激1995」據說在1994年的時候,臺灣引進了一部賣座的片子「The Sting」,並譯作「刺激」,於是「肖申克的救贖」上映後因部分劇情和「刺激」有些相似,所以就拍板叫「刺激1995」。
  • 開發以中文「與數據對話」的AI決策系統,「訊能集思」要做人工智慧...
    一個矛盾:企業強烈的數位化需求和企業傳統的數據分析運行機制在「訊能集思」創始人張宗堯博士看來,「商業決策平臺」概念的產生來自於企業強烈的數位化需求和企業傳統的數據分析運行機制之間的矛盾。考慮到高度的實用性和廣闊的應用前景,「訊能集思」創製了以中文作為查詢語言的對話式系統,「讓用戶以中文與數據對話」,使用戶可以通過中文語句進行數據調取,並提供基於中文查詢關鍵詞的聯想信息,提供進階數據。據透露,「訊能集思」的多語言對話機制正在開發中,下一步將有望推出韓語和日語版本的數據分析產品。
  • 「小富婆」的臺語怎麼講?
    「孵金婆」(˙ㄅㄨ ㄍㄧㄣ ㄅㄜˊ pū-kim-p),這個「孵金」是很有意思的。臺語的「孵」(pū),有孵化的意思,譬如「孵卵」(pū-nng)就是生蛋的意思,而將這個詞說出口的聲調也很有臨場感,就像是發出pu、pu、pu的聲音一樣,好像可以有畫面浮現、卡通片段會出現動物孵蛋的配音。
  • 速度、準確率與泛化性能媲美SOTA CNN,Facebook開源高效圖像...
    DeiT 方法由 Facebook AI 與索邦大學的 Matthieu Cord 教授合作開發,目前代碼已開源。所以,它們通常必須「觀察」大量的示例圖像之後才能學習對不同對象進行分類。然而,Facebook AI 研究者提出的 DeiT 僅使用 120 萬張圖像就可實現高效訓練,而不需要數億張圖像。DeiT 首個重要的組件是其訓練策略。