一周論文精選(1)谷歌 AutoDropout | Facebook 用Transformer多目標跟蹤/弱監督MOT等

2021-02-21 arXiv每日學術速遞
點擊文末閱讀原文,訪問www.arxivdaily.com獲取更詳細的信息及PDF下載【Google Brain AAAI 2021】AutoDropout 【Amazon】 GaN-Control:顯式可控GAN
【Facebook】使用Transformer進行多目標跟蹤【Facebook 】弱監督多目標跟蹤與分割(聯合弱監督實例分割和多目標跟蹤 )

【Google Brain AAAI 2021】AutoDropout 

神經網絡通常是參數冗餘的,傳統的正則化方法,例如Dropout或 weight decay,沒有利用網絡的輸入和隱藏狀態的結構。本文提出了 學習Dropout的模式 ,控制器在目標網絡(如ConvNet或Transformer)的每個通道和層學習dropout的模式,性能提明顯。代碼即將開源。

標題:Learning Dropout Patterns to Regularize Deep Networks
作者:Hieu Pham,Quoc V. Le
機構*:Google Research, Brain Team, Carnegie Mellon University
連結:https://arxiv.org/pdf/2101.01761.pdf
代碼:https://github.com/google-research/google-research/tree/master/auto_dropout

【Amazon】 GaN-Control:顯式可控GAN

提出了一個用於訓練具有對生成圖像的顯式控制的GAN,可以通過設置精確的屬性(如年齡、姿勢、表情等)來控制生成的圖像。

標題:GAN-Control: Explicitly Controllable GANs

作者:Alon Shoshan...

機構*:Amazon One

連結:https://arxiv.org/pdf/2101.02477.pdf

項目:https://alonshoshan10.github.io/gan_control/

【Facebook:使用Transformer進行多目標跟蹤】

提出了一種基於編解碼器Transformer架構的端到端多目標跟蹤與分割模型TrackFormer。引入了跟蹤查詢embeddings,它以自回歸的方式跟蹤視頻序列中的目標。新的跟蹤查詢由DETR目標檢測器產生,並且隨著時間的推移嵌入其相應目標的位置。Transformer解碼器逐幀調整軌道查詢嵌入,從而跟蹤改變的目標位置。TrackFormer通過同時考慮位置、遮擋和目標身份的自我和編解碼器注意機制,在一種新的注意力跟蹤範例中實現了幀之間的無縫數據關聯。TrackFormer在多目標跟蹤(MOT17)和分割(MOTS20)任務中達到SOTA。希望我們統一的檢測和跟蹤方式將促進未來多目標跟蹤和視頻理解的研究。

標題:TrackFormer: Multi-Object Tracking with Transformers
作者:Tim Meinhardt…
機構:Technical University of Munich, Facebook AI Research(FAIR)
連結:https://arxiv.org/pdf/2101.02702.pdf
代碼:即將開源

Facebook 弱監督多目標跟蹤與分割,聯合弱監督實例分割和多目標跟蹤 。

標題:Weakly Supervised Multi-Object Tracking and Segmentation
作者:Idoia Ruiz……
機構:Computer Vision Center, UAB, Facebook
備註: WACV 2021 Workshop
連結:https://arxiv.org/pdf/2101.00667.pdf

騰訊優圖&南開「高效的視頻動作分割結構搜索算法」

標題:Global2Local: Efficient Structure Search for Video Action Segmentation
作者:Shang-Hua Gao,Qi Han,Zhong-Yu Li,Pai Peng,Liang Wang,Ming-Ming Cheng
機構*:Nankai University, Tencent Youtu Lab
連結:https://arxiv.org/abs/2101.00910

【浙大:通過遊戲引擎合成的大規模步態數據集】

通過遊戲引擎自動創建一個大規模的合成步態數據集 ,由11000個對象的約100萬個輪廓序列組成 ,數據集和生成數據的工具包都將發布。

標題:VersatileGait: A Large-Scale Synthetic Gait Dataset with Fine-GrainedAttributes and Complicated Scenarios
作者:Huanzhang Dou,Wenhu Zhang,Pengyi Zhang,Yuhan Zhao,Songyuan Li,Zequn Qin,Fei Wu,Lin Dong,Xi Li
機構*:Zhejiang University,Merit Interactive Co., Ltd., Shanghai Institute for Advanced Study
連結:https://arxiv.org/pdf/2101.01394.pdf

相關焦點

  • Facebook AI的DETR:一種基於Transformer的目標檢測方法
    要了解有關目標檢測的更多信息,請參閱以下文章:基本目標檢測算法的分步介紹https://www.analyticsvidhya.com/blog/2018/10/a-step-by-step-introduction-to-the-basic-object-detection-algorithms-part-1/?
  • 【綜述專欄】多目標跟蹤(MOT)入門
    為此,我們精選國內外優秀的綜述文章,開闢「綜述專欄」,敬請關注。地址:https://www.zhihu.com/people/longer-61-43最近做了一些多目標跟蹤方向的調研,因此把調研的結果以圖片加文字的形式展現出來,希望能幫助到入門這一領域的同學。也歡迎大家和我討論關於這一領域的任何問題。
  • NLP攜手Transformer跨界計算機視覺,DETR:目標檢測新範式
    本文我們將要介紹的是用 Transformer 進行目標檢測任務,主要包括以下內容:論文 1:《End-to-End Object Detection with Transformers》,來自 Facebook AI 的研究者推出的 Transformer 視覺版本——Detection Transformer(DETR),可用於目標檢測和全景分割
  • 7 Papers|GCN大佬公開博士論文;谷歌提出擴展型BERT架構
    多階段判別器圖示。推薦:本文的亮點在於將將 SOTA 行人再識別系統精度降至 1.4%,並已被 CVPR 大會接收為 Oral 論文。推薦:本研究中的跟蹤器在 LaSOT 目標跟蹤數據集上實現了 63.7% 的 AUC,在 TrackingNet 目標跟蹤數據集上實現了 78.7% 的 Success。
  • 7 Papers & Radios | GCN大佬公開博士論文;谷歌提出擴展型BERT架構
    多階段判別器圖示。推薦:本文的亮點在於將將 SOTA 行人再識別系統精度降至 1.4%,並已被 CVPR 大會接收為 Oral 論文。論文 4:How to Train Your Energy-Based Model for Regression作者:Fredrik K.
  • AAAI 2020論文解讀:商湯科技提出新弱監督目標檢測框架
    除此之外,還引入了物體實例權重調整損失函數(reweighted loss),使網絡可以同時學習到更完整的物體實例,從而讓弱監督目標檢測方法得到更加準確的檢測框。現有的弱監督目標檢測方法大多數是基於多實例學習框架的,對於每個物體類別,基於多實例學習框架的方法傾向於學習圖像中該類中特徵最明顯的物體,並對於每張圖片選取得分最大的一個物體框進行訓練,其他被忽略的物體實例容易使學習網絡陷入局部最優,進而影響弱監督目標檢測的性能。
  • 基於深度學習的多目標跟蹤:從UMA Tracker出發談談SOT類MOT算法
    ©PaperWeekly 原創 · 作者|黃飄學校|華中科技大學碩士生研究方向|多目標跟蹤之前的文章中我們介紹了聯合檢測和跟蹤的多目標跟蹤框架,這類框架最大優勢在於可以利用優秀的檢測器平衡不同觀測輸入的質量。
  • 視覺+Transformer最新論文出爐,華為聯合北大、雪梨大學發表
    已有研究表明,Transformer 在計算機視覺領域不僅適用於高級任務如圖像分類、目標檢測、車道線檢測等,在低級任務如圖像增強中也取得了突破性進展,毫無疑問,Transformer 是目前計算機視覺領域最值得關注的方向之一。一時間,在各種視覺任務 + Transformer 的論文正如雨後春筍般湧出。
  • 今日Paper|弱監督目標的定位;遞歸殘差卷積神經網絡;嵌套U-Net結構...
    目錄重新思考通往弱監督目標的定位基於U-Net(R2U-Net)的遞歸殘差卷積神經網絡在醫學圖像分割中的應用UNet++: 一種醫學圖像分割的嵌套U-Net結構使用基於雙譜的深度卷積神經網絡對非線性時間序列進行分類
  • 南京大學周志華教授綜述論文:弱監督學習
    在《國家科學評論》(National Science Review, NSR) 2018 年 1 月份出版的機器學習專題期刊中,介紹了南京大學周志華教授發表的一篇論文《A brief introduction to weakly supervised learning》。機器之心經授權對此論文部分內容做了編譯介紹,更完整內容可查看英文論文原文。
  • EMNLP2018最佳論文:Facebook 提升 11BLEU 的無監督機器翻譯
    雷鋒網 AI 科技評論按:說到機器翻譯,谷歌吃螃蟹並商用的 NMT、微軟研究院媲美人類水平的 AI 翻譯系統我們都做過比較多的報導,大家也都比較熟悉;不過它們都是需要監督的。為了做到這一點,當前的機器翻譯(MT)系統需要訪問大量的已翻譯文本(例如,分別用英語和西班牙語表示的相同文本對)。因此,MT 目前僅對於已擁有大量翻譯文本的少數語言集表現出不錯的效果。在訓練模型時無需訪問任何翻譯文本資源的 MT 模型的建立(稱為無監督翻譯)是必要的下一步。
  • 加速RL探索效率,CMU、谷歌、斯坦福提出以弱監督學習解糾纏表徵
    選自arXiv作者:Lisa Lee等機器之心編譯機器之心編輯部巨大的探索空間阻礙了強化學習(RL)的發揮,這篇論文通過弱監督學習從廣泛的目標空間中分離出有語義意義的表徵空間,從而增強 RL 的學習速度與泛化性能。通用型智能體必須通過與真實環境交互來高效學習各種任務。
  • 外媒揭秘蘋果、谷歌和Facebook如何跟蹤用戶位置
    網易科技訊 1月2日消息,國外媒體Fast Company近日撰文詳述了三大科技巨頭蘋果、谷歌和Facebook如何及為何在線上線下對用戶實施位置跟蹤,並談到了一些防備方法。但鮮少人知道位置跟蹤的發生頻率有多高——它甚至在這些時候發生:不必要時,在他們的應用沒有在使用的時候,以及用戶連手機都沒有拿起來的時候。當然,跟蹤你的位置,並不總是為了改善用戶體驗,而是為了更好地理解你是誰,該向你展示推送什麼樣的廣告。例如,如果一家公司知道你剛剛進入他們的門店,那他們可能就會開始向你推送推銷廣告。推銷是好是壞不好爭論,但位置跟蹤會引發各種各樣的隱私擔憂。
  • 【綜述專欄】3W字長文帶你輕鬆入門視覺transformer
    為此,我們精選國內外優秀的綜述文章,開闢「綜述專欄」,敬請關注。512)相加,所以其shape為(1,N,512)表示N個位置,每個位置採用512長度向量進行編碼自定義規則做法非常多,論文中採用的是sin-cos規則,具體做法是:
  • 近兩年目標跟蹤資源全匯總(論文、模型代碼、優秀實驗室)
    極市導讀:目標跟蹤是計算機視覺領域中非常熱門且具有挑戰性的研究主題之一。近年來,基於深度學的的目標跟蹤取得了巨大的進展,為了方便大家研究學習,極市整理了一份2019年至2020年的目標跟蹤相關資源合集,包括頂會論文(CVPR/ECCV/ICCV)、算法匯總以及目標跟蹤國內外優秀實驗室,詳見下文:頂會論文(由於篇幅有限,以下每個分題均展示前5篇,完整版可前往閱讀原文
  • AI攢論文指日可待?Transformer生成論文摘要方法已出
    如果能夠將相關算法應用在論文寫作上,是不是摘要、引言、相關工作、結論部分都可以省很多功夫了?但是,正是因為現有的相關算法不夠成熟,能夠實際應用在生產中的文檔摘要算法不多,而且現有的算法普遍只能生成短的、描述事實的文本(在一些新聞平臺有所應用)。要將帶有邏輯結構的長文本進行抽取和摘要化處理,這樣的算法並不常見。
  • 論文論證谷歌Facebook免費產品如何損害消費者!
    「感覺好像Facebook和谷歌會贏,其他所有人都會輸。籌碼完全在大頭一邊。」斯裡尼瓦桑說。「我認為這一點大家都沒有理解。」  於是斯裡尼瓦桑辭去了世界上最大廣告公司WPP的工作,轉而開始寫法律論文。  斯裡尼瓦桑沒有學術背景,只是對數字廣告有深入了解,還讀過一些經濟學書籍。
  • 多目標跟蹤論文筆記:Tracking without bells and whistles
    這個跟蹤器在三個具有挑戰性的多目標跟蹤基準測試集上都大幅超越了所有跟蹤器;在失敗案例和具有挑戰性的跟蹤場景中進行了詳細的分析,結果顯示並沒有一個專用的跟蹤方法的表現比我們的方法更好;提出了兩種使用我們方法的方式作為一種新的跟蹤範式,可以讓研究者關注於真正的跟蹤挑戰,本文的跟蹤器則處理剩下的工作。
  • 基於機器視覺的典型多目標追蹤算法應用實踐
    視頻目標追蹤算法是機器視覺中一項很實用重要的算法,視頻目標追蹤算法應用場景很廣,比如智能監控、機器人視覺系統、虛擬實境(人體跟蹤)、醫學診斷(細胞狀態跟蹤)等。本文由滴普科技2048團隊AI產品部算法工程師朱曉麗介紹基於機器視覺的典型多目標追蹤算法應用實踐。
  • Paper 研習社每日精選論文推薦 12.30 - 雷鋒網
    Hi 歡迎來到Paper 研習社每日精選欄目,Paper 研習社(paper.yanxishe.com)每天都為你精選關於人工智慧的前沿學術論文供你參考,以下是今日的精選內容——目錄Scalable Fine-grained Generated Image Classification Based>Merging Weak and Active