今日Paper | CausalML;隱式函數;慢動作視頻重建;交叉圖卷積網絡等

2020-12-11 雷鋒網

CausalML:用於因果機器學習的Python包

用於3D重建和形狀補全的特徵空間中的隱式函數

基於混合成像系統的慢動作視頻重建

交叉圖卷積網絡(Cross-GCN):使用k順序特徵交互來增強圖卷積網絡

選擇核網絡

  CausalML:用於因果機器學習的Python包

論文名稱:CausalML: Python Package for Causal Machine Learning

作者: Huigang Chen*

發表時間:2020/3/2

論文連結:https://paper.yanxishe.com/review/14227?from=leiphonecolumn_paperreview0318

推薦原因

本文主要內容:

本文提出了一種新的機器學習算法包——CausalML,這是一種採用ython語言編寫而成用於解決因果推理(causalinference)與機器學習(machine learning)任務的算法,並且已經封裝成型,提供了API接口供學習者使用。對於CausalML包的使用用途,作者從三方面進行介紹,分別為 定位優化(Targeting Optimization)、因果影響分析(Causal Impact Analysis)以及模型的個性化(Personalization)。此外作者也對後續的研究提出了自己的觀點。總之,本文適合於剛入機器學習方向的同學學習研究。

論文名稱:Implicit Functions in Feature Space for 3D Shape Reconstruction and Completion

作者: Julian Chibane /Thiemo Alldieck /Gerard Pons-Moll

發表時間:2020/3/3

論文連結:https://paper.yanxishe.com/review/13186?from=leiphonecolumn_paperreview0318

推薦原因

這篇文章被CVPR2020接收!文章主要考慮從各種各樣的3D輸入來進行3D重建和形狀補全的工作,能夠處理低和高解析度體素、稀疏和稠密電雲、完整或不完整的數據等等。

作者通過神經網絡從輸入數據提取基於三維張量表達的多尺度特徵,並將該張量與嵌入原始形狀的歐式空間進行對齊,然後從張量提取的深層特徵進行分類。實驗表明文章提出的模型根據全局和局部形狀結構做出決策,能夠得到更準確的重建結果。文章的方法能夠提供連續的輸出,可以處理多種拓撲,可以從缺失或者稀疏的輸入數據生成完整的形狀,並且可以重建3D人體並保留表面細節。

論文名稱:Deep Slow Motion Video Reconstruction with Hybrid Imaging System

作者: Avinash Paliwal /Nima Khademi Kalantari

發表時間:2020/2/27

論文連結:https://paper.yanxishe.com/review/12733?from=leiphonecolumn_paperreview0318

推薦原因

慢動作視頻在近些年來變得越來越流行,但以極高的幀率捕獲高解析度視頻需要專業的高速相機,對於普通消費者或者攝影愛好者比較難實現。文章提出了一種重建高解析度慢動作視頻的方法。

當前的慢動作視頻生成方法大多是通過線性插幀來實現,對於運動較小的簡單情況能夠得到不錯的結果,但是對於稍微複雜的情況,結果就變得很差,會得到不自然的結果。文章將兩個視頻流作為輸入來解決這一問題,除了低幀率高解析度的主視頻,還提供一個高幀率低解析度的輔助視頻來提供時序信息。作者提出了一個由對齊和外觀估計組成的兩階段深度學習系統,來從混合視頻輸入中重建高解析度慢動作視頻。作者使用合成的混合視頻數據集訓練了網絡,並搭建了一個簡單的雙攝裝置,來驗證文章方法的表現。

  交叉圖卷積網絡(Cross-GCN):使用k順序特徵交互來增強圖卷積網絡

論文名稱:Cross-GCN: Enhancing Graph Convolutional Network with $k$-Order Feature Interactions

作者: Fuli Feng /Xiangnan He /Hanwang Zhang /Tat-Seng Chua

發表時間:2020/3/5

論文連結:https://paper.yanxishe.com/review/13480?from=leiphonecolumn_paperreview0318

推薦原因

1 核心問題:

在過往的研究中,圖卷積網絡(GCN)顯示了強大的表示能力,在推薦系統和相關文檔分類中取得了亮眼的效果。本文主要解決了傳統的圖卷積網絡放棄建模交叉特徵的問題。

2 創新點:

本文提出了一個交叉特徵圖卷積運算符,此運算符提供了一個新的特徵轉換模塊,該模塊以任意順序編碼交叉特徵,並且具有依據特徵維數和順序大小的線性複雜度。接著,在此運算符的基礎上,本文提出了一個新的基於圖學習的方法。

3 研究意義:

過往的圖卷積網絡放棄了對圖交叉特徵的建模,這影響了圖卷積網絡在交叉特徵相對重要的數據集上取得的效果和效率。本文提出的Cross-GCN在交叉特徵的建模上具有實用性,特別是在低層上的特徵提取上。同時,Cross-GCN在低維稀疏數據集上取得了更大的效果提升。

論文名稱:Selective Kernel Network

作者: Xiang Li;Wenhai Wang;Xiaolin Hu;Jian Yang

發表時間:2019/5/16

論文連結:https://paper.yanxishe.com/review/13537?from=leiphonecolumn_paperreview0318

推薦原因

在神經科學界,視皮層神經元的感受野大小受刺激的調節,即對不同刺激,卷積核的大小應該不同,但這在構建CNN時一般在同一層只採用一種卷積核,很少考慮多個卷積核的作用。文中提出了一種在CNN中對卷積核的動態選擇機制,該機制允許每個神經元根據輸入信息的多尺度自適應地調整其感受野(卷積核)的大小。設計了一個稱為選擇性內核單元(SK)的構建塊,其中,多個具有不同內核大小的分支在這些分支中的信息引導下,使用SoftMax進行融合。由多個SK單元組成SKNet,SKNet中的神經元能夠捕獲不同尺度的目標物體。

雷鋒網(公眾號:雷鋒網)雷鋒網雷鋒網

相關文章:

今日 Paper | 雙向ConvLSTMU-Net卷積;SAU-Net;立體匹配;深度語義分割等

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 今日Paper | 物體渲染;圖像和諧化;無偏數據處理方法;面部偽造檢測...
    from=leiphonecolumn_paperreview0319推薦原因本文被ICLR 2020接收!文章提出了一種基於學習的圖像引導的渲染技術,該技術將基於圖像的渲染和基於GAN的圖像合成相結合,可以生成重建對象的高真實感渲染結果。
  • 深度圖像識別ISDA-深層網絡的隱式語義數據擴增方法
    因此,我們可以直接最小化上界,而不是顯式地執行增強過程,這實際上是一種新的魯棒損失函數。由於不需要生成顯式的數據樣本,我們將我們的算法稱作隱式語義數據擴增(ISDA)。與現有的語義數據增強算法相比,我們所提出的 ISDA 可以在大多數深層模型之上方便地實現,而不需要引入輔助模型或額外的計算成本。
  • 深度圖像識別-深層網絡的隱式語義數據擴增 ISDA 方法
    因此,我們可以直接最小化上界,而不是顯式地執行增強過程,這實際上是一種新的魯棒損失函數。由於不需要生成顯式的數據樣本,我們將我們的算法稱作隱式語義數據擴增(ISDA)。與現有的語義數據增強算法相比,我們所提出的 ISDA 可以在大多數深層模型之上方便地實現,而不需要引入輔助模型或額外的計算成本。
  • 今日Paper|二氧化碳排放預測;3D人臉重建;BERTology入門;動態場景...
    目錄用機器學習方法對電網中的二氧化碳排放強度進行短期預測基於圖卷積神經網絡的高保真3D人臉重建BERTology入門:解讀BERT的工作原理DymSLAM:基於幾何運動分割的動態場景重建基於圖卷積神經網絡的高保真3D人臉重建論文名稱:Towards High-Fidelity 3D Face Reconstruction from In-the-Wild Images Using Graph Convolutional Networks作者:Jiangke Lin
  • 今日Paper|點雲分類框架;多模式Transformer;神經網絡;有序神經元等
    from=leiphonecolumn_paperreview0304推薦原因這篇論文要解決的是行人重識別問題。在線實例匹配(OIM)損失函數和三元組(Triplet)損失函數是行人重識別問題的主要方法。
  • 今日Paper|問答系統;3D人體形狀和姿勢;面部偽造檢測;AdderNet等
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。
  • 今日Paper | 問答系統;3D人體形狀和姿勢;面部偽造檢測;AdderNet等
    (paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。以作者證明了常規的機器學習模型和算法,例如隨機特徵模型,淺層神經網絡模型和殘差神經網絡模型,都可以作為不同連續公式的特定離散化而全部恢復。作者還介紹了新模型的示例,例如基於流的隨機特徵模型,以及新算法(例如平滑粒子法和光譜法)的示例,這些新算法自然地源於這種連續公式。作者在文中討論了如何在此框架下研究泛化誤差和隱式正則化問題。
  • 用於視頻回歸任務的長期循環卷積網絡
    基本概念通過深度學習進行視頻處理是一個非常複雜的領域,因為它需要處理空間和時間兩個方面。 為了總結現代比較流行的方法是什麼,在這篇文章中我們將對視頻回歸任務的深度學習方法進行一些研究。處理視頻意味著處理圖像,所以這裡需要cnn。但是,有不同的方法來處理時態組件。
  • NeurIPS 2020最佳論文;全卷積網絡實現E2E目標檢測
    推薦:原來,丟棄 Transformer,全卷積網絡也可以實現 E2E 檢測。儘管卷積神經網絡只要有大量已標記的訓練樣本就能夠執行,但是由於物體的變形與移動、場景照明變化以及視頻序列中攝像頭位置的變化,卷積神經網絡在視頻幀合成方面的表現並不出色。近日,來自東南大學的研究者提出了一種新型的端到端架構,稱為卷積 Transformer(ConvTransformer),用於視頻幀序列學習和視頻幀合成。
  • 卷積網絡訓練太慢?Yann LeCun:已解決CIFAR-10,目標 ImageNet
    該系統率先將節點分段、卷積網絡和圖解模型集成起來,點對點地進行整體訓練。圖解模型被叫做「圖變換網絡」,從概念上來說與條件隨機場(CRF)或者結構化的感知機(先於其產生)類似,但是允許包含非線性評分函數(CRF和結構化的感知機都只允許線性函數)。
  • 今日Paper | 依賴性解析器;DNNs對圖像損壞;高效人臉特徵學習...
    這篇論文提出了基於卷積網絡的共享表示集成方法,並展示了其數據處理效率和對大規模面部表情數據集處理的可伸縮性。通過改變共享表示集成方法的分支級別可以顯著減少冗餘和計算負荷,而不損失多樣性和泛化能力。在大規模數據集上進行的實驗表明,這種集成方法可以減少AffectNet和FER+數據集上的殘留泛化誤差,以達到人類水平的性能。
  • 今日Paper | 不確定性量化;邊緣感知深度預測;雙目深度估計;自適應...
    from=leiphonecolumn_paperreview0316推薦原因這篇論文提出了第一個實時的雙目深度估計網絡StereoNet,能夠在英偉達Titan X上達到60FPS。論文的亮點主要在網絡結構的設計上,StereoNet屬於基於3D卷積的立體匹配,cost volume的大小決定了網絡的參數量和推理速度。
  • 創建新理論解釋運行原因,MIT研究者探索深度網絡的基礎理論問題
    深度網絡的近似能力對於一般的範例如下:為了確定一個網絡的複雜性,使用函數 f (x ) 表示,理論上應當保證一個未知目標函數 g 的近似達到給定的準確率(> 0)。特別地,深度網絡在近似函數方面比淺層網絡具備更好的條件。這兩種類型的網絡都使用相同的操作集——點積、線性組合、單一變量的固定非線性函數、可能的卷積和池化。
  • 創建新理論解釋運行原因,MIT研究者探索深度網絡基礎理論問題
    深度網絡的近似能力對於一般的範例如下:為了確定一個網絡的複雜性,使用函數 f (x ) 表示,理論上應當保證一個未知目標函數 g 的近似達到給定的準確率(> 0)。特別地,深度網絡在近似函數方面比淺層網絡具備更好的條件。
  • 港中文AAAI錄用論文詳解:ST-GCN 時空圖卷積網絡模型 | AAAI 2018
    」提出了一種新的 ST-GCN,即時空圖卷積網絡模型,用於解決基於人體骨架關鍵點的人類動作識別問題。該任務要求輸入在連續的視頻幀中檢測到的人體骨架關鍵點序列,輸出正在發生的人類動作類別。作為動作識別系統中的重要模態,基於骨架的動作識別已經展現出重要的實用價值與研究價值。本論文正是針對這個任務提出了一種全新的深度學習模型,我們稱之為「時空圖卷積網絡」(ST-GCN)。構建時空圖ST-GCN 的基礎是時空圖結構。
  • 一文帶你了解卷積網絡中的幾何學
    在Cohen等人的論文《規範等變卷積網絡和二十面體CNN》中,這種現象尤其明顯。這篇論文也正是本文要探討的對象。論文中使用了規範場理論的用辭,那些喜歡把「量子」和「場」兩個詞合起來使用的所有的物理學當中,規範場理論居於中心地位。論文承諾對規範場理論的基礎知識提供一個直觀的解讀,其實,我也不得不承認,它做到了,而且它也許是目前我看到的最棒的入門介紹。然而,它終究是個很難的學科。
  • MSRA視覺組可變形卷積網絡升級!更高性能,更強建模能力
    去年,微軟亞洲研究院視覺計算組提出了 「Deformable Convolutional Networks」(可變形卷積網絡),首次在卷積神經網絡(CNN)中引入了學習空間幾何形變的能力,得到可變形卷積網絡(Deformable ConvNets),從而更好地解決了具有空間形變的圖像識別任務。
  • 研究人員提出可以改善任何視頻質量的AI模型
    據研究團隊表示,他們使用的「時空視頻超解析度(STVSR)」算法不僅在圖像質量上比現有方法更好,而且比以前的最新AI模型快三倍。就某種意義上而言,這一框架的提出是繼英偉達在2018年發布的針對視頻處理AI模型後的再次提升,當年英偉達的AI模型可以對任何視頻應用進行慢動作處理。
  • 抖音香水噴霧慢動作視頻怎麼拍 抖音香水噴霧慢動作視頻方法解析
    抖音香水噴霧慢動作視頻怎麼拍抖音香水噴霧慢動作視頻怎麼拍,相信不少小夥伴都被抖音上很火的香水噴霧慢動作視頻所吸引,好多小夥伴都還不清楚抖音香水噴霧慢動作視頻是怎麼拍出來的,小編這就為大家分享下抖音香水噴霧慢動作視頻方法解析,希望對大家有幫助。
  • 一種基於深度卷積神經網絡(DCNN)用于于頭髮和面部皮膚實時分割方法
    但是,由於計算受限的平臺(例如,無人機,自動駕駛,智慧型手機)的要求,人們更加關注網絡的效率,而不僅僅是性能。ENet是第一個用於實時場景分割的輕量級網絡,它不以端到端的方式應用任何後處理步驟。有團隊引入了級聯特徵融合單元,以快速實現高質量的分割。圖12示出了一種緊湊的編碼器模塊,其基於流線型架構,該流線型架構使用深度可分離卷積來構建輕型深度神經網絡。