今日Paper | 3D手勢估計;自學習機器人;魯棒語義分割;卷積神經網絡...

2020-12-11 雷鋒網

為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。以下是今日的精選內容——

  • Self learning robot using real-time neural networks

  • Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs

  • Inferring Convolutional Neural Networks' accuracies from their architectural characterizations

  • Hierarchical Reinforcement Learning as a Model of Human Task Interleaving

  • A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control

  • Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation

  • Data Structure Primitives>

    HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation

  • From 'F' to 'A'>

    Information Theoretic Model Predictive Q-Learning

論文名稱:Self learning robot using real-time neural networks

作者:Gupta Chirag /Nangia Chikita /Kumar Chetan

發表時間:2020/1/6

論文連結:https://paper.yanxishe.com/review/8314?from=leiphonecolumn_paperreview0108

推薦理由:隨著高容量,低精度計算技術的發展以及認知人工智慧啟發式系統的應用研究,通過具有實時學習功能的神經網絡的機器學習解決方案引起了研究界以及整個行業的極大興趣。

本文涉及對神經網絡的研究,開發和實驗分析,該神經網絡在帶有手臂的機器人上實現,通過該機器人的進化可以學習直線或根據需要行走。神經網絡使用梯度下降和反向傳播算法進行學習。神經網絡的實現和訓練均在樹莓派pi 3上的機器人上本地完成,因此其學習過程是完全獨立的。首先在MATLAB上開發的自定義模擬器上對神經網絡進行測試,然後在樹莓派計算機上對其進行實現。存儲每一代不斷發展的網絡中的數據,並對數據進行數學和圖形分析。分析了學習率和容錯度等因素對學習過程和最終輸出的影響。

論文名稱:Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs

作者:Myronenko Andriy /Hatamizadeh Ali

發表時間:2020/1/6

論文連結:https://paper.yanxishe.com/review/8316?from=leiphonecolumn_paperreview0108

推薦理由:多模式腦腫瘤分割挑戰(BraTS)將研究人員召集起來,以改進3D MRI腦腫瘤分割的自動化方法。 腫瘤分割是疾病診斷和治療計劃所必需的基本視覺任務之一。 得益於現代GPU的出現,前幾年獲勝的方法都是基於深度學習的,可以快速優化深度卷積神經網絡體系結構。

在這項工作中,作者探索了3D語義分割的最佳實踐,包括常規的編碼器-解碼器體系結構以及組合的損失函數,以試圖進一步提高分割的準確性。 作者評估了BraTS 2019挑戰賽的方法。

論文名稱:Inferring Convolutional Neural Networks' accuracies from their architectural characterizations

作者:Hoang D. /Hamer J. /Perdue G. N. /Young S. R. /Miller J. /Ghosh A.

發表時間:2020/1/7

論文連結:https://paper.yanxishe.com/review/8311?from=leiphonecolumn_paperreview0108

推薦理由:卷積神經網絡(CNN)在分析來自許多領域(包括粒子成像探測器)的科學數據方面顯示出了巨大的希望。但是,對於特定的應用程式和不同的數據集選擇合適的網絡體系結構(深度,內核形狀,激活功能等)的挑戰仍然知之甚少。

在本文中,作者通過提出一種系統的語言來研究CNN的體系結構與其性能之間的關係,該語言對於訓練之前的不同CNN的體系結構之間的比較很有用。通過不同的屬性來表徵CNN的體系結構,並證明這些屬性可以預測兩個特定的基於計算機視覺的物理問題中的網絡性能-事件頂點發現和費米國家加速器實驗室的MINERvA實驗中的強子多重性分類。為此,作者從針對物理問題的優化網絡架構中提取了幾種架構屬性,這些屬性是一種稱為多節點深度學習神經網絡的模型選擇算法(MENNDL)的輸出。作者使用機器學習模型來預測網絡在訓練之前是否可以比某個閾值精度更好地運行。

與隨機猜測相比,模型的執行效果要好16-20%。此外,作者在大量網絡的準確性回歸中發現普通最小二乘模型的確定係數為0.966。

論文名稱:Hierarchical Reinforcement Learning as a Model of Human Task Interleaving

作者:Gebhardt Christoph /Oulasvirta Antti /Hilliges Otmar

發表時間:2020/1/4

論文連結:https://paper.yanxishe.com/review/8313?from=leiphonecolumn_paperreview0108

推薦理由:人們如何決定一項任務要持續多長時間,何時切換以及執行另一項任務?理解支持任務交錯的機制是認知科學的一個長期目標。先前的工作提出了貪婪的啟發法和最大化邊際收益率的政策。然而,目前尚不清楚這種策略如何適應於提供多種任務,轉換成本昂貴且回報延遲的日常環境。

在這裡,作者開發了由強化學習(RL)驅動的監督控制的分層模型。主管級別使用特定於任務的近似效用估計值學習切換,這些估計值是在較低級別上計算的。即使在具有多個任務以及任意和不確定的報酬和成本結構的條件下,也可以從經驗中學到分層的最優價值函數分解。該模型再現了任務交錯的已知經驗效果。與六任務問題(N = 211)中的近視基線相比,它可以更好地預測個人數據。結果支持分層RL作為任務交織的合理模型。

論文名稱:A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control

作者:Rostam Mohammadreza /Nagamune Ryozo /Grebenyuk Vladimir

發表時間:2020/1/7

論文連結:https://paper.yanxishe.com/review/8308?from=leiphonecolumn_paperreview0108

推薦理由:為了減少控制器的保守性,本文提出了一種混合高斯過程(GP)方法,用於在未知未來擾動下進行魯棒的經濟模型預測控制。提出的混合GP是兩種已知方法的組合,即核成分和非線性自回歸。在分析預測結果之後,採用切換機制來選擇這些方法中的一種來進行幹擾預測。混合GP旨在通過使用過去的幹擾測量來檢測模式,而且還檢測未知幹擾中的意外行為。

在混合GP中還使用了一種新穎的遺忘因子概念,可以減輕較舊的測量的權重,從而基於最近的幹擾值提高預測精度。}檢測到的幹擾信息用於減少預測的不確定性。經濟模型的預測控制器。仿真結果表明,與其他基於GP的方法相比,在擾動具有可識別模式的情況下,該方法可以提高經濟模型預測控制器的整體性能。

論文名稱:Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation

作者:You Di /Vo Nguyen /Lee Kyumin /Liu Qiang

發表時間:2020/1/7

論文連結:https://paper.yanxishe.com/review/8309?from=leiphonecolumn_paperreview0108

推薦理由:為了打擊假新聞,研究人員主要致力於發現假新聞,而新聞工作者則建立並維護了事實檢查網站(例如,此URL(https://www.snopes.com/)和此 URL(https://www.politifact.com/))。 但是,通過社交媒體網站大大促進了虛假新聞的傳播,並且這些事實檢查網站還沒有得到充分利用。

為了克服這些問題並補充現有的偽造新聞方法,本文提出了一種基於深度學習的事實檢查URL推薦器系統,以減輕偽造新聞在諸如Twitter和Facebook等社交媒體網站上的影響。 特別是,作者提出的框架由一個多關係注意模塊和一個異構圖注意力網絡組成,以學習用戶URL對,用戶對用戶對和URL URL對之間的複雜/語義關係。 在真實數據集上進行的大量實驗表明,我們提出的框架優於八個最新的推薦模型,至少提高了3〜5.3%。

論文名稱:Data Structure Primitives>作者:Götze Philipp /Tharanatha Arun Kumar /Sattler Kai-Uwe

發表時間:2020/1/7

論文連結:https://paper.yanxishe.com/review/8310?from=leiphonecolumn_paperreview0108

推薦理由:永久內存(PM),例如已經可用的Intel Optane DC永久性存儲器的技術代表了一種非常有前途的下一代存儲器解決方案,對資料庫體系結構具有重大影響。已經提出了這項新技術的幾種數據結構及其特性。但是,基本上只提出並評估了完整的結構,掩蓋了個人想法和PM特徵的影響。

因此,在本文中,我們將分解目前為止介紹的結構,識別其基礎設計原語,並將其分配給有關PM的適當設計目標。在真實的PM硬體上進行全面實驗的結果是,作者能夠在微觀水平上揭示基元的取捨。由此,可以導出所選圖元的性能配置文件。有了這些,就可以精確地確定其最佳用例以及漏洞。除了對基於PM的數據結構設計的一般見解之外,作者還發現了迄今為止文獻中尚未考慮的新的有希望的組合。

  HandAugment:一種用於HANDS19挑戰任務1-基於深度的3D手勢估計的簡單數據增強方法

論文名稱:HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation

作者:Zhang Zhaohui /Xie Shipeng /Chen Mingxiu /Zhu Haichao

發表時間:2020/1/3

論文連結: https://paper.yanxishe.com/review/8175?from=leiphonecolumn_paperreview0108

推薦理由:這篇論文考慮的是3D景深圖像中預估手勢的問題。

這篇論文提出了一個簡單的數據增強方法HandAugment,包含兩階段的神經網絡學習:第一階段在迭代的模式下抽取手部圖像塊,並根據深度圖預估手的初始姿態,過濾掉噪音圖塊(例如背景與手臂)。被抽取出的圖塊與初始化手部姿態被代入第二階段的神經網絡,以獲取最終的手部姿態。

這種兩階段策略極大提升了手勢識別的準確率,並在HANDS19挑戰任務1-基於景深的3D手勢識別大賽上獲得了第一名。

  紐約攝政科學考試從「 F」到「 A」:Aristo項目概述

論文名稱:From 'F' to 'A'>作者:Clark Peter /Etzioni Oren /Khashabi Daniel /Khot Tushar /Mishra Bhavana Dalvi /Richardson Kyle /Sabharwal Ashish /Schoenick Carissa...

發表時間:2019/9/4

論文連結:https://paper.yanxishe.com/review/7846?from=leiphonecolumn_paperreview0108

推薦理由:人工智慧已經在西洋棋,圍棋和撲克,甚至《危險》等遊戲上獲得了非凡的掌握,但是各種各樣的標準化考試仍然是一個巨大的挑戰。即使在2016年,最好的AI系統在8年級科學考試挑戰中也僅達到59.3%。

這篇論文報導了在紐約8年級攝政科學考試中取得了空前的成功,該系統首次在該考試的非圖表多項選擇(NDMC)問題上得分超過90%。此外,基於最近的語言模型的成功,我們的Aristo系統在相應的12年級科學考試NDMC問題上超過了83%。在看不見的測試問題上得出的結果在不同的測試年份和這種測試的不同變體中都是可靠的。他們證明了現代的NLP方法可以精通此任務。雖然不是一般問題解答的完整解決方案(問題是多項選擇,並且領域僅限於8年級科學),但它代表了該領域的重要裡程碑。

論文名稱:Information Theoretic Model Predictive Q-Learning

作者:Bhardwaj Mohak /Handa Ankur /Fox Dieter /Boots Byron

發表時間:2019/12/31

論文連結:https://paper.yanxishe.com/review/8312?from=leiphonecolumn_paperreview0108

推薦理由:當可以廉價地收集經驗時,無模型強化學習(RL)算法可以很好地解決順序決策問題;當可以準確地建模系統動力學時,基於模型的RL有效。但是,這兩個假設在諸如機器人技術之類的現實世界問題中都可能違背,在這種情況下,查詢系統的成本可能過高,而現實世界的動力學可能難以準確建模。儘管模擬到真實的方法(例如域隨機化)試圖減輕有偏模擬的影響,但它們仍然會遭受優化挑戰(例如局部最小值和針對隨機化的手工設計分布),從而難以學習準確的全局值函數或直接轉移到現實世界的政策。

與RL相反,模型預測控制(MPC)算法使用模擬器在線優化簡單的策略類,從而構建可以有效應對現實世界動態變化的閉環控制器。MPC性能通常受模型偏差和優化範圍有限等因素的限制。

在這項工作中,作者提出了信息理論MPC與熵正則化RL之間的新型理論聯繫,並開發了一種可利用偏差模型的Q學習算法。我們驗證了在Sim-to-sim控制任務上提出的算法,以證明優化控制和從頭開始強化學習的改進。我們的方法為系統地在真實機器人上部署強化學習算法鋪平了道路。

雷鋒網雷鋒網雷鋒網(公眾號:雷鋒網)

相關文章:

今日 Paper | 精簡BERT;面部交換;三維點雲;DeepFakes 及 5G 等

今日 Paper | 虛假新聞檢測;馬爾可夫決策過程;場景文本識別;博弈論框架等

今日 Paper | 問答系統;3D人體形狀和姿勢;面部偽造檢測;AdderNet等

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 今日Paper|3D手勢估計;自學習機器人;魯棒語義分割;卷積神經網絡...
    Challenge Task 1 -- Depth-Based 3D Hand Pose EstimationFrom 'F' to 'A'>Information Theoretic Model Predictive Q-Learning使用實時神經網絡的自學習機器人
  • 今日Paper | 多人姿勢估計;對話框語義分析;無監督語義分析;自然...
    Leonid /Insafutdinov Eldar /Tang Siyu /Andres Bjoern /Andriluka Mykhaylo /Gehler Peter /Schiele Bernt發表時間:2015/11/20論文連結:https://paper.yanxishe.com/review/9236推薦原因:領域:多人關節姿態估計
  • 今日Paper | 模態平衡模型;組合語義分析;高表達性SQL查詢;多人...
    /review/9324這篇論文研究的是深度神經網絡的對抗性攻擊。加入論文作者團隊你需要:    1.將你喜歡的論文推薦給廣大的研習社社友    2.撰寫論文解讀如果你已經準備好加入 AI 研習社的論文兼職作者團隊,可以添加運營小姐姐的微信,備註「論文兼職作者」相關文章:今日 Paper | 多人姿勢估計;對話框語義分析;無監督語義分析;自然語言處理工具包等今日
  • 今日Paper | 可視問答模型;神經風格差異轉移;圖像壓縮系統 ;K-SVD...
    from=leiphonecolumn_paperreview0211 推薦原因這篇論文考慮的是圖像壓縮的問題。在基於深度神經網絡的有損圖像壓縮中,重要性圖方法被廣泛應用,以根據圖像內容的重要性來實現比特分配,然而這種方法容易出現嚴重失真。
  • 入門 | 一文了解什麼是語義分割及常用的語義分割方法有哪些
    我們已經開始發展自動駕駛汽車和智慧機器人,這些都需要深入理解周圍環境,因此精確分割實體變得越來越重要。什麼是語義分割?語義分割是計算機視覺中的基本任務,在語義分割中我們需要將視覺輸入分為不同的語義可解釋類別,「語義的可解釋性」即分類類別在真實世界中是有意義的。
  • 入門| 一文了解什麼是語義分割及常用的語義分割方法有哪些
    我們已經開始發展自動駕駛汽車和智慧機器人,這些都需要深入理解周圍環境,因此精確分割實體變得越來越重要。什麼是語義分割?語義分割是計算機視覺中的基本任務,在語義分割中我們需要將視覺輸入分為不同的語義可解釋類別,「語義的可解釋性」即分類類別在真實世界中是有意義的。
  • 今日Paper | RevealNet;時間序列預測;無監督問答;實時語義立體...
    from=leiphonecolumn_paperreview0331推薦原因本文已經被提交到ECCV2020。Image Matting是眾多圖像編輯應用中的一個關鍵技術,其需要將對象從圖片分割出來並估計其不透明蒙版。基於深度學習的方法也取得了很大的進展,但大多數現有網絡僅預測alpha遮罩,需要藉助後處理方法來恢復透明區域中的原始前景色和背景色。
  • 2019 語義分割指南
    這種分割在計算對象數量的應用程式中非常有用,例如計算商城的行人流量。它的一些主要應用是在自動駕駛、人機互動、機器人和照片編輯/創意工具中。例如,語義分割在汽車自動駕駛和機器人技術中是至關重要的,因為對於一個模型來說,了解其所處環境中的語義信息是非常重要的。
  • 今日Paper|RevealNet;時間序列預測;無監督問答;實時語義立體匹配等
    from=leiphonecolumn_paperreview0331推薦原因本文已經被提交到ECCV2020。Image Matting是眾多圖像編輯應用中的一個關鍵技術,其需要將對象從圖片分割出來並估計其不透明蒙版。
  • 最新語義視覺SLAM綜述:面向應用的移動機器人自主導航解決方案
    本文認為,多尺度地圖表示,對象SLAM系統和基於神經網絡的SLAM等設計方案,能夠有效解決圖像語義融合的視覺同步定位和建圖。I.研究背景介紹現如今,自主機器人可以在沒有人為幹預的情況下,獨立操作完成特定的任務。作為自主機器人的一個主要的屬性--自主運動,主要取決於準確的運動估計和高層次的環境感知。
  • 一文讀懂語義分割與實例分割
    今天,它被廣泛用於圖像分類、人臉識別、物體檢測、視頻分析以及機器人及自動駕駛汽車中的圖像處理等領域。圖像分割技術是目前預測圖像領域最熱門的一項技術,原因在於上述許多計算機視覺任務都需要對圖像進行智能分割,以充分理解圖像中的內容,使各個圖像部分之間的分析更加容易。本文會著重介紹語義分割和實例分割的應用以及原理。
  • 今日Paper|弱監督目標的定位;遞歸殘差卷積神經網絡;嵌套U-Net結構...
    目錄重新思考通往弱監督目標的定位基於U-Net(R2U-Net)的遞歸殘差卷積神經網絡在醫學圖像分割中的應用UNet++: 一種醫學圖像分割的嵌套U-Net結構使用基於雙譜的深度卷積神經網絡對非線性時間序列進行分類
  • [計算機視覺論文速遞] 2018-07-02 圖像分割專場
    ,包括運動捕捉圖像的語義分割、將FCN和GAN結合的鞏膜分割。直接點擊「閱讀全文」即可訪問daily-paper-computer-vision。Our dilated temporal fully-convolutional neural network (DTFCN) for motion capture segmentation Abstract:運動捕捉序列的語義分割在許多數據驅動的運動合成框架中起著關鍵作用
  • 今日Paper|動態手勢識別;領域獨立無監督學習;基於BERT的在線金融...
    目錄抓取新物體的領域獨立無監督學習動態手勢識別的短時卷積網絡一種基於BERT的在線金融文本情感分析和關鍵實體檢測方法基於語音增強和注意力模型的魯棒說話人識別新時代的深度學習調參,從拒絕參數初始化看人品開始
  • 魚與熊掌可以兼得:何愷明等人一統語義分割與實例分割
    語義分割任務中佔領榜單 [17, 14] 的網絡是 FCN,它擁有由空洞卷積增強的特殊主幹 [55, 10]。在實例分割任務中,帶有特徵金字塔網絡(FPN)[34] 主幹的基於區域的 Mask R-CNN [23] 成為解決幾個棘手識別難題 [35, 58, 41] 的基礎。
  • CVPR 2018:新型語義分割模型:動態結構化語義傳播網絡DSSPN
    近日,來自 CMU、Petuum 等機構的研究者提出一種新型語義分割模型動態結構化語義傳播網絡 DSSPN,通過將語義概念層次明確地結合到網絡中來構建語義神經元圖。實驗證明 DSSPN 優於當前最優的分割模型。
  • CVPR 2018 | 新型語義分割模型:動態結構化語義傳播網絡DSSPN
    DSSPN,通過將語義概念層次明確地結合到網絡中來構建語義神經元圖。實驗證明 DSSPN 優於當前最優的分割模型。引言隨著卷積神經網絡的不斷進步,目標識別和分割作為計算機視覺的主要研究方向取得了巨大的成功。然而,目前使用更深、更寬網絡層的分割模型 [24,5,40,37,22] 在對分割注釋有限的大型概念詞彙的識別方面表現欠佳。原因在於它們忽略了所有概念的固有分類和語義層次。
  • 圖像語義分割
    圖像語義分割是計算機視覺中十分重要的領域。語義分割對圖像中的每一個像素點進行分類,確定每個點的類別(如屬於背景、邊緣或身體等)需要和實例分割區分開來。語義分割沒有分離同一類的實例;它關心的只是每個像素的類別,如果輸入對象中有兩個相同類別的對象,則分割本身不會將它們區分為單獨的對象。
  • 實時語義分割算法大盤點
    在許多領域,如機器人和自動駕駛汽車,語義圖像分割是至關重要的,因為它提供了必要的上下文,以採取行動,基於對場景的理解在像素級。帶有定位的分類,對分類任務的一個擴展,使用邊界框將對象框起來在分類;實例分割,是語義分割的擴展,在實例分割中,相同類型的不同對象被視為不同的對象;全景分割,結合語義分割和實例分割,所有像素被分配一個類標籤,所有對象實例都被獨立分割《A Comparative Study of Real-time Semantic Segmentation for Autonomous Driving》https:/
  • 從全卷積網絡到大型卷積核:深度學習的語義分割全指南
    本文由淺層模型到深度模型,簡要介紹了語義分割各種技術,雖然本文並沒有深入講解語義分割的具體實現,但本文簡要地概述了每一篇重要論文的精要和亮點,希望能給讀者一些指南。  什麼是語義分割?  語義分割指像素級地識別圖像,即標註出圖像中每個像素所屬的對象類別。