為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。以下是今日的精選內容——
Self learning robot using real-time neural networks
Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs
Inferring Convolutional Neural Networks' accuracies from their architectural characterizations
Hierarchical Reinforcement Learning as a Model of Human Task Interleaving
A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control
Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation
Data Structure Primitives>
HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation
From 'F' to 'A'>
Information Theoretic Model Predictive Q-Learning
論文名稱:Self learning robot using real-time neural networks
作者:Gupta Chirag /Nangia Chikita /Kumar Chetan
發表時間:2020/1/6
論文連結:https://paper.yanxishe.com/review/8314?from=leiphonecolumn_paperreview0108
推薦理由:隨著高容量,低精度計算技術的發展以及認知人工智慧啟發式系統的應用研究,通過具有實時學習功能的神經網絡的機器學習解決方案引起了研究界以及整個行業的極大興趣。
本文涉及對神經網絡的研究,開發和實驗分析,該神經網絡在帶有手臂的機器人上實現,通過該機器人的進化可以學習直線或根據需要行走。神經網絡使用梯度下降和反向傳播算法進行學習。神經網絡的實現和訓練均在樹莓派pi 3上的機器人上本地完成,因此其學習過程是完全獨立的。首先在MATLAB上開發的自定義模擬器上對神經網絡進行測試,然後在樹莓派計算機上對其進行實現。存儲每一代不斷發展的網絡中的數據,並對數據進行數學和圖形分析。分析了學習率和容錯度等因素對學習過程和最終輸出的影響。
論文名稱:Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs
作者:Myronenko Andriy /Hatamizadeh Ali
發表時間:2020/1/6
論文連結:https://paper.yanxishe.com/review/8316?from=leiphonecolumn_paperreview0108
推薦理由:多模式腦腫瘤分割挑戰(BraTS)將研究人員召集起來,以改進3D MRI腦腫瘤分割的自動化方法。 腫瘤分割是疾病診斷和治療計劃所必需的基本視覺任務之一。 得益於現代GPU的出現,前幾年獲勝的方法都是基於深度學習的,可以快速優化深度卷積神經網絡體系結構。
在這項工作中,作者探索了3D語義分割的最佳實踐,包括常規的編碼器-解碼器體系結構以及組合的損失函數,以試圖進一步提高分割的準確性。 作者評估了BraTS 2019挑戰賽的方法。
論文名稱:Inferring Convolutional Neural Networks' accuracies from their architectural characterizations
作者:Hoang D. /Hamer J. /Perdue G. N. /Young S. R. /Miller J. /Ghosh A.
發表時間:2020/1/7
論文連結:https://paper.yanxishe.com/review/8311?from=leiphonecolumn_paperreview0108
推薦理由:卷積神經網絡(CNN)在分析來自許多領域(包括粒子成像探測器)的科學數據方面顯示出了巨大的希望。但是,對於特定的應用程式和不同的數據集選擇合適的網絡體系結構(深度,內核形狀,激活功能等)的挑戰仍然知之甚少。
在本文中,作者通過提出一種系統的語言來研究CNN的體系結構與其性能之間的關係,該語言對於訓練之前的不同CNN的體系結構之間的比較很有用。通過不同的屬性來表徵CNN的體系結構,並證明這些屬性可以預測兩個特定的基於計算機視覺的物理問題中的網絡性能-事件頂點發現和費米國家加速器實驗室的MINERvA實驗中的強子多重性分類。為此,作者從針對物理問題的優化網絡架構中提取了幾種架構屬性,這些屬性是一種稱為多節點深度學習神經網絡的模型選擇算法(MENNDL)的輸出。作者使用機器學習模型來預測網絡在訓練之前是否可以比某個閾值精度更好地運行。
與隨機猜測相比,模型的執行效果要好16-20%。此外,作者在大量網絡的準確性回歸中發現普通最小二乘模型的確定係數為0.966。
論文名稱:Hierarchical Reinforcement Learning as a Model of Human Task Interleaving
作者:Gebhardt Christoph /Oulasvirta Antti /Hilliges Otmar
發表時間:2020/1/4
論文連結:https://paper.yanxishe.com/review/8313?from=leiphonecolumn_paperreview0108
推薦理由:人們如何決定一項任務要持續多長時間,何時切換以及執行另一項任務?理解支持任務交錯的機制是認知科學的一個長期目標。先前的工作提出了貪婪的啟發法和最大化邊際收益率的政策。然而,目前尚不清楚這種策略如何適應於提供多種任務,轉換成本昂貴且回報延遲的日常環境。
在這裡,作者開發了由強化學習(RL)驅動的監督控制的分層模型。主管級別使用特定於任務的近似效用估計值學習切換,這些估計值是在較低級別上計算的。即使在具有多個任務以及任意和不確定的報酬和成本結構的條件下,也可以從經驗中學到分層的最優價值函數分解。該模型再現了任務交錯的已知經驗效果。與六任務問題(N = 211)中的近視基線相比,它可以更好地預測個人數據。結果支持分層RL作為任務交織的合理模型。
論文名稱:A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control
作者:Rostam Mohammadreza /Nagamune Ryozo /Grebenyuk Vladimir
發表時間:2020/1/7
論文連結:https://paper.yanxishe.com/review/8308?from=leiphonecolumn_paperreview0108
推薦理由:為了減少控制器的保守性,本文提出了一種混合高斯過程(GP)方法,用於在未知未來擾動下進行魯棒的經濟模型預測控制。提出的混合GP是兩種已知方法的組合,即核成分和非線性自回歸。在分析預測結果之後,採用切換機制來選擇這些方法中的一種來進行幹擾預測。混合GP旨在通過使用過去的幹擾測量來檢測模式,而且還檢測未知幹擾中的意外行為。
在混合GP中還使用了一種新穎的遺忘因子概念,可以減輕較舊的測量的權重,從而基於最近的幹擾值提高預測精度。}檢測到的幹擾信息用於減少預測的不確定性。經濟模型的預測控制器。仿真結果表明,與其他基於GP的方法相比,在擾動具有可識別模式的情況下,該方法可以提高經濟模型預測控制器的整體性能。
論文名稱:Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation
作者:You Di /Vo Nguyen /Lee Kyumin /Liu Qiang
發表時間:2020/1/7
論文連結:https://paper.yanxishe.com/review/8309?from=leiphonecolumn_paperreview0108
推薦理由:為了打擊假新聞,研究人員主要致力於發現假新聞,而新聞工作者則建立並維護了事實檢查網站(例如,此URL(https://www.snopes.com/)和此 URL(https://www.politifact.com/))。 但是,通過社交媒體網站大大促進了虛假新聞的傳播,並且這些事實檢查網站還沒有得到充分利用。
為了克服這些問題並補充現有的偽造新聞方法,本文提出了一種基於深度學習的事實檢查URL推薦器系統,以減輕偽造新聞在諸如Twitter和Facebook等社交媒體網站上的影響。 特別是,作者提出的框架由一個多關係注意模塊和一個異構圖注意力網絡組成,以學習用戶URL對,用戶對用戶對和URL URL對之間的複雜/語義關係。 在真實數據集上進行的大量實驗表明,我們提出的框架優於八個最新的推薦模型,至少提高了3〜5.3%。
論文名稱:Data Structure Primitives>作者:Götze Philipp /Tharanatha Arun Kumar /Sattler Kai-Uwe
發表時間:2020/1/7
論文連結:https://paper.yanxishe.com/review/8310?from=leiphonecolumn_paperreview0108
推薦理由:永久內存(PM),例如已經可用的Intel Optane DC永久性存儲器的技術代表了一種非常有前途的下一代存儲器解決方案,對資料庫體系結構具有重大影響。已經提出了這項新技術的幾種數據結構及其特性。但是,基本上只提出並評估了完整的結構,掩蓋了個人想法和PM特徵的影響。
因此,在本文中,我們將分解目前為止介紹的結構,識別其基礎設計原語,並將其分配給有關PM的適當設計目標。在真實的PM硬體上進行全面實驗的結果是,作者能夠在微觀水平上揭示基元的取捨。由此,可以導出所選圖元的性能配置文件。有了這些,就可以精確地確定其最佳用例以及漏洞。除了對基於PM的數據結構設計的一般見解之外,作者還發現了迄今為止文獻中尚未考慮的新的有希望的組合。
論文名稱:HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation
作者:Zhang Zhaohui /Xie Shipeng /Chen Mingxiu /Zhu Haichao
發表時間:2020/1/3
論文連結: https://paper.yanxishe.com/review/8175?from=leiphonecolumn_paperreview0108
推薦理由:這篇論文考慮的是3D景深圖像中預估手勢的問題。
這篇論文提出了一個簡單的數據增強方法HandAugment,包含兩階段的神經網絡學習:第一階段在迭代的模式下抽取手部圖像塊,並根據深度圖預估手的初始姿態,過濾掉噪音圖塊(例如背景與手臂)。被抽取出的圖塊與初始化手部姿態被代入第二階段的神經網絡,以獲取最終的手部姿態。
這種兩階段策略極大提升了手勢識別的準確率,並在HANDS19挑戰任務1-基於景深的3D手勢識別大賽上獲得了第一名。
論文名稱:From 'F' to 'A'>作者:Clark Peter /Etzioni Oren /Khashabi Daniel /Khot Tushar /Mishra Bhavana Dalvi /Richardson Kyle /Sabharwal Ashish /Schoenick Carissa...
發表時間:2019/9/4
論文連結:https://paper.yanxishe.com/review/7846?from=leiphonecolumn_paperreview0108
推薦理由:人工智慧已經在西洋棋,圍棋和撲克,甚至《危險》等遊戲上獲得了非凡的掌握,但是各種各樣的標準化考試仍然是一個巨大的挑戰。即使在2016年,最好的AI系統在8年級科學考試挑戰中也僅達到59.3%。
這篇論文報導了在紐約8年級攝政科學考試中取得了空前的成功,該系統首次在該考試的非圖表多項選擇(NDMC)問題上得分超過90%。此外,基於最近的語言模型的成功,我們的Aristo系統在相應的12年級科學考試NDMC問題上超過了83%。在看不見的測試問題上得出的結果在不同的測試年份和這種測試的不同變體中都是可靠的。他們證明了現代的NLP方法可以精通此任務。雖然不是一般問題解答的完整解決方案(問題是多項選擇,並且領域僅限於8年級科學),但它代表了該領域的重要裡程碑。
論文名稱:Information Theoretic Model Predictive Q-Learning
作者:Bhardwaj Mohak /Handa Ankur /Fox Dieter /Boots Byron
發表時間:2019/12/31
論文連結:https://paper.yanxishe.com/review/8312?from=leiphonecolumn_paperreview0108
推薦理由:當可以廉價地收集經驗時,無模型強化學習(RL)算法可以很好地解決順序決策問題;當可以準確地建模系統動力學時,基於模型的RL有效。但是,這兩個假設在諸如機器人技術之類的現實世界問題中都可能違背,在這種情況下,查詢系統的成本可能過高,而現實世界的動力學可能難以準確建模。儘管模擬到真實的方法(例如域隨機化)試圖減輕有偏模擬的影響,但它們仍然會遭受優化挑戰(例如局部最小值和針對隨機化的手工設計分布),從而難以學習準確的全局值函數或直接轉移到現實世界的政策。
與RL相反,模型預測控制(MPC)算法使用模擬器在線優化簡單的策略類,從而構建可以有效應對現實世界動態變化的閉環控制器。MPC性能通常受模型偏差和優化範圍有限等因素的限制。
在這項工作中,作者提出了信息理論MPC與熵正則化RL之間的新型理論聯繫,並開發了一種可利用偏差模型的Q學習算法。我們驗證了在Sim-to-sim控制任務上提出的算法,以證明優化控制和從頭開始強化學習的改進。我們的方法為系統地在真實機器人上部署強化學習算法鋪平了道路。
雷鋒網雷鋒網雷鋒網(公眾號:雷鋒網)
相關文章:
今日 Paper | 精簡BERT;面部交換;三維點雲;DeepFakes 及 5G 等
今日 Paper | 虛假新聞檢測;馬爾可夫決策過程;場景文本識別;博弈論框架等
今日 Paper | 問答系統;3D人體形狀和姿勢;面部偽造檢測;AdderNet等
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。