今日Paper|隨機微分方程;流式自動語音識別;圖像分類等

2021-01-10 雷鋒網

為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。以下是今日的精選內容——

目錄

Reinforcement Learning via Fenchel-Rockafellar DualityScalable Gradients for Stochastic Differential EquationsStreaming automatic speech recognition with the transformer modelThe importance of phase in complex compressive sensingDo As I Do: Transferring Human Motion and Appearance between Monocular Videos with Spatial and Temporal ConstraintsGenerating Object StampsRoboFly: An insect-sized robot with simplified fabrication that is capable of flight, ground, and water surface locomotionFrequentNet : A New Deep Learning Baseline for Image ClassificationConvolutional Networks with Dense ConnectivityImplementing version control with Git as a learning objective in statistics courses

通過Fenchel-Rockafellar對偶進行強化學習

論文名稱:Reinforcement Learning via Fenchel-Rockafellar Duality

作者:Nachum Ofir /Dai Bo

發表時間:2020/1/7

論文連結:https://paper.yanxishe.com/review/8517?from=leiphonecolumn_papereview0110

推薦理由:作者回顧凸對偶性的基本概念,重點是非常普遍且極為有用的Fenchel-Rockafellar對偶性。

作者總結了如何將這種對偶性應用於各種強化學習(RL)設置,包括策略評估或優化,在線或離線學習以及打折或未打折的獎勵。 這些推導產生了許多有趣的結果,包括使用行為不可知的離線數據執行策略評估和基於策略的策略梯度的能力,以及通過最大似然優化來學習策略的方法。 儘管許多結果以前都以各種形式出現過,但是作者對這些結果提供了統一的處理方法和觀點,作者希望它們能夠使研究人員更好地使用和應用凸對偶工具,從而在RL中取得更大的進步。

隨機微分方程的可擴展梯度

論文名稱:Scalable Gradients for Stochastic Differential Equations

作者:Li Xuechen /Wong Ting-Kam Leonard /Chen Ricky T. Q. /Duvenaud David

發表時間:2020/1/5

論文連結:https://paper.yanxishe.com/review/8518?from=leiphonecolumn_papereview0110

推薦理由:伴隨靈敏度方法可縮放地計算常微分方程解的梯度。 作者將這種方法推廣到隨機微分方程,從而利用高階自適應求解器實現梯度的時效性和恆定內存計算。 具體來說,作者推導了一個隨機微分方程,其解為梯度,一種用於記憶噪聲的內存有效算法以及數值解收斂的條件。 此外,作者將其方法與基於梯度的隨機變分推斷相結合,以解決潛在的隨機微分方程。 作者使用這種方法來擬合由神經網絡定義的隨機動力學,從而在50維運動捕獲數據集上實現競爭性能。

使用轉換器模型進行流式自動語音識別

論文名稱:Streaming automatic speech recognition with the transformer model

作者:Moritz Niko /Hori Takaaki /Roux Jonathan Le

發表時間:2020/1/8

論文連結:https://paper.yanxishe.com/review/8514?from=leiphonecolumn_papereview0110

推薦理由:基於編碼器-解碼器的序列到序列模型已經證明了端到端自動語音識別(ASR)的最新結果。最近,與基於遞歸神經網絡(RNN)的系統體系結構相比,使用自我注意力對時間上下文信息進行建模的轉換器體系結構已顯示出顯著更低的字錯誤率(WER)。儘管獲得了成功,但實際使用僅限於脫機ASR任務,因為編碼器/解碼器體系結構通常需要整個語音發音作為輸入。

在這項工作中,作者提出了一種基於變壓器的端到端ASR系統,用於流式傳輸ASR,在該系統中,每個口語單詞後必須立即生成輸出。為此,我們對編碼器應用了有時間限制的自注意力,並為編碼器-解碼器注意機制觸發了注意。對於LibriSpeech的「乾淨」和「其他」測試數據,作者提出的流媒體轉換器體系結構實現了2.7%和7.0%的WER,據所知,這是針對此任務發布的最佳流媒體端到端ASR結果。

相位在複雜壓縮感測中的重要性

論文名稱:The importance of phase in complex compressive sensing

作者:Jacques Laurent /Feuillen Thomas

發表時間:2020/1/8

論文連結:https://paper.yanxishe.com/review/8513?from=leiphonecolumn_papereview0110

推薦理由:作者考慮從複雜隨機測量的相位(即在僅相位壓縮感測(PO-CS)場景中)估計實際的低複雜度信號(例如稀疏矢量或低秩矩陣)的問題。

作者表明,如果感測矩陣是一個複雜的高斯隨機矩陣,並且與信號空間的複雜度級別相比測量次數較大,則可以以高概率且高達全局未知信號幅度,來完美地恢復此類信號。 。此外,如果每個測量值都乘以未知符號,則仍可以恢復。作者的方法是通過將(非線性)PO-CS方案重鑄為根據信號歸一化約束和相位一致性約束(施加任何信號估計以匹配測量域中的觀測相位)構建的線性壓縮感測模型而進行的。實際上,可以從壓縮感測文獻的任何實例最優算法(例如,基本追蹤去噪)中獲得穩定且魯棒的信號方向估計。通過證明與該等效線性模型關聯的矩陣,可以在上述條件下以測量次數高概率滿足受限等軸測特性,從而確保這一點。作者最終通過實驗觀察到,穩健的信號方向恢復大約是壓縮感測中信號恢復所需的測量次數的兩倍。

像我一樣做:在具有時空限制的單眼視頻之間轉移人類的運動和外觀

論文名稱:Do As I Do: Transferring Human Motion and Appearance between Monocular Videos with Spatial and Temporal Constraints

作者:Gomes Thiago L. /Martins Renato /Ferreira Joo /Nascimento Erickson R.

發表時間:2020/1/8

論文連結:https://paper.yanxishe.com/review/8515?from=leiphonecolumn_papereview0110

推薦理由:

從真實演員的圖像創建合理的虛擬演員仍然是計算機視覺和計算機圖形學的主要挑戰之一。無標記的人類運動估計和來自野外圖像的形狀建模使這一挑戰脫穎而出。儘管最近在視圖合成和圖像到圖像的翻譯方面取得了進步,但是當前可用的配方僅限於僅轉移樣式,並且不考慮角色的運動和形狀,而角色的運動和形狀天生就混雜在一起以產生合理的人類形式。

在本文中,作者提出了一種統一的公式,用於從涉及所有這些方面的單眼視頻中轉移外觀並重新定向人類運動。作者的方法由四個主要部分組成,並在最初錄製他們的不同上下文中合成了新的人們視頻。與最近的外觀轉移方法不同,作者考慮了身體形狀,外觀和運動約束。評估是使用包含嚴酷條件的可公開獲得的真實視頻通過幾次實驗進行的。其方法能夠以超越最新技術的方式傳遞人類動作和外觀,同時保留必須保持的動作的特定特徵(例如,腳觸摸地板,手觸摸特定對象)並保持最佳狀態視覺質量和外觀指標,例如結構相似度(SSIM)和學習的感知圖像補丁相似度(LPIPS)。

生成對象圖章

論文名稱:Generating Object Stamps

作者:Mejjati Youssef Alami /Shen Zejiang /Snower Michael /Gokaslan Aaron /Wang Oliver /Tompkin James /Kim Kwang In

發表時間:2020/1/1

論文連結:https://paper.yanxishe.com/review/8516?from=leiphonecolumn_papereview0110

推薦理由:作者提出一種算法來生成各種前景對象,並使用GAN架構將它們合成為背景圖像。 給定對象類,用戶提供的邊界框和背景圖像,作者首先使用遮罩生成器創建對象形狀,然後使用紋理生成器填充遮罩,以使紋理與背景整合。 通過將對象插入的問題分為兩個階段,作者證明了其模型可以改善各種對象生成的真實感,而這種現實感也與所提供的背景圖像一致。 與最新的對象插入方法相比,作者在具有挑戰性的COCO數據集上的結果顯示出更高的整體質量和多樣性。

RoboFly:昆蟲大小的機器人,具有簡化的製造工藝,能夠飛行,地面和水面移動

論文名稱:RoboFly: An insect-sized robot with simplified fabrication that is capable of flight, ground, and water surface locomotion

作者:Chukewad Yogesh M /James Johannes /Singh Avinash /Fuller Sawyer

發表時間:2020/1/8

論文連結:https://paper.yanxishe.com/review/8512?from=leiphonecolumn_papereview0110

推薦理由:像蜜蜂一樣大小的空中機器人(約100 mg)具有體積小,重量輕和材料成本低等優點,優於大型機器人。先前的迭代已經證明了飛行受控,但是由於它們由組裝在一起的許多獨立零件組成,因此很難製造。除了飛行之外,他們還無法執行運動模式。

本文介紹了一種74 mg拍打翼機器人的新設計,該機器人可大大減少零件數量並簡化製造過程。它還具有較低的質心,即使在不穩定的飛行情況下,也無需長腿即可使機器人額外著陸。此外,作者表明,新設計允許機翼驅動的地面和空氣-水界面移動,從而提高了機器人的多功能性。通過增加相對於拍打翼的上行程的下行程速度來產生前向推力。這也允許轉向。著陸並隨後沿著地面移動的能力使機器人能夠在障礙物下方和極其精確的位置之間協商極為狹窄的空間。作者將詳細描述新設計,並提供展示這些功能以及懸停飛行和受控著陸的結果。

FrequentNet:用於圖像分類的新的深度學習基準

論文名稱:FrequentNet : A New Deep Learning Baseline for Image Classification

作者:Li Yifei /Wang Zheng /Song Kuangyan /Sun Yiming

發表時間:2020/1/4

論文連結:https://paper.yanxishe.com/review/8510?from=leiphonecolumn_papereview0110

推薦理由:在本文中,作者從「 PCANet」方法中概括了這一思想,以實現用於圖像分類的新基線深度學習模型。 代替在「 PCANet」中使用主成分向量作為濾波向量,作者在離散傅立葉分析和小波分析中使用基礎向量作為濾波向量。 兩者在基準數據集中均達到了與「 PCANet」相當的性能。 值得注意的是,作者的算法不需要任何優化技術即可獲得這些基礎。

具有密集連接性的卷積網絡

論文名稱:Convolutional Networks with Dense Connectivity

作者:Huang Gao /Liu Zhuang /Pleiss Geoff /van der Maaten Laurens /Weinberger Kilian Q.

發表時間:2020/1/8

論文連結:https://paper.yanxishe.com/review/8511?from=leiphonecolumn_papereview0110

推薦理由:最近的工作表明,如果卷積網絡在靠近輸入的層和靠近輸出的層之間包含較短的連接,則可以進行更深入,更準確和有效的訓練。

在本文中,作者接受了這一觀察,並介紹了密集卷積網絡(DenseNet),該網絡以前饋的方式將每一層連接到其他每一層。而具有L層的傳統卷積網絡具有L連接-每層與其卷積網絡之間後續層-作者的網絡具有L(L + 1)/ 2個直接連接。對於每一層,所有先前層的特徵圖都用作輸入,而其自身的特徵圖則用作所有後續層的輸入。DenseNets具有幾個引人注目的優勢:它們減輕了消失梯度的問題,鼓勵了特徵重用並大大提高了參數效率。

作者在四個競爭激烈的對象識別基準測試任務(CIFAR-10,CIFAR-100,SVHN和ImageNet)上評估了作者提出的體系結構。DenseNets在大多數方面都獲得了超越現有技術的顯著改進,同時需要更少的參數和計算即可實現高性能。

在統計課程中以Git為學習目標實施版本控制

論文名稱:Implementing version control with Git as a learning objective in statistics courses

作者:Beckman Matthew D. /etinkaya-Rundel Mine /Horton Nicholas J. /Rundel Colin W. /Sullivan Adam J. /Tackett Maria

發表時間:2020/1/7

論文連結:https://paper.yanxishe.com/review/8509?from=leiphonecolumn_papereview0110

推薦理由:版本控制是可複製工作流的基本元素,在統計學課程的學習目標中應適當考慮。

本文介紹了四個在不同機構教授不同課程的貢獻型教師的經驗和實施決策。 這些教師中的每一個都將版本控制作為學習目標,並將Git教學成功地集成到一個或多個統計課程中。 本文中描述的各種方法跨越了不同的實施策略,以適應學生的背景,課程類型,軟體選擇和評估實踐。 通過提供廣泛的Git教學方法,本文旨在作為統計教員在本科或研究生課程中任何級別的課程教學的資源。

雷鋒網雷鋒網雷鋒網

相關焦點

  • 今日Paper|人體圖像生成和衣服虛擬試穿;魯棒深度學習;圖像風格...
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。
  • 微分方程重點一:常係數齊次線性微分方程
    微分方程前面的都是一些基礎,如果是一些和其他題型結合在一起的題目的話,可能會考前面的微分方程內容,比如說求知道函數的全微分,讓求原函數這類的。但是如果微分方程考大題的話,就是考二階常係數非齊次線性微分方程了。之前講的微分方程解的結構是基礎,主要是為了說明做題時我們需要求什麼。
  • 常微分方程:線性微分方程解的三個重要特徵
    前一篇《帶你走進微積分的堂學習:一階線性微分方程式的基礎原理》詳細討論了線性微分方程的結構以及通解特性,本篇我們藉此機會指出一階線性微分方程解的三個重要特徵1)有一階線性微分方程>的通解是可以看出,它等於(1)的一個特解(對應於上式的C=0)再加相應的齊次線性(2)的通解,因此如果求得非齊次線性微分方程(1)的一個特解為y=φ1(x)和相應的齊次線性方程(2)的通解,則(1)的通解為2)設a(x)和b(x)在區間α<x<β上連續,則由上述通解公式可知
  • 了解高階線性微分方程——初識二階線性微分方程
    小編照舊當大家都做了哦 ,現在微分方程篇已經算是複習了一半了,也不知道大家複習得怎麼樣,不過每天有進步終究還是好的。對於不想荒廢大學四年的同學,小編建議每天還是應該做一些學的課程裡面的題目,每天都有那份感覺在那裡,最終要用到的時候起碼不會生疏。下面小編開始對答案了。
  • AI攻破高數核心,1秒內精確求解微分方程、不定積分
    這裡有,積分數據集和常微分方程數據集的製造方法:函數,和它的積分首先,就是要做出「一個函數&它的微分」這樣的數據對。團隊用了三種方法:第一種是正向生成 (Fwd) ,指生成隨機函數 (最多n個運算符) ,再用現成的工具求積分。把工具求不出的函數扔掉。第二種是反向生成 (Bwd) ,指生成隨機函數,再對函數求導。
  • 第十一屆全國微分方程穩定性理論與應用學術會議召開
    第十一屆全國微分方程穩定性理論與應用學術會議召開 中國教育在線    2017-08-25  大 中 小   中國教育在線訊 8月18日至21日,第十一屆全國微分方程穩定性理論與應用學術會議在濰坊召開。
  • 創刊70周年特邀綜述---關於測度值過程的隨機分析
    在隨機分析中,Dirichlet 型理論和隨機微分方程理論是研究擴散過程的兩個重要工具。前者使用能量 (梯度) 和參考測度 (平穩分布) 確定預 Dirichlet 型,通過證明其可閉性和閉包的正則 (regular) 性或擬正則 (quasi-regular)性,確定相應的擴散過程;後者則通過解 (強解或鞅解) 由 Brown 運動驅動的隨機微分方程直接構造擴散過程。
  • 2017考研數學:n階線性微分方程的通解公式分析
    微分方程是高等數學中的一個重要章節,在實際中也有廣泛的應用,對於考研數學來講更是每年必考。關於線性微分方程的通解公式,在一般高等數學教材中只是簡單地做了些介紹,並沒有進行詳細的分析證明,因此有很多同學對其感到有些困惑,對其含義和作用也不能很好理解,為了幫助2017考研學子消除這些困惑,本文對n階線性微分方程的通解公式做些分析和證明,供同學參考。
  • 考研數學:線性方程組與線性微分方程的通解對比
    線性方程組是線性代數中的一個重要知識點,而線性微分方程是高等數學中微分方程部分的一個重要知識點,二者雖然分別屬於不同的數學課程內容,但其通解形式卻有著驚人的相似之處,有些同學在學習中感覺到了二者有相似之處,但並不十分清楚其相似在何處和怎麼相似,以及線性微分方程的通解是否包含其全部解,對此的蔡老師就這些問題做些歸納總結,供複習2018考研數學的同學和學習高等數學及線性代數的同學參考
  • 神經受控微分方程:非規則時間序列預測新SOTA
    機器之心報導參與:Racoon、魔王、小舟使用神經微分方程對時間序列的動態進行建模是一個很有潛力的選擇,然而目前方法的性能往往受限於對初始條件的選擇。這項新研究提出了改進策略,實現了新的 SOTA 性能。
  • 分析學的5大「步」:微積分到函數論、泛函分析、微分方程
    泛函分析:n維空間到無窮維空間的幾何學和微積分學微分方程伴隨著微積分的發展,以及客觀物質世界中關於物質運動規律的描述,都促進了常微分方程、偏微分方程的發展。而隨著物理科學、工程技術所研究領域的廣度和深度的擴展,微分方程的應用範圍也越來越廣泛。反過來,從數學自身的角度看,偏微分方程的求解促使函數論、變分法、級數展開、常微分方程、代數、微分幾何等各方面的發展。從這個角度說,偏微分方程變成了數學的中心。
  • 「每周一識」一階非齊次線性微分方程求解及應用舉例
    本文介紹一階非齊次線性微分方程的通解的應用、特解求解舉例,以及二階微分方程可用該通解求解的情形。一、方程通解公式一階非齊次線性微分方程的解析式為:y'+p(x)=q(x),則其通解表達式如下:y=e^[-∫p(x)]dx{∫q(x)*e^[∫p(x)dx]dx+c}.
  • 求微分方程y''+y=(sin3x+cos3x)e^2x通解的方法
    本文主要內容,介紹求微分方程y''+y=(sin3x+cos3x)e^2x通解的方法。解:微分方程的特徵方程為:r2+1=0,r1,2=±i,即該方程的齊次微分方程的通解為:y*=c1sinx+c2cosx;
  • 今日Paper | 虛假新聞檢測;馬爾可夫決策過程;場景文本識別;博弈論...
    (paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。以其中標註模塊可以根據用戶的報告為未標註的新聞自動分配弱標籤,基於強化學習的強化選擇模塊從弱標註數據中選擇高質量的樣本,並過濾掉那些可能降低檢測器預測性能的低質量樣本,虛假新聞檢測模塊則專注於根據新聞內容識別假新聞。文章在微信官方帳戶發布的大量新聞文章和相關的用戶報告上測試了其提出的WeFEND,實驗結果表明,與最新的方法相比,WeFEND模型具有最佳的性能表現。
  • 微分方程y〞+y=(sin2x+cos2x)e^2x怎麼解?
    微分方程的特徵方程為:r2+1=0,r1,2=±i,即該方程的齊次微分方程的通解為:y*=c1sinx+c2cosx>又因為λ+iw=2+2i,不是特徵方程的根,則設特解為:y1=(msin2x+ncos2x)e^2x;兩次求導得:y1'=(2mcos2x-2nsin2x)e^2x+2(msin2x+ncos2x)e^2x;
  • 基於百度EasyDL定製化圖像識別平臺的海洋魚類識別方法
    傳統的機器學習方法用於魚類識別的實現過程為:獲取魚圖像、提取特徵、構建分類器,將特徵向量輸入分類器以實現種類識別。如:Phenoix等人[1]採用貝葉斯和高斯核混合模型對魚類特徵進行分層分類的方法來實現魚的分類識別;杜偉東等人[2]提出了一種提取多方位聲散射數據的小波包係數奇異值、時域質心及離散餘弦變換係數特徵,並進行特徵融合,最後用支持向量機分類的魚識別方法;雖然這些方法都可以實現魚類識別,但是這些方法這類方法已不適用於當前的視頻或圖片數據,並且方法嚴重依賴於人工選擇特徵,而人工選擇特徵往往只能選擇表層特徵,
  • 「創作開運禮」求微分方程y''+2y'+3y=0在定點處的特解
    本文介紹微分方程y''+2y'+3y=0在y(0)=1,y'(0)=5處的特解.具體步驟如下:二階微分方程y''+2y'+3y=0,其特徵方程為:r^2+2r+3=0r^2+2r+1=-2(r+1)^2=-2
  • 帶你走進微積分的堂學習:一階線性微分方程式的基礎原理
    一階線性微分方程式是微分方程中最簡單的也是基本的,雖然看上去比較枯燥,但其背後的數學原理值得我們去學習和借鑑,本篇就來學習和探討下。希望對大家有所幫助。設一階微分方程式的右端函數f(x,y)關於y是一次線性的,設其中函數a(x)與b(y)在區間α<x<β上是連續的,此時,相應的微分方程可以寫成像這類的微分方程稱之為一階線性微分方程,不是線性的微分方程稱之為非線性微分方程
  • 今日Paper|TRANSFORMER結構;圖像到圖像翻譯;缺失標註目標檢測解決...
    目錄REFORMER:一個高效的TRANSFORMER結構具有文本指導的圖像到圖像的翻譯解決背景重校準損失下的缺失標註目標檢測問題MLFcGAN:基於多級特徵融合的條件GAN水下圖像顏色校正 from=leiphonecolumn_paperreview0221推薦原因這篇論文提出了一個新的圖像到圖像遷移方法,通過生成對抗網絡將可控因素(即自然語言描述)嵌入到圖像到圖像的遷移中,從而使文字描述可以確定合成圖像的視覺屬性。