史丹福大學新研究:聲波、光波等都是RNN

2020-12-04 機器之心Pro

選自Reddit

作者:Ian Williamson機器之心編譯參與:王子嘉、魔王

史丹福大學的一項研究發現:物理學中波動與 RNN 中的計算存在對應關係。

論文地址:https://advances.sciencemag.org/content/5/12/eaay6946GitHub 地址:https://github.com/fancompute/wavetorch最近,機器學習與物理和數值科學的一些領域碰撞出了不少火花。這讓機器學習框架在物理模型優化問題中有了用武之地,同時機器學習領域也在物理概念的幫助下出現了很多令人興奮的新模型(如神經 ODE 和哈密頓神經網絡等)。本文作者所在小組的研究重點是:物理本身就可以作為計算引擎。換句話說,作者們感興趣的是那些可以作為硬體加速器(或是專門用於快速高效的機器學習計算的模擬處理器)的物理系統。他們最近發表在《Science Advances》上的論文,證明了波的物理特性可被直接映射到循環神經網絡的時序變化。利用這種聯繫,作者們通過 PyTorch 開發了一個數值模型,該模型證明我們可以訓練一個聲學/光學系統,並利用它從人類說話者錄音中準確地識別出元音。本質上,作者們將元音元音波形引入物理模型,並允許優化器在域內的 1000 個點上添加和刪除材料,這個操作實際上可以當做模型的權重。因為這個機器學習模型實際上對應於一個物理系統,這也就意味著研究者可以把經過訓練的材料分布「列印」到真實的物理設備中。其結果類似於 ASIC (Application Specific Integrated Circuit),但只能針對特定的 RNN 計算。這令人感到非常興奮,因為這些結果表明可以在不消耗多餘能量(除了脈衝本身攜帶的能量)的情況下,執行複雜的循環機器學習計算。以下是對這篇研究核心思想的介紹。波動與 RNN 的聯繫這一部分將介紹 RNN 的操作與波動之間的聯繫。RNN 一步步對輸入序列的每一部分執行相同的操作,從而將輸入序列轉換成輸出序列(圖 1A)。之前步的信息被編碼存儲在 RNN 的隱藏狀態中,隱藏狀態在每一步都會更新。正是這些隱藏狀態使得 RNN 記住過去的信息,同時學習數據中的時序結構和長距離依賴關係。在給定時間步 t 處,RNN 同時處理輸入序列中的當前輸入向量 x_t 以及前一步傳來的隱藏狀態向量 h_t-1,從而得到輸出向量 y_t,並更新當下的隱藏狀態 h_t。

圖 1:標準 RNN 與基于波的物理系統之間的概念比較。訓練一個分辨元音的物理系統這一部分將說明如何使用波動方程來訓練元音分類器,其主要通過構建非均勻材料分布來實現。為了完成這個任務,該研究所用數據集包含 45 位男性和 48 位女性關於 10 個元音的 930 條原始錄音。在模型訓練過程中,該研究選取了關於這 3 個元音(ae、ei、iy)的 279 條錄音作為訓練集(圖 2A)。

圖 2:元音識別的設置和訓練過程示意圖。對初始網絡 5 次交叉驗證訓練的結果取均值後得到的訓練集與測試集上的混淆矩陣參見圖 3(A、B)。混淆矩陣中對角線上的值定義了正確預測元音的比例,非對角線上的值則是未能正確預測的比例。從結果可以看出,初始結構是無法完成識別任務的。圖 3 中的 C 和 D 展示了優化後訓練集和測試集上的最終混淆矩陣。這些結果同樣是對 5 次交叉驗證運行的結果取均值得到的。訓練後的混淆矩陣是對角佔優的,也就是說現在這個結構可以執行元音識別任務了。

圖 3:元音識別任務的訓練結果。圖 3 中的 E 和 F 分別展示了交叉熵損失和預測準確率,橫坐標是訓練集和測試集上的訓練 epoch 數。圖中的實線表示平均值,陰影區域則是交叉驗證訓練運行的標準差。從中我們看到第一個 epoch 使損失下降了最多,而且對於準確率的提升也是最大的。從圖 3F 中可以看出,這個系統在訓練集上的平均準確率是 92.6 ±1.1%,而在測試集上的平均準確率是 86.3 ± 4.3%。從圖 3 的 C 和 D 中可以觀察到系統在元音 ae 的識別上表現近乎完美,也能很好地將 iy 和 ei 分辨開來(不過準確率稍低),這種特徵在測試集的未見樣本上尤為明顯。圖 3 的 G 到 I 展示了:將每個元音類的代表性樣本注入到訓練結構中時的綜合場強分布(integrated field intensity)∑_t u_t^2。該研究用視覺化的方式證明了,產生目標結構的優化過程將大部分信號發送至正確的地方。該任務以傳統 RNN 作為性能基準,其分類準確率與波動方程差不多,但是它需要大量自由參數。此外,我們觀察到,訓練線性波動方程所獲得的分類準確率也是很有競爭力的,有關性能的更多細節會參見原論文。討論該研究提出的這種基于波的 RNN 有很多優勢,這些優勢使得它在處理時序編碼信息時可以得心應手。與傳統 RNN 不同,波動方程在從一個時間步到另一個時間步的更新過程中,通過拉普拉斯算子(圖 1E 中的稀疏矩陣)實現隱藏狀態元素之間的最近鄰耦合。最近鄰耦合主要得益於,波動方程是信息以有限速度傳播的雙曲型偏微分方程。因此,模擬 RNN 的隱藏狀態大小和存儲容量直接取決於傳播介質的大小。此外,與傳統 RNN 不同的是,波動方程遵循能量守恆約束,防止隱藏狀態和輸出信號的範數無限增長。相比之下,定義標準 RNN 更新關係的無約束密集矩陣會導致梯度消失和爆炸,這是傳統 RNN 訓練過程中的主要挑戰。該研究證明波動方程在概念上等價於 RNN。這種概念上的聯繫為一類新的模擬硬體平臺提供了思路,在這類平臺中,演化時序在物理和數據集中都扮演著重要的角色。當我們專注於用標量波動方程描述的最普遍波動示例時,我們的結果可以很容易地擴展到其他類似于波的物理概念。這種利用物理執行計算的方法可能促進新型模擬機器學習設備新平臺的研發,模擬設備有望比對應的數字設備更自然高效地執行計算。該方法的通用性進一步表明,許多物理系統可能是對動態信號(如光學、聲學或地震學中的動態信號)執行類 RNN 計算的有力候選者。參考連結:https://www.reddit.com/r/MachineLearning/comments/ej3bgf/r_acoustic_optical_and_other_types_of_waves_are/

相關焦點

  • 斯坦福華人教授:聲波、光波,其實都是RNN!機器學習模型對應物理系統
    新智元報導來源:Reddit、Science編輯:大明、鵬飛【新智元導讀】近日,史丹福大學華人教授Shanhui Fan團隊在Science子刊發文,指出不管是聲波、光波還是其他形式的波,其描述方程上都可以和循環神經網絡(RNN)等效。
  • 研究人員發現結合聲波和光波方式 數據傳輸或更快!
    [PConline 資訊]據外媒報導稱,利茲大學和諾丁漢大學的研究人員近日發現結合聲波和光波功率的超快調製方式,並聲稱在太赫茲量子級聯雷射器的控制方面取得了突破。研究團隊介紹稱,它可以使數據以每秒100吉比特的速率傳輸,比以10000兆赫茲運行的快速乙太網快約一千倍。
  • 美利用光波-聲波耦合開發出新的矽基雷射器
    近日,美國耶魯大學利用聲波開發出一種新的矽雷射器。耶魯大學應用物理學教授說:「在過去幾年,我們看到矽光子技術呈爆發式增長。我們開始看到這些技術進入消費品,使我們的數據中心運行得更快。我們還發現新的光子器件和技術,有望在生物傳感、片上量子信息等領域引起變革。」
  • 以聲波形式存儲光波信息,為大型數據中心帶來福利?
    如果可以將光波轉化為聲波,在某種意義上而言,降低了光束的傳輸速度,由此可使光波存儲更容易。雪梨大學的研究人員發現了可將光波轉化成聲波,實現以聲波形式存儲光波信息。優勢在於有利於消除處理器間的某些電子連接,進而幫助數據中心節能。該項研究發表在近期的《自然通訊》上。
  • 聲波技術新突破:有望讓潛艇實現「隱身」!
    導讀近日,瑞士洛桑聯邦理工學院與奧地利維也納技術大學以及希臘克裡特大學的研究人員一起合作,開發出一種可以使得聲波無失真地穿過無序媒介的系統。背景大多數天然材料都具有一種無序的原子結構,這種結構會干擾聲波和電磁波的傳播。當波與這些材料發生接觸時,波會向四周反彈並擴散開來。
  • 新研究預測聲波極限速度大約每秒36公裡
    新研究預測聲波極限速度大約每秒36公裡  Connor Feng • 2020-10-11 15:21:47 來源:前瞻網
  • 聲波最大速度上限算出
    愛因斯坦的狹義相對論為光波的傳輸速度設定了上限:300000千米/秒,但科學家一直不清楚其「孿生兄弟」——聲波在固體或液體中傳播時是否也有速度上限。英國科學家在最新一期《科學進展》雜誌中指出,他們發現了聲波迄今最大速度上限:約36千米/秒,了解這一值有望讓材料科學等多領域受益。
  • 「壓電光機迴路」實現光波、聲波和無線電波相互轉換
    任職於國家標準與技術研究所(NIST)的研究人員已經開發出一種將信號在光波,聲波和無線電波之間轉換的「壓電光機迴路」。基於此設計的系統可以在下一代計算機中移動和存儲信息。  摩爾定律——一個認為集成電路的電晶體數量將每兩年翻一番的理論——已經被證明是非常符合實際情況的,因此工程師們將很快會開始遭遇根本上的極限。
  • 史丹福大學心理學研究領域介紹
    史丹福大學(Stanford University),是美國的一所私立大學,其在2014年USNews最新美國大學綜合排名第5名。斯坦佛大學心理學系已經有50多年的歷史,在最新US News排名中,史丹福大學在心理學專業排名中位居第一位。該系的研究設施非常全面,心理學的研究和其他院系的關係非常密切,比如視覺,感官,記憶,語言,認知,情感,文化和社會。
  • 科學家發現聲波也有自旋
    從天體到基本粒子,自旋都是一個重要的基本物理量。對於基本粒子,攜帶半整數自旋的粒子(比如電子)是費米子,遵循泡利不相容原理;攜帶整數自旋的粒子(比如光子)是玻色子,遵循玻色-愛因斯坦分布。 我們知道,圓偏振光中有旋轉偏振現象,所以光子(亦或是光波)存在自旋。那麼聲波也有自旋嗎? 聲波是縱波,所以人們普遍認為聲波不具備自旋。但是不久前,來自美國加州大學伯克利分校、美國喬治亞理工學院以及中國同濟大學的合作研究團隊(石承志教授、趙榮闊博士、龍洋、楊隋博士、汪遠教授、陳鴻教授、任捷教授以及張翔教授)發現並通過實驗觀測證明,在特定條件下聲波自旋存在。
  • 史丹福大學科學家發現用聲音也能燒開水
    5月12日資訊,用高溫可以將水燒開是我們在日常生活中的常識,我們需要燒開的水來泡茶,泡咖啡,做湯 ,做菜,最近史丹福大學實驗室的科學家又提出了一個新的方法來燒水,這個方法就是使用聲音。史丹福大學實驗室的科學家提出通過使用一種強大聲音,迅速將水氣化,考慮水分子在加熱時趨向於以加速度運動,足夠大的聲波似乎也能夠達到同樣的效果,如果你曾經將水放到低音炮附近,你會看到水會產生非常多的波紋,這是同樣的道理。
  • 美媒:「聲音鬥篷」讓物體對聲波隱形
    在無回音的空間內,從球體和環狀鬥篷散射出的聲波會互相干涉並抵消。參考消息網4月1日報導 美媒稱,一個簡單的塑料框架首次令三維物體對聲波「隱形」。據美國《科學新聞》網站3月29日報導,杜克大學的電氣工程師史蒂文·坎默說:「這篇論文利用精心設計但又相對簡單的材料實現了簡化版的隱形。」坎默曾在2007年提出了聲音鬥篷的概念,但他並未參與此次研究。科學家們近年來讓物體隱形的工作是基於對世界的感知依賴于波的散射這一事實。人們能看到物體是因為光波射到物體上發生了散射。
  • 聲波最大速度上限算出
    科技日報記者 劉霞愛因斯坦的狹義相對論為光波的傳輸速度設定了上限:300000千米/秒,但科學家一直不清楚其「孿生兄弟」——聲波在固體或液體中傳播時是否也有速度上限。劍橋大學和高壓物理研究所的科學家在固態氫原子內發現了這一聲速上限,這一速度是聲波在鑽石(迄今已知地球上最堅固材料)內傳輸速度的兩倍左右。
  • 控制光子的全自由度,製造出時間反演光波
    物理學家們剛剛研發出一種新技術,可以反演光波的時間。不,當然不是時間機器。他們只是找到了一種方法,誘導光波回溯其路徑,並返回原點——在數學上,相當於時間反演。這有什麼意義呢?試想現在一片大霧,遠處隱隱約約有個廣告牌,但是看不清上面的內容。
  • 史丹福大學新的輻射冷卻技術 這次連電費都省了
    ­  (原標題:史丹福大學新的輻射冷卻技術 這次連電費都省了) ­  熱量傳遞是一種複雜的現象,我們身邊所有的物體都會放出熱輻射。從宏觀的角度看,這些輻射一部分會被大氣層反射和吸收,另外一部分會變成特定波長逃逸到更冷的外太空。
  • 物理學家打造出能讓光學光波實現時間逆轉的技術
    據外媒報導,就像倒著看電影一樣,物理學家剛剛展示了一種可以使光學光波實現時間逆轉的新技術。不過這並不意味著他們逆轉了時間的流動,而是他們發現了一種可以誘導光波反向沿正向路徑折回到原點的方法。這是第一次在完全控制光的所有自由度的情況下實現了光波的時間反轉。
  • 聲波最大速度上限算出
    愛因斯坦的狹義相對論為光波的傳輸速度設定了上限:300000千米/秒,但科學家一直不清楚其「孿生兄弟」——聲波在固體或液體中傳播時是否也有速度上限。  來自倫敦瑪麗皇后大學、劍橋大學和高壓物理研究所的科學家在固態氫原子內發現了這一聲速上限,這一速度是聲波在鑽石(迄今已知地球上最堅固材料)內傳輸速度的兩倍左右。
  • 聲波
    傳播介質  除了空氣,水、金屬、木頭等彈性介質也都能夠傳遞聲波,它們都是聲波的良好介質
  • 聲波可讓光纖中的光變「聽話」
    最近,美國伊利諾伊大學厄本那-香檳分校研究人員首次實驗證明了用布裡淵散射引致透明(BSIT)可以實現這種效果,BSIT效應允許光向前傳播,而向後傳播的光被強烈吸收,還可以讓光纖中的光加快、減慢甚至停止。這種非交互的性質是構建絕緣器和環形器的基本條件,也是光學設計中必不可少的工具之一。相關論文發表在最近的《自然·物理學》雜誌上。
  • 史丹福大學的新研究還提升了能量密度
    不過近日史丹福大學公布的一項技術,可以降低鋰電池起火後發生爆炸的風險,這是基於研究團隊在集電器中使用的新型聚合物材料。史丹福大學的研究團隊將其用聚合物包圍。這種聚合物使集電器的重量減輕了80%,從而使能量密度從16%提高到26%,對於電池能量密度的發展起了巨大的推動作用。