深度學習遇上物理學,更好地識別粒子和分析數據

2020-12-03 電子發燒友

深度學習遇上物理學,更好地識別粒子和分析數據

工程師8 發表於 2018-05-11 12:01:00

當你向Facebook上傳了一張你朋友的照片後,這張照片就進入了一個複雜的幕後處理過程。算法迅速行動並分析照片的每一個像素,直到將朋友的名字和這張照片匹配起來。這類型的前沿技術也被用在了自動駕駛汽車上,使得自動駕駛汽車能夠從背景中區分行人和其它車輛。

這項技術也可以用來區分μ介子和電子嗎?很多物理學家相信這一點。在該領域的研究人員正著手運用它來分析粒子物理數據。

支持者們希望利用深度學習節省實驗時間、金錢和人力,讓物理學家們做其它不太繁瑣的工作。另一些人希望能提高實驗的結果,相比以前使用的任何算法,這個算法能使他們更好地識別粒子和分析數據。儘管物理學家們不認為深度學習是萬能的,但一些人認為它可能在應對即將到來的數據處理危機中起到關鍵作用。

神經網絡

直至今日,計算機科學家們仍經常人工編寫算法,一個任務往往需要無數個小時的複雜計算機語言工作。「我們仍然做著不錯的科學工作,」費米國立加速器實驗室的科學家Gabe Perdue說,「但是我認為科學工作還可以做得更好。」

而如果要使用深度學習,我們則需要一種不同的人類輸入。

一種實現深度學習的方法是使用卷積神經網絡(CNN)。CNN是模擬人類視覺感知建模的。人類用自身的神經元網絡處理圖像;CNN通過輸入層節點(node)來處理圖像。人們通過向網絡送入預處理的圖像來訓練CNN。通過學習這些輸入,算法會不斷調整各節點的權重並因此學會識別模式和相關點。由於算法不斷修正這些權重,預測結果會變得越來越準確,甚至超越人類。

卷積神經網絡以通過將多個權重綁在一起的方式來縮短分解數據處理的步驟,這意味著必須調整的算法元素更少。

CNN出現於90年代末。但是近年來隨著許多方面的突破(如處理圖形的硬體價格降低、訓練數據集不斷擴增以及CNN架構本身的創新),越來越多的研究人員開始使用它們。

CNN的發展導致語音識別、翻譯以及其它傳統上由人類完成的任務的進步。一家Alphabet(谷歌母公司)旗下位於倫敦的公司DeepMind使用CNN創建了AlphaGo,這個電腦程式在3月份打敗了世界排名第二的圍棋選手,圍棋是比西洋棋更複雜的策略棋盤遊戲。

CNN使得我們可以更從容地處理大量的基於圖像的數據,而之前我們對這些數據束手無策——高能物理學中經常會碰到這種圖像數據。

進入物理學領域

隨著大數據和具有處理大量信息所必需的計算能力的圖形處理單元(GPU)的出現,CNN在2006年開始得到大規模運用。Perdue說:「從那之後,精確度有了很大的提高,人們也還一直在繼續高速地創新。」

大約一年前,各類高能物理實驗的研究人員開始考慮將CNN引入他們的實驗的可能性。「我們把物理問題變成了:『我們能否分辨一輛自行車和汽車?』」SLAC國家加速器實驗室研究員Michael Kagan說,「我們只想弄清楚如何以正確的方式重組問題。」

在大多數情況下,CNN將用於粒子識別和分類以及粒子軌跡重建。一些實驗已經使用CNN來分析粒子的相互作用,其準確性很高。例如,NOvA中微子實驗的研究人員已經將CNN應用到了其數據上。

「CNN 本來是用於識別動物和人的圖片,但它也能很好的用於物理領域的識別,」費米實驗室科學家Alex Himmel 說,「預測結果非常好——相當於我們的檢測器多產生了30% 的數據。」

從事大型強子對撞機(LHC/Large Hadron Collider)實驗的科學家們希望藉助深度學習來使他們的實驗更自動化,CERN 物理學家Maurizio Pierini 說:「我們正試圖在一些任務上取代人。用人來看管比用計算機看管要昂貴得多。」

在檢測器物理學以外,CNN 也被證明是有用的。在天體物理學方面,一些科學家正在開發可以發現新的引力透鏡的CNN;引力透鏡是指可以扭曲來自它們後面的遙遠星系的光的大型天體(如星系團(galaxy clusters))。對望遠鏡數據掃描以尋找引力透鏡扭曲現象的過程是非常耗時的,並且普通的模式識別程序難以區分它們的特徵。

「公平地說,在使用這些工具時,我們僅僅涉及了很淺的部分,」在費米實驗室的NOvA 實驗項目工作的威廉瑪麗學院博士後研究員Alex Radovic 說。

未來的數據盛宴

一些科學家認為神經網絡可以幫助應對他們預見的即將到來的數據處理危機。

計劃於2025年推出的升級版大型強子對撞機將產生大約10倍的數據。暗能量光譜儀(Dark Energy Spectroscopic Instrument)將收集大約3500萬個宇宙物體的數據,大型綜合巡天望遠鏡(Large Synoptic Survey Telescope)將捕獲近400億個星系的高解析度視頻。

數據量一定會飛速增長,但從前計算機晶片處理能力的指數級增長預計將會陷入停頓。這意味著處理更大量的數據將越來越昂貴。

「對於10倍的碰撞次數,你可能需要超過100倍的處理能力,」Pierini 說。「用傳統的做事方式,我們會走入死胡同。」

然而,並不是所有的實驗都適用於該技術。

「我認為有時這會是正確的工具,但它不會一直是正確的,」Himmel 說,「數據與自然圖像越不相似,神經網絡的有用性越低。」

大多數物理學家都同意,CNN 不適合剛剛啟動的實驗中的數據分析,因為神經網絡對於計算過程不是很透明。「這會很難說服人們相信他們已經發現了新的東西,」Pierini 說,「我認為用紙和筆做事情仍然是有價值的。」

在某些情況下,運用CNN 的挑戰將超過獲益。例如,如果數據尚未轉換為圖像格式,則需要將其轉換為圖像格式。並且神經網絡需要大量的數據用於訓練——有時不得不模擬數百萬的圖像。即使這樣,模擬也不如真實數據那麼好。因此,神經網絡必須用實際數據和其它交叉檢查進行測試。

「一個高標準的物理學家能夠接受任何新事物,」德克薩斯大學阿靈頓分校的物理學副教授Amir Farbin 說,「需要跨越很多障礙去說服大家這是對的。」

展望未來

對於那些相信CNN 結果的人,CNN 意味著更快的物理學和值得期待的未知。

一些人希望用神經網絡來檢測數據中的異常,這可以指示檢測器中的缺陷或者為新發現指引線索。為了尋找新發現,研究人員可以只是讓 CNN 遍歷數據並試圖找到突出點,而不是一定要找到具有特定標誌的新事物。「不必指定要搜索的新物理的領域,」Pierini 說,「這裡獲取數據的方式更開放。」

日後,研究人員甚至可能開始採用無監督學習來處理物理數據。無監督學習,顧名思義,是指可以無需人工指導就訓練大量數據的算法。科學家可以傳輸給該算法相應的數據,然後該算法就能從中得出結論。

「如果你足夠聰明,你可以使用它來做所有類型的事情,」Perdue 說,「如果它能夠推斷新的自然規律或類似定律,這將是驚人的。」

「但是,」他補充道,「那樣的話,我也要去尋找新的工作了。」

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 物理學對於深度學習可解釋性的啟發
    語音識別、自動駕駛、機器翻譯和視覺對象識別等領域的深度學習已經系統地改進了現有技術的狀態。然而,使深度神經網絡(DNN)如此強大的原因只是啟發式理解 ,即我們只從經驗中知道我們可以通過使用大型數據集並遵循特定的訓練來獲得優異的結果。
  • 深度學習和拓撲數據分析的六大驚人之舉
    將深度學習與拓撲數據分析結合在一起完全能夠達到此目的,並且還綽綽有餘。1、它能在幾分鐘內創建一張數據圖,其中每一個點都是一個數據項或一組類似的數據項。基於數據項的相關性和學習模式,系統將類似的數據項組合在一起。這將使數據有唯一的表示方式,並且會讓你更清晰地洞察數據。可視化圖中的節點由一個或多個數據點構成,而點與點之間的連結則代表數據項之間高相似性。
  • 量子計算符合粒子物理學的LHC數據分析
    豐富的數據:對大型強子對撞機質子-質子碰撞中產生希格斯玻色子時產生的粒子軌跡的模擬。(由CERN提供)一項國際合作正在探索如何使用量子計算來分析CERN 的大型強子對撞機(LHC)上的實驗所產生的大量數據。
  • 量子計算符合粒子物理學的LHC數據分析
    (由CERN提供)一項國際合作正在探索如何使用量子計算來分析CERN 的大型強子對撞機(LHC)上的實驗所產生的大量數據。研究人員表明,「量子支持向量機」可以幫助物理學家從CERN產生的大量信息中理解。在LHC上進行的實驗可以從每秒約10億個粒子碰撞中產生驚人的每秒PB的數據。由於實驗只能專注於碰撞事件的子集,因此必須丟棄其中的許多數據。
  • 物理學-宇宙的粒子深度
    按照近代物理學的觀點,真空不是虛空,而是量子場系統的基態,具有複雜的結構。處於基態的量子場在不斷地振動,具有零點振動能,且具有相互作用(包括自作用),真空中各種量子場不斷地有各種虛粒子在產生、消失和轉化。在某種意義上真空像是介質,類似於電磁學中電場對電介質的極化、真空與外電磁場的相互作用產生真空極化。真空極化反過來會影響粒子的性質,導致可觀測的後果。
  • 深度學習技術和卷積神經網絡(CNN)讓機器視覺識別更智能
    所以機器視覺軟體已經達到了非常高的精準識別率,因此,被廣泛應用於故障檢測、工件定位和機器人對象的自動處理。分析和評估大數據深度學習是機器學習的一個領域,使計算機能通過架構如卷積神經網絡(CNN)學習。AI的特殊屬性、機器學習和深度學習技術,全面分析和評估大量數據(大數據),從而能更有效的區分對象,區分圖像檢測中的良品跟不良品。這些數據圖像的來源可以是數字圖像信息以及從高速傳感器、掃描儀、攝像機等快速傳遞的圖像。
  • 圖像識別中的深度學習【香港中文大學王曉剛】
    深度學習可以從大數據中自動學習特徵的表示,可以包含成千上萬的參數。  採用手工設計出有效的特徵往往需要五到十年時間,而深度學習可以針對新的應用從訓練數據中很快學習到新的有效的特徵表示。  一個模式識別系統包括特徵和分類器兩部分。在傳統方法中,特徵和分類器的優化是分開的。而在神經網絡的框架下,特徵表示和分類器是聯合優化的,可以最大程度地發揮二者聯合協作的性能。
  • 普林、DeepMind新研究:結合深度學習和符號回歸,從深度模型中看見...
    符號模型緊湊,具備可解釋性和良好的泛化能力,但很難處理高維機器學習問題;深度模型擅長在高維空間中學習,但泛化性和可解釋性卻很差。那麼有沒有什麼辦法可以取二者之所長呢?這項研究做到了。如何將深度模型轉換為符號方程?來自普林斯頓、DeepMind 等機構的研究人員提出了一種解決方案:結合深度學習和符號回歸實現這一目標。
  • 「幾何深度學習」受愛因斯坦啟示:讓AI擺脫平面看到更高的維度
    紐約大學物理學家凱爾·克蘭默(Kyle Cranmer)說:「他們希望將這種思想其、引入神經網絡,要將機器學習應用於粒子物理學數據上,而且成功實現了。」以這種方式更改「滑塊」過濾器的屬性,可以讓CNN能夠更好地「理解」某些幾何關係。比如可以自動識別出彎成兩個不同姿勢的3D形狀(一個站直的人,和一個抬起一條腿的人)是同一類對象實例,而不是兩個完全不同的對象。這一變化讓神經網絡的學習效率大大提高。
  • 基於深度學習的人臉識別技術全解
    、處理、分析和學習能力,以便使計算機和機器人系統具有智能化的視覺功能。 2014年:2014 年前後,隨著大數據和深度學習的發展,神經網絡重受矚目,並在圖像分類、手寫體識別、語音識別等應用中獲得了遠超經典方法的結果。香港中文大學的 Sun Yi 等人提出將卷積神經網絡應用到人臉識別上,採用 20 萬訓練數據,在 LFW 上第一次得到超過人類水平的識別精度,這是人臉識別發展歷史上的一座裡程碑。
  • 超全深度學習細粒度圖像分析:項目、綜述、教程一網打盡
    由細粒度特性造成的類間(inter-class)小變化和類內(intra-class)大變化使得這一問題具有極大的挑戰性。由於深度學習的蓬勃發展,近年來應用了深度學習的 FGIA 取得了顯著的進步。本文系統地對基於深度學習的 FGIA 技術進行了綜述。具體來說,本文將針對 FGIA 技術的研究分為三大類:細粒度圖像識別、細粒度圖像檢索和細粒度圖像生成。
  • 深度學習與圖像識別 圖像檢測
    來源:http://blog.csdn.net/omenglishuixiang1234/article/details/53305842  點擊閱讀原文直接進入主要做了基於深度學習的圖像識別與檢測的研究,下面是一些整理內容1、深度學習的優勢(1)從統計,計算的角度看,DL
  • 深度學習和經驗主義的勝利
    現在深度學習在許多監督式機器學習的任務中扮演著領頭羊的角色。也可以這樣認為,在近幾十年中,深度學習已經產生了最實用的非監督式機器學習算法。興奮之餘,這也引發了一系列的研究和聳人聽聞的新聞頭條。雖然我警惕這些炒作,但是我也發現了令人興奮的技術,並且最近加入了一個社團,針對回歸神經網絡序列學習發表了 一篇30頁的關鍵評語。
  • 機器學習和深度學習最佳作品
    來源:CPDA數據分析師網 機器學習算法的超參數優化:理論與實踐 機器學習算法已廣泛應用於各種應用程式和領域,為了使機器學習模型適應不同的問題,必須調整其超參數,為機器學習模型選擇最佳的超參數配置會直接影響模型的性能,它通常需要對機器學習算法和適當的超參數優化技術有深入的了解
  • 基於深度學習的物候學識別
    點擊藍色字免費訂閱,每天收到這樣的好資訊本文闡述了基於深度學習的物候學識別,植物表型資訊簡介如下:自動化精準植物表型分析是農業技術和作物檢測必不可少的環節。由於環境變化對植物生長影響較大,因此,在增加作物品質和提高作物產量方面,物候學的精確監控可為其提供一些指導信息。隨著計算機視覺技術和網絡通訊系統的進步和發展,人們對精準農業的認識也在發生變化。研究人員利用農業監測網絡地面站的傳感器收集大量信息,通過將這些高質量的信息與現代圖像處理算法相結合,可逐步增加表型分析在農業上的應用潛力。
  • 深度學習與統計力學(I) :深度學習中的基礎理論問題
    我們回顧了最近的工作,其中的物理分析方法植根於統計力學已經開始提供這些問題的概念見解。這些見解產生了深度學習與各種物理和數學主題之間的聯繫,包括隨機曲面、自旋玻璃、幹擾、動態相變、混沌、黎曼幾何、隨機矩陣理論、自由概率和非平衡統計力學。
  • 量子物理學機器學習:讓人工智慧學習與運用量子力學
    在剛出版的《 自然通訊 》上,發表了一篇科技論文,題為:「將機器學習和量子化學與分子波函數的深度神經網絡統一起來」,科學家們讓人工智慧學習與運用量子力學。在當代醫學和工業應用中的新型專用分子的化學計算設計過程中,需要求解一些方程。
  • 普林,DeepMind新研究:結合深度學習符號回歸,深度模型中看見宇宙
    在機器學習領域,人們通過遺傳算法學習符號模型。這種方法無法針對輸入特徵的數量進行很好地縮放。但深度神經網絡可以高效學習高維空間中的模式。那麼,問題來了,我們可以兼二者之所長嗎?來自普林斯頓大學和 DeepMind 等機構的研究者提出了一種通用方法,通過引入強歸納偏置來提取深度模型的符號表示。
  • 前沿研究丨深度學習在醫學超聲圖像分析中的應用
    中國工程院院刊《Engineering》刊發《深度學習在醫學超聲圖像分析中的應用綜述》一文,旨在全面而系統地總結深度學習在醫學超聲圖像分析中的應用,主要是在典型的任務及其在不同解剖結構中的應用。到目前為止,在網絡結構或者模型方面,深度學習獲得了快速的發展,如更深的網絡結構與深度產生式模型。同時,深度學習也成功應用於各種研究領域,如CV、自然語言處理(NLP)、語音識別以及醫學圖像分析,因此表明深度學習能夠在各種自動分析任務中獲得顯著的性能改善,並能取得最優的性能表現。
  • .| 深度學習理論與實戰:提高篇(5)——深度學習在語音識別中的應用
    編者按:本文節選自《深度學習理論與實戰:提高篇 》一書,原文連結http://fancyerii.github.io/2019/03/14/dl-book/。作者李理,環信人工智慧研發中心vp,有十多年自然語言處理和人工智慧研發經驗,主持研發過多款智能硬體的問答和對話系統,負責環信中文語義分析開放平臺和環信智慧機器人的設計與研發。以下為正文。提起深度學習的再次興起,大家首先可能會想到2012年AlexNet在圖像分類上的突破,但是最早深度學習的大規模應用發生在語音識別領域。