深度高能粒子對撞追蹤:Kaggle TrackML粒子追蹤挑戰賽亞軍訪談

2020-12-25 雷鋒網

雷鋒網 AI 科技評論按: Kaggle TravML 粒子追蹤挑戰賽的頒獎儀式即將在 NIPS 2018 大會上進行。這個比賽不僅是機器學習助力其它領域科學研究的經典案例,而且來自中國臺灣的 Pei-Lien Chou 也獲得了挑戰賽的第二名。

TrackML 粒子追蹤挑戰賽介紹

為了探索我們的宇宙是由什麼構成的,歐洲核子研究中心的科學家們正在碰撞質子,本質上就是重現了小型大爆炸,並且用複雜的矽探測器仔細觀察這些碰撞。

 

雖然編排碰撞和觀測已經是一項巨大的科學成就,但是分析由實驗產生的大量數據正成為一個最為嚴峻的挑戰。

實驗的速率已經達到了每秒數億次的碰撞,這意味著物理學家必須每年對數十千兆字節的數據進行篩選。而且,隨著探測器解析度的提高,需要更好的軟體來實時預處理和過濾最有用的數據,從而產生更多的數據。

為了幫忙解決這個問題,一個在 CGRN(世界上最大的高能物理實驗室)工作,由機器學習專家和物理學家組成的小組,已經與 kaggle 和著名的贊助商合作來回答這個問題:機器學習能幫助高能物理學發現並描述新粒子嗎?

具體來說,在這次競賽中,參賽者們面臨著一個挑戰,那就是建立一個算法,它需要能夠從矽探測器上留下的 3D 點快速重建粒子軌跡。這一挑戰包括兩個階段:

●在 kaggle 上的調整精確度的階段是從 2018 年 5 月到 2018 年 8 月 13 號(獲獎者將在 9 月底公布)。在這一階段,主辦方只關注最高分數,而不會管得到這個分數需要運行的時間。這個階段是一個正式的 IEEE WCCI 競賽(會議地址在裡約熱內盧, 2018 年 7 月舉辦)。

●生產階段將在 2018 年 9 月開始,參與者將提交他們的軟體,由平臺進行評估。激勵取決於系統達到良好的分數時,評估的吞吐量(或速度)。這個階段是一個官方的 NIPS 競賽(會議地址在蒙特婁,2018 年十二月舉辦)。

在 Kaggle 比賽官方頁面(https://sites.google.com/site/trackmlparticle/)上可以獲得精確度調整階段的所有必要信息。

挑戰賽亞軍 Pei-Lien Chou 訪談

Pei-Lien Chou 是 TrackML 粒子追蹤挑戰賽亞軍。他帶領了一隻研究用深度學習方法解決圖像相關問題的團隊參加了這次比賽。Pei-Lien Chou 在視頻監控領域有 12 年經驗。他在國立臺灣大學讀取了數學學士學位,並在中國臺灣國立清華大學攻讀了語音信號處理的碩士學位。

在這次競賽中,kaggle 參賽者被要求建立一個算法,這種算法能夠快速地從矽探測器上留下的3D點重建粒子軌跡。 這是這個比賽兩階段挑戰的一部分。在 2018 年 5 月至 8 月 13 日的精確度調整階段,只關注最高分數,而不考慮評估需要的運行時間。第二階段是正式的NIPS競賽,這個階段重點關注準確性和算法速度之間的平衡。

比賽結果出爐後,Kaggle Team 與 Pei-Lien Chou 進行了訪談,雷鋒網編輯整理如下。

基礎知識

在參加這次比賽前,你的背景是什麼?

我擁有數學學士學位和電子工程碩士學位。從去年開始,我就一直是以基於圖像的深度學習的工程師。  

你是如何開始在kaggle上參加比賽的?

大約 1.5 年前,我加入了 Kaggle 來練習深度學習,這對我的工作幫助很大。我在第一次比賽中就進入了前 1%,在接下來的下一次比賽中就贏了。參加 kaggle 比賽真令人興奮。

是什麼促使你參加這次比賽的?

起初我沒有注意到這次比賽,因為它不是基於圖像的,儘管我在這次比賽中嘗試了一些點雲方法。但當我意識到組織者是歐洲核子研究中心(CERN),也就是製造黑洞的那些人時,我毫不猶豫地加入了。

有關技術

你的方法是什麼?

我的方法是從一個簡單的想法開始的。我想建立一個模型,這個模型可以把每個事件的所有軌道(模型輸出)映射到檢測器中(模型輸入),就和我們使用 DL 解決其他問題的方法一樣。

如果一次事件有 N 個命中(通常 N 在 100k 左右),則輸出可以很容易地用 NxN 矩陣表示,如果 i 和 j 在同一軌道上,則 Mij=1,否則為 0 。但是模型太大了,所以我把它分成了最小的單元:輸入兩個點擊並輸出它們的關係(如圖 1 )。和真實的只連接相鄰的點的「連接點」遊戲不一樣,為了穩健性,我連接了所有屬同一軌道的點。此時,我已經準備好了參加這次比賽。

你是怎麼做的?

首先,我使用命中位置(x,y,z)作為輸入,通過 10 個項目的訓練,很容易獲得 99% 的準確率。但我很快發現這並不足以重建軌道。問題是,即便誤差率 0.01,對於給定的命中,負對數目可以達到 0.01*100k = 1000,而實際的負對數目在 10 左右(軌道的真實平均長度)。但是為了得分,我們需要真實的數據和模型有超過 50% 的部分是重疊的。

接下來怎麼做?

我第一次在自己的計算機上嘗試運行的時候就得到了 0.2 的得分,這與當時的公共內核相同。我猜也許我做到 0.6 就能贏,並且希望通過我的方法可以做到。天曉得!

你是如何得到更好的預測結果的?

我嘗試了很多方法,並且我的進步大大超出了我的預期。

●採用更大的模型,更多的訓練數據。

具有 4k-2k-2k-2k-2k-1k 神經元的 5 個隱層 MLP,總共訓練 3 組,5310 次事件,大約 24 億個正例對和更多的負例對。

●選取更好的特徵

一對 27 個特徵:x,y,z,count(cell),sum(cell.value),兩個單位向量來自神經單元,用於估計命中方向和訓練時的隨機反轉(如圖2),並且假設兩個擊中是線性的或螺旋形的 (0,0,z0),用前兩個估計向量和曲線的切線計算 abs(cos()),並且最後一個是 z0。

 

 ●更好的負樣本

多對接近正例對的負例對進行採樣(也就是重點提高模型分辨相近的正例負例的能力),並且我做了一些很難負例的挖掘。

最後,在 0.97TPR 下,對於給定的命中,我平均得到了 80 個負對,並且只有 6 個假陽性對的概率大於真陽性對的平均值。並且只有 6 個負對的概率大於正對的平均值。

你是如何重建軌跡的?

到目前為止,我有一個不太精確的 NxN 關係矩陣,但如果我把它們全部用上,就可以得到很好的軌跡。

重建:找到 N 個軌跡

1. 以一次撞擊作為種子(例如第 i 次命中),找到最高概率(這個概率大於閾值)對 P(i,j),然後將第 j 次撞擊添加到軌道。

2. 求最大值 P(i,k)+P(j,k),如果兩對概率大於閾值,則將第 k 次撞擊添加到軌道 。

3. 測試新的命中,看看它是否和 x-y 平面上的圓匹配,圓是有兩三次命中的軌跡後面的圓。(這句話也不是很懂)(沒有這一步,我只能得到0.8分)。在軌跡有兩次或者三次撞擊後,根據現有的命中在 x-y 平面中組成一個圓,然後看新一次的撞擊是否在這個圓內

4. 找到下一個撞擊,直到沒有更多的撞擊符合這個圓。

5. 循環步驟1用於所有 n 次撞擊(如圖 3)。

合併擴展

1. 計算所有軌道的相似度作為軌道的質量,這意味著在軌道中,如果所有撞擊(作為種子)對應的軌道相同,則軌道的合併優先級較高。(圖 6)  

2. 首先選擇高優先級軌跡,然後通過放鬆重構步驟中的約束條件對其進行擴展。

3. 循環

其它的工作

我最後添加了 z 軸約束和兩個模型的集成,得到了 0.003 改進。

我還嘗試應用 PointNet 在預測的樣本中找到軌跡並細化跟蹤。這兩種方法都表現良好,但沒有更好。

 

圖 3:用 6 個命中重建一次事件的例子

 

圖 6:合併優先級確定的一個實例

 

                       圖 4:x-y 平面上的種子(大圓)及其對應的候選(匹配顏色)。很明顯種子是在一條軌道上的。

 

                                        圖 5:每個命中的直徑與九個真命中(紅色)的預測概率之和成正比。

這裡是一個參考的內核。

我把這個過程稱為無止境的循環,這離我原來的想法很遠。儘管如此,當我的準確率超過 0.9 的時候,我還是很高興。

訓練和預測獲勝方案的運行時間是多少?

你知道,我的訓練數據有 5k 個事件,而且我還要做難的負例的挖掘。對於每個測試事件,我必須預測 100k*100k 對,重建 100k 軌道(實際上在獲勝解決方案中是 800k+),合併它們並擴展到 10k 軌道。所以運行時間是天文數字。在一臺計算機上再做一次這項工作可能需要幾個月的時間。

賽後感想

DL 適合這個主題嗎?

在我看來,這取決於目標能否被很好的描述。如果目標可以被描述,那麼基於規則的方法應該更好。換句話說,在這種競賽中,使用聚類的方法就可以得到0.8的準確率,所以用深度學習來做簡直是自找麻煩。但是這依然是有趣的。

對於剛剛開始從事數據科學的人,你有什麼建議嗎?

你如果還沒有加入 Kaggle,那一秒鐘都不要耽擱,現在就加入吧!

雷鋒網(公眾號:雷鋒網) AI 科技評論整理。

雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 粒子對撞機歷史回顧與展望 | 「小粒子 大宇宙」科學公開課
    歡迎來到「小粒子 大宇宙」系列課程。這裡是中國科學院高能物理研究所。我是高傑。今天我們講的這一堂課,題目是《粒子對撞機歷史回顧與展望》。大家知道宇宙的構成有三大部分,它是由物質、暗物質和暗能量構成。其中物質大約佔百分之五,暗物質佔百分之二十幾,還有接近百分之七十是暗能量。那麼物質的構成,大家都知道,分子,比如像水分子,它是由氫和氧構成的。
  • 2013諾貝爾物理學獎深度解讀:希格斯粒子,賦予其他所有粒子以質量
    幸運的是,標準模型預言出了我們需要知道的、有關希格斯玻色子的一切——除了它確切的質量。對於每一個可能的質量,我們能夠預言大型強子對撞機(LHC)中能夠產生的希格斯粒子的數量,並且預言它們會衰變成什麼。例如,希格斯粒子有時應該會衰變成一對高能光子。由於粒子衰變時動量守恆,這兩個光子的動量就可以換算為產生這兩個光子的粒子的質量。
  • 胡震:傾心物理 擁抱粒子
    都說興趣是最好的老師,胡震在這位「最好老師」的帶領下,順利完成了大學學業,並於2007年憑藉優異成績被保送到北京大學物理學院繼續學習粒子物理。來到北京大學以後,胡震再一次被物理的神奇所震撼,在高能實驗組負責人冒亞軍教授、導師錢思進教授等老師和同學的指導幫助下,做出了多項突出貢獻。
  • 粒子物理的統一夢
    人們利用粒子加速器發現了絕大部分新的超鈾元素,合成了上千種新的人工放射性核素,還發現了包括重子、介子、輕子和各種共振態粒子在內的幾百種新粒子。之後,人們又採取將兩束粒子對撞的方法。顯而易見,這樣比只加速一束粒子能夠得到更大的能量。
  • 希格斯粒子與環形正負電子對撞機
    這個類比形象地說明了沒有質量的基本粒子是如何通過與希格斯場的相互作用而獲得質量的。  4希格斯粒子為什麼如此難以捕獲?  希格斯粒子作為質量之源,在137億年前的宇宙大爆炸初始就已經完成了它的使命。現在,物理學家要再次捕獲希格斯粒子的蹤跡,就只有建造高能對撞機,通過高能粒子的對撞,來模擬宇宙起源的時刻,「復活」希格斯粒子。
  • 北京正負電子對撞機國家實驗室 探尋粒子的奇妙世界
    (資料圖片)在高能物理研究領域,BEPC是陶—粲物理能區最先進的正負電子對撞機,實時觀測基本粒子對撞產生的「碎片」,研究、探索粒子的性質和相互作用規律,發現新粒子。球拍的頂端是對撞機的心臟部位——北京譜儀,在這裡,正負電子束流按相反的方向以每秒125萬圈的速度狂奔,並聚焦到大小只有頭髮絲十分之一左右的空間內對撞,巨型機器猶如幾萬隻眼睛,實時觀測基本粒子對撞產生的「碎片」——次級粒子,並記錄相關數據。對這些數據進一步分析、研究,探索這些粒子的性質和相互作用規律,便有可能觀測到新現象和發現新粒子。
  • 粒子對撞機到底是啥?有什麼用?
    比如著名數學家、菲爾茲獎獲得者丘成桐和高能所所長王貽芳就主張中國建造,而諾貝爾物理學獎獲得者楊振寧卻持有相反的態度。先不管到底誰的見解更有道理,我們先來看看到底粒子對撞機是何方神聖?它又對人類未來的發展到底有什麼作用?通俗來說,粒子對撞機不過一種設計為高能粒子相互碰撞的機器。
  • 舉世矚目的粒子對撞機,原來是在擲骰子?
    這無形中給了人們一種印象,LHC是通過把粒子砸碎來查看它們的成分。但其實這並非LHC真正的意義,LHC真正做的,是用能量製造粒子。大致的原理是把兩個粒子加速到接近光速,高速意味著高能(動能)。當這些高能粒子碰撞在一起,它們攜帶的能量會轉化成質量(著名的愛因斯坦方程:E=mc2 )。
  • 來自海山二雙星系統的高能粒子如何產生「星風」
    來自海山二雙星系統的高能粒子如何產生「星風」▲19世紀40年代,海山二(Eta Carinae)的恆星大爆發產生了波濤洶湧的侏儒星雲(Homunculus Nebula)。該照片由哈勃望遠鏡拍攝。據《自然·航空學》(Nature Aeronautics)雜誌7月2日刊發的一篇研究論文稱,美國科學家利用國家航空航天局(NASA)的核光譜望遠鏡陣列(Nuclear Spectroscopic Telescope Array,簡稱「核星(NuSTAR)」)進行的一項最新研究表明,在離地球一萬光年距離之內,亮度最大且質量最大的恆星系統海山二(Eta Carinae)正在將粒子加速到高能狀態
  • 超級粒子加速器,模擬展現了這罕見一幕
    他們希望借鑑於粒子加速的原理,在旋轉的黑洞能量中,讓一些接近光速的等離子體,在對撞的過程中,獲得逃離黑洞的機會,並從黑洞強大的引力場中竊取能量! 逃離黑洞,這並非僅屬科幻小說裡的橋段。在物理學家的眼裡,這一個新見解,至少在理論是存在合理的邏輯的,更並非不可現之事!他們認為訣竅在於如何巧妙、仔細地安排好一切,這樣粒子就不會永遠消失在貪得無厭的黑洞中。
  • 210億歐元建更強粒子對撞機,為何楊振寧極力反對中國建對撞機?
    在探尋「上帝粒子」和暗物質的路上,歐洲又往前走了一步。6月19日,歐洲核子研究組織全票通過《2020歐洲粒子物理戰略》,決定最高優先等級就是研究希格斯玻色子(即「上帝粒子」)和推動高能物理學。故歐洲核子研究中心通過決策,計劃建造耗資210億歐元的高能物理實驗機──未來環形對撞機(Future Circular Collider,FCC)。這是一項長期計劃。2013年《歐洲粒子物理戰略》更新時,就開始進行概念設計研究,打算建造一臺比LHC能量更高的環狀對撞機。
  • Y3T35 光子叫γ粒子,什麼是α粒子、β粒子和γ粒子
    從能量源,以電磁波或者粒子的形式向外發射能量。光子就是其中一種粒子,叫γ粒子,其他也有α、β粒子今天聊聊這是啥氦原子長這個樣,倆中子倆質子倆電子氦原子剝離了電子之後,只剩原子核,有倆質子帶正電,是一種高能粒子,叫α粒子。
  • 粒子很小,粒子對撞機為什麼要特別巨大?
    粒子物理學(高能物理學)是研究粒子的結構以及粒子間相互作用的一個物理學分支,這是非常基礎的研究。研究粒子的結構及相互作用往往需要把粒子打開,打開的方法是讓高速的粒子撞擊物體或讓兩個高速的粒子迎頭相撞。要使粒子獲得較大的速度或能量主要要兩種方法,一是靠天吃飯,獲取來自宇宙中的高能粒子;二是自己動手解決溫飽,用粒子加速器對粒子進行加速。對撞機是目前非常重要的粒子加速器,是將兩束粒子加速到非常高的能量後使粒子迎頭相撞。對撞機主要分兩種,一種是正反粒子對撞機;另一種是直線對撞機。不論是哪種對撞機,目前只有建造得足夠大才有希望做出比較有價值的成果。
  • 花210億歐元建更大的粒子對撞機,歐洲為什麼要做這事?
    為此,歐洲核子研究中心通過了一項決策,計劃建造一臺耗資 210 億歐元的高能物理實驗機器——未來環形對撞機(Future Circular Collider,FCC)。這是一項長期計劃。2013 年《歐洲粒子物理戰略》更新時,就開始進行概念設計研究,打算建造一臺比 LHC 能量更高的環形對撞機。
  • 為什麼楊振寧要反對我國建造大型粒子對撞機?原來是時機未到
    可是要研究探索微觀世界,卻沒有我們想像的那麼容易,原因就是微觀粒子普通的手段很難進行觀測,而有一些粒子更是隱藏得非常深,比如反物質粒子,這些隱藏起來的粒子,我們想要發現它們,更是需要一種強大的手段。這個時候,科學家想到了粒子對撞機,我們都知道,粒子的速度能夠無限接近光速,如果讓粒子在接近光速的速度下進行對撞,往往就會發生很多不可思議的現象。
  • 【科學種子科技英語】量子基本粒子的「秘密」運動軌跡
    Ina theoretical paper published in the journal PhysicalReview A, they have shown that the way that particles interact withtheir environment can be used to track quantum
  • 揭開「上帝粒子」之謎 數據顯示其的確存在(圖)
    探測器中顯示的粒子對撞後形成新粒子的運動軌跡圖片。新華社發  一些美國物理學家說,「有力數據」顯示,「上帝粒子」希格斯玻色子的確存在。  這些學者說,物理學界定新發現的標準非常嚴格,當前的數據難以作為證實希格斯玻色子存在的憑證。但他們相信,數十年的「上帝粒子」追逐記即將劇終。
  • 走近粒子加速器
    粒子加速器全名為「荷電粒子加速器」,是一種可以使帶電粒子在高真空環境中受磁場力控制、電場力加速而達到高能量的特種電磁、高真空裝置,也是為人類提供各種能量的粒子束或輻射線,如電子、質子、氘核、α粒子、各種重離子以及其他一些微觀粒子的現代化裝備。
  • 十個問題帶你認識粒子物理學
    △ 大統一理論:三種基本力在高能下會統一在一起。在高能下,電磁力和弱核力的確已經被統一成電弱力。一些物理學家認為,在更高的能量下——遠遠超越了我們目前在實驗所能達到的能量——強核力、弱核力和電磁力會統一成一個「大統一」的力。這樣的一個理論被稱為「大統一理論」(GUT)。有許多物理學家也經常隨意地使用「基本力」和「基本相互作用」。
  • 粒子加速器的工作原理是怎樣的?帶電粒子的速度極限是多少?
    那我們是怎樣通過加速器加速粒子的?粒子加速器是怎樣加速粒子的?如果你把一個帶電粒子放在電場中,帶電粒子會受到力的作用並加速。帶正電荷的粒子加速的方向與電場相同,帶負電荷的粒子受到的力與正電荷相同,但方向相反。 帶電粒子一旦運動,也會對磁場做出反應。