「找到」成千上萬的候選行星,天文學家必須有能力將「真行星」與「假行星」分開。
考慮到許多天文學資料庫的規模都大得驚人,區分並不是一件簡單的事,但是,人工智慧算法給此事帶來前所未有的希望。
近日,英國華威大學的大衛·阿姆斯特朗博士(David Armstrong)領導的研究團隊開發了一項新的機器學習算法,從美國航空航天局(NASA)的陳舊數據中,識別出太陽系外的行星。他們確認了50顆系外行星的存在,從海王星大小的氣體巨行星到比地球還小的巖石世界,無所不包。
方法是,計算出每個行星的成為候選星球的概率。
歷史上天文學家一般相信在太陽系以外存在著其它行星,然而它們的普遍程度和性質則是一個謎。直至1990年代人類才首次確認系外行星的存在,而自2002年起每年都有超過20個新發現的系外行星。
許多太陽系外行星調查都通過望遠鏡中的大量數據來搜索行星在望遠鏡與恆星之間通過的跡象,這就是所謂的過境。這會導致望遠鏡探測到的恆星發出明顯的光線下降,但這也可能是由於來自背景物體的幹擾,甚至相機中的微小誤差所致。這些誤報可以在行星驗證過程中篩選出來。
華威大學(Warwick U)物理系和計算機科學系以及艾倫·圖靈學院的研究人員建立了一種基於機器學習的算法,該算法可以在NASA的克卜勒和TESS等望遠鏡任務發現的數千個候選行星的大樣本中區分出真實的行星和虛假的行星。
AI算法接受了識別真實行星的訓練,使用了兩大已確認的行星樣本和現已退役的克卜勒任務的誤報。
然後,研究人員在克卜勒尚未確認的候選行星數據集上使用了該算法,產生了50個新的確認行星,其中第一個將通過機器學習進行驗證。以前的機器學習技術只對候選行星進行排序,但從未自行確定候選行星是否是真正行星的概率,而這是行星驗證的必要步驟。
通過確認這50顆行星是真實存在的,天文學家現在可以優先利用專門的望遠鏡對它們進行進一步的觀察。
華威大學物理系的大衛·阿姆斯特朗博士說:「我們開發的算法可以讓我們挑選50個候選行星進行行星驗證,並將它們升級為真正的行星。」我們希望將這項技術應用於當前和未來的TESS和PLATO等任務中的大量候選樣本。
天文學家有兩種方法探測太陽系外的行星。一種是徑向速度方法,它用來監測恆星是否有行星引力引起的小反運動。第二種是更敏感的技術, 也是凌日系外行星巡天衛星和克卜勒採用的技術, 它主要依靠宿主星的亮度變化。
問題是,第二種方法產生了大量恆星的亮度數據,其中許多恆星不會有可見的系外行星。
於是,人工智慧上場了。
阿姆斯特朗博士的學校個人網頁上介紹:「我的興趣之一是將機器學習技術應用於天體物理學問題。與計算機科學部門合作,將最新的機器學習技術應用於太陽系外行星。」
論文中也強調:「我們的算法模型只要短短幾秒就能對數千個肉眼看不見的候選行星進行識別,確認其是否真的是行星。我們現在不僅能說哪些候選行星『更可能』是行星,而是可以用確切的數據說明這種可能性有多大:如果候選天體是『假行星』的可能性小於1%,就可以被確認為是真正的行星。」
阿姆斯特朗博士,談道:「就行星驗證而言,之前沒有人使用過機器學習技術。機器學習已經被用於對候選行星進行排名,但從來沒有在概率框架中使用過,而概率框架是你真正驗證一顆行星所需要的。我們現在可以說出精確的統計可能性,而不是說哪些候選者更有可能是行星。如果一個候選行星的假陽性概率小於1%,它就被認為是經過驗證的行星。」
華威大學的計算機科學系副主任、阿蘭·圖靈研究所(Alan Turing Institute)研究員Dr Theo Damoulas博士說
「概率統計機器學習方法,尤其適合這樣一個激動人心的問題。在天體物理學中,需要整合先驗知識-阿姆斯特朗博士等專家和量化預測的不確定性。一個典型的例子,當額外的計算複雜性的概率方法取得顯著的回報。一旦建立和訓練好,該算法比現有的技術更快,而且可以完全自動化,這使得它非常適合分析在當前調查中觀察到的潛在的數千個候選行星,比如TESS。
阿姆斯特朗博士補充說:「到目前為止,幾乎30%的已知行星僅用一種方法就被驗證了,這並不理想。僅僅因為這個原因,開發新的驗證方法是可取的。但機器學習也能讓我們做得非常快,更快地確定候選人的優先級。」
研究人員認為,它應該是未來用來驗證行星的工具之一。
根據新的研究,在所有確認的系外行星中,大約有三分之一是用單一的分析方法確認的,這並不理想。科學家們用已確認身份的系外行星數據和「假行星」的數據來訓練神經網絡(一種人工智慧算法),這樣能在新的數據中識別出那些明顯的跡象(信號)。
新技術比以前的技術更快,可以自動化,並且可以通過進一步的"訓練」加以改進效果。
阿姆斯特朗博士說:「我們仍然需要花時間訓練算法,但一旦訓練完成,在未來的候選人中應用它就會變得容易得多。你也可以結合新的發現來逐步改進它。像TESS這樣的調查預計會有成千上萬的行星候選行星,能夠一致地分析它們是很理想的。像這樣快速、自動化的系統可以讓我們用更少的步驟驗證行星,讓我們做得更有效率。」
論文《利用機器學習驗證系外行星:50顆新驗證的克卜勒行星》發表在《皇家天文學會月刊》上。阿姆斯特朗博士的研究得到了英國研究與創新部門科學技術設施委員會(STFC)通過Ernest Rutherford獎學金的支持。
GitHub上也有不少天文學軟體包,比如,allesfitter,用於對光度和RV數據進行建模。它可以容納多個系外行星,多星系統、星點、恆星耀斑和各種噪聲模型。
儘管取得了突破,該算法仍處於早期階段。但是,在陳舊數據中找到錯失的金子,提高了人類探索未知宇宙世界的效率。驗證行星的新工具問世了,新老方法共同為系外行星探索出力。
(全文結束)
《親愛的數據》出品