由北京智源人工智慧研究院主辦,國家天文臺、數據評測平臺biendata聯合舉辦的天體分類數據競賽於2020年1月開賽。本次比賽旨在鼓勵大眾參與到天文學的探索當中,利用最新的人工智慧算法分析望遠鏡收集到的真實科學數據。
天文學是一門古老的學科,從古至今,人類從未停止過仰望星空、探索宇宙的腳步。而隨著觀測技術的不斷發展,天文學已經進入大數據時代,天文數據正在以PB甚至EB量級的速度不斷增長。海量的數據為天文學研究帶來了機遇,也迎來了挑戰。
在天文學中,光譜描述了天體的輻射特性,以不同波長處輻射強度的分布來表示。天體的觀測光譜主要是由黑體輻射產生的連續譜、天體中元素的原子能級躍遷產生的特徵譜線(吸收線、發射線)以及噪聲組成。天文學家依據光譜的特徵譜線和物理參數就可以判定出天體的類型。
LAMOST望遠鏡又稱為郭守敬望遠鏡(大天區面積多目標光纖光譜天文望遠鏡)是一架中國天文學家發明的大視場兼備大口徑的新型光學望遠鏡。它的視場和口徑規模都居世界領先地位,焦面上的4000根光纖可以同時獲得4000個天體的光譜。LAMOST 每個觀測夜晚能採集萬餘條光譜,是世界上光譜獲取率最高的望遠鏡。LAMOST在大規模光學光譜觀測和大視場天文學研究方面,居於國際領先地位。
在目前LAMOST發布的巡天數據中,光譜主要被分為恆星、星系、類星體和未知天體四大類。 LAMOST數據集中的每一條光譜提供了3690-9100埃(1埃=0.1納米)的波長範圍內的一系列輻射強度值。光譜自動分類就是要從上千維的光譜數據中選擇和提取對分類識別最有效的特徵來構建特徵空間,例如選擇特定波長或波段上的光譜流量值等作為特徵,並運用各種算法對天體進行區分。傳統的人工或半人工的利用模板匹配的方式不能很好應對,需要高效而準確的天體光譜智能識別分類算法。
在本次大賽中,中國科學院國家天文臺提供了LAMOST DR4數據集中近100萬個天體的光譜數據,由國家天文科學數據中心基於科學發布版本製作成機器學習數據集。選手們將以LAMOST巡天光譜分類為題,利用高效、高準確率的自動化算法,將未知天體分成恆星(star)、星系(galaxy)和類星體(QSO)三類,以期用最新的人工智慧技術來解決天文研究中的實際問題。
國家天文科學數據中心常務副主任、國家天文臺中國虛擬天文臺團隊負責人崔辰州博士表示,天文大數據不斷拓展著人類對宇宙認知的邊界。作為科學數據的代表,天文數據標準化程度高、體量豐富且具有高度複雜性,是機器學習、數據挖掘等算法訓練的優質樣本。希望本次大賽能發掘出更多跨學科人才,不僅能夠推動AI行業的進步,更可以助力天文學產出更多、更好的科研成果。
【免責聲明:CSDN本欄目發布信息,目的在於傳播更多信息,豐富網絡文化,稿件僅代表作者個人觀點,與CSDN無關。其原創性以及中文陳述文字和文字內容未經本網證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本網不做任何保證或者承諾,請讀者僅作參考,並請自行核實相關內容。凡註明為其他媒體來源的信息,均為轉載自其他媒體,轉載並不代表本網贊同其觀點,也不代表本網對其真實性負責。您若對該稿件由任何懷疑或質疑,請即與CSDN聯繫,我們將迅速給您回應並做處理。】