大數據應用在商業市場往往被廣泛關注,近幾年更是蜂擁而入,畢竟是個「賺錢的生意」,人人都想要的香餑餑。而不賺錢卻有價值的大數據領域,也有一群人在默默研究,天文大數據就屬於這個範疇。
12月11日,由中關村大數據產業聯盟、北京大數據研究院主辦的第七屆中關村大數據日——「大數據應用與治理」主題高峰會議在中關村國家自主創新示範區會議中心舉行。本文內容由雷鋒網整理自中國科學院國家天文臺研究員崔辰州的演講——《天文大數據研究動態》,天文學不僅僅是你我看到的宇宙星辰,還有這些大數據研究人員背後的情懷與堅持。雷鋒網做了不改變原意的編輯整理,將內容分享在這裡,希望對你有所啟發。
以下是崔辰州主任演講全文整理:
天文學跟賺錢沒有太大關係,跟國際形勢也沒有太大關係,更多的是一個情懷。我用十分鐘的時間讓大家放鬆一下,分享天文學給大家帶來的樂趣。
我先用一個大家比較熟悉的一個畫面來開場,大家都知道這是什麼吧?(下圖)
不錯,這就是我們國家天文臺的南仁東研究員團隊,花了20多年時間,鑄造的「中國天眼」,就是FAST。2016年落成的時候,習總書記專門發來了賀電。這張照片是我自己拍的。
中國天眼目前還在調試階段。但在去年我們就發現了第一顆脈衝星,在今年早些時候FAST又發現了第一顆高能毫秒脈衝星,為下一步引力波的探測提供了條件。未來幾年我們首先要開展叫做「19波束多科學目標同時巡天項目」,這個項目將發現一千顆左右脈衝星,對數十萬星系進行研究 。
「中國天眼」也會帶來大數據,每天的數據量就達到近150TB。
除了中國天眼,還有一個大家不太熟悉的項目,叫做「郭守敬望遠鏡」。
這個望遠鏡是2008年落成的,是現在全世界光譜尋天效率最高的望遠鏡,它已經觀測了901萬條光譜,是世界上最大的天體光譜庫。利用郭守敬望遠鏡的數據,現在已經發表了300多篇高水平論文,在給銀河系重新畫像等方面產生了一批科學成果。比如以前人類認為銀河系只有5萬光年大小,而現在通過研究、利用LAMOST的數據把銀河系的大小擴大了一倍——銀河有10萬光年的半徑。
同時,國際上的天文學家們也在做很多事。比如說這個「大口徑全天巡視望遠鏡」。
它的鏡子不算太大,只有7米,這是一群人圍繞望遠鏡玻璃主鏡拍的一張合影。它厲害的地方在於,配備有一個32億像素的相機,上圖右邊這位女士拿著的拼接相機,可以說是底片,它有半人多高。通過望遠鏡在三個晚上就把能看到的天區看一遍,每晚就會產生25TB的數據量。這個望遠鏡能帶來從「宇宙畫廊」到「宇宙影院」的轉變,把靜態的宇宙變成動態的宇宙,讓我們能夠近乎實時看到宇宙的變化,給天文學帶來跨時代的進步。
下一個與大家分享的項目叫做「一平方千米天線陣」。
它由兩大部分組成,其中一部分天線在南部非洲8個國家部署,另一端在西澳大利亞及紐西蘭由100多萬天線構成。整個天線可以進行數據採集,在全球區域中心進行深入分析。這個望遠鏡能帶來什麼?它的原始數據每天可以達到5千個PB,處理之後會達到50個PB左右,進一步處理則可以變成數據產品供科學家使用。
在國內除了有中國天眼,我們在天上還有「悟空」還有「慧眼」,國家天文臺的同事們正隨著「雪龍號」船在建設南極天文臺,國際同仁除了剛才介紹的兩個望遠鏡項目外也還在做更多的事情。這些天文學背後的英雄們給我們帶來的就是數據。大數據正推動著天文學的發展,讓人類對宇宙的認識逐漸加深。
為了給天文學家提供良好的基礎設施,中國正在打造「中國天文數據中心」,除了把國內數據收集在一起,還把國外的數據匯總起來,共同為天文學研究提供服務。「中國天文數據中心」通過了世界數據系統的權威認證,這在亞洲是第一個。
再給大家開拓下思路,現在天文學研究都在研究哪些事?
這裡有一個很好的總結:一黑兩暗三起源。
「一黑」就是黑洞,「兩暗」是暗物質和暗能量。三起源是什麼呢?是宇宙的起源,天體的起源還有生命的起源。這都是我們的終極問題。當然現在一個都沒有徹底解決。
天文學的發展受制於技術能力,以前通過光學通過眼來觀察,現在我們除了電磁波段還拓展到了引力波、中微子等手段,因此我們進入到了多信使的天文學時代。
我們對地外文明和生命的探索也一直都在進行。
為了充分發揮大數據的作用,20年前,天文學家和很多業界的朋友共同提出了一個叫做「虛擬天文臺」的設想。
「虛擬天文臺」是通過先進的信息技術將全球範圍內的研究資源無縫透明連接在一起形成的數據密集型網絡化天文研究與科普教育平臺。
簡單介紹一下虛擬天文臺的工作模式。
除了前面介紹的望遠鏡產生的天文大數據,天文學家開展科學研究所需要的計算資源、軟體環境等都是研究資源。天文學家還有他們的電腦、手機都要消費這些資源。而我們為了讓全世界的天文學家能夠更方便地利用這些資源,讓他們知道有哪些資源存在,同時把資源送到他們的手邊,送到他們的程序裡去,這就是「虛擬天文臺」要做的事情。
從技術層面上有很多工作要做,比如在語義層面、在數據格式層面、在數據傳輸層面、在註冊機制層面等等。這就是「虛擬天文臺」要實現的目標。
為了推動「虛擬天文臺」在全世界的發展,2002年「國際虛擬天文臺聯盟」成立了。我們可以看到這一個全世界地圖,這個地圖就是有「虛擬天文臺」研究項目的國家在地理上的分布。在大數據的時代,「虛擬天文臺」會作為一個基礎設施為全世界的天文學家提供服務。
「中國虛擬天文臺」也是在2002年提出的。我們現在已經有了這樣一個門戶,也有了這樣一個體系,我們通過望遠鏡時間的申請、大數據和雲環境的提供,正在向全世界不同國家的用戶提供服務,發揮著它的作用。
從2016年開始,國家天文臺和阿里雲結成了戰略合作夥伴,我們利用公有雲基礎設施把「虛擬天文臺」打造成具備全球服務能力的資源型服務平臺。
當然,天文大數據除了讓天文學家去探索宇宙奧秘,同樣可以為我們的孩子、為我們的年輕人、為我們學校的學生提供更多的服務。因為天文大數據不單是天文研究資源,也是科普教育資源。我們在全球率先提出了「數據驅動的天文科普教育」理念。我們中國在這個領域有非常棒的表現。
2015年,虛擬天文臺和新疆烏魯木齊一中的一位高中老師合作,打造了一個搜尋超新星的項目。有一個10歲合肥小朋友利用這個平臺發現了超新星,成為全球最年輕的超新星發現者。
天文大數據在科研、科普中要發揮作用離不開產業界朋友的助力。
比如:阿里雲給我們提供基礎的設施和服務;天文學家和微軟的合作已經持續十年以上,我們共同打造了萬維望遠鏡的教育平臺;華為跟我們合作SKA(即「一平方公裡天線陣」)項目,助力天文學家探索天文大數據;努比亞和國家天文臺籤訂獎學金項目等等。
虛擬天文臺的天文信息學社區,也得到了更多的合作夥伴的大力支持。天文學的發展離不開產業界的合作和支持。藉此機會,我也歡迎更多產業界的朋友一起來推動我們的天文情懷,有一種徵程叫星辰大海,希望有情懷的企業家一起來探討宇宙的奧秘。(完)