「數」說老科學家採集工程

2020-08-27 中國科協創新院

摘要:「老科學家學術成長資料採集工程」(以下簡稱「採集工程」)是由中國科協牽頭,會同中組部、教育部、科技部等11部委,以搶救和挖掘我國老一輩科學家學術成長史料為目標的國家基礎性工程。採集工程歷經10年建設,已積累海量可供探究科技人才成長規律、宣傳卓越科技人物的實物和數據資料。本文從信息化建設角度出發,在系統介紹當前採集數據成果的基礎上,對各環節涉及的數據採集、存儲、分析和展示的全生命周期管理和信息化系統進行歸納分析和展示,總結採集過程中遇到的問題,並據此提出建議。

1. 採集工程緣起

2009年,季羨林、任繼愈、錢學森、貝時璋等學術泰鬥相繼離世,引發社會廣泛關注。中國科協組織專家研究起草《老科學家學術成長歷史資料亟待搶救》報告並上報中央,國務院領導高度重視並作出批示,2010年,採集工程正式啟動。

截至2019年底,採集工程已啟動543個採集小組,共有427位科學家的125128件實物資料、298498件數位化資料、8000餘小時的音頻資料、7000餘小時視頻資料入藏,涵蓋科學家口述文字資料、傳記、手稿、報導、學術評價等共計15個分類。

2. 採集工程信息化建設

2.1 平臺概覽

為永久保存採集工程數位化資料,中國科協創新戰略研究院於2013年啟動了採集工程信息化建設。目前已建成服務採集小組、項目管理、研究支撐、對外展示不同業務場景的11個應用系統/工具(表1),擁有1PB大容量NAS架構存儲,業務系統雙活災備,全面支撐採集工程的「採、藏、研、宣」工作。


表1 採集工程信息化系統總覽

上述11個業務系統及基礎設施平臺的整體業務架構如圖1所示。

圖1 採集工程信息化業務架構圖

2.2 業務系統概述

目前採集工程信息化平臺運行了11個業務系統,分別面向採集、管理、服務、支撐和展示等五大類業務。採集業務主要服務採集小組資料採集和規範入庫工作,管理業務為資料管理者、學術專家提供資料入庫、審核管理和查詢功能,服務業務提供全文檢索、目錄檢索和基於典型流媒體資料的轉碼、播放和管理服務,支撐業務提供內容發布管理和運營分析,展示業務實現對採集資料的公開展示。五類業務之間的關係如圖2所示。

圖2 採集工程信息化系統關係圖

五大業務中,除展示業務外的其他四類屬於與硬體類似的基礎設施,對於用戶不可見,但卻是支撐展示不可或缺的根基。展示業務是對用戶可見的系統,其核心是中國科學家博物館(網絡版)。自2015年啟動建設以來,中國科學家博物館(網絡版)已成為科技人物宣傳的重要陣地、弘揚科學精神的窗口以及開展科技人物學術研究、進行文獻檢索的資源寶庫。同時,為了加大中國科學家精神及採集工程的海外宣傳推廣力度,創新院於2017年6月啟動了中國科學家博物館(英文版)建設工作,該網站已於2018年12月正式上線。此外,展示業務中另外一個平臺—科學家數據可視化系統,力求方便快捷地從多個維度對採集資料進行統計分析及快速展示(圖3),也已於今年上線。

圖3 數據展示業務組圖


2.3 平臺數據總覽

採集工程信息化平臺數據包括資料數據、成果數據、項目數據和業務系統數據(圖4),涵蓋採集項目啟動、中期、結項全過程(圖5)。

圖4 採集工程數據結構


圖5 採集工程數據生命周期

2.3.1 採集工程數據概述

採集工程的項目數據包含年採集量、承擔單位數量、參與課題人員的數量以及項目管理方數量等。截至2019年底,參與採集工作的項目承擔單位共554個(含終止項目)(圖6),參與課題人員達4124人,承擔項目管理工作的地方科協、所屬事業單位及各級學會共19家,遍布全國24個省市自治區。從年採集數量上來看,採集工程經歷了搶救期(2010年-2012年)、過渡期(2013

年-2016年)、平穩期(2017年至今)等三個階段,目前採集工程已進入常態化工作階段。

圖6 科學家和群體年度採集數量圖

目前,位於中國科技會堂的採集工程自建機房已存儲經初步規範化清洗、總量達218TB的科學家資料,平均每位科學家的數據總量約400GB,單個文件最大可達100GB(圖7)。

圖7 數位化資料和實物資料逐年數量

2.3.2 中國科學家博物館(網絡版)數據概述

截至2019年,中國科學家博物館(網絡版)已建設完成了375位科學家的專題。其中,以科學家為單位、依據其學術成長脈絡梳理、加工開發進行展示的「珍貴史料」欄目,已成功上線17866件數位化資料,且以每年千件的速率穩步增長(圖8)。

圖8 2015-2019年科學家博物館上線採集資料數量趨勢

2.3.3 系統數據概述

除採集資料數據、成果數據以及項目數據外,採集工程信息化業務系統中也存在諸多數據,如內容管理系統中的編輯展示數據、英文網站以及可視化系統中各類統計數據、科學家資料數據服務系統中的系統管理數據、中國科學家博物館(網絡版)運營分析系統中的運營分析數據等等。採集工程信息化業務系統中的主要數據如表2所示。

表2 採集工程信息化業務系統數據內容及數量


●3. 思考與建議

隨著採集工程業務體系逐年擴大,現有信息化框架如何適應需求的變化、數據資源的開放標準和價值挖掘等將是採集工程信息化建設面臨的主要問題,據此我們提出如下建議:

一是注重信息化應用的頂層設計,健全數據治理環節。採集工程歷經十年建設,隨著用戶需求的不斷延展,查漏補缺型的應急型應用建設模式已經難以為繼。注重頂層設計、優化數據生產模式、完善數據管控工作機制、突破業務與信息化間的融合壁壘、將信息化手段以標準規範的細粒度貫通全生命周期管理,是採集工程信息化建設的當務之急。

二是探索科學家數據開放模式,加快推動數據資源開放標準建立。隨著採集工程以採集為核心轉向側重應用的趨勢導向,面對已積累的海量科學家數據資源,當前的數據管理及利用審批模式並不能充分滿足數據開放使用的需求。這就要求在充分考慮從數據研究到成果轉化和實際應用周期的前提下,採取「分對象、分領域、分階段」的開放原則,推動科技人物數據資源開放標準化,打造「科技史+N」的複合型隊伍,為實現數據二次開發利用提供國家層面的準則支撐;面向不同需求,逐步探索進行開放共享、分級使用等舉措,推動數據服務精準指向。

三是拓寬數據複合型產品研發模式,佔領中國科學家精神宣傳數據高地。以現有「中國科學家博物館」網站為基礎,盤活科學家數據資源,建成集「人-事-物」為一體的綜合性科技人物數字博物館;充分利用中國科協的優勢資源,將分散在各機構各平臺下的異構數據源重組,統一交互模式,消除「信息孤島」,在對現有數據有效整合的基礎上,建立國家級科技人物數據服務平臺;融合拓展涉及多學科、多形式的數據資源產品,推動形成以宣傳、研究兩條主線為支點的應用品牌,結合社會網絡分析與知識圖譜等熱點技術,分析、挖掘與展示科學家群體的學術成長經歷,打造以弘揚科學精神、培育科學文化為目標的多維品牌矩陣,力求多鏈條推進中國科學家精神傳播進程。

文獻來源:武虹,齊碩,趙立新,寧華華,楊寶龍.「數」說老科學家採集工程[J].今日科苑,2020(4):31-36.

參考文獻:略

作者:武虹1,齊碩1,趙立新1,寧華華2,楊寶龍1


1 中國科協創新戰略研究院

2 中國科學院軟體研究所


感謝您的支持與關注,歡迎賜稿交流

投稿郵箱:nais-research@cnais.org.cn

相關焦點

  • 「科學」號採集到的數千歲深海珊瑚原來長這個樣子......
    本航次科考隊員共採集到深海巨型及大型底棲生物樣品近400個、170多種,專家推測其中一個巨大珊瑚的年齡在數千歲。◎我國新一代遠洋綜合科考船「科學」號圓滿完成中國科學院戰略性先導專項「熱帶西太平洋海洋物質能量交換及其影響」中的2017年卡羅琳海山航次,9月5日靠泊海南三亞。
  • 中國科協「老科學家學術成長資料採集工程」北京大學聯合採集啟動儀式暨交流會舉行......【北大發布(7.13-7.27)】
    該研究發現,該效應的持續時間可長達數十年,遠超過其大氣停留時間。在2010年,短生命氣候脅迫物質通過氣候-碳循環反饋產生的淨輻射強迫為-13±50mW-2,這一數值是正輻射強迫和負輻射強迫相互抵消後的淨值。該研究揭示了短生命氣候脅迫物質的長期氣候效應,為氣候變化的預測和歸因提供了理論依據。研究成果於7月13日發表於《自然·氣候變化》雜誌。
  • 科學家:140種長江魚類三年無法採集到標本
    長江水產研究所首席科學家危起偉說,最後一次見到活體白鱘是2003年,在四川宜賓南溪江段,專家救助一條白鱘後,給其裝上超聲波追蹤器並放流,但是因為水急灘險,半夜時分,追蹤船不慎觸礁,導致跟丟白鱘。
  • 數千歲的深海珊瑚你見過嗎?「科學」號採集到了![圖]
    本航次科考隊員共採集到深海巨型及大型底棲生物樣品近400個、170多種,專家推測其中一個巨大珊瑚的年齡在數千歲。「科學」號採集到的巨大珊瑚的根部(9月4日攝)  航次首席科學家徐奎棟介紹,本航次科考隊員利用「發現」號遙控無人潛水器下潛15次,對此前人類從未探索過的西太平洋卡羅琳海山進行了精細調查,取得了豐富的生物、巖石和沉積物樣品
  • 北京譜儀最新採集數據為奇特強子態和粲重子研究奠定基礎
    北京譜儀最新採集數據為奇特強子態和粲重子研究奠定基礎 2020-07-06 19:56:26,首次在Y(4660)共振能區採集到世界上最大的高質量數據樣本,為奇特強子態和粲重子研究奠定基礎。
  • 觀眾在科技館競相與袁隆平屠呦呦「擊掌」,大科學家「手模牆」是如何採集的
    >袁隆平採集手模第一個手模來自病房中國科技館一層東大廳正紅色的牆面上,33塊金色展示牌依次排列,33位國家最高科學技術獎獲獎者的肖像照、個人簡介、寄語鐫刻在牆上,其中包括21位科學家的雙手手印——每名科學家的掌紋都清晰可見,靜靜講述著歲月的積澱。
  • 《原神》水晶礦怎麼採集 水晶礦採集攻略
    導 讀   原神水晶礦怎麼採集,有不少的玩家都有這樣的疑問,那麼接下來小編就為大家分享一下原神水晶礦採集攻略
  • 美國道德綁架要求公開嫦娥五號採集數據,該公開嗎?
    此次搭乘的嫦娥五號登月器作為整個嫦娥探月工程第三階段、也是最重要的一環,嫦娥五號登月器不僅要完成此前幾枚嫦娥探月器所要完成的月球表面軟著陸過程,同時還要完成包括月球表面、地下土壤、巖石等物質的採集工作,並且在完成所有採集工作後,登月器將自主返回月球軌道和母艙對接,並最終安全返回對球。
  • 中國採集的月壤是否會分享給NASA?官方回應
    嫦娥五號已經攜帶採集的大約2千克月壤樣本返回地球,任務取得圓滿成功,後續分析研究也即將即將展開。相信不少人都知道,NASA(美國航空航天局)當年成功組織阿波羅載人登月計劃,先後帶回了近400千克的月壤、月巖樣品,並於1978年將1克樣品贈予我國。我國科學家也利用這一珍貴的機會,展開了一系列研究,取得了不少成果。
  • 科技周刊薦讀 | 量子科技掀起前沿技術新浪潮;江蘇創新企業數連年...
    省生產力促進中心主任趙志強介紹,今年全省高新區瞪羚企業總數較上年度增加69家,增幅高達15.75%,2017—2020年,瞪羚企業數年增長率均保持在10%以上。  更多內容,請點擊  【星光】,40位科學家和1個團隊榮獲第十三屆光華工程科技獎,江蘇有四位科學家獲此殊榮。
  • 如果採集的樣本和阿波羅的不一樣,說明什麼
    因為嫦娥五號探測器的任務並不僅僅要成功登陸到月球表面,還會首次在月球表面無人採集樣本,在完成樣本採集以後還會首次從月球表面發射起飛,在到達月球軌道後還會與軌道器進行無人交會對接,最後以接近地球的第二宇宙速度高速返回地球。這些技術都是很大的挑戰,畢竟月球離我們地球達到38萬公裡遠,不過,相信嫦娥五號探測器能夠順利完成所有的任務。
  • 為什麼說老司機們都值得擁有一輛乘龍H5
    這就是我為什麼說老司機們都值得擁有一臺乘龍H5的原因。各位老司機們,回望自己的運輸之路,你們是否覺得自己值得擁有一臺乘龍H5呢?註:本文內容轉載自其它媒體,轉載請尊重版權保留出處,一切法律責任自負。卡車之家登載此文出於傳遞更多信息之目的,並不意味著贊同其觀點或證實其描述,也不代表本網對其真實性負責。
  • 中國採集的月壤是否會分享給NASA?官方霸氣回應
    嫦娥五號已經攜帶採集的大約2千克月壤樣本返回地球,任務取得圓滿成功,後續分析研究也即將即將展開。相信不少人都知道,NASA(美國航空航天局)當年成功組織阿波羅載人登月計劃,先後帶回了近400千克的月壤、月巖樣品,並於1978年將1克樣品贈予我國。
  • 科學網—講好中國科學家的故事
    講好中國科學家的故事、開闢了旱地農業生理生態研究新領域的山侖院士(1933年出生,中國工程院院士); 5.為建立農業領域地下水開發利用工程技術體系做出了大量奠基性工作的李佩成院士(1934年出生,中國工程院院士); 6.今年已90歲高壽、上世紀50年代響應中央「向科學進軍」的號召,毅然從原國家計委、國家經委辭官回到科研隊伍,之後便潛心於光譜分析研究的胡皆漢先生(1928出生);
  • 專業採集與眾包,細數兩種地圖製作方式的優劣
    01專業採集與眾包採集在諸多實現自動駕駛技術方案中,地圖都處於「感知擔當」的角色,地圖數據到底該如何採集?比較常見的是專業採集與眾包採集兩種方案。孰優孰劣?可以一起來了解看看。專業採集在傳統導航發展的早期階段,需要大量專業的數據採集人員、測繪設備、採集車等,往往在測繪一條道路時測繪車會來回採集多遍,以確保數據的準確性。
  • 夢參老和尚談虛雲老和尚:我問過他自己,我說老和尚你開悟沒有?
    我問過他自己,我說老和尚你開悟沒有。他說開什麼悟啊。我說他們說什麼,坐禪要開悟嘛。他說你慢慢等著吧,將來你會知道了,也沒跟我說。說明他悟不悟,我還是不知道了。
  • 嫦五採集月壤不足2千克,專家:或是美國提供錯誤數據
    對於航天,在古代的時候無論是中國還是西方都有各種對於宇宙洪荒的描寫,人們對於探索未知的宇宙一直保持著一個很大的好奇心,數千年過去了,人類成功做到了探索其他的星球,甚至是直接將太空人送上那個月球採樣勘探。
  • 在中國之前,美國和前蘇聯採集了幾次月壤,又帶回了多少月壤?
    中國成為世界上第三個從月球上帶回月壤的國家,並且中國在探月工程的「三部走」——繞、落、回的基礎上更進一步。此次月壤的收集,不僅僅讓全世界看到中國航天的能力,更是為下一步中國登月打下堅實基礎。前面我們說過,中國成為第三個帶回月壤的國家,前兩個是美國和前蘇聯,那麼在嫦娥五號之前,人類一共採集過多少月壤呢?採集了幾次月壤呢?今天就讓小潭給大家普及下採集月壤的歷史知識吧。
  • 俄羅斯科學家提議建造無人駕駛月球穿梭機,能在月表採集樣本
    俄羅斯科學院空間研究所核行星學部主任伊戈爾·米特羅法諾夫表示,俄方科學家提議建造能自動在月球表面採集樣本,並往返於月表和月球軌道站的「三桅船」穿梭機。俄羅斯目前正在建造用於執行月球飛行任務的「雄鷹」號飛船。伊戈爾·米特羅法諾夫在有關太陽系研究的座談會上說:「除『雄鷹』號飛船外,我們建議建造能多次降落月表,並返回軌道與『雄鷹』號或臨時軌道站對接的『三桅船』自動穿梭機。」
  • 科學家發現一種在無需電子元件的情況下存儲太陽能達數年之久的方法
    科學家發現一種在無需電子元件的情況下存儲太陽能達數年之久的方法 來源:新華網 • 2020-12-10 11:41:42 據英國《獨立報》網站12月5日報導,科學家發現了一種在無需電子元件的情況下存儲太陽能達數年之久的方法