北京大學大數據分析與應用技術國家工程實驗室助力科學抗疫

2020-12-21 北京大學

2020年,一場突如其來的新冠疫情席捲全球,北京大學大數據分析與應用技術國家工程實驗室(以下簡稱「實驗室」)各團隊、中心積極響應習近平總書記關於打贏抗擊新冠疫情的人民戰爭、總體戰、阻擊戰的號召,及時完成了系列研究成果,以實際行動助力科學抗疫。

王騰蛟團隊研發多源大數據疫情防控研判系統

1月底,實驗室數據管理及分析中心王騰蛟教授團隊接到學校一項緊急任務安排:發揮團隊在大數據分析技術方面的優勢,立即投入大數據疫情防控研判系統的研發,為疫情研判服務。從那時開始,王騰蛟團隊的老師和同學們聞令即動,爭分奪秒,立即進入了全力以赴的科研攻關狀態。

由於疫情的突發性和高傳染性,原有數據統計和分析方式存在來源單一、覆蓋面小、缺少綜合研判機制等問題。為了與疫情拼速度,及時掌握真實全面的疫情數據並對這類數據進行高效的分析和準確的趨勢預測,王騰蛟團隊集中攻關,連續奮戰,迅速研製開發出多源大數據疫情防控研判系統(Pneumonia Epidemic Situation Analyst ,PESA)。系統採集多種來源的數據,包括全球疫情每日發布信息、疫情相關網絡輿情信息、各國疫情環境數據等,通過疫情分析因素提取方法,從採集的多源數據中提取出用於疫情發展研判的因素數據。各個來源的數據和預測模型相互獨立又互相補充,最終通過多個預測模型的集成學習,生成對疫情發展的多維度研判結果,為我國疫情防控指揮和部署提供科學有效的決策支持。

3月以來,在國內疫情防控形勢積極向好的同時,疫情在全球快速蔓延。積極穩妥地做好應對海外輸入風險工作,堅決維護好前一階段來之不易的疫情防控成果,成為我國當前最重要的任務。王騰蛟團隊及時追蹤疫情形勢發展,開發了基於多源大數據集成學習的國際疫情發展研判系統(PESA-Global),並依據該系統對國際疫情發展態勢做出預測和研判,每天上報一次《疫情預測日報》,每周上報一次《疫情防控政策研判報告》。

國際疫情發展研判科研團隊核心成員包括:王騰蛟、陳薇、博士後常一鳴、博士生高翔、博士生王鶴媛、碩士生王朝和碩士生韓愉等。

周曉華團隊展開科研攻關迎戰新冠病毒疫情

如何科學、高效地控制住疫情發展是亟待解決的現實問題。實驗室數據處理及統計分析中心主任、北京大學公共衛生學院生物統計系主任、北京國際數學研究中心生物統計及生物信息實驗室主任,統計科學研究中心副主任周曉華教授團隊針對這一重大現實需求,全力開展新冠肺炎疫情科研攻關,並取得一定進展,已撰寫多篇簡報或論文,部分成果已公開發表。

周曉華團隊綜合利用流行病學數據、病毒基因數據和交通流量數據等各種信息,從數學模型和統計模型相結合的角度對本次新型冠狀病毒疫情的發生和發展過程進行深入研究,力圖闡明新型冠狀病毒的疾病流行特點和規律,為防控新型冠狀病毒疫情提供以數據為基礎的定量化決策建議。

團隊於1月23日完成了武漢市在封城前新型冠狀病毒潛在感染人數的估計(An Estimation of the Total Number of Cases of NCIP (2019-nCoV)),這項成果於1月29日被中國疾病預防控制中心官方雜誌《中國疾病預防控制中心周報(英文版)》(China CDC Weekly)接受發表。文章作者是Chong You(尤翀)、Qiushi Lin(林秋實),通訊作者是Xiao-hua Zhou(周曉華)。

團隊提出新冠病毒潛伏期新估計方法及傳染病動力學模型。新的傳染病動力學模型對主要地區的疫情狀況進行綜合分析,模型估計出的確診人數與報導人數具有高度一致性,同時對無症狀病毒攜帶者的比例進行了估計。由張雲俊、張原、尤翀和周曉華共同撰寫的「基於數學和統計模型的新型冠狀病毒(SARS-CoV-2)傳染規律分析和決策」已被《中華醫學科研管理雜誌》在線發表。

周曉華團隊率先採用更新過程(renewal process)理論對潛伏期的分布進行估計。這一方法通過可觀察的離開武漢時間到發病時間,即可以得到不可觀測的潛伏期的分布。

在「浙江大學新型冠狀病毒肺炎(COVID-19)應急科研專項」資金資助下,周曉華團隊聯合靈迅醫藥科技搭建了新型冠狀病毒疫情分析監測平臺,並可在線展示。目前,他們已經收集湖北省外上萬餘名確診患者信息及部分國外病例信息,主要包括基本人口學特徵、臨床診療經過和流行病學接觸史等三方面共計25項信息。目前團隊正在推進系統平臺與分析算法融合,下一步將融合課題組及全球預測模型,對世界範圍疫情關注點進行分類、分區域預測。

新型冠狀病毒疫情分析監控平臺示例圖(全國疫情概況)

團隊撰寫的相關論文「Estimation of the time-varying reproduction number of COVID-19 outbreak in China」「Estimating the daily trend in the size of the COVID-19 infected population in Wuhan」「Estimation of incubation period distribution of COVID-19 using disease onset forward time: a novel cross-sectional and forward follow-up study」 均可在網絡上檢索預印本進行查看。

(來源:北京大學公共衛生學院、北京國際數學研究中心 文字:北京大學周曉華教授團隊 圖片:北京大學周曉華教授團隊、ChinaCDCWeekly官網)

鄒磊團隊建立知識圖譜系統助力科學抗疫

在全民抗疫的關鍵時刻,OpenKG推出了新冠疫情專題知識圖譜數據集,實驗室知識集成和智能決策中心主任鄒磊教授團隊在此基礎上將數據轉化成RDF數據,並基於gStore建立了知識圖譜系統,為廣大科研工作者提供知識服務。本次發布的疫情知識圖譜訪問平臺由大數據分析與應用技術國家工程實驗室知識集成和智能決策中心發布。

團隊在本次OpenKG發布的新冠知識圖譜數據基礎上,將其轉化為RDF三元組數據格式,並導入gStore圖資料庫,提供基於雲端的Endpoint接口服務。目前用戶可通過SPARQL查詢語言進行訪問,同時他們正在開發基於關鍵詞等智能化訪問接口,供大家學習和研究使用。

OpenKG開放的新冠知識圖譜數據包括八大類共17個知識圖譜,分別為新冠科研圖譜、新冠百科圖譜、新冠健康圖譜、新冠臨床圖譜、新冠英雄圖譜、新冠熱點事件圖譜、新冠流行病學圖譜和新冠物資圖譜,均提供訪問接口和詳細的使用手冊。

新冠知識圖譜(部分)

本次疫情知識圖譜訪問平臺由大數據分析與應用技術國家工程實驗室知識集成和智能決策中心發布,發布後得到了大量科研工作者的廣泛關注,截止到3月31日,數據訪問24,336人次,且仍然在高速增長中。

實驗室聯合發布城市交通活力恢復指數排行榜

3月4日,實驗室聯合常務理事單位滴滴出行及中國電子信息產業發展研究院(賽迪研究院),共同發布城市交通活力恢復指數排行榜。此次發布的城市交通活力恢復指數,是結合城市交通軌跡、道路擁堵數據及滴滴平臺通勤數據綜合分析得出。指數越高,說明城市交通活動量更積極。數據顯示,自2月10日起,全國交通出行活力穩步提升。

正常狀況下,2019年底城市交通活力接近於1,隨著城市生產生活逐步恢復,城市交通活力也將逐漸恢復至正常水平。考慮到湖北多地依舊實施機動車限行,因此並未將湖北省內城市納入統計。這一城市交通活力恢復指數即日起也將對外開放,點擊https://sts.didichuxing.com/t-activity-index/即可查看城市交通活力恢復指數詳情。

在實驗室主任張平文院士看來,各地生產生活正在有序恢復,大數據如何更好地助力國民經濟恢復是當下社會關注的重點。北京大學大數據分析與應用技術國家工程實驗室積極響應國家號召,聯合滴滴出行和賽迪研究院共同發布「城市交通活力恢復指數」,通過數字可視化系統及分析報告,幫助社會及主管部門宏觀了解疫情防控及經濟生活恢復現狀。滴滴出行發揮其在出行領域數據及算法特長,創新驅動,使命驅動,體現了公司的社會責任感。未來,國家工程實驗室將聯合更多的企業和研究機構,協同合作,進一步開展各行各業大數據的研究和應用,為全社會提供服務。

滴滴出行高級副總裁、雲平臺事業群負責人、大數據分析與應用技術國家工程實驗室理事會常務理事章文嵩表示,此次發布「城市交通活力恢復指數」,希望基於滴滴的技術和數據分析能力,讓大家直觀看到每個城市交通的恢復情況,為有序推進生產生活恢復提供更多信息參考,這也得到了大數據分析與應用技術國家工程實驗室和賽迪研究院的大力支持。此前滴滴免費向國內科研機構、醫療及救助平臺等開放用於抗擊疫情相關工作的GPU雲計算資源和技術支持,向企業和個人開發者免費開放口罩佩戴識別技術,滴滴將繼續強化疫情防控舉措,做好運輸服務保障,並在保障數據安全的情況下,和更多合作夥伴共享算法算力,齊心協力抗擊疫情,助力生產。

賽迪研究院副總工程師安暉指出,交通出行情況是反映城市運轉、生產生活是否健康有序的關鍵指徵,其中路況和出行數據能較好地反映城市生產與消費活動的恢復情況。滴滴作為交通出行領域的排頭兵,其出行平臺大數據具有覆蓋面廣、時效性強等特點,是反映交通出行情況的重要依據。基於滴滴平臺的城市交通軌跡、道路擁堵數據和通勤訂單數據所計算的城市交通活力恢復指數可對相關政策研判及研究提供支撐。

張平文團隊與中國移動合作完成基於軌跡大數據的疫情風險評估和疑似病例檢測

新型冠狀肺炎疫情已迅速形成全球大流行,導致數十萬人感染和全球經濟動蕩。世衛組織宣布,採取更精確的措施追蹤、發現和隔離感染者是迅速遏制疫情的最有效手段之一。特別是當前國際各界關注的「無症狀感染者」,其可能帶來的疫情傳播失控亟需解決方案。隨著我國復工復產帶來人員流動的不斷增強,對疫情風險的精細化評估和監測是抗疫工作面臨的難題之一。

張平文院士團隊與中國移動通信集團有限公司信息技術中心團隊聯合攻關,按照《網絡安全法》《突發事件應對法》《傳染病防治法》《中央網絡安全和信息化委員會辦公室關於做好個人信息保護利用大數據支撐聯防聯控工作的通知》等相關規定,根據國務院聯防聯控機制的要求,依法依規,嚴格落實數據安全和個人信息保護的相關措施,基於實驗室的算法模型能力與中國移動的大數據能力,開展了精細化疫情風險評估和疑似病例預測研究。已取得的研究成果包括基於軌跡大數據與物理平均場理論的HiRES風險地圖時空模型、HiRES-p個人流行病感染風險客觀評分模型,以及基於該模型的疑似病例預測算法。

基於我國新冠早期爆發階段(2020年1月)數據集的數值實驗表明,HiRES風險地圖對全域和局部等不同尺度的風險都具有高精度的模擬量化能力,區域尺度的風險值與該地區確診病例總數相關性達95%以上;HiRES-p評分經驗證是衡量個人流行病感染風險的有效方法,只要人群感染率低於20%,對疑似病例基於正確分類的預測準確率可達90%以上。

這項研究提出的流行病高精度風險評估與疑似病例預測的思路和方法在我國復工復產、國際抗疫合作和流行病風險長期監測中具有廣泛應用前景。研究結果可用於監測國家、省、市、區、縣和社區等不同層級以及醫院、車站等典型場景的疫情風險,並指導抗疫物資和人力的有效調度;同時可以推廣和應用到境外以及未來其它流行性傳染病疫情風險的精細化管理工作中。特別是對於無症狀感染者、境外輸入疑似風險者,應用該模型無需開展流行病調查,基於電信運營商等第三方提供的客觀軌跡數據即可實現及時識別,對當前疫情防控實踐具有重要意義。如果能夠基於我國人口和國際及港澳臺漫遊來訪用戶的全量軌跡數據,使用該模型可統一實現精細化到社區的小時級疫情風險管理,可為基層防疫減負,提升防疫工作信息化和智能化水平,還可以大大減少抗疫期間以「抗疫」的名目對個人數據的大量非法採集和使用的情況。

中國移動在工信部指導下,在落實疫情防控大數據支撐工作中,試點應用HiRES模型和方法,有效提升了信令數據的算法準確度和計算效率,在2月應用測試過程中,對疑似病例預測準確率達90%,能夠有效實現社區疫情風險及個人密接風險的動態評估,可提升疾控調查和風險處置效率。

雙方將基於前期成果繼續推進模型與算法合作,進一步研究完善在商場、園區和食堂等短時人員聚集場所提供密集人流管理能力,提升管理人員現場核查信息化能力和公共場所安全保障智能化水平,並為基層防疫減負,助力企業逐步復工復產、居民公共場所有序活動以及學生安全返校。

聯合攻關項目組主要成員包括:北京大學副校長張平文,中國移動集團有限公司IT管委會辦公室主任、中移動信息技術有限公司董事長、總經理徐海勇,中移動信息技術有限公司副總經理江勇等。

學術論文可通過網絡預印本查看:https://arxiv.org/abs/2004.00908

延伸閱讀:

北京大學大數據分析與應用技術國家工程實驗室是由國家發展和改革委員會批覆,由北京大學牽頭建設的國家級平臺。實驗室緊密圍繞大數據分析與應用技術發展的需要,開展相關產業關鍵技術攻關、重要技術標準制訂,集聚與培養產業急需的技術創新人才。探索和實施適合具體行業特點的創新方案,著力解決行業發展的重大技術問題,提高產業自主創新能力,建立該領域發展趨勢與重大問題的研究機制,積極提供行業發展研究情況和重要進展,更好地為國家和行業發展服務。

疫情期間,實驗室始終不忘初心,利用專業知識,為疫情防控貢獻力量。實驗室將繼續砥礪前行,為基層防疫減負,助力企業逐步復工復產、居民公共場所有序活動以及學生安全返校。

相關焦點

  • 大數據協同安全技術國家工程實驗室打造「超級智囊團」
    來源:中國網科技近日,360未來安全研究院在北京舉辦的年度思想薈上,重磅舉行了大數據協同安全技術國家工程實驗室(以下簡稱「實驗室」)專家委員聘任儀式。在此背景下,2016年國家明確了組建13個大數據領域國家級工程實驗室的專項目標,其中在大數據安全方向組建一個,目標是解決大數據環境下數據安全保障、大數據安全分析與監測等關鍵問題。360公司作為國內網絡安全領域的龍頭企業,積累了雄厚的大數據處理能力,擁有世界領先的大數據安全分析技術與安全大數據資源。
  • 中科天璣高校大數據實驗室建設方案 賦能大數據人才培養
    中科天璣攜創新高校大數據實驗室建設方案,亮相本次展會,科技創新賦能大數據人才培養。 多年來,中科天璣依託自身的技術實力和行業經驗,針對學校特點和學生水平,進行課程、實驗、案例共同開發和聯合教學,累計跟數十所高校展開合作,從基礎平臺搭建,到基礎知識教學、專項技能培養,全方位建設大數據實驗室,為高校教學能力建設及人才縱深發展提供教育人才培養整體解決方案,持續不斷為大數據、人工智慧的應用發展、人才培養等方面注入新鮮血液。
  • 「哈工大—國雙大數據科學聯合實驗室」籤訂
    5月14日,北京國雙科技公司宣布與哈爾濱工業大學籤訂了戰略合作協議,攜手共建"哈工大-國雙大數據科學聯合實驗室"。哈工大教育發展基金會理事長、校黨委書記王樹權、北京國雙科技有限公司董事長兼CEO祁國晟、聯席總裁李峰、助理總裁許雲等出席了戰略合作籤約儀式。
  • 熱點|中國空間站工程巡天望遠鏡北京大學科學中心成立儀式在京舉行
    11月21日,中國空間站工程巡天望遠鏡北京大學科學中心(以下簡稱「中心」) 成立儀式在北京大學舉行。中國載人航天工程總設計師周建平,中國載人航天工程辦公室主任郝淳,中國載人航天工程空間科學首席專家顧逸東,中國科學院空間應用工程與技術中心主任高銘,北京大學校長郝平、副校長黃如,以及來自國家天文臺、上海天文臺、北京大學、清華大學、中山大學等研究機構及高校的專家學者出席了本次活動。
  • 群星璀璨聚集國際大數據競賽,5000位AI人才助力全球抗疫
    2020 IKCEST第二屆「一帶一路」國際大數據競賽暨第六屆百度&西安交大大數據競賽是國內最專業最權威的高校大數據賽事之一,由中國工程院、教育部高等學校大學計算機課程教學指導委員會及絲綢之路大學聯盟指導,聯合國教科文組織國際工程科技知識中心(IKCEST)、中國工程科技知識中心(CKCEST)、百度、西安交通大學共同主辦。
  • 南方海洋科學與工程廣東省實驗室(珠海)招聘40人
    一、單位簡介南方海洋科學與工程廣東省實驗室(珠海)(以下簡稱「南方海洋實驗室」)是以培育創建國家實驗室、打造國家實驗室「預備隊」為目標,由廣東省政府於2018年11月啟動建設。南方海洋實驗室由珠海市政府主導,中山大學牽頭建設和管理,陳大可院士擔任實驗室主任,蘇紀蘭院士擔任學術委員會主任。
  • 福建高校「硬核」抗疫,這些專業來助力!
    而受到疫情影響的福建各大高校,也在這場戰役中發揮作用,助力抗「疫」行動,我們來看看福建高校的一些專業在抗疫中,如何一展身手。、生物技術3個本科專業,擁有生物學、食品科學與工程2個省級重點學科;生物醫藥工程技術實驗中心和食品科學工程中心實驗室2個省部共建高校特色優勢學科實驗室;1個省級特色專業,1個省級實驗教學示範中心和1個省級人才培養模式創新實驗區。
  • 新一代人工智慧地圖的AI釋放能量 大數據加持全力抗疫
    本次論壇邀請了清華大學電子工程系副系主任、長聘教授、博士生導師、清華大學精準醫學研究院臨床大數據中心共同主任吳及教授,北京大學軟體工程國家工程研究中心副主任、教授、博士生導師王亞沙教授,百度人工智慧技術委員會主席黃際洲博士,百度地圖出行業務部主任架構師張傳明博士作為嘉賓,從「理論+實踐」帶領參會人員了解AI是如何應用到疫情前線,助力疫情防控。
  • 智能頭盔N901助力抗疫 光啟科學護航全球「戰」疫
    日前,一款實現高效無感機動排查發熱人員的人工智慧「抗疫神器」出現在全球30多個國家的公共場所。記者發現,這款「抗疫神器」正是已在國內火翻天的光啟熱成像智能頭盔N901。而為這款從國內火到海外的「抗疫神器」賦能人工智慧應用服務的則是深圳高科技創新的名片之一——光啟科學。
  • 高分子領域國家重點實驗室儀器配置清單
    人類的生產和生活離不開高分子材料,小到日用家居,大至航空領域,高分子材料廣泛應用於通訊、電子、電氣、醫療、化工、航空、航天、汽車、信息、生命科學等多個領域,因此高分子材料的研究與應用具有十分重要的意義。儀器信息網特對高分子領域國家重點實驗室儀器配置情況進行盤點。
  • ETNews | 《中國基礎教育大數據發展藍皮書》發布:從」走向數據驅動的精準教學「到」大數據助力教育治理現代化「
    京時間2018年5月30日,《中國基礎教育大數據發展藍皮書(2016-2017)》發布會暨第四屆「網際網路+教育」創新周閉幕式在北京世紀金源大飯店舉行,此次發布會上,《中國基礎教育大數據發展藍皮書(2016-2017)》正式對外發布。此份藍皮書由北京師範大學未來教育高精尖創新中心、江蘇省教育信息化工程技術研究中心與北京拓思德科技有限公司聯合編制。
  • 熱烈祝賀張平文院士當選美國工業與應用數學學會會士!
    中國工業與應用數學學會理事長、北京大學副校長張平文院士因其在複雜流體建模、多尺度分析和自適應網格計算領域的卓越貢獻當選新晉會士,也是今年中國內地高校中唯一入選的會士。此外,本次獲得會士榮譽的華人還包括美國加州大學伯克利分校的馬毅教授、美國普渡大學的沈捷教授、香港理工大學的孫德鋒教授。其中,沈捷教授和孫德鋒教授是中國工業與應用數學學會的專業會員。
  • 高校數據科學與大數據技術專業建設全景報告
    數據科學與大數據技術專業,專業代碼:080910T,無疑是未來十年最火的專業,甚至沒有「之一」。  2020年3月,138所高校獲批第五批「數據科學與大數據技術」專業,180…  數據科學與大數據技術專業,專業代碼:080910T,無疑是未來十年最火的專業,甚至沒有「之一」。
  • 人工智慧、大數據助力,百度與中國疾控中心攜手戰「疫」
    新冠肺炎疫情攻堅戰中,人工智慧、大數據等前沿技術正在為科學決策、精準治理、高效服務貢獻重要力量。百度集團副總裁、深度學習技術及應用國家工程實驗室吳甜告訴記者,自疫情爆發以來,百度一直與中國疾病預防控制中心密切合作,以人工智慧、大數據技術助力中國疾控中心監測疫情發展態勢、研判防疫科普需求,開發定製化的病毒RNA二級結構分析工具等,支持疫情防控和病毒研究工作。
  • 播撒科學種子:犀牛鳥中學科學人才培養計劃啟動
    在未來6個月的時間裡,本次入選的中學生將通過科研能力提升環節學習系列學術導論課程以提升自身學術素養,並通過聆聽系列計算機學科前沿報告了解學科發展、相關領域專業知識、以及新興技術在騰訊的發展和應用,培養科研興趣。
  • 青島新能源山東省實驗室揭牌,未來將謀劃國家實驗室建設
    這無疑是青島促進全省乃至全國新能源科學發展,突破前瞻性關鍵技術,支撐引領新能源戰略性新興產業發展的又一重大戰略舉措。  打造國家實驗室的「預備隊」  山東省實驗室是省級基礎創新平臺的龍頭,是創建國家實驗室的「預備隊」。
  • 乳業生物技術國家重點實驗室拓展科技創新邊界
    12月15日,乳業生物技術國家重點實驗室第二屆學術委員會第五次會議暨上海乳業生物工程技術研究中心技術委員會會議在滬召開。針對我國乳品行業中亟需解決的重大瓶頸問題,乳業生物技術國家重點實驗室共申請發明專利704項,不斷引領益生菌及功能性發酵乳行業的跨越式發展。
  • 我會成功舉辦「智能用電大數據集成分析平臺研發 及其工程應用...
    我會成功舉辦「智能用電大數據集成分析平臺研發 及其工程應用」科技成果鑑定會 2020-09-01 13:14 來源:澎湃新聞·澎湃號·政務
  • SAS表彰數據科學與數據分析教學活動
    增設新銳教育家獎和HBCU教育家旅行獎中國北京,2020年6月17日——SAS正在通過與世界各地大學合作,創建並持續擴大數據科學與分析人才庫。在2020年虛擬SAS®全球論壇 (the Virtual SAS® Global Forum)上,SAS公司表彰了以創新方式教授、學習和使用SAS軟體的教育工作者和學生。
  • 國家內河航道整治工程技術研究中心暨長江航運工程與智能航道技術...
    ,國家內河航道整治工程技術研究中心暨長江航運工程與智能航道技術協同創新中心主任、重慶交通大學校長唐伯明,重慶交通大學副校長王平義、周建庭及河海學院、西科所等中心建設單位領導及相關人員出席會議。國家內河航道整治工程技術研究中心暨長江航運工程與智能航道技術協同創新中心常務副主任楊勝發教授、總工劉懷漢教授、長江航運工程與智能航道技術省部共建協同創新中心副主任劉明維教授分別作了「中心」一年來建設與運行工作報告。