2020年浦江創新論壇-新興技術論壇「雲時代的科學第四範式」於10月29日下午在錦江飯店錦江小禮堂舉行。中國科學院上海巴斯德研究所「發育與健康微生物學研究中心」首席科學家、法國科學院院士、美國科學院外籍院士、德國科學院院士、瑞典工程院院士、英國皇家學會會士Philippe Sansonnetti,中國科學院院士、復旦大學常務副校長、復旦大學上海醫學院院長金力, 中國科學院院士、中科院上海營養健康研究所生物醫學大數據中心首席科學家趙國屏,以及青雲QingCloud CEO,Eclipse Committer黃允松,分別做主題報告。(按演講先後排序)。
主題報告
▼ Philippe Sansonnetti,中國科學院上海巴斯德研究所「發育與健康微生物學研究中心」首席科學家
大數據時代下微生物與宿主相互作用的研究
○ 1.如今數據的溝通和交流變得越來越重要,在生物學的傳染疾病研究過程中,微生物整個發展的相互介入包括整個遺傳學還有物理、化學包括基因組學各方面相互作用,所有的研究過程均會生成大量數據,更需要相互之間的協同效應。
○ 2.所有人體中都有生物,且是微生物群落,存在於人體皮膚的各個地方,在新冠疫情下,需要更加注重微生物群落相互之間的作用,研究如何應對各種各樣的疾病或者細菌和病毒。
○ 3.隨著科技的發展和變革,在進行微生物研究的過程中,可以更方便的獲得數據,而且數據處理方法也更為強大,使得每一次研究都發生質的飛躍。
○ 4.新的測序和新的生物信息方式可以幫助科研工作者了解整個微生物群落的情況,相關數據採集量越來越大,總體上的數據複雜度也越來越高。
○ 5.人體體系非常複雜,人體中的微生物菌落能起到屏障功能,以刺激或消弱病毒感染,多年來做了很多研究,探尋細菌感染的發病機理,研究結果表明,在一開始感染時就對病菌有充分了解並且進行幹預措施能起到很好的效果。
▼ 金力,中國科學院院士、復旦大學常務副校長、復旦大學上海醫學院院長
表型組學-大數據時代生命科學範式變革
○ 1.傳統的科學研究是問題導向的研究,而大數據時代的科學第四範式下的科學研究是產生問題,核心是通過產生大量數據而產生問題。這兩種範式並不是相互排斥的,而是相互補充,使研究效率更高。
○ 2.數據的作用是從觀察現象到發現因果關聯,因果關聯構成對自然界認識的重要部分。首先要通過「測量」獲得大量數據,然後才能進行分析。生命科學已進入大數據時代,與大數據的概念相似,基因組學範式的第一步即是發現基因與表型的關聯。
○ 3.表型組範式是繼基因組學範式的一種新科學範式,是大數據時代生命科學的第四範式。表型組範式與基因組範式的主要區別在於從篩基因到篩表型+基因。
○ 4.精密測量技術和大數據科學的發展使科學家們可以對大規模人群樣本進行全景精密測量後獲得海量表型大數據,並加以科學分析,繼而,發現表型—環境—基因之間、宏觀表型—微觀表型之間的跨尺度關聯與相互作用,最終繪製出人類健康與疾病的全景式表型組「導航圖」。
○ 5.新範式下的產業創新鏈主要體現在:一是以精密測量為導向,突破一批生命健康與臨床診療關鍵技術,推動健康管理與醫療設備的研發;二是通過對健康人群和疾病人群精密測量,發現全新生物表現標誌物,研發新型診斷試劑和產品;三是解晰健康與疾病表型的遺傳基礎及致病機制,數量級獲得新型新藥靶點及組合,為原創新藥提供源頭支撐;四是挖掘表型組圖譜大數據,發掘全表型組基因關聯分析方法,形成系列健康管理數據產品和智能化輔助診斷系統。
▼ 趙國屏,中國科學院院士、中科院上海營養健康研究所生物醫學大數據中心首席科學家
新冠大疫和生物醫學大數據
○ 1.生物學經歷了三次革命,伴隨著每次革命,數據量在不斷增大。第一次革命始於上世紀中葉,進入分子生物學時期;到上世紀八十年代末九十年代初時,發生第二次革命,進入基因組學時期,此時數據量已達到TB級;第三次革命開始於21世紀初,即進入了生命科學、物理科學和工程學的會聚時期,數據量則進入了EB級。
○ 2.流行病學是研究人群中疾病以及健康相關狀況及其影響與決定因素,並研究防治疾病及促進健康的策略和措施的科學。在流行病研究過程中的每個層次上都會產生大量數據,這些數據能夠有效的支撐研究工作。
○ 3.傳染病暴發上升原因主要源於四大因素:一是全球經濟的一體化使人口和貨物的流通加速;二是全球氣候總體呈現變暖趨勢;三是城市化與壹健康,全球大城市人口量急劇上升;四是經濟社會發展與傳染病防控因素,貧困地區醫療衛生條件差,快速發展中國家防控體系不完善,發達國家「消費型」生活方式,因此新時代需要新的平衡。
○ 4.從考慮應用目標和追求基本認識兩個維度,生物醫學研究或劃分為四大象限,一是巴斯德象限的應用基礎,既尋求擴展知識的邊界,又受到應用目的影響的研究活動;二是愛迪生象限的應用研究,單純的應用研究,不尋求對某一學科的全面認識;三是波爾象限的基礎研究,只受認識需求推動,不受實際應用引導的研究活動;四是NCBI象限的數據/樣本積累活動,這是真正需要國家支持才能做好的事。
○ 5.傳染病防治體系應將傳染病的相關研究納入其中,在疾控、醫療、研究教育機構相關單元之間建立經常性的聯繫和有效的科研合作。在實現信息與資源在安全可控及績效共贏基礎上的交流共享。以臨床為核心,建立「非典」研究的常規演練體系。
▼ 黃允松,青雲QingCloud CEO,Eclipse Committer
科研創新加速器——軟體定義的多維雲計算
○ 1.軟體定義世界。以汽車為例,軟體定義汽車帶動商業模式的發展,汽車功能的發布和更新不再依託硬體的發布和更新,當下一代汽車進行投入的時候絕大部分崗位將是軟體工程師。
○ 2.網絡是雲計算的核心服務,雲計算的拓展帶來SDN的多域互聯,SDN從局域往廣域拓展,到SDN-WAN。而雲網邊端帶來物聯網的落地和實踐。新冠肺炎疫情正在加速物聯網的發展,三分之一的決策者表示將因新冠疫情而增加物聯網的投資。
○ 3.雲計算的計算形態可劃分為幾種類型:一是科學家用的較多的高性能雲;二是較為普遍應用的面向雲原生應用的容器混合雲;三是私有雲或託管雲;四是公有雲。
○ 4.數據如果是孤島式沒有共享,不能相互交叉,則研究則沒有意義,以上海為例,很多科學團隊在從事微生物、病毒傳染病等相關研究,這些研究是相互交叉的,是大數據的交叉和分享過程,這時無論公有雲還是行業科研雲形態都變得至關重要。
○ 5.開源是全世界的基礎架構技術協作,基礎架構不存在國別,一定是全球一體化的。
本文由上海市科學學研究所產業創新研究室副研究員傅翠曉整理。文章觀點不代表主辦機構觀點。