劉曉 陶誠 陳大明 中國科學院院刊
本文刊載於《中國科學院院刊》2020年第1期
專題:融合科學與開放數據
《生物技術與信息技術的融合發展》
劉曉1 王躍1 毛開雲1 範月蕾1 陶誠2* 陳大明1*
1 中國科學院上海生命科學研究院 中國科學院上海營養與健康研究所
2 中國科學院 發展規劃局
1
生物技術與信息技術融合發展的意義
生物技術與信息技術的融合發展,其源頭可追溯至物理學家埃爾溫 · 薛丁格(Erwin Schrödinger)於1944年發表的《生命是什麼?活細胞的物理學觀》一書。
在書中,薛丁格提出「是什麼讓生命系統似乎與已知的物理學定律相悖」的問題,啟發了詹姆斯·沃森(James Watson)和弗朗西斯 · 克裡克(Francis Crick)等物理學家投身生命科學的研究,進而發現DNA的雙螺旋結構,開啟了現代生命科學的發展。同時,薛丁格提出在生命系統中「必須努力找到一種新的物理定律」,這也啟發了克勞德 · 香農(Claude Shannon)和諾伯特 · 維納(Norbert Wiener)對於新概念的探索,並進而在「信息」的探索中分別提出了資訊理論和控制論。
以此為起點,20 世紀下半葉,生物技術和信息技術分別沿著各自的軌跡漸進發展。1990 年正式啟動的「人類基因組計劃」,使得人們從「三論」(系統論、控制論和資訊理論)的角度重新審視生命科學的發展規律。「人類基因組計劃」最早的倡導者之一萊諾伊 · 胡德(Leroy Hood)提出了「系統生物學」研究的必要性,並進而提出預見性(predictive)、預防性(preventive)、個性化(personalized)和參與性(participatory )的「4P 醫學」發展方向。
此外,美國麻省理工學院從控制論的角度審視了「系統生物學」在合成生物學中的應用。由此,生物技術與信息技術融合發展的序幕已經徐徐拉開。
生物技術和信息技術的融合發展,已成為新一輪科技革命的重要驅動力
總體上看,信息技術在生命科學研究和生物技術開發方面的規模化應用,早於生物技術驅動信息技術的發展。
早在 20 世紀 80 年代,生物信息學已經成為生命科學研究的重要工具,發達國家順勢布局建立了美國國立生物技術信息中心(NCBI)資料庫、歐洲生物信息學研究所(EBI)資料庫和日本 DNA 資料庫(DDBJ)三大資料庫。
「人類基因組計劃」的開展,引發了基因組、轉錄組、表觀遺傳組、蛋白質組、代謝組等生命科學組學數據的急劇增長,推動了信息技術在生命科學領域的大規模應用,驅動生命科學研究進入「數據密集型科學發現(Data-Intensive Scientific Discovery)」的第四範式時代。由此,生物技術實現了信息化、工程化、系統化的發展,為「設計—構建—驗證(Design-Build-Test)」循環模式的建立奠定了堅實的基礎,並朝著可定量、可計算、可調控和可預測的方向躍升。
信息技術的引入,使得生命科學從「實驗驅動」向「數據驅動」轉型發展,而生物體內的信息處理過程也為信息技術的發展帶來了無窮的啟迪。隨著當前科技逐步逼近香農定律的理論瓶頸、內存牆的馮·諾伊曼瓶頸、摩爾定律的工程瓶頸,科技界和產業界將目光投向了 DNA 存儲、神經形態晶片、生物啟發計算等交叉技術領域。
例如,2013 年 10 月美國半導體研究聯盟(SRC)便啟動了「半導體合成生物技術」(semiconductor synthetic biology,SSB)研究項目,以研究受生物啟發的半導體系統,加深對未來信息通信技術的認識,把握戰略機遇。美國於 2018 年首次發布的「半導體合成生物學路線圖」,將生物技術的引入視為半導體領域發展的重要機遇。從這個角度看,生物技術在信息技術領域的應用,著眼點是大數據存儲、高性能計算等方面的需求瓶頸,進而從仿生、似生、創生、再生等角度出發尋求新的解決方案。
生物技術的研究發展是對信息技術的有力支撐,信息技術的「瓶頸」解決需要從生物技術發展尋求啟示;生物技術與信息技術的融合發展進入了相互推動、齊頭並進的時代,並成為新一輪科技革命和產業變革的重大推動力和戰略制高點。生物技術、信息技術與納米技術等融合形成的「會聚技術」(converging technologies),將產生難以估量的效能:「如果認知科學家能夠想到它,納米科學家就能夠製造它,生物科學家就能夠使用它,信息科學家就能夠監視和控制它」。從這個角度看,生物技術和信息技術的「1+1」融合發展,或將產生「11」的巨大效能。
生物技術和信息技術的融合發展,已成為大國和創新企業的戰略選擇
早在 2001 年,美國商務部、國家科學基金會(NSF)、國家科學技術委員會(NSTC)在華盛頓聯合發起由生物技術、信息技術、納米技術等領域的頂級專家參加的圓桌會議,探討「會聚技術」的布局前景。由此開始,美國各界高度重視信息技術與生物技術的融合。
例如,美國國防高級研究計劃局(DARPA)的諸多項目布局中均體現了生物技術與信息技術融合發展的趨勢。在生物技術領域,美國融合各界共識形成的《21 世紀的新生物學》《會聚觀》等報告認為,信息技術等的會聚已經是生物技術發展的核心驅動力,為此美國在「腦科學計劃」「精準醫學計劃」等重大計劃中均廣泛運用信息技術融合手段。在信息技術領域,美國半導體研究聯盟將目光瞄準了「半導體合成生物學」並加以重點布局。
總體上看,這一布局的發展歷程,與人類社會的信息量增長有著或多或少的聯繫:生物技術的大發展,催生了大數據存儲和分析的需求;信息技術的大發展,加速了受生物啟發的解決方案的開發。在這一背景下,歐洲和日本也在加速布局。
除國家層面的布局外,谷歌、微軟等信息技術企業紛紛與生物技術企業開展戰略合作。比較典型的是,多個大型醫藥企業或醫藥投資者紛紛與信息技術企業開展合作,加速融合布局(圖1)。例如,在大數據和人工智慧領域,美國麻省理工學院已與安進、巴斯夫、拜耳、禮來、Sunovion 製藥等醫藥公司開展機器學習方法的合作。再如,半導體設備的龍頭企業泛林(Lam Research)公司已成立投資機構加速半導體合成生物學研究等方面的布局。
圖1 醫藥企業與信息技術企業的融合布局
生物技術和信息技術的融合發展,或將催生諸多的新興布局空間
從美國「腦科學計劃」「國家微生物組計劃」「人類細胞圖譜計劃」等的資助項目可以看出,生物技術與信息技術的深度融合,還將促進 3D 細胞列印、人機智能等顛覆性技術的發展,並由此帶動系統科學和系統工程的發展,推動農業、工業、健康、環境、交通等領域的新布局(圖2)。綜合分析來看,已有的諸多研究布局,都是在這種背景下展開。
圖 2 生物技術與信息技術融合帶來的新布局空間示例
其中,比較典型的項目是,美國 DARPA 和美國情報高級研究計劃局(IARPA)促進生物技術與信息技術融合發展的研究項目布局(圖3)。整體上看,近年來這兩大機構的諸多布局,都是在上述的新布局空間背景下展開。
圖 3 美國國防高級研究計劃局(DARPA)和美國情報高級研究計劃局(IARPA)的生物技術與信息技術融合布局項目示例
2
生物技術與信息技術融合發展帶來的變革
生物技術與信息技術的融合發展,至少將帶來 8個方面的重大變革。
研究新範式
信息技術的深度融入,使得現代生命科學研究範式發展成為集人工智慧驅動的生物設計和生物模擬(「幹實驗」)、自動化驅使的實驗研究(「溼實驗」)於一體的計算機輔助生物學(Computer-Aided Biology,CAB)範式;並促進了「假設驅動的科學」(Hypothesis-driven Science)先是向「發現驅動的科學」(Discovery-driven Science)的躍升,進而實現「數據密集型科學發現(Data-Intensive Scientific Discovery)」,從而驅動「格物致知」與「建物致知」的有機融合,同時也在「設計—構建—驗證—學習—設計」的反饋循環中推動信息架構設計、信息科學理論、信息技術開發的躍遷。
多學科、多要素、多層次、跨學科、跨領域、跨區域的生命科學研究,在闡明生命系統的層次、結構、演化的同時,也促成了整體性、關聯性、等級結構性、動態性、平衡性和時序性等新研究發展,從而為系統論、控制論、資訊理論、耗散結構論、協同論和突變論的研究發展提供了新途徑。
科學新發現
生命系統和信息系統都是下級結構有序形成上級結構、上層設計約束下層單元的有序系統:分子組成細胞,細胞構成組織,組織形成器官,器官形成系統;電晶體組成邏輯門,邏輯門組成模塊,模塊組成計算機,計算機連接成網際網路,這些系統的組成、結構、功能、運行和發展規律,有其可類比之處。
在生物技術與信息技術的深度融合發展中,人們對於結構和功能、整體與部分、運行與調控的基本規律認知,必將推動生命科學和信息科學的新發現,提升系統科學和智能科學的新認知。
技術新發明
生命信息的感知、存儲和計算,已經催生了生物傳感器和生物納米物聯網(IoBNT)技術、生物啟發的信息通訊技術(BICT)、基因測序、基因合成和DNA存儲、系統生物學分析、人工突觸、人機互動和神經調節等技術的開發,同時也帶動了生物學計算機輔助設計(BioCAD)工具和合成生物學開放語言(SBOL)等「基礎設施」的開發,極大地豐富了現代生物技術的生態。
可以預見的是,生物技術和信息技術的融合,或將成為「會聚技術」發展的源頭動力,進而在與其他技術的融合發展帶動「湧現效應」的發生。
產業新模式
生物技術和信息技術的融合,更將全面改變農業、工業和服務業的業態,驅動產業的新突破,帶來新產品、新業態和新模式的發展(圖4),驅動精密儀器和裝備、軟體和系統工具、3D 列印和 4D 列印等服務的創新。同時,兩者的融合或將產生集數據驅動型的「幹實驗室」和自動化使能的「溼實驗室」一體化的「雲端實驗室」,在改變科學研究模式的同時,將帶來協同研究和轉化研究的新發展。
圖4 生物技術和信息技術融合發展帶來的產業新模式示例
健康新理念
生物技術和信息技術的融合發展,將使「生物-社會-心理-環境」醫學模式具備強大的技術支撐,進而將該醫學模式的理論優勢轉化為實踐優勢,促成以「疾病」為中心向以「健康」為中心的轉變、從「治已病」向注重「治未病」的轉變、從「單一要素防控」向「全方位幹預健康影響因素」的轉變、從「依靠衛生健康系統」向「社會整體聯動」的轉變、從「服務部分人群」向「維護全生命周期健康」的轉變。
此外,使「每個人都是自己健康的第一責任人」理念得到健康狀態辨識、健康風險評估、健康自主管理和健康主動促進等技術的全面支持,從而構建起支撐從尚未出生的胎兒到老年人群、貫穿家庭社區和醫院的健康信息平臺,消除數據壁壘,暢通共享通道,推動醫學取得突破,幫助百姓獲得實惠;推動覆蓋全生命周期的健康管理服務、支持全鏈條管理的重大慢性疾病防治,實現預防、治療、康復和自我保健管理一體化發展。
綜合來看,在技術交叉融合的驅動下,健康管理或將實現早發現、早診斷、早幹預的「關口前移」,數位化、個性化、精準化的「一人一方案、一病一路徑」,全面篩查、全程管理、全民健康的「全方位診療」,以進一步滿足人民群眾的健康需求。
製造新能力
信息技術的引入,使生物技術的工程化開發有了強有力的工具支撐,從而使在 DNA 合成、細胞製造等方面的能力實現質的突破。
以 DNA 合成為例,半導體技術的引入促進了新的發展:第二代 DNA 合成儀的開發借鑑了半導體技術,通過半導體工藝引入發展了物理掩膜法原位合成儀器、光敏保護基團介導的光控原位合成儀器、基於電化學介導酸脫保護合成方法的半導體原位合成儀器、噴墨式列印 DNA 原位合成儀器、基於矽片的噴墨式合成儀器及原位拼接技術等。
其中,基於矽片的噴墨式合成儀的開發,或將意味著這一領域走出類似「摩爾定律」的路徑,並為第三代 DNA 合成儀的開發提供基礎支撐(酶法合成或許也可以與基於矽片的噴墨式平臺相結合)。
細胞製造的產業發展,或將經歷類似半導體領域的從「垂直一體化」向「垂直分工」的分化發展,形成「設計—製造—測試」的垂直鏈條分工,即「細胞設計」「細胞製造」和「細胞測試(分為基本質量控制測試和臨床應用測試)」三大環節,由價值鏈上的不同企業分工來完成。
2017 年,美國國家細胞製造協會(NCMC)發布了《面向 2025 年大規模、低成本、可複製、高質量的細胞製造技術路線圖》的更新版,從其定義的細胞處理,細胞保存、分配與操作,處理監測與質量控制、標準化與監管支持,以及員工發展等環節,也可以看出分工協同的思路。因而,細胞製造的成本或將也以類似「摩爾定律」的路徑下降,從而帶來生物製造能力的巨大突破。
上述方面的突破,將為信息技術的發展帶來新空間。例如,美國發布的「半導體合成生物學路線圖」提出了「高能效、小規模、細胞啟發的信息系統」的開發方向。通過編程細胞機器與半導體平臺的相互作用,「生物-半導體混合系統」或將具有超過傳統電子設備的、前所未有的能力,能夠對環境信號進行連續複雜的計算。這些創新產品的製造能力升級,將帶來空前的發展潛能。
環境新要素
對人體健康而言,水、土、大氣等傳統環境要素,分子、細胞、組織、器官和個體水平的內環境,以及近人體空間的「小環境」等「新要素」,都是不可或缺的環境要素。囿於技術手段,關於這些環境「新要素」的研究在以往相對較少,而生物技術和信息技術的發展或將把這些環境「新要素」與傳統環境要素結合起來,使其在人體安康、家庭安居、社會安全中的作用得到更為充分的研究,從而為包括信息技術產品在內的新場景、新技術、新標準、新體系開發提供有力支撐(圖5)。
圖 5 以「環境 - 健康」關係為核心的知識圖譜示意圖
農業新發展
生物技術和信息技術的交叉融合發展,推動了以種源農業、智慧農業、綠色農業等為特色的健康農業新體系的建構,提供了名、特、優、新的產品和生產、生活、生態、生息「四生共融」的功能,從而使農產品消費模式由追求溫飽型轉變為追求安全、營養、健康型。
美國國家科學院(NAS)在《面向 2030 年推動食品和農業研究的科學突破》中指出:高精度、精準、可現場部署的生物傳感器等系列傳感器是未來發展的底層技術;實驗室研究和生產實踐中的數據脫節是當前的主要瓶頸;將基因組信息、先進育種技術和精確育種方法納入常規育種和選擇計劃是未來的必要選擇;而土壤和植物微生物組之間的相互作用表徵和信息分析則至關重要。
3
促進生物技術與信息技術融合發展的建議
與發達國家相比,我國在生物技術和信息技術的基礎性、先導性、顛覆性布局上仍存在短板,主要表現為生命科學信息的採集和分析所需的儀器、工具以及平臺嚴重依賴國外;在生物技術和信息技術融合發展方面的前沿技術布局系統性不夠;在融合發展帶來的範式和模式轉變等方面的認知有待進一步深入等。面對未來戰略競爭制高點,建議在以下領域率先布局,推動我國高新技術向質量效能型和科技密集型轉變。
1
開發關鍵共性工具,支持發展「所需」
針對高維度、跨尺度和多模態的生命信息採集工具、分析儀器、設計軟體、模擬環境和驗證體系,仿生感知、通訊、計算和控制所需的基礎元件、器件和模塊等方面,面向戰略制高點率先布局關鍵共性工具的開發,在工具的「設計—構建—測試—應用—學習」循環中驅動工具開發能力的「螺旋式」上升。
2
布局前沿引領技術,實現自主「所有」
針對 DNA 存儲與計算技術、細胞半導體界面、3D 生物學分析和仿真技術、人機智能交互技術等前沿技術領域,以類似「摩爾定律」的性能升級路徑為導向,制定關鍵技術戰略發展路線圖,並依據路線圖採取工程化的模式加以布局實施。
3
構建使能技術平臺,支持協同「所創」
以構建生命健康數據平臺、智能化細胞構建與製造平臺、基於大數據和人工智慧的使能技術平臺為切入點,促成會聚範式的形成,推動理念融合、技術集成和工程協同,實現高效的協同創新發展。
劉 曉中國科學院上海生命科學信息中心館員。主要從事生命科學相關領域情報研究。參與國家自然科學基金委員會、中國科學院、上海市科學技術委員會等多項戰略研究和軟科學研究項目。
陶 誠 中國科學院發展規劃局規劃管理處處長。長期從事科技發展戰略研究和科技規劃管理工作。參與組織了「創新2050中國科技發展路線圖戰略研究」「科技發展新態勢與面向2020年的戰略選擇」等戰略研究,組織研究編制了中國科學院「十三五」發展規劃綱要。
陳大明 中國科學院上海營養與健康研究所產業與技術情報研究中心副主任,研究館員。從事生物技術與信息技術交叉融合等方面的科技情報研究。近年來,帶領團隊完成了10多項生命健康領域產業情報研究、生物技術和信息技術等領域的智慧財產權分析評議工作,研究成果獲華東地區科學技術情報成果獎一等獎等多個獎項,所著的《芯事》一書入選「解放書單」。
總監製:楊柳春
責任編輯:張帆
助理編輯、校對:PAN
排版:立夏