經過5年建設,2016年9月22日,總部位於深圳的中國國家基因庫將正式投入運行。這是繼美國的NCBI,日本DDBJ和歐洲EBI之後全球第四個建成的國家級基因庫,也是目前為止世界最大的基因庫。中國國家基因庫要解決什麼問題?未來如何運營?華大基因與國家基因庫之間是什麼關係?這些將是本文要解答的問題。
國家基因庫要做什麼?
相關資料顯示,美國NCBI在成立之初定位於四個主要功能:第一,「為儲存和分析分子生物學、生物化學、遺傳學知識創建自動化系統」(即信息存儲功能);第二,「從事研究基於計算機的信息處理過程的高級方法,用於分析生物學上重要的分子和化合物的結構與功能」(即數位化功能);第三,「促進生物學研究人員和醫護人員應用資料庫和軟體」(既產業共享功能); 第四,「努力協作以獲取世界範圍內的生物技術信息」(即開放平臺功能)。這四個功能定位至今未有大的調整。而歐洲的EBI則更加注重開放和創新的學術氛圍,其功能更多定位與分子生物學基礎研究和教育培訓
在中國國家基因庫的相關介紹中,繞不開「三庫兩平臺」的描述,國家基因庫未來的架構功能,也與此有關。華大基因研究院院長、國家基因庫執行主任徐訊向網易科技介紹,「三庫」包括「幹庫」(數位化庫,既基因、蛋白、分子、影像等多組學生物信息資料庫)、「溼庫」(多樣性生物樣本和遺傳資源庫)和活庫(既活體生物庫);「兩平臺」則是基因信息讀取平臺和基因編輯與合成平臺。
從功能上看,中國國家基因庫的「三庫兩平臺」定位涵蓋了基因庫基本的功能屬性,並在綜合性上有所超越。根據徐訊的描述,中國國家基因庫將是世界上綜合性最強的基因庫,「他們(指DDBJ、NCBI、EBI)只是資料庫,沒有樣品保存功能。相比之下,國家基因庫還有樣品庫和活體庫,目前全球沒有這麼大規模的綜合性資料庫,我們一期就達到了。」
徐訊介紹,國家基因庫主要產生人類疾病和物種多樣性的相關數據。目前,罕見病資料庫已檢測了3000多個家庭,新發現400多種罕見病;癌症資料庫包含上萬份不同種類的數據。公開資料顯示,華大基因今年在與地方政府合作中總計完成27萬多個樣本檢測,包括無創產前、遺傳性耳聾、地中海貧血、新生兒遺傳代謝病、宮頸癌篩查等。這些數據都將在政策規範指導下通過數據共享中心向全國科研機構和人員、產業機構開放。
從國家基因庫所採用的「PPP模式」中不難發現,將基因技術產業化、商業化將是國家基因庫極為重要的功能之一,這種屬性和一開始的定位,與NCBI、DDBJ和EBI有很大的不同。梅永紅向網易科技表示,「國家基因庫與國外三大基因庫相比,不僅在存儲規模上有很大的超越,更注重研發和在產業生態中發揮積極作用,未來國際基因庫希望成為國內基因產業孵化器,繞著存儲、解讀、利用這條產業鏈,希望通過這個平臺有更多人、更多模式走出來。」
另一方面,由於目前國內民眾對基因和基因庫價值的認知尚且有限,科普和科教也是基因產業化必須面臨的課題。對此,梅永紅認為「國家基因庫必須具備科普的功能,人才培養也在國家基因庫的功能規劃之中,根據梅永紅的介紹,國家基因庫不是一個保存平臺,而是一個研發平臺,未來會建立基因庫聯盟,未來人才隊伍會很龐大。」
與美歐的國家級基因庫相比 中國國家基因庫有什麼不同?
在中國國家基因庫建成以前,NCBI(美國國家生物技術信息中心)、DDBJ(DNA Data Bank of Japan語譯「日本基因資料庫」)和EBI(歐洲生物信息研究所)已有多年運營歷史。中國國家基因庫立項建設開始是在2011年,這種晚起步對中國而言意味著什麼?能否產生後發優勢?
以NCBI為例,受當時的美國參議員Claude Pepper提議,美國國立醫學圖書館(NLM)於1988年建立國家生物技術信息中心(NCBI)。在管理體系上,NCBI是在國立醫學圖書館(NLM)的一個分支。這種體制劃分,最初來源於當時基因行業的產業化程度不足和國立醫學圖書館的存儲功能模型思考,也決定了政府在NCBI的組建和運營過程中的核心角色。
與NCBI不同,中國國家基因庫借鑑經濟學理論中的「PPP模式」,由國家財政、地方財政和華大基因三方出資、最終由財政向華大基因購買這種專業服務。這種模式在理論上比NCBI更加先進和高效,但具體效能的發揮仍有待進一步觀察。國家基因庫主任、華大農業集團董事長兼總裁梅永紅向網易科技表示:「國家基因庫設有理事會,由國家發改委、財政部、工信部、衛計委四部委牽頭,深圳市政府共同參與。這個平臺怎麼建設、運營,按照什麼樣的機制實現資源共享,都由理事會建立標準。」
另一方面,國家基因庫在未來的運營過程中能否發揮更大研發、產業化和社會公益價值,將取決於國家基因庫運營的具體操盤手華大基因的思考和運營方式。梅永紅向網易科技表示,「國家基因庫作為一個國家級平臺,不僅是獲得更多的基因資源,我們還要對這些基因資源進行數位化、進行研發、進行利用,這是一個很浩大的系統工程」。
在DNA資料庫容量方面,由於DDBJ、NCBI、EBI這三大數據中心在各自收集序列數據的基礎上共同組成了國際DNA資料庫,於每日都交換和更新數據信息,因此,三個庫的數據實際上是相同的。根據國家基因庫執行主任徐訊的介紹,國家基因庫目前已實現基因信息數據總量達60PB的訪問支持,生物樣本存儲量達到1000萬份,已成為全球最大生命信息平臺。徐訊向網易科技表示,國家基因庫已與國外多個國家級自然歷史博物館、挪威世界末日種子庫等機構建立合作,待國家基因庫正式運營後,也將與國際DNA資料庫三方組織一樣開放數據共享平臺,但出於國家安全或倫理方面的要求,特殊的數據將在一定的監管制度和規範下通過特殊授權才可實現共享。
華大基因在中國國家基因庫中的角色
國家級基因庫乃國之重器。梅永紅向網易科技表示:「基因庫是真正的國庫,比銀行的金庫還要寶貴,農耕時代的核心資源代表是耕地,工業時代是能源,而生命科學時代則是基因。以精準醫學為例,很大程度是通過DNA測序來確定醫院的範式。未來精準醫學方面的發展和競爭,一定程度上是基因資源的競爭。」換言之,在未來生命科學產業的發展中,基因庫將是產業的基礎和核心平臺。
中國政府為什麼會把如此重要之事交給「華大基因,這與華大基因的發展歷史和目前國內國際基因產業格局的現狀不無關係。
華大基因成立於1999年9月9日,2000年代表中國與美國、英國、德國、日本、法國共同承擔完成人類基因組繪製計劃,目前已是全球最大的基因測序機構。
華大基因在中國基因領域的研究能力首屈一指。從2007年到2016年5月5日,華大基因平均每兩天即有一篇論文發表,其中95%被SCI收錄。在今年4月發布的自然指數排名中,華大基因位列中國產業機構首位、全球產業機構第12名。中國其餘基因公司中的創始人、主要負責人大多來自華大基因。
(位於華大基因博物館的華大科研和專利展示)
(華大基因業務/產業板塊組成)
而對於公眾對國家級平臺為什麼要交給華大基因承建運營,而不是中科院或者高校的疑問,梅永紅向網易科技表示:「民營機構比體制內機構在研究方面擁有更大的優勢,沒有壁壘,資源能得到充分的共享。交給華大,是國家對目前國內科研態勢的一個判斷。」
正是基於這樣的發展背景、科研水平和產業化組織能力,2011年1月10日,國家發展改革委等四部委批覆同意華大基因承建並運營深圳國家基因庫。
在建設方面,在根據梅永紅的介紹,在國家基因庫一期7.8億的工程總投資款中,華大基因已經投資了3.6億,配套服務和設備都是由華大基因提供,未來還會繼續加大投入。
運營方面,基因庫作為國家級平臺,將為公眾提供公共產品和公共服務,華大在這個過程中是參與者和具體的操盤手。梅永紅向網易科技強調:「國家基因庫是政府資助、官辦的機構,是由華大基因來運營,或者某種程度上來說可以理解為是由政府來購買服務,但是現在這個機制還並沒有最終完全明確。」
在產業化方面,「國家基因庫是公共服務平臺,不是民生工程。國家基因庫是一個開放的網絡平臺,而不是壟斷所有的基因信息。華大或者國家基因庫不可能包打天下,更多的是提供一個模式和建構標準,使得基因資源得以開發利用,這對提升國家在生命科技領域的能力是非常有價值的。」梅永紅表示。
而對於在產業化過程中如何平衡公共利益和商業屬性之間的關係,梅永紅表示:「產業化的事情,可以是華大來做,也可以是授權,經營的收益一定是屬於基因庫的發展的」。徐訊也表示:「國家基因庫是完全獨立的,雖然由華大團隊建設和管理,但與我們的商業版塊是分開來的。基因庫會提供對外公共服務統一的政策和規則,產業機構包括華大都必須按照規則使用這個公共平臺。」
華大基因在整個過程中會得到什麼?對於這個問題,梅永紅向網易科技表示:「華大基因在商業模式上不是研發技術,形成產品,最後賣產品的公司,華大是做基礎研究起步的機構,在方向和架構選擇時都在摸索一種新的生存發展模式。」另一面,梅永紅同時表示,樹立大目標,集中大資源、搭建大平臺,就會產生大數據,有了大數據就可能產生大科學,最終衍生出產業門類和產業化機構。