1989年,人類基因組計劃開始前,班伯裡學術峰會在紐約冷泉港實驗室舉行。圖片來源:Cold Spring Harbor Lab. Library &Archives
25年前,新創建的美國人類基因組研究國家中心(NHGRI,現在的國家人類基因組研究所)和美國及國際合作夥伴聯手,發起了「人類基因組計劃」(HGP)。接下來發生的事情,代表了最具歷史意義的科學努力之一:歷經13年,對人類基因組全部30億個鹼基對進行測序。
甚至僅在幾年前,關於HGP的討論還主要關注此項目已經或將對認識人類疾病帶來何種見解。然而,直到今天人們才逐漸明晰,除了極大地加速生物醫學研究,HGP還開啟了一種做科研的新方式。
作為生物學領域的首個大規模項目,HGP為眾多基於合作的研究項目鋪就了道路。自2000年起,僅NHGRI便參與發起了超過25個此類項目。這些對生物醫學研究提出了新挑戰,比如要求來自不同國家和學科的多個團隊共同分享並分析海量數據集。
對於年輕的研究人員來說,他們很容易忘記今天正試圖解決的很多問題,在25年前甚至都沒有被前輩思考過。同樣容易被忽視的還有這樣一種見解,即HGP仍在向那些追尋大科學項目的人提供建議。
美國國家人類基因組研究所所長Eric D. Green、冷泉港實驗室名譽主席James D. Watson和國立衛生研究院院長Francis S. Collins日前聯合撰文,闡述了HGP為今天基於合作的科學項目提供的六大關鍵經驗。
擁抱合作。HGP不可避免地打破了研究人員獨自埋頭苦幹、回答一小部分科學問題的常規。它還同假設驅動的研究背道而馳,反而關注將為很多後續研究提供借鑑的基礎信息的發現。
HGP匯集了來自很多國家、學科和年齡層的2000餘名研究人員,每個小組則對應著不同的資助機構。成功來自於資助者強有力的領導、對任務重要性的共同認知,以及研究人員為了集體利益願意放棄個人成就。
很多合作型基因組學項目隨之而來。這包括:對人類基因組中的序列變異進行分類的千人基因組計劃、描繪導致癌症的突變特徵的癌症基因組圖譜,以及利用基因組測序和其他技術研究微生物群落的人類微生物群系項目。
合作型科研的一個常見障礙是參與者不願擁抱新的合作。然而,各種努力以及集中起來的數據和資源會使每個人都受益的意識不斷強化,並且正在使舊的觀念遭到擯棄。
數據分享最大化。HGP改變了生物醫學研究中關於數據分享的既有規範。一旦大量的基因組作圖和測序數據開始產生,為縮短數據產生和發布相隔時間而建立相關政策的勢頭很快便發展起來。這些努力促成了1996年「百慕達原則」的採用。當時,參與此項目的主要團隊負責人同意在超過一定規模的基因組序列集產生的24小時內將其提交至一個公開資料庫。
從那以後的這些年裡,此項努力變成一種基石。2003年,勞德代爾堡協議延伸了相關原則。2008年,美國國立衛生研究院(NIH)擴展了其數據分享的期望,將全基因組關聯研究包括進來。2014年,「百慕達原則」開始執行擴展的基因組數據共享政策。這要求利用NIH資助產生或分析出來的幾乎所有大規模基因組數據都要共享。
廣泛存在的數據共享正帶來新的挑戰。這包括:分析和移動大量數據集存在的計算和輸送上的困難,以及對於人類數據(尤其是基因組和臨床數據)來說,如何保護研究參與者的隱私問題。各種舉措已經推出,以解決這些問題。例如,對強大可靠的計算平臺的需求,正帶來生物醫學研究中雲計算使用的快速增長。
制定數據分析計劃。對於HGP的規劃,本身存有缺陷。回顧過去,早期未受到充分關注的一個領域是數據分析。首個人類基因組序列以一種零零碎碎的方式產生了。為獲得每條染色體的連續序列,上千個單獨組裝的序列片段(每個約100~300千鹼基)不得不通過計算被連接在一起。當對此類計算過程的需求(最終證實在技術上非常有挑戰性)變得明顯時,已處於項目相對較晚期。通過一小群生物信息學家的巨大努力,這一任務在幾個月的時間裡完成。如果規劃中給予更多關注,此項工作便不會面臨如此大的壓力。
近年來,一些基因組學項目(諸如千人基因組計劃和癌症基因組圖譜)已經展示了對於數據分析計劃的早期設計會如何為數據產生策略提供信息。最近,對美國精準醫學計劃的規劃包括了如何最好地整合和分析預期的大量數據類型的討論——從電子健康檔案到基因組分析,以及來自環境監測器和可穿戴人體傳感器的信息。
優先考慮技術開發。1990年10月,HGP參與者在項目推進過程中充分意識到,繪製和測序人類基因組的工具和方法,作為更大型項目的一部分需要被研發出來。事實上,項目促成了多項關鍵基因組學技術的開發以及分子生物學、化學、物理學、機器人學和計算領域的實質性創新,並且帶來了以創新性方式利用工具和方法的策略。在一些情況下,多重漸進式改進被拼湊在一起,產生了革命性的進展,比如最終被用於產生首個人類基因組序列的毛細管DNA測序設備。
從一開始便鼓勵技術創新,對於今天的大型項目同樣至關重要。在這方面領先一步的是美國「通過推動創新型神經技術開展大腦研究」(BRAIN)。項目的總體目標是變革對人類大腦的認識,將首先關注新一代工具的研發,以對大腦中所有細胞類型進行定義、建立其相互連接的地圖,並記錄來自同功能和行為關聯起來的迴路信號。
關注進展的社會影響。HGP的創始人意識到,從繪製和測序人類基因組中獲得的信息會對社會產生深遠影響。HGP由此成為首個包含了致力於分析更廣泛社會問題的大型研究項目,比如怎樣保護人們的隱私並預防歧視。這一項目分支——被稱為倫理、法律和社會影響研究——由NIH劃撥給HGP預算的約5%來支持。它是生物倫理學研究領域迄今最大規模的投資。
社會和倫理方面的考慮出現在當下很多尖端的科學研究中。最引人注目的例子包括利用CRISPR/Cas9基因編輯工具改變人類和其他物種的基因組,以及快速跟進臨床試驗設計,以便在傳染病暴發期間迅速研究潛在治療方法。不幸的是,大多數合作型項目並未像HGP那樣,將專門的生物倫理學研究包括進來。
大膽而不失靈活。HGP的目標很大膽。考慮到關於人類基因組究竟該如何被繪製並且最終被測序的表達不夠清晰,該項目在開始時遭到一些質疑也就不足為奇了。
在專家看來,HGP成功的關鍵在於學術帶頭人一直持有開放態度,以及他們能定期停頓下來評估狀況。1993年和1998年,HGP最初的5年計劃分別得到更新。
只要總體目標基於明確的時間表和定性評估標準,有著偉大目標的大型項目便能取得成功。它們還需要一種必要時迭代計劃的意願。等著完全清楚最終目標將如何被實現,要面臨著錯失機會的風險,因為機會只有在研究人員開始工作後才會呈現出來。這已成為若干大型項目的規範,其中包括BRAIN項目和精準醫學計劃。(宗華)