原標題:Nature:人類基因組計劃,回顧大生物學的25年
本文由微信公眾號環球科學ScientificAmerican授權轉載。
25年前,人類基因組計劃啟動了,時至今日,它所提供的經驗仍舊指引著由它開啟的,以團隊協作為基礎的科學研究。
1989年,人類基因組計劃啟動前,紐約冷泉港實驗室舉行的的班伯裡會議。弗朗西斯·柯林斯與詹姆斯·沃森位於前排。
25年前,新落成的美國國家人類基因組研究中心(即現在的國立人類基因組研究所,National Human GenomeResearch Ins,NHGRI)在我們三人的領導下,協同美國國內與國際的合作夥伴,啟動了人類基因組計劃(Human Genome Project,HGP)。此後發生的一切,成為最具歷史意義的重要科學成就之一:通過長達13年的探索,測序人類基因組的三十億鹼基對。
就在數年前,圍繞人類基因組計劃的討論焦點還主要集中在這個問題上:該項目為我們理解人類疾病已經帶來,或者會帶來怎樣的啟示?這個問題的答案到現在才水落石出:人類基因組計劃不僅大力推動了生物醫學研究的發展,還開啟了科學探索的新途徑。
作為首個大規模生物學項目,人類基因組計劃為之後諸多的團隊協作研究項目鋪平了道路。僅NHGRI自2000年開始就啟動了超過25個此類項目。這為生物醫學研究帶來了新挑戰:譬如,要求來自不同國家與學科的不同團隊齊心協力,來共享和分析大規模的數據集。
現在的年輕學者很容易忽略這樣一個事實:很多他們正在努力攻克的問題是25年前他們的前輩想都沒想過的。同樣容易被忽略的是,人類基因組計劃迄今仍在啟發這些大規模科學項目的探索。事實上,我們認為今天這些以團隊協作為基礎的科研之所以能成功,是基於人類基因組計劃的六條重要經驗。
六條經驗
通力合作
人類基因組計劃打破了研究學者獨自探索,為少數幾個科學問題尋求答案的格局,這是勢所必然的。同樣,它還一反「假說推動研究」的規矩,而是專注於發現能夠啟發大量後續研究的基礎信息。
人類基因組計劃匯集了來自多個國家,多種學科背景和具有不同資歷的2000多名研究人員,他們分成若干小組,由不同的基金會支持。該項目的成功源自投資人有力的領導、對這項工作重要性的共識以及研究者甘心為共同的利益而放棄個人成就的意願。
不少以團隊合作為基礎的基因組學項目緊隨其後。其中包括:對人類基因組中的序列差異進行分類的「千人基因組項目」(the 1000 Genomes Project);鑑定致癌突變的「癌症基因組圖譜項目」(Cancer Genome Atlas);以及,在其他技術中加入基因組測序技術,來研究微生物群落的「人類微生物組計劃」(Human Microbiome Project)。
對於以團隊合作為基礎的科研而言,一個常見的障礙是參與者不願意接納新成員。不過經過多方努力,再加上越來越多的人認識到積累數據和資源對每個人都有益,這一成規最終得以瓦解。
譬如,直到最近為止,非洲的遺傳學家和基因組學家與歐美科學家的合作最為頻繁,而與其他非洲研究者合作得較少。「非洲人類遺傳與健康新方案」(Human Heredity and Health in Africa,H3Africa)旨在增強非洲基因組學研究。它的關鍵目標之一就是培養建立起非洲本土的交流合作。由美國國立健康研究所(NIH)和 英國維康信託基金(Britain's Wellcome Trust)在2012至2013年提供給該項目的啟動基金資助了24個非洲國家的29次合作;而這些數字還在進一步增長。H3ABioNet是一個旨在促進整個非洲共享專業知識、基礎設施和工具的生物信息學網絡平臺,目前已經包括了15個國家的32個研究團隊。
數據分享最大化
人類基因組計劃改變了生物醫學研究中數據分享的舊例。大量基因組圖譜定位與測序的數據開始生成之後,要求設立可以縮短數據從生成到發布的時間的政策的呼聲就日益增強。1996年,百慕達原則(Bermuda Principles)的實施為這一番努力畫上了句點。人類基因組計劃主要團隊的領導人同意在序列生成後的24小時內,將達到一定規模的基因組序列整合提交到一個公共資料庫。
在那之後的幾年中,促進數據共享的工作仍在繼續。在2003年,勞德代爾堡協定(Fort Lauderdale Agreement)推廣了百慕達原則,而在2008年,NIH將其這種數據共享擴展到全基因組關聯性研究中。全基因組關聯性研究指的是組織成百上千人,分析其常見的基因組變異,從中找出與感興趣的性狀相關的變異。2014年,一項全面的「基因組數據分享政策」(Genomic Data Sharing Policy)開始實施,要求幾乎所有在NIH基金資助下獲得或分析的基因組數據都必須拿出來共享。
數據的廣泛共享也帶來了新挑戰。其中包括分析和移動大批數據時計算和物流上的難點,另外,以人類數據(尤其是基因組和臨床數據)為例,怎樣保護研究中被試者的隱私也是問題之一。人們正在探索大量新方案以解決此類問題。
對於穩定可靠且功能強大的計算平臺的需求,促使雲計算在生物醫學研究中的應用飛速增長。人們也提議利用新資源,比如建立一個「公用數據」系統(data commons)來儲存已發表和未發表的數據。國際基因組與健康同盟(Global Alliance for Genomics and Health)是一個在2013年成立的國際性聯盟組織,它正在準備一個國際性的「基因組與健康相關數據責任分享框架」(Framework for Responsible Sharing of Genomic and Health-related Data)。這將把法律、倫理和技術都納入考慮範圍之中。
1994年:早期DNA 測序實驗室
有計劃地分析數據
人類基因組計劃的籌劃有其缺陷。回顧當時,數據分析在計劃之初就未獲得足夠的重視。第一個人類基因組數據是由零化整地建立的。為了獲得每條染色體上相鄰的序列,必須由計算機把幾千條單獨整合的序列片段(每條長約100-300千鹼基對)拼接在一起。此類計算處理的需求(其實也是技術挑戰)在人類基因組計劃後期變得愈發明顯。通過生物信息學小組艱苦卓絕的努力,這一任務耗費了數月得以完成。如果在計劃階段多花點心思,完成這些工作就會輕鬆許多。
近幾年來,一些基因組學計劃(譬如千人基因組計劃和腫瘤基因組圖譜計劃)展示了及早制定計劃是怎樣影響數據生成的策略的。最近的美國精準醫療計劃(US Precision Medicine Initiative)預期將得到種類異常繁多的數據,於是事先就探討了整合與分析這些數據的最佳方案——從電子健康檔案和基因組分析到環境監控儀和可穿戴身體傳感器等等。
優先發展技術
1990年10月,人類基因組計劃的成員們清醒地認識到,必須把基因組測序與繪製圖譜的工具與方法作為一個更大的項目去開發。事實上,這個項目催生了不計其數的關鍵遺傳學技術,並引發了其後的分子生物學、化學、物理學、機器人技術和計算科學的革新,同時也讓工具和技術手段的使用策略更富有創意。在某些案列中,人們把多種漸進的改進整合在一起,就獲得了革命性的進步,譬如毛細管DNA 測序設備最終被用於生成第一個人類基因組圖譜。
對技術革新的注重在今天的大規模項目中一樣重要。這方面的領頭羊就是美國腦科學研究所,它的推進創新神經科技行動(Advancing Innovative Neurotechnologies Initiative)目標是徹底改變我們對人類大腦的認識。此計劃致力於發展新一代可鑑定大腦中所有的細胞類型的工具,並且建立它們聯繫的圖譜,再記錄各種功能和行為相應的神經迴路信號。
追蹤進展帶來的的社會影響
人類基因組計劃的發起人意識到,從人類基因組測序與圖譜建立過程中獲得的信息可能為社會帶來深遠影響。該項目因此成為首個致力於研究更廣泛的社會問題(譬如怎樣保護個人隱私和避免歧視)的大規模研究項目。NIH為人類基因組計劃提供的經費中,有5%撥給了研究ELSI(即倫理、法律與社會意義)問題的分支項目。這是有史以來對生物倫理學研究最大的投資。
當今,很多前沿的研究都存在社會與倫理學的顧慮。備受關注的例子包括應用CRISPR/Cas9基因編輯工具改變人類與其他物種的基因組,以及為了在傳染病爆發時迅速研究可行的治療方法而快速設計臨床試驗。遺憾的是,很多以團隊合作為基礎的項目並不像人類基因組計劃這樣,包含專門的生物倫理研究程序。我們認為,新的大型方案啟動時,對倫理和社會影響的研究也應該是其中一個關鍵的組成部分。
到了2006年,DNA測序對人力的需求降低了很多
大膽而靈活
人類基因組計劃的目標是相當大膽的。鑑於人們不知道人類基因組的測序和分析會得出什麼樣的結果,一些人抱著懷疑的態度審視這項工作也情有可原。
我們相信,人類基因組計劃成功的關鍵在於科學帶頭人們一直保持著一個開放的心態,以及定期暫停項目並進行評估。人類基因組計劃最初的5年計劃在1993年與1998年分別被修正更新,它的的各個項目也得到了定期的更新。
只要整個任務是建立在明確的基礎、質量標準和評價體系之上,目標大膽規模龐大的項目就有可能成功。此外,還需要對計劃的反覆調整更新。要是等到最終目標都弄清楚才開始,就會有錯失良機的風險,而且很多機會只有在研究者著手工作以後才會出現。這一原則已成為多個大規模計劃的規範,其中包括BRAIN和精準醫療計劃項目。
規則顛覆者
20世紀90年代早期——無論是NIH在人類基因組計劃的領導層(詹姆斯·D·沃森與弗朗西斯·E·柯林斯),還是在該項目的第一線(弗朗斯西·D·柯林斯)——我們當中並沒有人預見到人類基因組計劃的主要收穫是新型的科研模式。
在當今研究生的職業生涯中,他們可能會見證或親身參與闡明數千種疾病的分子機制、癌症診斷與治療的革命、微生物組學的成熟、幹細胞治療的常規化應用以及其他令人嘆為觀止的生物醫學成就。
人類基因組計劃的故事是一份珍貴的備忘錄,提醒我們該工程的一些成就從根本上引發了研究方式的變革,同時,它也提醒我們,接受和歡迎這些變革是多麼的重要。(撰文:Eric D. Green James D. Watson Francis S. Collins 翻譯:陳曉青 審校:董子晨曦)