人類基因組計劃(英語:Human Genome Project, HGP)是一項規模宏大,跨國跨學科的科學探索工程。其宗旨在於測定組成人類染色體(指單倍體)中所包含的30億個鹼基對組成的核苷酸序列,從而繪製人類基因組圖譜,並且辨識其載有的基因及其序列,達到破譯人類遺傳信息的最終目的。
「人類基因組計劃」在研究人類過程中建立起來的策略、思想與技術,構成了生命科學領域新的學科——基因組學,可以用於研究微生物、植物及其他動物。人類基因組計劃與曼哈頓原子彈計劃和阿波羅計劃並稱為三大科學計劃,是人類科學史上的又一個偉大工程,被譽為生命科學的「登月計劃」。
人類基因組計劃由美國科學家於1985年率先提出,於1990年正式啟動的。美國、英國、法國、德國、日本和我國科學家共同參與了這一預算達30億美元的人類基因組計劃。按照這個計劃的設想,在2005年,要把人體內約2.5萬個基因的密碼全部解開,同時繪製出人類基因的圖譜。換句話說,就是要揭開組成人體2.5萬個基因的30億個鹼基對的秘密。截止到2003年4月14日,人類基因組計劃的測序工作已經完成。其中,2001年人類基因組工作草圖的發表(由公共基金資助的國際人類基因組計劃和私人企業塞雷拉基因組公司各自獨立完成,並分別公開發表)被認為是人類基因組計劃成功的裡程碑。
研究歷史對人類基因組的研究在70年代已具有一定的雛形,在80年代在許多國家已形成一定規模。1984年在Utah州的Alta,White R and Mendelsonhn M受美國能源部(DOE)的委託主持召開了一個小型專業會議討論測定人類整個基因組的DNA序列的意義和前景(Cook Deegan RM,1989)
1985年5月在加州Santa Cruz由美國DOE的Sinsheimer RL主持的會議上提出了測定人類基因組全序列的動議,形成了美國能源部的「人類基因組計劃」草案。
1986年3月,在新墨西哥州的Santa Fe討論了這一計劃的可行性,隨後DOE宣布實施這一計劃。
1986年,諾貝爾獎得主杜爾貝科(R. Dulbecco)在《科學》(Science)周刊撰文回顧腫瘤研究的進展,指出要麼依舊採用「零敲碎打」的策略,要麼從整體上研究和分析人類基因組。文中指出:如果我們想更多地了解腫瘤,我們必須關注細胞的基因組。…… 從哪個物種著手努力?如果我們想理解人類腫瘤,那就應從人類開始。……人類腫瘤研究將因對DNA的詳細知識而得到巨大推動。」
1986年遺傳學家McKusick V提出從整個基因組的層次研究遺傳的科學稱為「基因組學」
1987年初,美國能源部和國立衛生研究院為HGP下撥了啟動經費約550萬美元(全年1.66億美元)
1988年,美國成立了「國家人類基因組研究中心」由Watson J出任第一任主任
1990年10月1日,經美國國會批准美國HGP正式啟動,總體計劃在15年內投入至少30億美元進行人類全基因組的分析。
1987年,義大利共和國國家研究委員會開始HGP研究,其特點是技術多樣(YAC,雜種細胞,cDNA等)、區域集中(基本上限於Xq24-qter區域)
1989年2月英國開始HGP,特點是:帝國癌症研究基金會與國家醫學研究委員會(ICRP-MRC)共同負責全國協調與資金調控,劍橋附近的Sanger中心注重首先在線蟲基因組上積累經驗,改進大規模DNA測序技術;同時建立了YAC庫的篩選與克隆、特異細胞系、DNA探針、基因組DNA、cDNA文庫、比較生物基因組DNA序列、信息分析等的「英國人類基因組資源中心」。可謂「資源集中、全國協調」。
1990年6月法蘭西共和國的HGP啟動。科學研究部委託國家醫學科學院制定HGP,主要特點是注重整體基因組、cDNA和自動化。建立了人類多態性研究中心(CEPH),在全基因組YAC重疊群、微衛星標記(遺傳圖)的構建以及馳名世界的用作基因組研究的經典材料CEPH家系(80個3代多個體家系)方面產生了巨大影響。
1990年,美國能源部(DOE)與國立衛生研究院(NIH)共同啟動HGP,原定投入30億美元,用15年時間完成該計劃。英、日、法、德等國相繼加入。
1995年德意志聯邦共和國開始HGP,來勢迅猛,先後成立了資源中心和基因掃描定位中心,並開始對21號染色體的大規模測序工作。
1990年6月歐共體通過了「歐洲人類基因組研究計劃」,主要資助23個實驗室重點用於「資源中心」的建立和運轉。還有丹麥王國、俄羅斯聯邦、日本、韓國、澳大利亞等。
1994年,中國HGP在吳旻、強伯勤、陳竺、楊煥明的倡導下啟動,最初由國家自然科學基金會和863高科技計劃的支持下,先後啟動了「中華民族基因組中若干位點基因結構的研究」和「重大疾病相關基因的定位、克隆、結構和功能研究」,
1998年在國家科技部的領導和牽線下,在上海成立了南方基因中心。
1998年5月11日,世界上最大的測序儀生產商美國PE Biosystems公司,以其剛研製成功的300臺最新毛細管自動測序儀(ABI 3700)和3億美元資金,成立了Celera Genomics公司,宣稱要在3年內,以所謂的「人類全基因組霰彈法測序策略」完成人類基因組測序,並聲稱要專利200~400個重要基因,並將所有序列信息保密3個月。Celera公司已有僱員300多人,購買了號稱「全球第三」的超大型計算機,號稱擁有了超過全球所有序列組裝解讀力量總和的實力。就在六國共同宣布工作框架圖構建完成的同一天,Celera公司宣稱已組裝出了完整的人類遺傳密碼。Celera公司此舉,是對公益性的HGP的競爭與挑戰
1998年,組建了中科院遺傳所,1998年在北京成立了北方人類基因組中心。1999年7月在國際人類基因組註冊,得到完成人類3號染色體短臂上一個約30Mb區域的測序任務,該區域約佔人類整個基因組的1%。
人類基因組計劃(Human genome project)由美國於1987年啟動,中國於1999年9月積極參加到這項研究計劃中的,承擔其中1%的任務,即人類3號染色體短臂上約3000萬個鹼基對的測序任務。中國因此成為參加這項研究計劃的唯一的發展中國家。
2000年6月26日,參加人類基因組工程項目的美國、英國、法國、德國、日本和中國的6國科學家共同宣布,人類基因組草圖的繪製工作已經完成。最終完成圖要求測序所用的克隆能忠實地代表常染色體的基因組結構,序列錯誤率低於萬分之一。95%常染色質區域被測序,每個Gap小於150kb。完成圖將於2003年完成,比預計提前2年。由於人類基因測序和基因專利可能會帶來巨大的商業價值,各國政府和一些企業都在積極地投入該項研究,如1997年AMGEN公司轉讓了一個與中樞神經疾病有關的基因而獲利3.92億美元。
研究領域選擇人類的基因組進行研究是因為人類是在「進化」歷程上最高級的生物,對它的研究有助於認識自身、掌握生老病死規律、疾病的診斷和治療、了解生命的起源。
測出人類基因組DNA的30億個鹼基對的序列,發現所有人類基因,找出它們在染色體上的位置,破譯人類全部遺傳信息。
在人類基因組計劃中,還包括對五種生物基因組的研究:大腸桿菌、酵母、線蟲、果蠅和小鼠,稱之為人類的五種「模式生物」。
HGP的目的是解碼生命、了解生命的起源、了解生命體生長發育的規律、認識種屬之間和個體之間存在差異的起因、認識疾病產生的機制以及長壽與衰老等生命現象、為疾病的診治提供科學依據。
研究內容遺傳圖譜又稱連鎖圖譜(linkage map),它是以具有遺傳多態性(在一個遺傳位點上具有一個以上的等位基因,在群體中的出現頻率皆高於1%)的遺傳標記為「路標」,以遺傳學距離(在減數分裂事件中兩個位點之間進行交換、重組的百分率,1%的重組率稱為1cM)為圖距的基因組圖。遺傳圖譜的建立為基因識別和完成基因定位創造了條件。意義:6000多個遺傳標記已經能夠把人的基因組分成6000多個區域,使得連鎖分析法可以找到某一致病的或表現型的基因與某一標記鄰近(緊密連鎖)的證據,這樣可把這一基因定位於這一已知區域,再對基因進行分離和研究。對於疾病而言,找基因和分析基因是個關鍵。
第1代標記
經典的遺傳標記,例如ABO血型位點標記,HLA位點標記。70年中後期,限制性片段長度多態性(RFLP),位點數目大於105,用限制性內切酶特異性切割DNA鏈,由於DNA的一個「點」上的變異所造成的能切與不能切兩種狀況,可產生不同長度的片段(等位片段),可用凝膠電泳顯示多態性,從片段多態性的信息與疾病表型間的關係進行連鎖分析,找到致病基因。如Huntington症。但每次酶切2-3個片段,信息量有限。
第2代標記
1985年,小衛星中心(minisatellite core)、可變串聯重複VNTR(variable number of tandem repeats)可提供不同長度的片段,其重複單位長度為6至12個核苷酸 ,1989年微衛星標記(microsatellite marker)系統被發現和建立,重複單位長度為2~6個核苷酸,又稱簡短串聯重複(STR)。
第3代標記
1996年MIT的Lander ES又提出了SNP(single nucleotide polymorphysm)的遺傳標記系統。對每一核苷酸突變率為10-9,雙等位型標記,在人類基因組中可達到300萬個,平均約每1250個鹼基對就會有一個。3~4個相鄰的標記構成的單倍型(haplotype)就可有8~16種。
物理圖譜物理圖譜是指有關構成基因組的全部基因的排列和間距的信息,它是通過對構成基因組的DNA分子進行測定而繪製的。繪製物理圖譜的目的是把有關基因的遺傳信息及其在每條染色體上的相對位置線性而系統地排列出來。DNA物理圖譜是指DNA鏈的限制性酶切片段的排列順序,即酶切片段在DNA鏈上的定位。因限制性內切酶在DNA鏈上的切口是以特異序列為基礎的,核苷酸序列不同的DNA,經酶切後就會產生不同長度的DNA片段,由此而構成獨特的酶切圖譜。因此,DNA物理圖譜是DNA分子結構的特徵之一。DNA是很大的分子,由限制酶產生的用於測序反應的DNA片段只是其中的極小部分,這些片段在DNA鏈中所處的位置關係是應該首先解決的問題,故DNA物理圖譜是順序測定的基礎,也可理解為指導DNA測序的藍圖。廣義地說,DNA測序從物理圖譜製作開始,它是測序工作的第一步。製作DNA物理圖譜的方法有多種,這裡選擇一種常用的簡便方法──標記片段的部分酶解法,來說明圖譜製作原理。
用部分酶解法測定DNA物理圖譜包括二個基本步驟:
⑴完全降解
選擇合適的限制性內切酶將待測DNA鏈(已經標記放射性同位素)完全降解,降解產物經凝膠電泳分離後進行自顯影,獲得的圖譜即為組成該DNA鏈的酶切片段的數目和大小。
⑵部分降解
以末端標記使待測DNA的一條鏈帶上示蹤同位素,然後用上述相同酶部分降解該DNA鏈,即通過控制反應條件使DNA鏈上該酶的切口隨機斷裂,而避免所有切口斷裂的完全降解發生。部分酶解產物同樣進行電泳分離及自顯影。比較上述二步的自顯影圖譜,根據片段大小及彼此間的差異即可排出酶切片段在DNA鏈上的位置。下面是測定某組蛋白基因DNA物理圖譜的詳細說明。
完整的物理圖譜應包括人類基因組的不同載體DNA克隆片段重疊群圖,大片段限制性內切酶切點圖,DNA片段或一特異DNA序列(STS)的路標圖,以及基因組中廣泛存在的特徵型序列(如CpG序列、Alu序列,isochore)等的標記圖,人類基因組的細胞遺傳學圖(即染色體的區、帶、亞帶,或以染色體長度的百分率定標記),最終在分子水平上與序列圖的統一。
基本原理是把龐大的無從下手的DNA先「敲碎」,再拼接。以Mb、kb、bp作為圖距,以DNA探針的STS(sequence tags site)序列為路標。1998 年完成了具有52,000個序列標籤位點(STS),並覆蓋人類基因組大部分區域的連續克隆系的物理圖譜。構建物理圖的一個主要內容是把含有STS對應序列的DNA的克隆片段連接成相互重疊的「片段重疊群(contig)」。用「酵母人工染色體(YAC)作為載體的載有人DNA片段的文庫已包含了構建總體覆蓋率為100%、具有高度代表性的片段重疊群」,近幾年來又發展了可靠性更高的BAC、PAC庫或cosmid庫等。
序列圖譜隨著遺傳圖譜和物理圖譜的完成,測序就成為重中之重的工作。DNA序列分析技術是一個包括製備DNA片段化及鹼基分析、DNA信息翻譯的多階段的過程。通過測序得到基因組的序列圖譜。
大規模測序基本策略
逐個克隆法
對連續克隆系中排定的BAC克隆逐個進行亞克隆測序並進行組裝(公共領域測序計劃)。
全基因組鳥槍法
在一定作圖信息基礎上,繞過大片段連續克隆系的構建而直接將基因組分解成小片段隨機測序,利用超級計算機進行組裝(美國Celera公司)。
轉錄圖譜轉錄圖譜是在識別基因組所包含的蛋白質編碼序列的基礎上繪製的結合有關基因序列、位置及表達模式等信息的圖譜。在人類基因組中鑑別出佔具2%~5%長度的全部基因的位置、結構與功能,最主要的方法是通過基因的表達產物mRNA反追到染色體的位置。
原理
所有生物性狀和疾病都是由結構或功能蛋白質決定的,而已知的所有蛋白質都是由mRNA編碼的,這樣可以把mRNA通過反轉錄酶合成cDNA或稱作EST的部分的cDNA片段,也可根據mRNA的信息人工合成cDNA或cDNA片段,然後,再用這種穩定的cDNA或EST作為「探針」進行分子雜交,鑑別出與轉錄有關的基因。用PolyA互補的寡聚T或克隆載體的相關序列作為引物對mRNA雙端尾側的幾百個bp進行測序得到EST(表達序列標籤)。2000年6月,EMBL中EST數量已有4,229,786。
轉錄圖譜的意義
在於它能有效地反應在正常或受控條件中表達的全基因的時空圖。通過這張圖可以了解某一基因在不同時間不同組織、不同水平的表達;也可以了解一種組織中不同時間、不同基因中不同水平的表達,還可以了解某一特定時間、不同組織中的不同基因不同水平的表達。
人類基因組是一個國際合作項目:表徵人類基因組,選擇的模式生物的DNA測序和作圖,發展基因組研究的新技術,完善人類基因組研究涉及的倫理、法律和社會問題,培訓能利用HGP發展起來的這些技術和資源進行生物學研究的科學家,促進人類健康。
主要用途人類疾病貢獻
人類疾病相關的基因是人類基因組中結構和功能完整性至關重要的信息。對於單基因病,採用「定位克隆」和「定位候選克隆」的全新思路,導致了亨廷頓氏舞蹈症、遺傳性結腸癌和乳腺癌等一大批單基因遺傳病致病基因的發現,為這些疾病的基因診斷和基因治療奠定了基礎。對於心血管疾病、腫瘤、糖尿病、神經精神類疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是疾病基因研究的重點。健康相關研究是HGP的重要組成部分,1997年相繼提出:「腫瘤基因組解剖計劃」「環境基因組學計劃」。
對醫學的貢獻
基因診斷、基因治療和基於基因組知識的治療、基於基因組信息的疾病預防、疾病易感基因的識別、風險人群生活方式、環境因子的幹預。
生物技術貢獻
⑴基因工程藥物
分泌蛋白(多肽激素,生長因子,趨化因子,凝血和抗凝血因子等)及其受體。
⑵診斷和研究試劑產業
基因和抗體試劑盒、診斷和研究用生物晶片、疾病和篩藥模型。
推動細胞工程
胚胎和成年期幹細胞、克隆技術、器官再造。
對製藥的貢獻
篩選藥物的靶點:與組合化學和天然化合物分離技術結合,建立高通量的受體、酶結合試驗以知識為基礎的藥物設計:基因蛋白產物的高級結構分析、預測、模擬—藥物作用「口袋」。
個體化的藥物治療:藥物基因組學。
社會經濟影響
生物產業與信息產業是一個國家的兩大經濟支柱;發現新功能基因的社會和經濟效益;轉基因食品;轉基因藥物(如減肥藥,增高藥)
生物進化影響
生物的進化史,都刻寫在各基因組的「天書」上;草履蟲是人的親戚——13億年;人是由300~400萬年前的一種猴子進化來的;人類第一次「走出非洲」——200萬年的古猿;人類的「夏娃」來自於非洲,距今20萬年——第二次「走出非洲」?
負面作用
侏羅紀公園不只是科幻故事;種族選擇性滅絕性生物武器;基因專利戰;基因資源的掠奪戰;基因與個人隱私。
破譯人類遺傳信息,將對生物學,醫學,乃至整個生命科學產生無法估量的深遠影響。目前基因組信息的注釋工作仍然處於初級階段。隨著將來對基因組的理解更加深入,新的知識會使醫學和生物技術領域發展更為迅速。基於DNA載有的信息在細胞生命活動中的指導作用,在分子生物學水平上深入了解疾病的產生過程將大力推動新的療法和新藥的開發研究。對於癌症、老年痴呆症等疾病的病因研究也將會受益於基因組遺傳信息的破解。事實上,在人類基因組計劃完成之前,它的潛在使用價值就已經表現出來。大量的企業,例如巨數遺傳公司開始提供價格合宜,而且容易使用的基因檢測,其聲稱可以預測包括乳腺癌、凝血、纖維性囊腫、肝臟疾病在內的很多種疾病。
人類基因組計劃對許多生物學研究領域有切實的幫助。例如,當科研人員研究一種癌症時,通過人類基因組計劃所提供的信息,可能會找到某個,或某些相關基因。如果在網際網路上訪問由人類基因組信息而建立的各種資料庫,可以查詢到其他科學家相關的文章,包括基因的DNA,cDNA鹼基順序,蛋白質立體結構、功能,多態性,以及和人類其他基因之間的關係。也可找到和小鼠、酵母、果蠅等對應基因的進化關係,可能存在的突變及相關的信號傳到機制。人類基因組計劃對與腫瘤相關的癌基因,腫瘤抑制基因的研究工作,起到了重要的推動作用。
分析不同物種的DNA序列的相似性會給生物進化和演變的研究提供更廣闊的路徑。事實上,人類基因組計劃提供的數據揭示了許多重要的生物進化史上的裡程碑事件。如核糖體的出現,器官的產生,胚胎的發育,脊柱和免疫系統等都和DNA載有的遺傳信息有密切關係。