來自杜克大學的研究人員創造了第一張人類基因組印記基因(imprintedgenes)圖譜,並且他們表示其成功的關鍵在於一個稱為機器學習(machinelearning)的人工智慧形式:modern-dayRosettastone。這項研究新發現了四倍於之前識別的印記基因,並即將公布在12月3日Genome Research封面上。
印記基因是指存在親本染色體上的等位基因的表達取決於它們是在父源染色體上還是在母源染色體上,來自父系、母系的印記基因有所不同,當精卵結合時,父母雙方印記基因均應出現,否則發育就不正常。這種基因印記是等位基因依賴雙親性別表達的不符合孟德爾遺傳定律的特殊遺傳現象,基因印記異常調節可引起一些遺傳性疾病。
在傳統的遺傳學中,子女會繼承一個基因的兩個拷貝,一個來自於父本,一個來自於母本,這兩個拷貝的活性形式會影響子女的發育。但是當印記基因出現——這兩個拷貝中一個會被來自母本或父本的分子調控關閉,這也就意味著子女只會繼承基因的一個拷貝的信息,這樣的子女易受到環境壓力的影響:如果一個功能拷貝受到損傷或遺失,那麼就沒有頂替的後備了。
杜克大學放射腫瘤學及病理學系的遺傳學家Randy Jirtle博士表示,「基因印記一直以來都是一個謎,這部分是由於它們並不遵循傳統的遺傳規律」,「我們希望這一新發現的roadmap能幫助我們和其他研究人員發現更多有關這些基因如何影響我們的健康的信息。」
在文章的其他作者AlexanderHartemink,PhilippeLuedi的合作下,Jirtle他們將兩類基因——一類是已知的印記基因,一類不是——的序列數據輸入到計算機中,利用程序幫助發現其中的差別,通過這一機器分析的方法獲得了一個運算法則:能像最原始的Rosettastone解碼看上去費解的數據,在這裡指的是指向印記基因的特異性DNA序列。
Hartemink表示,「我們不能完全肯定的說我們識別了所有印記基因,但是我們認為這是其中的大部分。」
Jirtle研究印記已經多年了,他表示印記事件是一個表觀遺傳事件,這也就是說不需要改變DNA的序列就可以改變基因的功能,「印記基因容易受到環境的攻擊——甚至是我們的飲食和呼吸。而且重要的是,表觀遺傳變化是可以遺傳,我想人們還沒有意識到這一點。」
預計印記基因佔人類基因組的1%,並且至今只發現了一部分,利用這一研究中的新「Rosettastone」方法,Jirtel和Hartemink發現了156個新的印記基因,其中兩個特殊基因定位在8號染色體上,這在之前是沒有發現過的,其中一個基因:KCNK9,在大腦中十分活躍,已知是引起癌症,和雙相障礙(bipolardisorder),癲癇的原因之一,而第二個基因:DLGAP2是一個可能的膀胱癌腫瘤抑制因子。
原始出處:
Cover Just as the discovery of the Rosetta Stone by Napoleon’s troops in 1799 led to the deciphering of Egyptian hieroglyphics, computational machine learning techniques have recently been used to decipher the imprint status of a gene from nearby genomic sequence features. These techniques permit the genome-wide identification of human genes that have a high probability of being imprinted. These candidate imprinted genes are in turn linked to complex human conditions where parent-of-origin inheritance is involved. (Cover design by James V. Jirtle, Webwiz Design, www.webwizdesign.com. Phototgraph of the Rosetta Stone used with permission © The Trustees of the British Museum.
Published online before print November 30, 2007, 10.1101/gr.6584707
Genome Res. 17:1723-1730, 2007
Computational and experimental identification of novel human imprinted genes
Philippe P. Luedi1, Fred S. Dietrich2,3, Jennifer R. Weidman4, Jason M. Bosko5, Randy L. Jirtle4,6, and Alexander J. Hartemink1,5,6
1 Center for Bioinformatics and Computational Biology, Duke University, Durham, North Carolina 27708, USA; 2 Institute for Genome Sciences & Policy, Duke University, Durham, North Carolina 27708, USA; 3 Department of Molecular Genetics and Microbiology, Duke University Medical Center, Durham, North Carolina 27710, USA; 4 Department of Radiation Oncology, Duke University Medical Center, Durham, North Carolina 27710, USA; 5 Department of Computer Science, Duke University, Durham, North Carolina 27708, USA
Imprinted genes are essential in embryonic development, and imprinting dysregulation contributes to human disease. We report two new human imprinted genes: KCNK9 is predominantly expressed in the brain, is a known oncogene, and may be involved in bipolar disorder and epilepsy, while DLGAP2 is a candidate bladder cancer tumor suppressor. Both genes lie on chromosome 8, not previously suspected to contain imprinted genes. We identified these genes, along with 154 others, based on the predictions of multiple classification algorithms using DNA sequence characteristics as features. Our findings demonstrate that DNA sequence characteristics, including recombination hot spots, are sufficient to accurately predict the imprinting status of individual genes in the human genome.
6 Corresponding authors.
E-mail amink@cs.duke.edu ; fax (919) 660-6519.
E-mail jirtle@radonc.duke.edu ; fax (919) 684-5584.
附:
遺傳印記技術不僅是一種生物學技術,而且是在涉及血緣分析和刑偵分析的民事領域也同樣被採用的分析技術,因而是牽涉到社會演化問題的一個關鍵領域。從生物學研究的角度看,由於人們對基因組織的發展,使我們對DNA多態性的解釋越來越完善,並使我們從中確認了每個生物具有的這種極端的獨特性。
基因組印記是指來自父方和母方的等位基因在通過精子和卵子傳遞給子代時發生了修飾,使帶有親代印記的等位基因具有不同的表達特性,這種修飾常為DNA甲基化修飾,也包括組蛋白乙醯化、甲基化等修飾。在生殖細胞形成早期,來自父方和母方的印記將全部被消除,父方等位基因在精母細胞形成精子時產生新的甲基化模式,但在受精時這種甲基化模式還將發生改變;母方等位基因甲基化模式在卵子發生時形成,因此在受精前來自父方和母方的等位基因具有不同的甲基化模式。目前發現的印記基因大約80%成簇,這些成簇的基因被位於同一條鏈上的順式作用位點所調控,該位點被稱做印記中心(imprintingcenter,IC)。印記基因的存在反映了性別的競爭,從目前發現的印記基因來看,父方對胚胎的貢獻是加速其發育,而母方則是限制胚胎發育速度,親代通過印記基因來影響其下一代,使它們具有性別行為特異性以保證本方基因在遺傳中的優勢。
印記基因的異常表達引發伴有複雜突變和表型缺陷的多種人類疾病。研究發現許多印記基因對胚胎和胎兒出生後的生長發育有重要的調節作用,對行為和大腦的功能也有很大的影響,印記基因的異常同樣可誘發癌症。
相關報導:
Science:查癌先看基因印記丟失
基因阻遏平衡論與返老還童
傑美基因Genmed技術服務項目
試管受精可能會造成胚胎基因錯誤
日本將研究基因異常與男性不育的關聯
Cell:施揚小組解析疾病相關基因