原創 奇點糕 奇點網
奇點糕寫過不少國外的基因組資料庫。講道理,基因組學已經深入參與了醫學研究的各個方面,層出不窮的新研究新結果也頗給人一種「窺基因知天命」的感覺。
不過啊,這外國的資料庫,納入的樣本多少還是以外國人為主。地球這麼大,兩邊兒的人遺傳背景和特徵可能天差地別,如果有可能,還是用咱自己人的基因來研究咱自己人的身體比較靠譜啊。
稍等莫急,這不就來了!
為了獲得全面、獨立、高質量的中國人群特異性基因組資料庫,中國代謝解析計劃ChinaMAP(China Metabolic Analytics Project)誕生了。
4月30日,ChinaMAP在《細胞研究》雜誌上發表了一期研究成果[1],首次報導了來自全國27個省份和直轄市、8個民族超過一萬人的深度全基因組測序數據分析,發現了1.36億個單核苷酸多態性(SNPs)和1070萬個插入或缺失位點(INDEL),其中一半以上是未在其他資料庫報導過的新突變。
該論文的通訊作者是上海交通大學醫學院附屬瑞金醫院、國家代謝性疾病臨床醫學研究中心的寧光院士、王衛慶教授和畢宇芳教授。
那麼我們就來看看ChinaMAP有哪些有趣的研究結果吧~~
ChinaMAP打哪來?
ChinaMAP的數據來源於三個大型隊列,總計包括45萬名參與者。在第一階段成果中,研究者們從中隨機選取了10588位參與者進行深度測序,參與者來自全國27個地區,包括漢族、回族、滿族、苗族、蒙古族、彝族、藏族和壯族8個族裔,參與者平均基線年齡54歲,女性佔64.8%。
與此前的類似研究相比,ChinaMAP採用了更深的測序深度,達到40x,最終獲得了1.36億個SNP和1070萬個INDEL。在與常用的國際資料庫gnomAD、1KGP、UK10K和TOPMed對比之後,研究者發現有54.41%的突變是僅有一個個體具有的,此前從未報導。這些突變中編碼蛋白質的共有178萬個,佔比1.21%。
在與現有資料庫的對比中,研究者發現ChinaMAP表現出了非常大的差異性,出現了很多新的常見突變和低頻突變,且個體突變數表現出了很明顯的地理及民族特點。
ChinaMAP與其他的資料庫之間存在較大差異(c,d)
且表現出明顯的地理因素(e)
依照ChinaMAP,我們的民族還可以更豐富
總的來說,中國人的遺傳特點還是非常鮮明的,與歐洲、非洲、南亞、拉丁美洲差異都很大,與非洲差異最大,和日本、越南人的遺傳結構非常相似。
而我們內部的多民族也各有各的特徵,少數民族總體具有更多的突變數,各個少數民族都有獨特的聚類。至於人口眾多的漢族,自己也可以繼續細分為七個亞群:北方漢族(北京、天津、河南、河北、山東、遼寧、吉林、黑龍江、山西),西北漢族(甘肅、陝西),東部漢族(江蘇、浙江、上海、安徽),中部漢族(湖北),南方漢族(貴州、四川、重慶、湖南、雲南、江西),東南漢族(福建)和嶺南漢族(廣東、廣西)。
從人群聚類中,也能夠看出歷史留下的腳印。比如滿族和北方漢族相似,回族與西北漢族相似,這和歷史上的人口遷移是能夠對應上的;在絲綢之路的要道河西走廊地區,繁華鼎盛的時期有多民族聚居,這個地區的人相對來說也具有更多變複雜的基因。
不同地區和亞群的人口表現出不同的聚類
中國更高發的遺傳病
ChinaMAP與國外的資料庫如此不同,那麼中國人常見的遺傳病是不是也與外國人有很大差異呢?
ChinaMAP中最常見的致病突變為SERPINB7 rs142859678,等位基因頻率達到1.1%,是歐美人群的21倍多。這個突變會引起長島型掌蹠角化症,該病在中國人和日本人中高發。
還有導致慢性胰腺炎的突變SPINK1 rs148954387,在中國人中等位基因頻率0.5%,也是歐美人群的接近18倍;類似的,與甲狀腺功能相關的6個基因在ChinaMAP中也更常見。
可見在遺傳疾病上,中外差異還是很大的,相關的研究、臨床指南制定,還是得依照咱們自己的數據開展。
中外數據中致病基因頻率相差非常大
ChinaMAP說,還是北方人能喝
由於乙醛脫氫酶ALDH2 rs671突變的存在,東亞人天生對酒精的代謝能力更差。數據顯示,中國人中rs671純合子的比例達到4.5%,雜合子的比例也有34.27%,而且rs671突變也意味著食管癌的風險更高。
所以呀,少喝酒,特別是那些會「上臉」的人。
按照地理位置,北方人要比南方人代謝酒精的能力更強、更能喝,藏族、蒙古族和彝族酒豪遍地,嶺南漢族和東南漢族排名墊底。
另外,研究者們還討論了中國人藥物代謝的特徵。從基因來看,幾乎所有中國人都應當減量使用華法林;半數以上(59.08%)中國人對氯吡格雷代謝不佳;而21.02%的人在使用抗血脂藥辛伐他汀的時候更容易出現橫紋肌溶解的不良反應,需要減量用藥。
諾,酒不能隨便喝,藥更是不能隨便吃呀。
幾種主要物質代謝相關SNP的分布
用ChinaMAP研究糖尿病,發現……
基因組數據的一個大用途,就是通過多基因風險評分(PRS)來估計個體的疾病風險。
研究者們調查了最常見的代謝特徵,空腹血糖和餐後血糖的多基因風險評分,並綜合年齡和血糖值給參與者們排了個榜。名列前10%的個體明顯更老,與後10%有顯著差異,而且西北、中部、南部和嶺南漢族排名更加靠前。
同時,研究者們還鑑定到了一大堆與2型糖尿病有關的風險基因,除了已知的部分,還發現了DENND5B、ORM1、MafA、Pax6和Sox4等新位點,前兩者與空腹血糖有關,後三者則是控制胰島β細胞中胰島素產生和分泌的關鍵轉錄因子。
研究者還發現了與BMI有關的新突變CADM2 rs369036035和rs372115169,CADM2通過大腦神經信號調節體重和能量穩態。
小結
以上的這些只是奇點糕摘錄了部分比較有趣的結果,對ChinaMAP有更深興趣的讀者,不妨去到http://www.mbiobank.com/了解更多有關中國基因的故事。
ChinaMAP一方面體現出了中國人口內部複雜多樣的遺傳背景,一方面也揭示了中外人口基因特徵的巨大差異。對於基於基因組數據的醫學未來來說,ChinaMAP的出現,無疑是最牢靠的一塊基石。
參考資料:
[1]https://www.nature.com/articles/s41422-020-0322-9
本文作者 | 代絲雨閱讀原文
原標題:《《細胞研究》:中國力量!迄今最大規模中國人群高深度全基因組測序結果發布,藥該怎麼吃,酒誰最能喝等,這裡有答案丨科學大發現》
閱讀原文