2018年3月8日/
生物谷BIOON/---你今年忘了母親的生日嗎?振作起來:你的家譜如今可能包括1300萬人的生日。
在一項新的研究中,美國哥倫比亞大學計算生物學家Yaniv Erlich和他的同事們利用眾包數據構建了一個將1300萬人關聯在一起的家譜(family tree)[1]。這個家譜被認為是同類中最大的經過驗證的資源---平均跨越了11代人。相關研究結果於2018年3月1日在線發表在Science期刊上,論文標題為「Quantitative analysis of population-scale family trees with millions of relatives」。
圖片來自Columbia University。
Erlich團隊分析了這個家譜中的人的出生日期和死亡日期,並計算出如果個人之間存在密切的親緣關係,他們是否更有可能在相似的年齡死亡。該團隊得出結論:在這些人中,
遺傳僅解釋了大約16%的壽命差異。大部分差異都歸因於其他的因素,比如人們在哪裡生活和如何生活。
美國馬裡蘭大學醫學院
遺傳流行病學家Braxton Mitchell說,「這是一次真正的旅行。這是利用大量公開可用的數據集開展有趣的研究的一個很好例子。」
健康長壽和繁榮昌盛科學家們已猜測環境比基因對人們的存活時間產生更大的影響。但是Erlich估計,基因發揮的作用要比科學家們想像中的更少。
一些研究,比如Mitchell團隊在2001年發表的一項研究[2],已估計了基因決定著大約四分之一的人們壽命差異。
猶他大學醫學院遺傳學家Lisa Cannon-Albright說,Erlich的發現證實了極其龐大的家譜的力量。她說,「這些資源將成為未來
遺傳學研究的一個重要組成部分。」
Erlich說,「好」的基因可能會使一個人的壽命平均延長五年。一些環境因素對壽命產生更大的影響,比如,吸菸能夠減壽十年。
遺傳學家們長期以來一直使用家譜來研究
遺傳因素如何影響疾病風險等許多性狀。但是,將包含大量人員的家庭記錄資料庫匯集在一起是比較困難的,需要花費大量的資金。 Erlich的研究是如今正在進行中的將數字記錄匯集到非常龐大的家譜中的多項研究[3][4]之一;一些人已鑑定出與癌症和阿爾茨海默病等疾病相關的基因[5]。
數據洪流Erlich的研究使用了來自在線家譜工具Geni.com的數據。他是位於以色列耶呼達市的Geni.com母公司MyHeritage的首席科學官。
這種分析利用了大約8600萬人的數據,這些人的記錄是由Geni.com用戶上傳的。這些人要比包含在23andme公司構建的最大消費者基因檢測資料庫[5]中的人數多了一個數量級。
加州舊金山分校的計算
基因組學家Atul Butte說:「這些參與者人數如此眾多實在太令人瘋狂了。你僅能夠通過眾包(crowdsourcing)獲得這樣的數據集。這真地很令人印象深刻。」
Erlich團隊利用這些數據分析Geni.com上登記的人員的遷移和婚姻模式。比如,這些研究人員發現在1750年之前,這個資料庫中的大多數美國人和歐洲人都嫁給了離他們的出生地最多10公裡的人。到1950年,大多數美國人和歐洲人不得不到離他們的家鄉至少100公裡的地方才能找到配偶。
換言之,你的父母很可能比他們的祖先到離家更遠的地方組建自己的家庭。你至少能夠做到的就是記住他們的生日。(生物谷 Bioon.com)
資訊出處:Colossal family tree reveals environment’s influence on lifespan參考資料:1.Joanna Kaplanis, Assaf Gordon, Tal Shor et al. Quantitative analysis of population-scale family trees with millions of relatives. Science, Published online: 01 Mar 2018, doi:10.1126/science.aam9309