TOC
什麼是Mendelian randomization?研究背景?名稱的由來?設計的初衷是什麼?
Mendelian randomization的基本原理?
Mendelian randomization的應用場景?實例分析
基本背景
醫學科研中,隨處可見「關聯性」研究。毫不誇張的說,關聯性研究構成了醫學科研的基礎,比如經典的研究吸菸和肺癌的關係,以及十年前十分火熱的全基因組關聯研究(GWAS)。這些研究雖然「流於表面」,但為後續的機制探索和功能研究提供了最初的證據。隨著醫學科研的日漸深入,關聯性研究開始飽受詬病,其中最大的槽點莫過於相關性並不等於因果關係。association != causality
正是由於這個原因,關聯性研究提供的證據有限,有些時候由於「混雜因素」的存在,極有可能出現「虛假關聯」。比如說,你小時候在院子裡種了一棵桃樹,隨著時間的推移,你的個子在長,桃樹也在變高,如果你說「我長桃樹也長」是有關係的,這就落入了虛假關聯的陷阱,因為在這裡,時間是一個混雜因素。
相關性分析某種程度上可以為我們提供一些研究思路,比如缺乏元素A與某種癌症相關,那麼我們可以通過補充元素A來減少患癌率。這個結論的大前提是缺乏元素A會導致這種癌症,也就是說元素A和癌症有因果關係。
但實際上,元素A和癌症有相關性,不代表他們之間就有因果關係。也有可能是患癌症的人同時有其他的併發症,這種併發症會導致元素A缺乏。
再比如,研究表明,大胸女生與不愛運動相關。那麼,到底是因為胸大的女性不愛運動,還是因為不愛運動導致胸大(肥胖)。
如果不做其他分析,光看這個相關性,我們是無法得知這兩個表徵之間是否有真實的因果關係。
為了闡明這些表徵是否有因果關係,我們一般在研究中考慮加入孟德爾隨機化分析。
基本問題
既然相關性不等於因果性,那麼如果去探索醫學科研中的「暴露」與「結局」之間的因果性呢?
隊列雖好,卻是可望不可及的。而更加省時省力的病例對照研究,受限於其研究設計,只能得到相關係,而無法得到因果性。為了解決這一問題,統計學家們就設計了孟德爾隨機化(Mendelian Randomization, MR)。
名稱由來
簡單來說,MR是基於最基本的孟德爾遺傳規律,即親代的等位基因會隨機分配給子代,而基因型決定表型(疾病當然也是一種表型)。
方法特點
此處基因型AA和aa決定了某種我們感興趣的表型(可以看作是「暴露」,比如血液中維生素D的含量),「暴露」又進一步影響了我們關心的結局。由於基因型是先天的,在時間上必然領先於結局發生的時間,且它不受後天的環境等各種混雜因素的影響,因此能夠作為研究暴露和結局因果關係的有力工具!
MR最大的優點在於遺傳變異都是可以直接測量的,比如通過SNP晶片或者全基因組測序,而且不受外界環境的影響。遺傳變異與「暴露」的因果關係一般是經過明確證實的。
Circulating vitamin D concentration and risk of seven cancers: Mendelian randomisation study
https://www.bmj.com/content/359/bmj.j4761
這是發表在BMJ上的一篇MR研究,研究的是血清中循環維生素D含量與7種不同腫瘤的關係。
我們以結直腸癌為例。其基本的思路大致如下:
我們的目的是研究X與Y的因果關係,即維生素D含量與結直腸癌的關係,此處我們不直接測量X(VitD含量),而是測量Z(SNP rs2282679和rs10741657)。Z已經明確證實與X相關(rs2282679與維生素D結合蛋白含量相關,rs10741657影響維生素D3向25(OH)D轉化)。此處,需要測量的Z是幾種不同的SNP,這些SNP一般是前人通過GWAS研究得到的,我們通過測量Z,觀察Y,就可以得到X和Y的關係。但是,大家可能有個疑問,即便得到了X和Y的關聯,如何去量化它呢?
方法有很多,其中最簡單直接的是採用基因評分法。簡單來說,就是以前人得到的SNP和X的關聯(即OR值)作為每一個SNP的權重,然後構建一個X和Y之間的加權線性回歸模型。或者使用Wald比值法先進行單個SNP的關聯分析,然後再利用meta分析的思路將所有研究的SNP進行綜合。不過這兩種方法都要求所有SNP之間是完全獨立的,連鎖不平衡的SNP需要剔除掉。
MR的原理並不複雜,但是在實際操作中,還是需要注意幾點,其中最重要的是找到合適的基因變異作為工具變量。該工具變量必須與我們關心的「暴露」明確相關且不能與混雜因素相關。此外,還要注意的是工具變量只能通過一條途徑影響結局,即我們關心的「暴露」這條途徑,而不能通過其他途徑影響結局。
參考:
MendelianRandomization: Mendelian Randomization Package
https://cran.r-project.org/web/packages/MendelianRandomization/index.html
- 有R包,跑一遍教程,理解程度會有本質提升。
A robust and efficient method for Mendelian randomization with hundreds of genetic variants
https://www.nature.com/articles/s41467-019-14156-4
-NC
有相關性就有因果關係嗎,教你玩轉孟德爾隨機化分析(mendelian randomization )
https://www.jianshu.com/p/253309a571aa
- 實戰
以NEJM一篇新文為例,聊聊孟德爾隨機化研究
https://www.mediecogroup.com/method_topic_article_detail/311/
- 實例
希望以上內容對大家有所幫助,如果你還有什麼疑問也可以在評論區留言,歡迎大家和我一起學習一起進步~
如果本篇文章對你有所幫助,麻煩點下關注,下次我更新的時候就能及時收到提醒了,你的收藏、點讚、關注、留言和轉發都是對我的鼓勵~
歡迎關注公眾號【科研情報站BioSCI】,這裡有許多關於SCI的內容,快來和我一起暢聊科研吧,平時會解說各類科研基金、項目政策、期刊推薦、資料庫挖掘、實驗指南、資源共享等話題,讓我們在這裡定位科研,也讀懂科研。