Mendelian randomization孟德爾隨機化法

2020-09-22 科研情報站BioSCI

TOC

什麼是Mendelian randomization?研究背景?名稱的由來?設計的初衷是什麼?

Mendelian randomization的基本原理?

Mendelian randomization的應用場景?實例分析


什麼是Mendelian randomization?研究背景?名稱的由來?設計的初衷是什麼?

基本背景

醫學科研中,隨處可見「關聯性」研究。毫不誇張的說,關聯性研究構成了醫學科研的基礎,比如經典的研究吸菸和肺癌的關係,以及十年前十分火熱的全基因組關聯研究(GWAS)。這些研究雖然「流於表面」,但為後續的機制探索和功能研究提供了最初的證據。隨著醫學科研的日漸深入,關聯性研究開始飽受詬病,其中最大的槽點莫過於相關性並不等於因果關係。association != causality

正是由於這個原因,關聯性研究提供的證據有限,有些時候由於「混雜因素」的存在,極有可能出現「虛假關聯」。比如說,你小時候在院子裡種了一棵桃樹,隨著時間的推移,你的個子在長,桃樹也在變高,如果你說「我長桃樹也長」是有關係的,這就落入了虛假關聯的陷阱,因為在這裡,時間是一個混雜因素。

相關性分析某種程度上可以為我們提供一些研究思路,比如缺乏元素A與某種癌症相關,那麼我們可以通過補充元素A來減少患癌率。這個結論的大前提是缺乏元素A會導致這種癌症,也就是說元素A和癌症有因果關係。

但實際上,元素A和癌症有相關性,不代表他們之間就有因果關係。也有可能是患癌症的人同時有其他的併發症,這種併發症會導致元素A缺乏。

再比如,研究表明,大胸女生與不愛運動相關。那麼,到底是因為胸大的女性不愛運動,還是因為不愛運動導致胸大(肥胖)。

如果不做其他分析,光看這個相關性,我們是無法得知這兩個表徵之間是否有真實的因果關係。

為了闡明這些表徵是否有因果關係,我們一般在研究中考慮加入孟德爾隨機化分析

基本問題

既然相關性不等於因果性,那麼如果去探索醫學科研中的「暴露」與「結局」之間的因果性呢?

隊列雖好,卻是可望不可及的。而更加省時省力的病例對照研究,受限於其研究設計,只能得到相關係,而無法得到因果性。為了解決這一問題,統計學家們就設計了孟德爾隨機化(Mendelian Randomization, MR)。


Mendelian randomization的基本原理?

名稱由來

簡單來說,MR是基於最基本的孟德爾遺傳規律,即親代的等位基因會隨機分配給子代,而基因型決定表型(疾病當然也是一種表型)。

方法特點

此處基因型AA和aa決定了某種我們感興趣的表型(可以看作是「暴露」,比如血液中維生素D的含量),「暴露」又進一步影響了我們關心的結局。由於基因型是先天的,在時間上必然領先於結局發生的時間,且它不受後天的環境等各種混雜因素的影響,因此能夠作為研究暴露和結局因果關係的有力工具!

MR最大的優點在於遺傳變異都是可以直接測量的,比如通過SNP晶片或者全基因組測序,而且不受外界環境的影響。遺傳變異與「暴露」的因果關係一般是經過明確證實的。


Mendelian randomization的應用場景?實例分析

Circulating vitamin D concentration and risk of seven cancers: Mendelian randomisation study

https://www.bmj.com/content/359/bmj.j4761

這是發表在BMJ上的一篇MR研究,研究的是血清中循環維生素D含量與7種不同腫瘤的關係。

我們以結直腸癌為例。其基本的思路大致如下:

我們的目的是研究X與Y的因果關係,即維生素D含量與結直腸癌的關係,此處我們不直接測量X(VitD含量),而是測量Z(SNP rs2282679和rs10741657)。Z已經明確證實與X相關(rs2282679與維生素D結合蛋白含量相關,rs10741657影響維生素D3向25(OH)D轉化)。此處,需要測量的Z是幾種不同的SNP,這些SNP一般是前人通過GWAS研究得到的,我們通過測量Z,觀察Y,就可以得到X和Y的關係。但是,大家可能有個疑問,即便得到了X和Y的關聯,如何去量化它呢?

方法有很多,其中最簡單直接的是採用基因評分法。簡單來說,就是以前人得到的SNP和X的關聯(即OR值)作為每一個SNP的權重,然後構建一個X和Y之間的加權線性回歸模型。或者使用Wald比值法先進行單個SNP的關聯分析,然後再利用meta分析的思路將所有研究的SNP進行綜合。不過這兩種方法都要求所有SNP之間是完全獨立的,連鎖不平衡的SNP需要剔除掉。

MR的原理並不複雜,但是在實際操作中,還是需要注意幾點,其中最重要的是找到合適的基因變異作為工具變量。該工具變量必須與我們關心的「暴露」明確相關且不能與混雜因素相關。此外,還要注意的是工具變量只能通過一條途徑影響結局,即我們關心的「暴露」這條途徑,而不能通過其他途徑影響結局。



參考:

MendelianRandomization: Mendelian Randomization Package

https://cran.r-project.org/web/packages/MendelianRandomization/index.html

- 有R包,跑一遍教程,理解程度會有本質提升。

A robust and efficient method for Mendelian randomization with hundreds of genetic variants

https://www.nature.com/articles/s41467-019-14156-4

-NC

有相關性就有因果關係嗎,教你玩轉孟德爾隨機化分析(mendelian randomization )

https://www.jianshu.com/p/253309a571aa

- 實戰

以NEJM一篇新文為例,聊聊孟德爾隨機化研究

https://www.mediecogroup.com/method_topic_article_detail/311/

- 實例

希望以上內容對大家有所幫助,如果你還有什麼疑問也可以在評論區留言,歡迎大家和我一起學習一起進步~

如果本篇文章對你有所幫助,麻煩點下關注,下次我更新的時候就能及時收到提醒了,你的收藏、點讚、關注、留言和轉發都是對我的鼓勵~

歡迎關注公眾號【科研情報站BioSCI】,這裡有許多關於SCI的內容,快來和我一起暢聊科研吧,平時會解說各類科研基金、項目政策、期刊推薦、資料庫挖掘、實驗指南、資源共享等話題,讓我們在這裡定位科研,也讀懂科研。

相關焦點

  • 以Nature Genetics一篇新文為例,探討孟德爾隨機化方法學的應用
    研究者提出的科學問題是:我們是否能夠運用孟德爾隨機化研究(Mendelian randomization)來預測藥物隨機對照試驗(randomized controlled trial)的結果,並提高藥物研發的成功率。孟德爾隨機化是遺傳流行病的方法學中蓬勃發展的一支。
  • 檢測疾病或表型間遺傳相關性的方法——孟德爾隨機化方法與LD分數回歸
    目前,檢測疾病或表型間遺傳相關性的方法主要有三大類:1)家系研究2)孟德爾隨機化方法,檢測兩個變量間的遺傳效應的因果關係;3)使用全基因組數據評估遺傳相關性,又分為兩小類,第一,使用個體水平的基因型數據,主要包括使用GCTA等軟體包實現的Genetic restricted maximum likelihood (GREML)方法(詳細介紹見前期)以及多基因風險分數(詳細介紹見前期);
  • 孟德爾遺傳定律的由來
    大家好,歡迎收看我的百家號小林看天下事,今天小編要給大家的介紹的是孟德爾遺傳定律的由來。孟德爾遺傳定律從眼睛的顏色到某些疾病的發病率,我們的所有性狀和特徵都遺傳自我們的父母。奧地利修士格雷戈爾·孟德爾第一個發現了控制這些性狀遺傳的定律。
  • 簡單隨機分組
    常見的隨機分組方法包括:簡單隨機化(simple randomization)、區組隨機化(block randomization)和分層隨機化(stratifiedrandomization)等。今天先看簡單隨機分組的原理及操作方法。
  • 孟德爾定律終於要改了
    按:今天有一次看到精卵結合不隨機的報導文章,於是又想起了此文,特拿來分享。 首先申明標題確實有標題黨的嫌疑,因為孟德爾遺傳規律是普適規律,想要顛覆不大可能,不過真理都是在修正中完善的。 孟德爾遺傳規律成立的一個條件就是精卵結合是隨機的。
  • 關注|臨床試驗中適應性隨機化的應用
    在傳統隨機對照試驗中,受試者隨機分配的概率不會在試驗過程中發生改變,分配比例通常設置為 1∶1,易於實施[2]。然而由於偶然性,固定的隨機化仍可能無法均衡潛在的協變量[3]。為應對這種情況,常採用的方法是適應性隨機化(adaptive randomization,AR),即允許在試驗過程中根據已累積的數據調整受試者分配的概率,以實現特定目的。
  • 遺傳學領域的先驅:孟德爾
    孟德爾是一位奧地利神父,他在花園裡通過實驗發現了遺傳的基本原理。孟德爾的觀察成為現代遺傳學和遺傳研究的基礎,他被廣泛認為是遺傳學領域的先驅。誰是孟德爾?孟德爾孟德爾於1822年7月22日出生在他的家族農場上的安東和羅西·孟德爾,當時他住在奧地利的海因策多夫。
  • 今天我們來聊一聊孟德爾隨機化
    孟德爾隨機化, Mendilian Randomization,  簡寫為MR, 是一種在流行病學領域應用廣泛的一種實驗設計方法。在孟德爾遺傳規律中,親代等位基因隨機分配給子代,基因型決定表型,基因型通過表型與疾病發生關聯,基因型看做是工具變量Z, 表型看做是暴露因素X, 疾病看做是結局變量Y。基因型(特指胚系細胞的基因型)是先天決定的,不會受到生長環境,經濟地位,行為因素的幹擾,而且先有基因,再有表型,再有疾病,三者的先後順序符合因果時序。
  • 顛覆孟德爾定律:卵細胞也會主動選擇精子?
    因此,幾乎所有科學家都認為,勝出的精子是隨機的;卵細胞一直在被動的等待,直到精子中的菲爾普斯到達終點。西北太平洋國家實驗室的主任研究員 Joe Nadeau 對此「教條」發起了挑戰。若受精是隨機的,那麼後代的基因組合應呈現特定比例,但在自己實驗室的兩個例子中,Nadeau 發現一些基因配對組合出現的概率比其他組合高的多,表明受精遠非隨機。
  • 孟德爾隨機化之R2的計算
    這一期內容其實就是對上一期的補充,希望大家能熟練掌握F統計量的計算方法並能正確應用於孟德爾隨機化的研究中!
  • 通過孟德爾的兩個豌豆雜交實驗理解假說演繹法
    通過孟德爾的兩個豌豆雜交實驗理解假說演繹法假說演繹法的幾個步驟:在觀察和分析的基礎上提出問題通過推理和想像提出解釋問題的假說演繹推理實驗驗證演繹推理的結果得出結論二、孟德爾的豌豆雜交試驗(一)提出問題實驗:(無論正反交結果一致)P:高莖豌豆
  • 高考生物複習孟德爾遺傳實驗的科學方法講解
    但在實際教學過程中,許多老師常常是對孟德爾獲得成功的原因進行簡單的總結,沒有提供新的情境讓學生思考與應用,學生缺少對科學方法的感悟和內化過程,從而影響課程標準具體目標的達成。從總結孟德爾成功的原因到分析和運用科學方法,是一個從感性到理性的提升過程。  1選擇理想的模式生物  實驗材料的選擇是決定研究工作成功與否的關鍵因素之一。
  • 深度揭秘不可思議的事實,孤獨的天才孟德爾
    孟德爾說明這是平均的結果,具體每個後代有多種可能,而且隨機,所以分開的實驗肯定有漂移,只有大量收集數據,才能得到真實的比例。在這裡,我們可以猜想孟德爾意識到了純合子A/A,a/a和雜合子A/a 和a/A,可惜沒有明確提出名詞。
  • 種豌豆的修道士---孟德爾
    種豌豆的修道士---孟德爾然而他們的研究成果被證明和孟德爾當時的理論結果完全相同也許孟德爾的偉大之處或者應該說是高明之處無需再提但還是再提一下他看見了許多人看不見的東西可以說他有超能力他也可以超越時空看透東西時間是超越四十年也許這也註定了他默默無聞具體是說在當時尚沒有先進的技術人們看不到微小的東西那麼染色體啦基因區段啦都沒辦法看見
  • 通過「豌豆」實驗創建遺傳學的孟德爾
    修道院的納普院長發現孟德爾是個有為青年,在他的資助下,孟德爾來到歐洲超級名校維也納大學,主攻物理,在那裡幸福地遇到了他一生的老師:著名物理學家都卜勒和站在時代尖端的植物學家安革爾,為他的豌豆研究打下了堅實的基礎。1856年,孟德爾從維也納大學回到布魯恩,之後就開始了長達8年的豌豆實驗。
  • 孟德爾的豌豆雜交實驗(一)
    二、孟德爾為何難覓知音?   1、孟德爾發表論文之時,正值達爾文名著《物種起源》發表不就,幾乎全部的生物學家都轉向對生物進化的討論。然而,達爾文的進化論中卻恰恰不清楚遺傳的本質。   2、當時的科學界缺乏理解孟德爾理論放入思想基礎,不明白孟德爾將生物學和統計學結合的真正含義。
  • 科學史上的今天 || 孟德爾定律的重新發現
    1866年,孟德爾對他的豌豆雜交實驗結果,經過再次核查各年的實驗記錄而未發現有什麼錯誤後,以題為「植物雜交的實驗」之論文,發表在布隆自然科學協會會刊第4卷上。在這篇約3萬字的論文中,孟德爾如實地記述了他的重大發現;總結出了被後人稱為「分離律」和「自由組合律」的兩個遺傳定規律。
  • 孟德爾是豌豆實驗,發現了遺傳規律、分離規律及自由組合規律
    保存至今的孟德爾遺物之中,就有好幾本達爾文的著作,上面還留著孟德爾的手批,足見他對達爾文及其著作的關注。起初,孟德爾豌豆實驗並不是有意為探索遺傳規律而進行的。他的初衷是希望獲得優良品種,只是在試驗的過程中,逐步把重點轉向了探索遺傳規律。
  • 孟德爾遺傳學解釋不了的蝗蟲
    蝗災的出現,僅僅用孟德爾的經典遺傳學無法解釋的。想要解釋蝗災,需要表觀遺傳學的知識。什麼是表觀遺傳學? 高中生物知識告訴我們,DNA序列決定生物的性狀。但是在實際中,科學家觀察到一些DNA未改變,生物性狀卻發生改變的情況。比如開頭我們提到的蝗蟲,當其種群密度較大時,散居的蝗蟲便會傾向於遷徙,進而造成蝗災。