很顯然,小孩身高和小樹高度的生長都與時間有關係,如果排除了時間變化的影響,兩者的關係就未必如此了。
我們之前講到的直線相關、秩相關都只是分析兩個變量間的相關,並沒有考慮當兩個變量同時與第三個變量相關時的情況。所以這就引出了「偏相關分析」。偏相關分析是指當兩個變量同時與第三個變量相關時,將第三個變量的影響剔除,只分析另外兩個變量之間相關程度的過程。
在偏相關中,根據固定變量數目的多少,可分為零階偏相關、一階偏相關、…(p-1)階偏相關。零階偏相關就是簡單相關。假設有三個變量,那麼在給定條件下的一階偏相關係數為:
表示變量的簡單相關係數。
如果增加變量,就可以求在、給定條件下的二階偏相關係數,在這裡不做詳述,只是給大家展示一個簡單的一階偏相關係數讓大家明白偏相關的基本理論思想。
所以對於要排除已知變量對兩變量的影響後,再來看兩變量的「淨相關」,就採用偏相關分析,尤其是臨床中對於兩代謝指標的相關性研究,由於人體結構的複雜性,代謝指標受到多方面的影響,此時就要考慮排除其它指標後再看兩代謝指標的淨相關。
如果讓你分析兩組指標間的相關性,你會怎麼做呢?是拿體力測試的7個指標與運動能力測試的5個指標分別求簡單相關係數嗎?那求出簡單相關係數後,怎樣反映這兩組指標的整體關係呢?
我們之前介紹的直線相關、秩相關、偏相關都是對單變量間的相關性分析,對於要研究兩組變量間的相關關係時,就需用到「典型相關分析」啦!
我估計大部分人對典型相關分析都比較陌生。其實在現實生活中,兩組甚至於多組變量之間具有相關關係的問題很多,典型相關分析就是用於研究一組隨機變量與另一組隨機變量之間的相關關係的方法。它借用了主成分分析的思想,根據變量間的相關關係,尋找一個或少數幾個綜合變量(原始變量的線性組合)對來替代原變量,從而將兩組變量的關係集中到少數幾對綜合變量的關係上。
以上面提到的例子來說明,兩變量組:
,
設12維隨機向量,其協方差陣
,其中
是X的協方差陣,
是Y的協方差陣,是X、Y的協方差陣。用X和Y的線性組合之間的關係來研究X和Y之間的相關性,典型相關分析的目的就是希望找到向量a和b,使U、V之間的相關係數最大,典型相關係數的公式為:
典型相關係數的計算比較複雜,在這邊不再展開介紹,感興趣的可以自行查閱資料學習。典型相關最終的結果能夠表明U和V的相關情況,以及與U的相關情況,與V的相關情況,通過這些相關情況就能夠把握兩變量組的整體相關情況。
對於典型相關分析,有幾點提醒:
(1)典型變量可以提取多對,一般只需要提取1~2對典型變量即可充分的概括樣本信息。
(2)當一個變量同典型變量的相關係數與其在典型變量上的係數符號相反矛盾時,有可能是多個原始變量之間也存在緊密相關造成的。
(3)運用典型相關分析前,需要判斷變量組之間的影響是雙向相關還是單向的因果關係是很重要的,這關係到對結果的正確解釋。
醫學方已推出「國自然基金申請」「臨床數據挖掘」、「基因數據挖掘」、「R語言教程」、「醫學統計學」、「微創動物實驗培訓」等多個專題課程,如需了解課程詳細推文,可關注「醫學方」公眾號,點擊「精品專題」進入
想了解「醫學方」最新視頻課程動態?可登陸騰訊課堂或網易雲課堂收看
目前已有課程:
(1)醫學方|醫學統計學公開課|石小白老師教您輕鬆學統計(公益免費課程)
(2)醫學方|醫學數據挖掘精品課程|豪斯醫生手把手教您如何數據挖掘
(3) 醫學方|R語言快速入門與數據清洗|一本R書走天涯系列課程
騰訊課堂:https://medfun.ke.qq.com
網易雲課堂:http://study.163.com/u/ykt1467466791112
客服電話:15821255568
客服微信:yixuefang1234
溫馨提示:醫學方還設有專門的討論群哦~各位明星導師都在群中,可以解答各位的遇到的問題,如有興趣,可以加客服微信後加入群聊~
微信公眾號:
如果你覺得文章還不錯,就請點擊右上角選擇發送給朋友或者轉發到朋友圈。您的支持和鼓勵是我們最大的動力。喜歡就請關注我們吧~
長按二維碼
關注我們