重複測量方差分析的操作教程及結果解讀

2021-01-08 騰訊網

內容來自:「小白學統計」微信公眾號,感謝作者授權。

重複測量數據是指對同一個體在不同時間點的測量,這種數據在醫學研究中較為常見,比較典型的數據形式如:

對一組人群分別在幹預前後不同的時間點觀察其結局情況。這種研究通常是為了比較不同時間點的差異情況,或者分析時間變化趨勢。

或將一組人群分配至不同組別,對每組人群分別在幹預前後不同的時間點觀察其結局。這種研究通常要比較不同組的差異,有的再深入點,可能還要分析幾個組的變化趨勢是否有差異。

重複測量數據的個體觀測值不完全獨立,數據間存在趨同性,如果採用獨立數據的統計推斷方法(如t檢驗、方差分析)進行分析,往往會增大Ⅰ類錯誤發生的概率,容易使本來無統計學意義的結果變成了有統計學意義。事實上,這種情況在審稿中甚至在已發表的文章中都不算少見。

基於不同的研究目的和分析策略,重複測量數據可採用不同的分析方法,醫學中常見的有重複測量方差分析、廣義估計方程、多水平模型。

1、重複測量方差分析思路

重複測量方差分析,顧名思義,仍是屬於方差分析的範疇,因此其思路也是基於方差分解。

重複測量方差分析與單變量方差分析思路的不同之處在於:單變量方差分析是對某一變量的方差進行分解,而重複測量數據存在多個時間點的測量結果,並不僅有1個變量,而有多個變量,從而形成多個變量的方差-協方差矩陣。

這裡關鍵要弄清楚,1個變量,只有方差,而2個及以上變量,不僅有每個變量的方差,還有表示幾個變量之間關係的協方差,所以多個變量就會形成一個方差-協方差矩陣。

因此,重複測量方差分析不是對1個變量的方差進行分解,而是對多個變量的方差-協方差矩陣進行分解。

為了給大家一個直觀印象,下面就是一個協方差矩陣

從左上到右下的對角線上的4個值,是4個變量的方差;其它值是行列對應的變量的協方差(反映了2個變量的相關大小)。

但不管是方差,還是方差-協方差矩陣,從分解結構來看,二者仍是一致的。單變量方差分析是將總的離均差平方和(SStotal)分解為模型解釋的變異(SSmodel,重複測量數據的比較重,通常指組別因素)和誤差變異(SSerror)。重複測量方差分析則是將總的交叉乘積平方和(SSCP)矩陣T(SSCPT)分解為模型SSCP矩陣H(SSCPH)和誤差SSCP矩陣E(SSCPE)。

所以這裡主要還是思路的理解:普通方差分析和重複測量方差分析的分解方式都一樣,只不過一個是對方差分解,一個是對方差-協方差矩陣分解。

2、重複測量方差分析的用途

從實際應用來看,重複測量方差分析可用於以下目的

比較組間有無差異,即兩條隨時間變化的曲線在高低上是否不同。

比較各時間點間有無差異,即不同時間點的值是否有不同。

比較組間的時間變化趨勢有無差異,即隨時間變化的多條曲線是否平行。注意與組間差異區分開。

3、重複測量方差分析的SAS軟體實現

例1:某藥物開展一項治療急性腦梗死的研究,將20名急性腦梗死患者隨機分為兩組,每組10例,分別接受試驗藥和對照藥,於治療前(0周)、治療後1、2、3、4周,分別以某症狀評分指標Y作為治療效果指標。欲實現以下目的:(1)兩組的Y值差異是否具有統計學意義;(2)不同時間點的Y值差異是否有統計學意義;(3)兩組的Y值變化趨勢有無統計學差異。

重複測量方差分析的SAS程序如下:

data ex1;

input id group w0 w1 w2 w3 w4;

/*注意數據輸入格式,以每個時間點觀測結局作為1個變量,形成多變量結局*/

cards;

……(此處省略數據)

;

proc glm data=ex1;

class group;

model w0-w4=group/nouni;

repeated time 5(0 1 2 3 4) contrast(1)/printe summary;

/*time指定時間點個數,如果時間點間隔不等,要在括號中指定具體的時間點值,如1、2、4、7;如果時間點間隔相等(如本例),也可不指定具體時間點。contrast(1)表示以第1次時間點為參照,其餘時間點與參照時間點進行對比*/

manova h=group;

/*指定輸出多變量的組間比較結果,如果不指定該語句,默認不輸出組間比較結果*/

run;

為了結果解釋方便,首先在表1中列出了對照組和試驗組在5個時間點的均值和標準差,圖1則直觀展示了兩組的變化趨勢。

重複測量方差分析的結果,絕大多數統計軟體都會給出4個統計量:Wilks′lambda、 Pillai′s trace、Hotelling‐Lawley trace 和 Roy′s largest root。

4個統計量的值雖然各不相同,但它們所對應的F值在絕大多數情況下都是一致的,我大概做了十多年統計分析,尚未遇到過這4個統計量所對應的F值不同的特殊情形,估計各位也很難遇上。因此實際中通常任選其一即可。以Wilks′lambda統計量為例,例1的主要結果見表2。

表2結果顯示,以0.05為檢驗水準,兩組間差異有統計學意義(P=0.006),5個時間點的差異有統計學意義(P= 0.002),組別和時間的交互效應無統計學意義。交互項反映了兩條曲線是否平行,儘管從圖1來看,兩條曲線似乎並不平行,但一定要注意,統計學中不能只看表面,還要看統計學的分析結果。趨勢變化似乎有差異,然而這種差異並無統計學意義。 嚴格來說就是:尚不能拒絕兩條曲線平行的假定。

上述SAS程序還同時給出了各個時間點的總體比較和分組比較結果

總體比較是指,以某一時間點為參照(程序中通過contrast指定以第1個時間點為參照),所有其他時間點與參照時間點的比較結果;

分組比較是指,以某一時間點的兩組差值為參照,所有其他時間點的兩組差值與參照時間點兩組差值的比較結果。表3給出了以第 1個時間點為參照,其他時間點與參照點的總體比較和分組比較結果。

注意統計軟體中不會說的這麼直白,名字也不叫「總體比較」和「分組比較」,但它們反映的意思基本如此。

表3結果提示,從所有觀測值來看(不分組),治療後第 3、4 周與治療前相比差異均有統計學意義(P值均

建議結合結果仔細理解一下結果的解釋。

另外,不同軟體給出的結果展示形式不同,SAS和SPSS就不一樣,結果雖然一樣,但是展示方式不一樣。大家要能分清結果的含義。重複測量方差分析的結果比較多,需要仔細研讀,然後根據結果結合自己的專業,做出合理的解釋。

另外還要注意一個問題,對於時間點間隔不等的情形,SAS分析沒有問題,在程序中指定具體時間點即可但SPSS尚做不到,只能做時間點間隔相等。如果要做,必須在SPSS中編程實現。(不過我沒用過最新版的SPSS,不知道最新版的是否可實現,因為本人平時不大用SPSS。如果有說的不對的地方,請讀者指正。謝謝)

4、重複測量方差分析的局限性

(1)重複測量方差分析要求數據必須是均衡(balance)的,即每一時間點測量值的數量必須相等。這一點在實際中很難滿足,例如,每組 20人,分別在治療前、治療後 1、3、 6個月進行重複測量,很難保證每個人都能完成結果的觀測;而且,即使都能完成,也難以保證這些人都恰好在 1、3、 6個月的固定時間點完成觀測。對於某一被觀測者,哪怕只有一個時間點的數據缺失或不符合時間方案,軟體分析中 該觀測者的整條記錄都會被刪除。

(2)重複測量方差分析要求方差‐協方差矩陣滿足多元正態性和多元方差齊性。這兩個條件,尤其是多元方差齊性,在實際中很容易被忽略,然而臨床研究中卻經常存在這種問題。例如,對高血壓和非高血壓兩組人群在多個時間點進行重複測量,通常情況下,正常人群的收縮壓往往變化不大,而血壓高的人群,其收縮壓往往變動更大,這就容易導致兩組人群的方差‐協方差矩陣方差不等。

(3)重複測量方差分析對時間變化趨勢的分析不夠充分。重複測量數據中,時間並不是以一個自變量的形式納入模型分析,而是本身就作為模型的一部分。因此組別與時間的交互效應,難以深入分析,其變化趨勢儘管可以通過正交多項式進行簡單探索,但形式有限,不夠靈活。例如,假定有試驗組和對照組各4個時間點觀測值,如果想要了解兩組的每一時間點相對初始時間點的變化情況,重複測量方差分析就難以實現。

總的來說,重複測量方差分析作為最簡單的處理重複測量數據的方法,相對臨床大夫來說還是比較友好的,實現的技術門檻不高,結果解釋的話,只要大家仔細看結果,也不是很難。如果想做相對深入的結果,也可以實現,比如趨勢變化等等。當然,局限性也有,上述三條很關鍵,尤其正態性和方差齊性,可能很多人並沒有關注,然而有時確實容易導致出現問題。

相關焦點

  • 重複測量數據的方差分析在SPSS中的應用——【杏花開醫學統計】
    關 注 重複測量數據的方差分析 在SPSS中的應用 關鍵詞:spss、重複測量方差 導 讀 在醫學研究中,很多實驗都涉及到重複測量的數據資料
  • 如何看懂SPSS重複測量方差分析的一系列結果
    作者:丁點helper來源: 丁點幫你重複測量方差分析與我們之前學習的各種方差分析(單變量,對於因變量而言)的區別主要在於「重複」二字。之前的方差分析是對一個變量的變異進行分解(即所謂的離均差平方和);重複測量的方差分析則是針對多個變量進行的,也可以叫做變異分解,但此時它有了一個新名字,叫方差-協方差矩陣的變異分解。什麼叫協方差?什麼又叫矩陣?
  • 一文帶你輕鬆掌握,重複測量方差分析
    在某些實驗研究中,常常需要考慮時間因素對實驗的影響,當需要對同一觀察單位在不同時間重複進行多次測量,每個樣本的測量數據之間存在相關性,因而不能簡單的使用方差分析進行研究,而需要使用重複測量方差分析。數據格式常見的重複測量數據格式,一般記錄成下圖格式:常見格式在上傳SPSSAU分析時,需要先進行整理。上傳格式如上圖,將三次測量的結果,整理到同一列中,並單獨設置一列用於識別測量時間。比如上圖有12個樣本(12個ID號),並且測量3個時間點。那麼就一定會有12*3=36行數據。同一個ID號會重複3次,同一個時間點會重複12次。
  • 線性混合模型在重複測量資料中的應用
    重複測量資料在我們的臨床研究中經常遇到,如果數據符合獨立正態和方差齊,我們可以採用重複測量的方差分析去解決他。
  • spss單因素方差分析的理論與實踐教程—— 【杏花開醫學統計】
    下面,我們來詳細了解單因素的方差分析(one-factor ANOVA)的基本原理、適用條件及其在SPSS中的具體操作。,在此案例操作中就不再做正態性檢驗的操作介紹了。   (2)結果解讀   ①首先,查看「方差同質性檢驗」表。
  • spss協方差分析
    什麼是協方差分析?協方差分析又稱「共變量分析」,是方差分析的引申和擴大。接下來,一個簡單的例子在spss中操作一遍協變量分析的過程(結果不重要,重要的是過程)首先,協方差分析的應用條件有以下幾點:各組觀察指標服從正態分布各組觀察指標彼此獨立各組觀察指標滿足方差齊性;各組協變量與觀察指標存在線性回歸關係,且斜率相同例:操作如下:1、選擇分析--一般線性模型--單變量,點擊模型,
  • SPSS實操教程——單因素方差分析
    這個時候需要使用方差分析。那怎麼做呢?做分析之前需要思考幾個問題?是不是單因素?是不是獨立?各組應變量是不是符合正態分布?各組應變量是不是方差齊性?好,他這個研究是單因素的,只是分析了藥物一個因素,包括三種不同的藥物,分為三組。而且各組之間也是相互獨立的。
  • SPSS超詳細教程:三因素方差分析
    在之前的醫咖會SPSS統計教程中,我們推送了「單因素方差分析」和「雙因素方差分析」的詳細教程,今天我們再來和小夥伴們分享「三因素方差分析
  • 回歸分析spss步驟 - CSDN
    【杏花開生物醫藥統計】微信公眾號(xhkdata)相關文章(灰色區域可滑動)● 方差分析之多因素方差分析(3)Graphpad Prism繪製簡單效應折線圖 ● SPSS方差分析之多因素方差分析(2)(簡單效應)● SPSS方差分析之多因素方差分析(1)(主效應和交互效應)● SPSS虛擬線性回歸分析在問卷數據分析中的應用
  • 方差分析(ANOVA)原理
    方差分析(ANOVA)原理微信公眾號:生信小知識關注可了解更多的教程及單細胞知識。
  • 方差分析F檢驗結果如何解讀?
    我們在閱讀論文時,經常看到(方差分析)F檢驗的結果,比如F(3,19)=3.4,這是什麼意思?我們自己對照描述統計結果時,如何根據SPSS輸出的方差分析表,寫出F括號中的兩個數字? 這是本篇文章要解決的問題。
  • SPSS單因素方差分析——菜鳥篇
    很多小夥伴對科技論文或畢業論文的數據分析方法存在諸多疑惑,最多的問題就是:我該用什麼分析方法?SPSS怎麼操作?結果怎麼詮釋?關注我們並做好筆記,相信你從菜鳥到精通SPSS不會很慢。本次內容我們將帶大家認識單因素方差分析,一起來學習吧!
  • 手把手教你用 Origin 做單次測量數據方差分析
    方差分析(ANOVA)又稱「變異數分析」或「F 檢驗」,用於兩個及兩個以上樣本均數差別的顯著性檢驗。 方差分析是數理統計中非常常見的一種分析方法,它可以研究目標變量的控制因素水平及其影響的顯著性。
  • SPSS超詳細操作:兩因素多元方差分析(Two-way Manova)
    醫咖會在之前的推文中,推送過多篇方差分析相關的文章,包括:每種方差分析的應用場景,以及該如何進行SPSS操作和解讀結果
  • Excel無重複雙因素方差分析原理解析
    雙因素方差分析法是一種統計分析方法,這種分析方法可以用來分析兩個因素的不同水平對結果是否有顯著影響,以及兩因素之間是否存在交互效應。一般運用雙因素方差分析法,先對兩個因素的不同水平的組合進行設計試驗,要求每個組合下所得到的樣本的含量都是相同的。
  • SPSS醫學統計高能方法:單因素方差分析(One Way ANOVA)——【杏花開醫學統計】
    案例:某三甲醫院114名準備進行腹腔鏡的患者,按照病情輕重分為輕度組(N=64)、中度組(N=23)和重度組(N=27)。ANOVA運算結果的穩定性,輕微偏態的界定視頻中有詳細講解)▶ K個獨立樣本非參數檢驗(任意一組的血鉀不服從正態分布)    關於正態性檢驗的方法可以觀看視頻中的演示,也可以看杏花開醫學統計公眾號中的正態性檢驗專題。
  • SPSS超詳細教程:雙因素方差分析(Two-way ANOVA)
    3.2 假設4-6  檢驗假設4-6需要用到殘差,因此我們先運行雙因素方差分析的SPSS操作,得到主要結果和相應殘差變量後,再逐一進行對假設的檢驗。  (12) 點擊Continue→OK  上述操作將可以得到雙因素方差分析的結果,並生成3個新變量:預測值(PRE_1),殘差(RES
  • SPSS中的多元方差分析如何操作?
    當自變量不止一個的時候,通常的方差分析就會形成幹擾導致結果的不準確,這就需要用到多元方差分析了,下面小編就來教大家如何操作吧!1.我們今天來統計一下不同組別中愉悅程度和健康狀況的分析,來演示下多元方差分析的操作吧!
  • 輔助生殖IVF多個周期數據如何分析?重複測量研究專題
    常規方法:只納入第一次周期的數據進行分析,簡單,損失數據信息,可能導致選擇偏性。或者納入多個周期,進行最佳和保守估計,看兩種極端情況下結果是否一致。考慮重複測量的方法:將所有周期都納入,好處是減少只納入第一次周期可能帶來的選擇偏性。May reduce bias over first-cycle only approaches。
  • 如何用SPSS做單因素和多因素方差分析
    結果分析:單因素方差分析結果,包括組間離差平方和、組內離差平方和總離差平方和。從表中可知,p=0.047<0.05,說明三個不同肥料對該苗木苗高生長差異顯著。進而可以進行多重比較。2:雙因素方差分析(無重複試驗)在無重複試驗的雙因素方差分析中,每個處理只設一個觀測值,即假定A因素有a個水平,B因素有b各水平,每個處理組合只有一個觀測值,無重複試驗的2個因素方差分析不存在交互作用。