此部分內容還是先從統計說起,然後用實例演示分析與作圖過程,此外還會介紹Prism鮮為人知的作圖彩蛋。希望這個系列能讓大家更準確地把握統計分析與高效製圖。
生存分析是對一個或多個非負隨機變量進行統計推斷,研究生存現象和響應時間數據及其統計規律的一門學科。與多因素分析不同的是:生存分析考慮了每個觀測出現某一結局的時間長短。主要應用於人或動物的存活(相對於死亡),也可以是患者的病情正處於緩解狀態(相對於復發或惡化),常常用追蹤的方式來研究事物發展的規律。
生存分析主要採用Kaplan-Meier檢驗。此外Log Rank、Breslow和Tarone-Ware法均可用於檢驗生存分布是否相同,區別在於Log Rank適用於各時間點權重一樣的比較;Breslow適用於各時間點的觀察例數為權重的比較;而Tarone-Ware適合於以各時間點的觀察例數的平方根為權重的比較。(用SPSS或Prism統計數據時注意區分)
PS:生存分析中還存在許多諸如起始事件、終點事件、生存時間或完全數據、不完全數據等統計學概念,請大家自行查詢,下面是小編總結的一個示意圖
2.生存分析實例(Kaplan Meier檢驗)小編用最近看到的一篇文章(PMID: 31727683)中的圖1A來進行舉例說明。該圖顯示高miR-541與低miR-541表達肝癌病人的存活率。
接下來我們進行數據模擬和分析作圖。具體步驟如下:
1)新建生存數據分析,數據輸入:選擇Survival表格,進入數據輸入頁面,輸入模擬數據。在這裡我們隨機輸入了40個數據,每組各20個(文章中多於此數據)。其中0代表live,1代表dead;X軸代表存活時間(months),A、B分別代表miR-541高表達組和低表達組。
2)數據分析:選擇Survival curve,進入選項窗口,依次按圖中1、2、3指示選擇合適的數據比較方法和數據表示方法,然後確定。
(統計參數設置)
3)數據統計:完成以上操作後,數據會計算出來,我們能看到數據統計界面以及兩種方法的數據統計結果。由於我們在模擬數據時,各時間點的權重均為「1」(時間無影響,即注重遠期效應),所以選擇看Log-rank檢驗的數據,及其P value。
(兩種統計方法的統計結果)
4)圖像輸出:完成上述分析後,我們點擊Graphs下方得到初步圖片,然後再進行修改和美化。首先雙擊High組,修改其為紅色標識。然後雙擊橫坐標,修改橫坐標最大為80 months。最後修改坐標軸等信息即可完成製圖。
(圖片修正過程)
(最終輸出圖片)
相關性分析是衡量兩個變量因素的相關密切程度,主要包含:Pearson相關和Spearman相關。其中Pearson相關是用於度量兩個變量之間的相關(線性相關),其值介於-1與1之間(兩個變量A和B:正相關/負相關)。Spearman相關是等級變量之間的Pearson相關係數(等級變量:如免疫組化:陰性/弱陽性/中等陽性/強陽性)。
2.相關性分析實例1)Pearson相關,我們還是以上述文章(PMID: 31727683)中的圖4I(下圖左)來進行統計分析與作圖,分析肝癌患者中ATG2A基因與miR-541的相關性。
首先我們選擇XY數據表格,進行數據模擬(下圖右)。然後選擇linear regression分析,進入參數設置界面(這裡選擇默認)。
(圖片信息及數據模擬)
(統計分析參數設置)
完成參數設置後點擊「ok」,輸出計算結果。重要的結果說明如下圖所示。
(統計結果說明)
最後,手動敲入R與P值,調整坐標軸等美化和修改圖片,最後輸出圖片。
(作圖修正)
2)Spearman相關
我們以PMID: 28837144文章中的圖7b為例(下圖左),進行數據模擬作圖分析。此結果是分析結直腸癌組織中lncRNA XIST與ZEB1表達的相關性。
首先我們新建XY數據模型、輸入模擬數據。然後選擇統計參數,最後查看結果並作圖(注意擬合曲線仍選用linear regression分析),在這裡不在詳細贅述,簡要過程見配圖。
(圖片信息及數據模擬,註:模擬數據較少)
(統計參數設置與結果分析)
(擬合曲線分析與圖片輸出)
現在很多文章中都有熱圖的出現,熱圖不僅可以用Excel和R語言,更新後的Prism也可以實現火山圖的繪製。我們以PMID: 313521032這篇文章中的圖4A來為大家舉例說明。
直接進入正題,先選擇grouped的模擬數據。輸入完畢在Graphs下的圖片,選擇Heat Map,可以初步完成圖片(兩組及以上的方法相同)。
(數據模擬)
(選擇grouped下的Heat map)
然後雙擊圖片,更改熱圖的顏色、Title、標尺、邊框等,簡要過程如下,最後輸出圖片。是不是很簡單呢?
(更改顏色、標題、邊框、標尺和方向)
(微調後的成品圖)
這是Prism統計與作圖系列的最後一期內容,小編在這裡首先感謝大家對投必得學術的支持,希望這三期內容能讓大家更加了解生物統計及作圖。Prism的功能還有很多,小編以後也會跟大家繼續分享一些應用中的小彩蛋。如果有任何疑問,大家也可在評論區留言或在我們的微信群內討論學習。雖然Prism每個版本都會有改進,但始終是一款繪圖為基礎的軟體,在數據處理方面還是不如SPSS等專業軟體功能豐富。接下來,小編將會與大家分享學習Prism不能做的一些統計分析,如主成分分析等。我們將用SPSS軟體進行分析與作圖,敬請期待!也請大家持續關注我們,將我們的資源分享給更多的小夥伴,一起快樂學習,共同進步!
系列相關推送:
《Prism作圖與統計教程(二)》
《都9102年了還在用SPSS做統計?Prism了解一下》
《科研論文作圖之Graphpad Prism》
發表SCI 論文很迷茫?來找「投必得」幫忙