2017年發表在Ann Intern Med(SCI IF=17)的研究,題目是咖啡攝入量和全因死亡與疾病特異性死亡的關係,一項基於非白種人的研究。Association of Coffee Consumption With Total and Cause-Specific Mortality Among Nonwhite Populations.原文摘要請點文末「查看原文」。
表2是文章的核心結果,摘要結果部分的HR就是這個表中標黃的部分。放大了看:
X是咖啡攝入量(Coffee Consumption),分別按分類變量和連續變量分析。分類變量分為:不喝咖啡(None)、每月1至3杯(1–3 cups/mo)、每周1至6杯(1–6 cups/wk)、每天1杯(1cup/d)、每天2至3杯(2-3cups/d)、每天至少4杯(≥4 cups/d)。連續變量的單位是杯(Increase per cup)。
Y是總死亡(Total Mortality),考慮到隨訪時間得出HR(Hazard Ratio)。調整不同變量得出3個模型。除了在總人群(Total)做分析,還按是否含咖啡因做了亞組分析。
0.88表明在考慮到其它因素影響後,每天一杯咖啡和不喝咖啡相比總死亡降低12%。95%CI為0.85至0.91是0.88的波動範圍,95%CI不包括1表明風險降低是顯著的,因此不需要再列p值。具體調整了哪些因素,在表的注釋中寫清楚了。
下面兩個0.82分別表明每天2-3杯咖啡或至少4杯咖啡和不喝咖啡相比總死亡降低18%,同樣也調整了混雜。
有學友提問:P for trend 是什麼意思?本表中很多HR可信區間包括1,最後的結論是怎麼得出的?
首先看趨勢性檢驗(P for trend)的意義:從效應值的變化(1、0.97、0.88、0.82)可以看出,隨著咖啡攝入量等級增加,死亡風險降低的幅度有逐漸變大的趨勢,這個趨勢是否顯著呢?因為P for trend小於0.001,表明這個趨勢是顯著的,即咖啡攝入量每增加一個等級,死亡風險降低的趨勢顯著。
理解了P for trend也就理解了雖然有的組HR的95%CI包括1,然而結論可以寫風險降低是顯著的。最後一行0.95表明每增加一杯咖啡,死亡風險降低5%。跟分類變量的結果是一致的。
看臨床型SCI論文,不少高質量文章的核心結果都會出現趨勢性檢驗的P值(P for trend)。例如JAMA這篇研究體力活動和增重的文章,在表3中列出了P Value for Trend。
又例如柳葉刀子刊(SCI影響因子26.3分)研究腦出血患者血壓波動和預後的研究,摘要中就列出了P trend。
【看懂了結果,還要自己做得出】
例如:易侕軟體自帶的練習數據(demo)中,年齡4分組對是否高血壓(HBP)做趨勢性檢驗。操作如下:
方法一:在AGE.Q4上點右鍵,選「按連續型變量處理」,軟體會新生成變量AGE.Q4.CONT。使用數據分析菜單下-單因素分析模塊。給出應變量Y(HBP),暴露變量X(AGE.Q4.CONT),可以給出調整變量(例如性別)也可以不調整,點擊「查看結果」。
得出結果如下:
結果中2.5表示年齡每增加一個等級(是四分位的等級)發生Y的風險比是2.5,最後面P<0.001表明2.5的作用是顯著的,也就是趨勢性檢驗的p值。這個方法有局限性,因為是假定X每個分組內中位數等距的情況下做的,但是大部分情況每個分組內中位數是不等距的,需要用第二種方法做。
方法二的易侕軟體操作。在AGE.Q4上點右鍵,選「分類變量取值重編碼」。出現這個對話框,勾選「取用另一變量的中位數」,下面「另一變量名」選AGE。點擊「保存」。
會得到一個新變量AGE.Q4.NEW。在該變量(AGE.Q4.NEW)上點右鍵,選「按連續型變量處理」,軟體會新生成變量AGE.Q4.NEW.CONT。做回歸分析操作設置同前,只是把暴露變量X換成新變量AGE.Q4.NEW.CONT。得出下面結果:
結果中1.1表示年齡每增加一歲對應的比值比,P<0.001,這個P值相當於趨勢性檢驗的P值。注意,若X原始測量值不是連續變量,而是分類變量(如:文化程度)就不能這樣做了,只能用第一種方法。
統計分析方法怎麼寫呢?可以參考這篇Ann Intern Med喝咖啡的文章,趨勢性檢驗是先分組(category),再用每組中位數(median value)按連續型變量(continuous variable)進入方程得出的。
臨床研究關聯分析的核心結果一定要用回歸分析做,因為可以得出作用大小。一定要做多元回歸,因為可以調整其它因素影響。
一朝習得回歸術,
一式破盡世間法。
觀察研究多混雜,
多元回歸來調整。
此文獻給愛喝咖啡的雲天、濤哥和燾哥!
校稿:初雲天
歡迎關注我們的微信公眾號!