多圖示例:如何呈現論文結果中的各種圖表

2020-12-04 騰訊網

本文根據《Journal of the American College of Cardiology》上曾發表的一篇文章《Making Sense of Statistics in Clinical Trial Reports》,來全面而具體地說明臨床試驗論文中,各種類型數據與結果使用圖表的正確展示方法。

本文將著重介紹基線數據、試驗信息以及結局數據中二分類頻數資料和計量資料的展示方法。

一、基線(Baseline)數據展示

基線(Baseline)數據是所有類型的試驗所必須要提供和展示的信息,具有描述研究所納入的樣本特徵、標示研究所關注的變量等重要作用。

基線(Baseline)數據的展示多以表格的方式,以各種變量的名稱為表格每行的標題,而不同的組名為表格每列的標題,需要涵蓋的變量包括人口學資料、可能影響結局事件的變量以及相關的醫療記錄,每列提供一個組別的數據,在RCT中沒有必要提供合計數據或進行組間差異比較。

下方提供一個研究的表格作為範本,數據的展示方法、可能遇到的情況及相關注意事項標註在相應位置(表1)。

二、試驗信息(Trial profile)展示

試驗信息(Trial profile)也是需要展示的部分,用以清晰直觀的描述在試驗進程中各個時間點的操作,以及在各個操作過後各組人數的變化及原因,方便讀者對研究有直觀的了解。

試驗信息(Trial profile)多以流程圖的形式進行展示,按照時間和操作順序排列,清晰列出每一部分的人數,需要展示的重要操作節點至少應包括隨機分組、完成隨訪及數據分析

下圖展示的是一個研究中所提供的試驗信息(Trial profile)圖,作為示例範本供參考,可行的展示方式多種多樣,樣式不用局限於示例,但主要信息要清晰地提供出來(圖1)。

三、二分類頻數資料的結果展示

二分類頻數資料在試驗研究中經常被涉及,例如:性別、各種事件發生與否等,是結果展示中的重要組成部分,主要結局數據表格和副作用表格均包含大量二分類資料

在主要結局數據表格中,與基線(Baseline)數據形式類似,同樣是以各種變量或事件的名稱作為表格每行的標題,而不同的組名為表格每列的標題,不同之處在於需要增加兩列,分別報告效應指標的大小和P值

值得注意的是,在事件的展示中,許多研究的主要終點為複合終點,此時需同時在下方依次提供各個事件單獨發生的數量與百分比。

效應指標需要包括點估計值與區間估計。在這裡,強調一下區間估計的重要性,並解釋一下點估計值與區間估計的關係:點估計可以得到一個具體的數值,表示結果的大小,而這一結果存在很大程度的不確定性,區間估計即可表達這種不確定性,通常用95%置信區間(Confidence Interval)。

之所以選擇95%,主要是為保證研究的一致性,方便與他人研究進行比較,因為大部分的研究都選擇了95%這一數值;同時,與通常設定的顯著性水平0.05保持一致,方便與P

下圖同樣提供一個研究的表格作為範本,注意事項標註在旁(表2)。

對於研究的效應分析可以用到多種不同的效應指標,表3總結了各個效應指標的概念及計算方法。通常,兩個組別時,先列好數據的四格表,計算發生率,再進行相應的效應指標計算。

效應指標包括絕對數(如危險度差(Risk difference, RD/Difference in percentages)、需治療人數(Number needed to treat, NNT)等)和相對數(如相對危險度(Relative risk, RR)、相對危險降低(Relative risk reduction, RRR)和比值比(Odds ratio, Relative odds, OR)等)兩類。相對數指標具有統計學優點,且對於不同類型的人群的一致性較好,結果易於推廣,而絕對數指標則更有實際價值和意義。

(詳見:總結:那些可以評價幹預措施效果的指標們)

此外,除了要報告詳細記錄和主要結局指標外,安全性信息也要進行報告,安全性表格也多為二分類資料。

與主要結局事件表格類似,同樣是以各種變量或事件的名稱為表格每行的標題,而不同的組別為表格每列的標題,不同之處在於只需要進行組間差異性檢驗,報告P值的大小。

下圖即為一個研究中所展示的安全性表格,作為內容與樣式的參考(表4)。

四、計量資料的結果展示

1. 單個時間點的組間均值比較

在分析定量結局指標時,一般比較常見的分析策略就是直接比較不同幹預組結局指標的組間差異。然而,考慮到多數情況下這些結局指標都會在基線時被測量,一個更加合理的方法是比較結局指標相對於基線的平均變化值

但是這裡也同樣存在一個Bug——這種變化值往往會受到基線水平的影響,比如我們常說的「向均數回歸(regression to the mean)」——在同等的幹預條件下,那些結局指標基線水平比較高的研究對象可能會獲得更大的下降。為了解決這樣問題,就需要另一種統計學分析方法——協方差分析(ANCOVA),即在比較結局指標變化值時調整其基線水平。

來看一個實例,SYMPLICITY HTN-3研究[6]是一項隨機、雙盲、假手術對照試驗,共招募 535 例嚴重難治性高血壓患者,按照 2:1 進行隨機分組,分別進行去腎交感神經術或假手術治療。研究主要終點為治療6個月時患者收縮壓(SBP)下降。

如表1所示,首先進行去腎交感神經術和假手術治療組6個月時SBP的組間比較,其次在比較兩組SBP 6個月的變化值時考慮是否調整其基線水平。可以比較明顯地看到第一種組間比較得到的95%CI比後兩種情況更「寬」,而在調整了SBP基線水平的第三種情況比較時95%CI最「窄」。

比較遺憾的是,上述95%CI仍跨越「0」,即組間差異無統計學意義。提示去腎交感神經術與假手術相比並未減少難治性高血壓患者的6個月時收縮壓水平。

調整SBP基線水平真的有必要嗎?下圖中去腎交感神經術和假手術治療組兩條回歸線顯示,兩組中基線SBP水平較高的研究對象,6個月後SBP下降值也更大。如果不進行SBP基線水平調整,實際的效應值可能會被錯誤估計(4.07 vs. 4.11adjusted mmHg)。

此外,從下圖中也可以明確另一點,即不同研究對象的研究結果差別很大,這也是為什麼臨床試驗通常需要納入足夠的研究對象(樣本量太少,結果可能並不穩定)。

細心的小夥伴可能會提另外一個問題,實際分析中是選擇結局變化的差值,還是選擇相對於基線水平的變化百分比?從統計上講,這時候就要看哪種情況更適合使用協方差分析。(詳見:手把手教你協方差分析的SPSS操作!)

2. 多個時間點計量數據的分析與結果展示方法

以上我們討論了,如何利用結局指標的基線數據來使幹預措施的臨床療效估計更為合理。實際上,很多時候一個臨床研究在設計數據收集時,往往不會只收集開始(基線)和結束(隨訪終點)兩個時間點的數據。當遇到結局指標多個時間點數據時,就需要採取不同的方法,當然也取決於研究目的。

兩組均值隨時間的變化趨勢

多個時間點的計量數據可以以時間為橫坐標、指標數值為縱坐標繪製折線圖展示,下圖為一項研究的結果圖,每個時間點都描繪了均值與標準誤(下圖)。

不同下降率(或升高率)的組間比較

許多研究的結局指標中,後續時間點較基線時的變化數值所佔百分比(下降率或升高率)具有重要的臨床意義,比如在呼吸系統功能損傷的研究中用力肺活量的下降率,此時可計算不同時間點的結局指標下降率或升高率,再進行組間比較及後續分析。

在隨訪過程中某一特定時間點的獨特價值

如在18個月時檢測糖化血紅蛋白來評價一種糖尿病藥物的療效,這樣的情況下,特定時間的數據應著重分析。

因為多個時間點的計量資料往往存在相關性,不同於一般的統計分析方法(要求各數據彼此相互獨立),此時應該選擇重複測量分析。(詳見:SPSS:單因素重複測量方差分析(史上最詳細教程))

3. 計量資料呈偏態分布的分析方法

有時候計量資料的數據呈偏態分布,此時組間均值比較的傳統分析方法可能受一些極端值的影響而扭曲,此時可以選擇如下的處理方法:

採取合適的數據轉換

例如,將原始數值取自然對數後,數據呈正態分布,此時採用幾何均數來進行組間差異的比較。

使用非參數檢驗

非參數檢驗中,比較常用的是採用中位數對兩組療效進行描述,並用非參數方法(例如常用的秩和檢驗)對組間療效差異進行分析可避免極端值的影響。

設定特定的臨界值,將原來的連續性變量轉換為二分類變量

例如,計算超過肝臟功能指標上限數值的人數佔總人數的百分比,這時採用卡方檢驗比較組間的百分比有無差異即可。

參考文獻

1. J Am Coll Cardiol 66(22):2536–2549

2. N Engl J Med 2014;371:993–1004.

3. N Engl J Med 2013;369:1317–26.

4. Lancet 2014;384:1849–58.

5. N Engl J Med 2013;368:1303–13.

6. N Engl J Med. 2014; 370:1393–401.

推薦醫咖會專欄課程《缺失值的處理和常見研究類型的統計分析》!

講解缺失數據的核心處理方法及SPSS操作,以及病例對照研究和RCT的統計分析思路。

使用電腦,打開醫咖會,觀看專欄視頻:

https://www.mediecogroup.com/zhuanlan/courses/7

關注醫咖會,及時獲取最新統計教程

相關焦點

  • 如何製作論文中的表格和圖表
    ),XY線圖(X,Y Line Graph)]的用法下面兩個示例圖是典型的直條圖和線圖,紅色字體標記了各組成部分。 圖表要告訴讀者儘可能多的信息,比如: (1)圖表反映的結果,包括扼要的統計描述; (2)如果可以應註明實驗的研究對象; (3)得出該結果的條件背景,如:採用的處理方法或顯示的相互關係等; (4)實驗地點(僅室外實驗時需要);(5)需要詳細的圖解對圖表反映的結果做出解釋(許多雜誌都強調圖表需成為獨立的部分,即讀者可以不閱讀正文章節而通過檢視圖表本身而理解論文結果,這一點經常被許多中國作者忽視);(6)
  • 高質量論文圖表製作及美化專題研討會
    事實上,我們不只是要了解圖表,更要精通圖表。然而許多科研工作者至今只會使用Excel製作包括柱形圖在內的少數幾種圖表,而對各種圖表的使用場景更是知之甚少。以往的課程中,老師往往從不對數據結構做稍多的分析,而是直接教你如何點擊哪幾個按鈕迅速生成某個圖形,這是「難」的根源。掌握了「數據結構和圖表的對照關係」及「不同數據結構間的靈活轉換」就掌握了圖表的1/3。
  • 論文圖表怎麼畫才能體現高級感?
    正如漫無目的的文章往往暗示作者毫無組織的思維一樣,一張不能說清楚數據信息的圖表通常意味著作者不知道應該通過這張圖表明什麼。因此,應該對圖表的設計和繪製給予足夠的重視,就像對學術論文本身的規劃與安排一樣。在設計圖表時,首先要選擇要呈現什麼數據。呈現何種數據間接但有力地界定了你想要引以為證的範圍,因為讀者想要的信息是從更大的數據集中挑選出來的。
  • 數據可視化當中的圖表組合:比例面積圖
    很多時候由於國內數據可視化行業相較於西方國家起步比較晚,所以很多時候我們在進行數據可視化的時候只會選用單個圖表來進行數據分析的呈現,有的時候其實多種圖表直接是可以相互組合的。該圖表對於發現兩個類別或變量之間的相關性以及查找數據中的模式很有用。
  • 圖表:一圖值千字
    所以,跟摘要一樣,論文的圖表(外加其標註)也必須能獨立成文,不用讀正文就能看懂。   圖表用於形象地表示正文所述結果。簡而言之,他們是表達結果最有效的方式。好的圖表可以把獲得的結果迅速、準確地傳達給讀者(遠比讀正文為快)。
  • 前研乾貨丨英語科技論文寫作技巧-結果與討論
    寫作一篇科技論文,從某種意義上來說,是一個結構化寫作的過程,又或者像是電影的腳本,有開幕,有起承轉合,有高潮,有謝幕,有套路可尋。一般的科研論文包括摘要、引言、方法(儀器)、結果描述與討論、結論等,其中結果和討論的作用是對利用所描述方法或使用相關儀器得到的結果進行描述或者討論,進而對引言中提出的科學問題做出回應。
  • 應用系統中如何正確使用圖表功能
    (一) 為什麼需要使用圖表功能圖表是一種將數據以圖形方式顯示的可視化手段,多用於實現以下需求:1. 讓數據更易於閱讀和理解2. 展示數據數據對比3. 發揮數據的影響力4.​(二) 如何選擇合適的圖表類型先來看一看以下這幅圖,他為我們提供了選擇正確圖表類型的基本導向。
  • 如何構建一個基於可視化理論的完美Python圖表?
    圖源:unsplash將數據轉換為可視化圖表是門學問。本文介紹了能從經典的《定量信息的視覺展示》(Edward Tufte)中學到的大部分知識,並向你展示以及如何在Python中實現它。具有固有密度的散點圖
  • excel圖表製作技巧:多系列數據,如何製作組合圖表?
    本篇教程是做懂領導心思圖表的第三篇,分享多系列數據圖表的製作經驗。多系列數據圖表的製作,在工作中,一直是個難題。由於數據系列較多,做出來的圖表看著總顯得混亂,各數據之間的對比性也不強,基本違背了我們作圖的初衷。那有沒有什麼好的思路或者方法來製作多系列的圖表呢?下面我們就來看看excel高手是如何進行製作的。學習更多技巧,請收藏關注部落窩教育excel圖文教程。
  • 在數據中查找異常值的5種方法總結及示例解釋
    為了演示單個異常值對結果的影響程度,我們來檢驗示例數據集的屬性。它包含15個男性身高的觀測值。其中一個值是異常值。下表顯示了帶有異常值和沒有帶異常值的平均值和標準差。 在這篇文章中,我將使用這個CSV樣例數據集。
  • 高中信息技術說課稿:《Excel數據的圖表呈現》
    我說課的題目是「讓數據生動起來」--《Excel數據的圖表呈現》,主要從說教材、說教法、說學法、說教學過程四個方面進行。一、說教材1、 本節課地位和作用本節課是《信息技術基礎》必修模塊中《表格信息的加工與表達》的內容,屬於信息素養中信息加工的範疇。信息加工的內容有文本信息加工、表格加工和多媒體信息加工,是信息素養中極為重要的部分。
  • 怎樣提高醫學論文的級別?
    無論處於何種目的,發表論文已經成為醫學界的常態。相信不少發表過論文的醫學工作者都體會過,論文發表了,可是級別不過關的煩惱。今天我們就來好好談談,如何提高醫學論文級別?在談論這個話題前,我們先理清楚論文的六個級別。
  • DeepMind 論文三連發:如何在仿真環境中生成靈活行為
    然而,這可能需要相當多的工程學努力,且會產生受限的行為,或難以泛化到其他新任務的行為。  在這三篇論文中(論文摘要見後文),我們尋找了產生靈活和自然行為的新方法,它們可被再利用,解決新任務。  富環境中移動行為的出現  對於一些人工智慧問題,比如玩Atari 或下圍棋,其目標易於定義,即獲勝。但是你如何描述定義一個後空翻動作,或者跳躍。
  • 示例—如何藉助翻譯軟體,寫英語論文?
    示例一:原文(原意):為了緩解石墨的供需矛盾,彌補石墨材料的力學缺陷。make up 有組成、編造、化妝、彌補的意思,在學術論文中,用 make up 表示「組成」的意思多,表示「彌補」的情況少。學術論文中表示彌補的話,用 offset 比用 make up 用的多。
  • 如何撰寫SCI論文圖片標題?
    本文重點講述一篇 SCI 論文的圖片標題應該如何書寫。實際上很多人撰寫圖片標題時,並不很重視,往往寫得不準確、不恰當,從而影響整篇論文的質量。有效的圖片說明通常包括以下元素:聲明性標題,用於總結您在圖中顯示的數據的結果或主要發現;對無需參考正文即可理解該圖的實驗方法的簡要說明;統計信息,例如重複次數
  • 論文繪圖神器:一行代碼繪製不同期刊格式圖表,哈佛博士後開源
    賈浩楠 發自 凹非寺量子位 報導 | 公眾號 QbitAI「一篇論文投多個期刊,每個期刊對圖表格式要求不一,同一組數據要用多種工具分別繪圖。」不光是你,哈佛大學天文研究所的博士後,也不堪忍受論文重複繪圖之苦。
  • 全球油田產品公司FET利用LightningChart圖表工具解決方案
    (來源:VisualSoft網站)FET是如何應用LightningChart的?LightningChart的XY和3D圖表已在其多個應用程式中使用。FET 最初是在尋找一種用於繪製2D圖形的圖表工具,開發人員研究了LightningChart的示例和文檔,隨著研究的深入,LightningChart對於增強其應用程式的3D視圖的優點也更加明顯。他們還注意到,諸如「Zoom Bar chart control」之類的功能很好的改善了用戶的產品體驗。
  • 數據可視化圖表的使用方式及最佳做法,你用對了嗎?
    編輯導語:我們在工作中經常會用到數據,如今為了更加方便的數據圖表,一些企業採用數據可視化圖表,製作數據可視化大屏;本文作者介紹了數據可視化圖表的使用方式以及最佳做法,我們一起來學習一下。
  • 數據可視化圖表工具有哪些圖表類型?
    但很多人往往只注重讓圖表看上去「高大上」,而忽視了「這些的數據究竟適合哪些圖表來表達」。結果很多人花了大力氣做可視化圖表,卻沒達到想要的效果。 那麼,如何讓數據「說人話」,讓受眾更快速地懂你呢?
  • 論文標題目錄和圖表目錄自動生成方法
    論文通常具有不同級別的各種標題。當內容的級別很多時,目錄非常重要,那麼如何自動生成畢業論文的標題目錄和圖表目錄??本文使用特定的步驟向您展示WORD自動目錄生成方法和自動更新過程。1.畢業論文題目目錄的自動生成方法步驟1:在Word文檔頁面中,將輸入字符放在第一級標題上,然後在「開始」菜單下的頂部目錄索引框中單擊「標題1」。