隨訪時間偏差和倖存者偏差:這兩個統計學陷阱,你掉進去了麼?

2020-12-26 澎湃新聞

醫學界腫瘤頻道

醫學統計學上的2個陷阱,你知道怎麼避開麼?

David Freedman提出「統計學是對令人困惑費解的問題作出數學假象的藝術」。醫學統計學是從事物同質性與變異性的數量表現出發,通過一定數量的觀察、對比、分析,揭示那些困惑費解的醫學問題的規律性,即由偶然性的剖析中,發現事物的必然性,並用於指導醫學的理論和實踐的科學。

醫學統計學同時作為一門藝術,必須在統計理論的指導下,正確運用統計學思維,針對數據特點,巧妙地選用恰當、高效的統計學分析方法,從而得出可靠的結果和科學的結論。

隨著醫學的發展,作為醫學科學研究方法的醫學統計學已逐漸為廣大醫務工作者和醫學科學工作者所認識,接受並廣為應用[1]。然而,在統計調查和分析中,人們往往會受到一些表象或虛假片面信息的影響而作出誤判,由此而產生偏見,下面,我們就來談談我們在工作中經常會被帶偏的兩個偏差——隨訪時間偏差和倖存者偏差。

隨訪時間偏差:

隨訪時間越短,生存時間被高估

首先我們要了解一下生存分析的概念,在許多腫瘤研究中,評估的主要終點是病人接受幹預後到某個事件發生的時間,這段時間通常被稱為生存時間,最常見的2個終點指標是無進展生存期(PFS)和總生存期(OS)。

然而生存分析中最大的難題在於,在一定時間內並不是所有試驗對象都會經歷定義的目標事件,以至於我們並不能確切地知道這些試驗對象的生存時間,這種現象我們稱為數據的刪失(censoring)。

在醫學研究中,被刪失的生存時間大多會低估真實(但未知)的事件發生時間,為了避免刪失對結果的影響,我們需要有足夠有效的隨訪時間,以獲取足夠多的目標事件來確保統計檢驗有足夠的效能。

舉個例子

某一類型的腫瘤患者在現行幹預手段下5年生存率有50%,而現在有一項新藥研究,隨訪時間只有3年,那麼很有可能在3年隨訪期內不足以獲取足夠的目標事件(死亡),大多數數據為刪失狀態,在這種情況下,試驗組的生存率會被高估[2,3]。因此,中位隨訪時間的長短也是判斷研究結果是否可靠的一個重要指標。之後,還請認真對待中位隨訪時間,這個在文獻中經常出現又經常被你忽視的數據。

思考

有兩個結構非常相似的第三代表皮生長因子受體酪氨酸激酶抑制劑(EGFR-TKI),分別展開了名為AURA Ex(奧希替尼)[4]和APOLLO(國產三代EGFR-TKI)[5]的研究。這兩個研究都是Ⅱ期劑量擴展隊列,樣本量分別是201例和244例。在AURA Ex[4]研究中,隨訪時間是13.2個月,PFS是12.3個月,緩解持續時間(DOR)是15.2個月;在APOLLO[5]研究中,隨訪時間是11.8個月,PFS也是12.3個月,DOR是12.4個月,那麼您認為到底哪個數據的結果更可靠?

倖存者偏差:

請不要再用不良事件預測療效了

倖存者偏差一詞的出現還要從二次世界大戰的一則故事說起。第二次世界大戰時,美英聯軍對德國展開了大轟炸。但由於德國防空力量強大,美英空軍損失慘重。國防部找來飛機專家,要求研究戰鬥機受損情況,以便對戰鬥機進行改進。專家們檢查了執行任務歸來的飛機,發現所有返回的飛機機腹都遍布彈痕,但機翼卻完好無損。於是專家們推斷,機腹非常容易受到炮火攻擊,應該改進機腹的防護能力。

但美國國防部特邀的美國哥倫比亞大學著名統計學家沃德教授卻認為:這證明被擊中機翼的飛機都墜落了,而僅僅被擊中機腹的飛機都返航了,故應該加強防護的是機翼,而不是機腹。最終國防部採納了沃德教授的建議。不久之後,聯軍轟炸機被擊落的比例,果然顯著地降低了。

為了確認這個決策的正確性,一段時間後,英國軍方動用了敵後工作人員,搜集了部分墜毀在德國境內的聯軍飛機殘骸,他們中彈的部位,果真如沃德教授所預料,主要集中在駕駛艙與發動機的位置。真所謂看不見的彈痕最致命!

飛機專家們之所以得出改進機腹的結論,是以能飛回來的飛機作為研究對象;而統計學家之所以得出相反的結論,是以那些沒能飛回來的飛機作為主要研究對象得出的。觀察和分析的角度不同,結論就不同。統計學裡將上述情況稱為倖存者偏差。它給我們的啟示是:我們不能只看到成功者,因為這可能會總結出一些不靠譜的「經驗之談」 [6]。

在臨床研究中也經常發生類似的偏差,比如某藥物療效不錯,但不良事件發生率較高,為了讓醫生能更加接受這款藥物,因此做了一個事後分析。結果發現:不良事件發生率較高的患者,療效更好。所以得出結論,不良事件發生率高的患者療效更好。很顯然,這個分析也掉進了「倖存者偏差」這個陷阱。因為只有用藥時間足夠長的患者,不良事件的發生率才會更高,所以不良事件發生率高的患者正是那些被「倖存」下來的患者!

如何消除倖存者偏差?最顯而易見的辦法當然是讓「沉默的數據」說話。雙盲研究設計和詳細、全面、客觀的數據記錄都是消除倖存者偏差的良方。所謂兼聽則明也是這個道理,拋掉對個案的迷信,全面系統地獲取調查資料,才能克服倖存者偏差的出現[6]。

參考文獻

[1] 孫振球主編,醫學統計學(第三版),人民衛生出版社2014年5月第三版第21次印刷,P1

[2] Clark TG, Bradburn MJ, Love SB, Altman DG. Survival analysis part I: basic concepts and first analyses. Br J Cancer. 2003;89(2):232–238.

[3] Kaplan EL, Meier P. Nonparametric estimation from incomplete observations. J Am Stat Assoc. 1958;53:457–481.

[4] Pasi A Janne, et al,. AURA Ex, JCO, 2017, 35:1288-1296.

[5] S Lu, et al,. APOLLO, WCLC2019, Barcelona, Spain.

[6] 祝國強(上海第二軍醫大學基礎醫學部),中國統計,2014.9,P53-54

審稿專家

季豔霞教授

季豔霞教授,河北醫科大學腫瘤學碩士。現任邯鄲市中心醫院放化療四科主任、河北省抗癌協會腫瘤轉移委員會常委、河北省抗癌協會腫瘤內科專業委員會青年組委員、華北胃腸專業委員會委員、邯鄲市癌症康復協會會長、邯鄲市抗癌協會腫瘤放化療專業委員會副主委。

漆興芝教授

宜春市人民醫院,主任醫師、教授。中國醫師協會中西醫結合醫師分會副主任委員、江西省醫學會第五屆腫瘤學分會委員、江西省中醫藥學會腫瘤學分會委員、江西省老年腫瘤專業委員會委員、宜春市醫學會腫瘤專業委員會副主任委員。

(按姓氏拼音首字母排序)

原標題:《隨訪時間偏差和倖存者偏差:這兩個統計學陷阱,你掉進去了麼?》

閱讀原文

相關焦點

  • 心理學:倖存者偏差,你最應該防止掉進去的人性誤區
    這種情況其實就是倖存者偏差,表面上看是統計學、邏輯學的範疇,但實際上卻是來自於人性。很多倖存者偏差問題,是非常隱蔽,危害性也相當大的。-1- 什麼是倖存者偏差倖存者偏差,又被稱為「生存者偏差」,是一種常見的邏輯謬誤,意思是只能看到經過某種篩選而產生的結果,而沒有意識到篩選的過程,因此忽略了被篩選掉的關鍵信息。
  • 倖存者偏差,看不到的真相最致命
    「倖存者偏差」,讓人們只看到經過某種篩選而產生的結果,而沒有意識到篩選的過程,因此忽略了被篩選掉的關鍵信息,得出的最終結論,自然是一個邏輯錯誤。這說明偏信「倖存者偏差」只會導致更多的不幸,只有看到「倖存者偏差」背後的邏輯錯誤,才有可能阻止更多不幸的發生。
  • 騙子密碼:倖存者偏差
    01你越認真,離真相越遠倖存者偏差又叫「倖存者謬誤」,反駁的是一種常見邏輯謬誤,即只看到經過某種篩選之後的結果,忽略關鍵信息。這涉及到數學的一個分支,也是統計學中的概念:越是認真觀察眼前的真相,你離真相越遠。
  • 統計學中的「倖存者偏差」,如何影響著你和我?
    丨全文2800字,預計閱讀時間6分鐘「倖存者偏差」是統計學中對一種邏輯謬誤的統稱,是指我們只關注了經過某種篩選過程後的結果,而忽略了篩選過程的邏輯謬誤。它起源於二戰時期的一個故事。最後國防部的要求卻是,改進和加強對機翼的保護。因為國防部的統計學家們發現,能夠倖存返航的戰鬥機,機翼都是完好無損的,這說明了被擊中機翼的戰鬥機都已經墜落了,而僅僅被擊中機腹的戰鬥機卻還能返航,應該加強保護的是機翼,而不是機腹。
  • 開車的「倖存者偏差」
    【 倖存者偏差 】「倖存者偏差」的其實是在統計概率分布時一個典型的錯誤。錯誤在於對統計過程中對於基數的錯誤估計。如果上面這兩句話你看起來很難理解,那我就舉個簡單的例子:A吃了一個偏方治好了某種病,於是說這個偏方可以治好這種病。
  • 什麼是「倖存者偏差」
    於是西塞羅就說那你把那些沒有活著的人叫回來,我問問他們有沒有拜過神。因此,西塞羅也就成了第一個提出「倖存者偏差」的人。因為只有活著的人才可以說話,死人是開不了口的,每當活著的人回來之後說:「因為我是拜過神的,所以我就活下來了。」
  • 舉幾個例子來聊聊股市投資分析中的統計學概念「倖存者偏差」
    統計學倖存者偏差概念也被應用於投資倖存者偏差是一個數學統計或者說是邏輯學的概念,指的是由於取樣時採用了某種篩選方式,而對分析結果產生了影響。由於分析結果忽略了被篩選掉的關鍵信息,導致分析結果偏離了原本應有的準確狀態。
  • 巧用「倖存者偏差」,讓我們的生活更舒心
    倖存者偏差雖然是經典的統計學案例,但心理學作為一門科學,也常常與統計學打交道,尤其是講「偏差」這種心理學範疇的概念,跟我們每個人的決策判斷又息息相關,其實也屬於心理學範疇,興趣猶濃,今天跟大家分享這個有趣的故事,以及我在生活中的一些使用心得——你會發現其實我們都是生活中使用科學原理的能手。
  • 航空愛好者才會寫的高考作文:倖存者偏差與統計學邏輯謬誤
    彈孔分布假想圖:如果你是決策者,你會選擇將哪裡加固呢?圖片來源:wikipedia.org海軍分析中心的工作人員認為,飛機的彈孔大多集中在機翼和尾部,於是他們建議將這些受損最嚴重的地方加固。統計學家亞伯拉罕·沃爾德(Abraham Wald)卻得出一個跟直覺相反的結論。
  • 股市中的倖存者偏差
    來源:雪球倖存者偏差,指的是當取得資訊的渠道,僅來自於倖存者時(因為死人不會說話),此資訊可能會存在與實際情況不同的偏差。倖存者偏差,是由優勝劣汰之後自然選擇出的一個道理:死人不會說話。人們只看到經過某種篩選而產生的結果,而沒有意識到篩選的過程,因此忽略了被篩選掉的關鍵信息。
  • 醫療服務質量評價中的「倖存者偏差」分析
    這種推理的方法與日常理解的邏輯關係有點出入,這就叫倖存者偏差又叫「倖存者謬誤」,反駁的是一種常見邏輯謬誤,即只看到經過某種篩選之後的結果,忽略被篩選掉的信息,使對事物的認識僅限於某一偏面,甚至是與事實相反的結論。二、倖存者偏差對醫療服務質量服務評價的偏差表現1.相信療效。在醫療服務質量評價中,稍不注意也會犯倖存者偏差的問題。
  • 掌握大局觀,警惕思維陷阱,擺脫倖存者偏差
    倖存者偏差是一個統計學常見的邏輯謬誤,指用少數倖存者概括整體情況並得出結論,而那些不在樣本範圍內的「死」人則被徹底忽略。顯而易見,存在倖存者偏差謬誤的結論是禁不住推敲的,擁有全局觀的辯證性思維才更能接近事物本真。
  • 投資應警惕倖存者偏差
    投資是一個知識和觀念變現的活動,錯誤的觀點會直接帶來金錢上的損失,而倖存者偏差就是一個很容易犯的錯誤。1.技術分析中的倖存者偏差筆者於2006年初入股市,當時,技術分析大行其道,股市相關的電視、網絡和書籍中大量充斥著各路短線大師的論斷。
  • 網際網路人必須要懂的 「倖存者偏差」
    不管你是否聽過這個詞,這篇文章都會讓你對 「倖存者偏差」 理解的更加深刻,先讓我們來看幾個段子:學校組織郊遊,老師問:沒來的同學舉個手,好,人齊了,我們出發吧!央視記者在一輛高鐵上問:您買到票了嗎?買到了!您呢,您買到了票了嗎?買到了!媽媽為什麼不挑食?因為她買菜的時候已經挑過了!降落傘的電商店鋪為什麼都是好評?因降落傘有問題而失事的人想給差評也給不了!
  • 91思維模型:倖存者偏差
    當然成功人士有我們值得學習的地方,但是要理性看待,不能盲目的模仿,因為時間變了,環境變了,同樣的方法就不一定管用了。請記住:倖存者的成功不可複製。3、營銷領域保健品行業是把倖存者偏差運用最好的行業之一,尤其是直銷公司和傳銷公司。
  • 2018重慶高考零分作文:倖存者偏差
    倖存者偏差,也叫做「生存者偏差」或「存活者偏差」「沉默的數據」「死人不會說話」等。  俗話說得好,一葉障目不見泰山,說的也是這個意思。因為被體現出來的表現往往把真相掩蓋了,我們特別容易被大多數迷住而忽略了只屬於少數的真理。那些安靜的,沉默的,往往隱藏著最接近事物本來面目的屬性。
  • 倖存者偏差,你知道嗎?
    今天,跟大家分享一個很有趣的概念:倖存者偏差。 如果搜索倖存者偏差關鍵詞,大概率會追溯到二戰期間的轟炸機中彈事件。 1941年,第二次世界大戰期間,美國哥倫比亞大學統計學亞伯拉罕沃德教授,接受軍方要求,給出關於加強戰鬥機的防護建議。
  • 重大疾病保險市場規律:倖存者偏差
    > 《重大疾病保險市場規律:倖存者偏差》 ·作者 | 李毅· 二戰的時候,美國的軍方,為了減少飛行員的傷亡,提高安全的返航率,通過大量數據分析,他們發現了一些規律,如上圖,飛機的彈孔分布,翅膀上面比較多,引擎上面比較少,所以他們得出結論
  • 別讓倖存者偏差的錯覺毀了你
    如果在這個時候,你當真信了這些話,認為讀書沒有用,那麼你接下來的將很難有出彩的機會,因為你陷入了一個致命的心理學陷阱:倖存者偏差心理。其實,仔細觀察,你會發現每當高考來臨時,總會有一些言論來批判「百無一用是書生」。甚至於現身說法,某人小學沒畢業如今當了大老闆,而那個讀書十幾年的卻在跟別人打工。
  • 倖存者偏差:小飛的第一本書
    確實,在這過程中,他得到了很多很多自己意想不到的收穫。首先,他明白了自己的思維是有問題的。例如,他發現了一條生活中常常用來被人們忽略的認知偏差。倖存者偏差。倖存者偏差是什麼?倖存者偏差,指的是只能看到經過某種篩選而產生的結果,而沒有意識到篩選的過程,因此忽略了被篩選掉的關鍵信息。人們又稱其為 "生存者偏差" 或 "存活者偏差",是一種常見的邏輯謬誤。這也就意味著,人們只關注那些成功存活下來的人,而忽略了那些失敗的人。進而導致過高地估計成功的概率。