抑鬱症是一種常見的心理障礙疾病,目前是僅次於癌症的人類第二大殺手,全球預計有3.5億人罹患抑鬱症。據世界衛生組織(WHO)估計,到2030年,抑鬱症將成為全球第一大疾病負擔。
據《柳葉刀》2018年的發表數據顯示,抑鬱症的全球發病率約為6%,而終生患病風險為15-18%,也就是說每5個人就有1人在一生中的某個時候經歷過抑鬱症。其中,有近一半生活在東南亞地區和西太平洋地區,包括印度和中國。
而近年來,因抑鬱症導致的自殺也是越來越頻繁。
心理社會應激與自殺行為存在著密切的聯繫,但這種聯繫不可能是獨立發生的,而是通過某種中介作用相聯繫,畢竟並不是所有經歷應激的人都會自殺。因此,只有結合自殺者的個人特質進行分析,將易致自殺的各種危險因素綜合起來,才有可能更加深入的理解自殺現象。
機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。近年來也被廣泛用於醫學領域。
我們都聽說過,大數據承諾要通過廣泛獲集電子健康檔案與高容量數據流來改變醫療領域,而從保險償付到個人基因組學及生物傳感器登記系統都可作為這些數據的來源。從應用風險評分指導抗凝治療(CHADS2)與降膽固醇藥的使用(ASCVD),到重症監護室內患者的風險分層(APACHE),由數據驅動的臨床預測在醫療實踐中已成慣例。
目前看來,結合現代機器學習,臨床數據源使我們得以對數以千計的相似臨床問題迅速生成預測模型。從對膿毒症的早期預警系統,到能力超人的影像診斷,這些方法的潛在適用範圍是相當可觀的。那麼是能用機器學習的方法,識別普通人群中歧途自殺的風險因素呢?答案是肯定的。
來自美國哥倫比亞大學的專家團隊對該問題進行了探究,相關結果發表在最新的JAAMA Psyhiatry雜誌上。
該研究數據來自全國酒精及相關疾病流行病學調查(NESARC)的兩次調查(2001年至2002年)(2004年至2005年)。後者一項面對面的縱向調查,調查對象為美國18歲及以上的非機構化平民人口的全國代表性樣本。兩次調查的累積回應率為70.2%,產生了34個653波次的訪談。使用交叉驗證訓練了一個平衡的隨機森林來開發一個自殺企圖風險模型。模型預測用於評估模型的性能,包括接收器操作曲線下的面積、靈敏度和特異性。
結果共有34 653名參與者中,其中20 089名為女性(52.1%),有222人(0.6%)在兩次訪談之間的3年內自述有自殺企圖。使用在第1次訪談時的調查問題,自殺企圖風險模型產生了交叉驗證的接受者操作者特徵曲線下面積為0.857,在優化的閾值下,靈敏度為85.3%,特異性為73.3%。
該模型識別出1.8%的美國人口有10%或更高的自殺企圖風險。最重要的風險因素是3個關於以往自殺意念或行為的問題;12項短表健康調查中的3個項目,即因情緒問題而感到心灰意冷、對所做的工作成就感較低;年齡較小;受教育程度較低;以及近期有財務危機。
綜上,該研究經過對2500多個調查問題的檢索,確認了幾個眾所周知的自殺未遂風險因素,如既往的自殺行為和意念。同時也發現了新的風險,包括精神障礙和社會經濟劣勢等。這些結果可能有助於指導未來的臨床評估和制定新的自殺風險量表。
參考文獻:
Identification of Suicide Attempt Risk Factors in a National US Survey Using Machine Learning. JAMA Psychiatry. Published online January 6, 2021. doi:10.1001/jamapsychiatry.2020.4165