撰文|小溪
阿維·雅吉爾(Avi Yagil)是美國加利福尼亞州大學聖地牙哥分校的物理學教授,主要從事粒子物理學研究。2011年12月,他在歐洲近一年的工作告一段落,他飛回美國加州度假了。雅吉爾回家後一直感到不適,咳嗽得很厲害,他認為自己可能是旅途中得了感冒,於是就開始服用感冒藥。
阿維·雅吉爾(Avi Yagil)
接下來的那些天裡,雅吉爾咳嗽的症狀一點沒見好轉,他只好去找了醫生。胸部的X射線檢查顯示他的肺部充滿了液體,隨後的超聲心電圖表明他的心臟有些受損。看來這並不是普通的感冒,雅吉爾被診斷為患有心力衰竭,醫生給出了治療方案,先通過藥物治療來控制病情。可雅吉爾無法做到完全在家休息,他還得回歐洲核子研究中心(CERN)繼續他的物理研究。他的工作很重要,只是他的自我感覺挺不好,心臟仿佛是掙扎著跳動以維持他的生命,全身各系統似乎都有些故障。
他研究什麼?
雅吉爾從事的是什麼工作呢?這裡需要先介紹一下「標準模型」。
20世紀50年代起,粒子物理實驗陸續發現了一些理論學家所預言存在的粒子以及粒子之間相互作用的信息。在此基礎上,理論物理學家建立了一個用來描述組成物質世界的基本粒子及它們之間相互作用(除了引力)的理論模型——稱為粒子物理「標準模型」。標準模型在20世紀80年代時得到粒子物理界的廣泛認可,但標準模型中有一種重要的粒子(被稱為希格斯粒子)是理論物理學家在20世紀60年代時就提出應該存在的,可一直沒有被任何粒子物理實驗確定發現,缺少了這個關鍵粒子的實驗驗證,標準模型仍被認為是不完整的。
粒子物理「標準模型」示意圖
CERN建造了一個可達到產生希格斯粒子所需的極高能量的大型強子對撞機(LHC)。LHC加速器環的周長達27公裡,它將質子在順時針和逆時針方向分別加速到接近光速。環上有四個位置點可進行質子對撞(根據理論計算,應有希格斯粒子產生),在四個對撞點上分別建有CMS、ATLAS、LHCb、ALICE四個大型粒子探測器(其中CMS、ATLAS為主探測器),用於測量及記錄質子束對撞後產生的各種次級粒子的信息。
雅吉爾所在的美國加州大學聖地牙哥分校是CMS國際合作組的成員,參加CMS合作的有37個國家(或地區) 161個研究單位的科技人員。CMS探測器的規模的確驚人(長21.6米,直徑15米,總重量12500噸)建造費用約4.75億瑞士法郎。
大型強子對撞機LHC鳥瞰
CMS探測器結構示意圖(注意圖中的人物比例)
CMS探測器
LHC運行時對撞點上每秒鐘發生至少6億次質子對撞,各探測器獲得的數據達1 PB/秒(存儲1 PB數據相當於22.3萬張DVD盤的容量),這樣龐大量的數據無法全部保存,必須設置各種處理條件進行過濾,僅將可能有用的數據存儲在特殊設備上,每年過濾後的數據量仍達60 PB。這些過濾後的數據還需以各種手段處理、分解,最後由CERN計算機中心通過高速網絡提供給各合作組的物理學家們分析研究,從中尋找希格斯粒子的蹤跡。
粒子對撞示意圖
LHC開始運行後,物理學家們使用「機器學習算法」(涉及概率論、統計學、逼近論等多個領域的交叉學科,屬人工智慧的核心)學習、積累大量的粒子特徵、粒子測量以及它們如何相互作用的信息,以分析LHC中的粒子碰撞。在尋找非常稀有的希格斯粒子時,雅吉爾所在的美國加州大學聖地牙哥分校研究團隊最關注的是如何將少數可能產生希格斯粒子的碰撞與沒有可能產生希格斯粒子的碰撞分開,這完全類似「大海撈針」,物理學家們夜以繼日地依靠多種最先進的計算軟體執行著這項艱巨的任務。
數千名物理學家在如此複雜的數據背景之下,以超強的數據分析處理技術,終於從數據的「大海」中撈到了「針」。2012年7月14日,CERN正式宣布:ATLAS和CMS兩個研究組(約3000位科學家組成)成功地從LHC的數十億粒子對撞中發現了希格斯粒子。
希格斯粒子的存在被實驗證實,補上了標準模型難題中所缺失的部分,這真是一個令人矚目的偉大成就(預測希格斯粒子存在的兩位理論物理學家,弗朗索瓦·恩格勒(Francois Englert)和彼得·希格斯(Peter Higgs)獲得了2013年諾貝爾物理學獎)。
心臟移植之後
在CERN宣布發現希格斯粒子後,雅吉爾與同事們仍在繼續對希格斯粒子的性質進行深入研究。這段緊張的工作期間,雅吉爾的健康狀況沒有好轉,2016年初雅吉爾又回診所檢查了。這次,醫生根據檢查數據認為他的心力衰竭已發展到了D期(心力衰竭分為A、B、C、D四期)。美國心力衰竭學會對D期心力衰竭的定義是:儘管接受了最佳藥物、手術和器械治療,仍然出現進展和/或持續的嚴重心力衰竭體徵和症狀。D期屬於晚期心力衰竭,是一種比癌症更致命的病,這類病人的預期壽命一般很短,雅吉爾不得不住院了。
為挽救雅吉爾的生命,美國加州大學聖地牙哥分校蘇爾皮茲奧心血管中心的心臟移植團隊經三個月的努力,終於為他找到了一個合適的心臟源。2016年6月17日,雅吉爾接受了心臟移植。手術非常成功,雅吉爾將手術這一天視為自己的第二個生日。
雅吉爾對給予自己第二次生命的醫療團隊心懷感激,他思考著怎樣向他們表達謝意。除了給他們送些巧克力等小禮物,是否還能做些更有意義的事呢?
雅吉爾了解到:醫學上對心力衰竭患者進行評估並預測死亡率對為患者制定最佳醫療方案有重要意義。很長時期內,臨床醫生大多是憑自己的經驗及直覺對心力衰竭患者進行評估並給出醫療方案的。隨著科學的發展,醫生們決策時也使用一些風險評估及其他統計工具,但這些工具只基於相當基本的統計方法和有限的數據。作為心臟病醫生,每天都可能有病人要問「我的預後如何?」所以非常需要準確的風險預測工具來幫助醫生更好地治療病人。
雅吉爾設想,如果能將自己在粒子物理研究中所使用的前沿技術應用於醫學數據的分析、處理,應用於對心力衰竭患者的評估,那就可以幫助醫生更科學地預測心力衰竭患者的預後,有利於制定出最佳的治療方案。雅吉爾的主治醫生埃裡克·阿德勒(Eric Adler)和巴裡·格林伯格(Barry Greenberg)對雅吉爾的這一想法非常讚賞,他們決定組成一個跨學科合作的研究團隊,心臟病學家和物理學家攜手研發一種可對心力衰竭患者進行風險評估的人工智慧工具。
埃裡克·阿德勒(Eric Adler)、巴裡·格林伯格(Barry Greenberg)
研究團隊以阿德勒、格林伯格所在醫院衛生系統的5822名心力衰竭患者(住院或門診)的電子病歷數據(醫院很少將這些數據用於研究)為基礎,用雅吉爾熟悉的「機器學習算法(涉及概率論、統計學、逼近論等多個領域的交叉學科,屬人工智慧的核心)」開發對心力衰竭患者風險和早期死亡率進行評估的模型。
雅吉爾擁有豐富的「機器學習算法」經驗,機器學習算法的特點是:它通過搜索資料庫中不同變量之間的相關性來積累經驗。給它預定的變量越多,算法在學習及訓練的過程中就越有機會找到最合適的分析模式。但如果預定的變量過多且樣本量不夠大,就會發現它為測試目標制定的分析模式無法適用於更大的群體——專業上這被稱為是「過度訓練」,是需要避免的。
雅吉爾在LHC上所研究的粒子目標是基於理論學家給出的物理定律所預言的,可以在預定的變量條件下用數百萬個虛擬實驗生成的粒子來對所創立的模型進行訓練並不斷改進。而訓練完成後就可以用於從真實實驗所獲的海量數據中去發現那些罕見的過程以及尋找意想不到的現象。但此次要將「機器學習算法」運用於心力衰竭的研究,整個環境完全不同,沒有相關的理論預言,無法提供海量虛擬病人的資料庫可供訓練,而所掌握的真正患者的數據由於種種原因造成的未知因素很多(例如數據採集的時間不統一、間隔採集的時間不規範、測試項目不完整、個人隱私的保護等等),研究團隊面臨了重大挑戰。
經過研究團隊內物理學家與醫學家之間大量的討論甚至辯論,最後選定了心力衰竭患者臨床數據中的8個指標(舒張壓、肌酐、血尿素氮、血紅蛋白、白細胞計數、血小板、白蛋白、紅細胞分布等)作為預定變量,用人工智慧技術從5822名患者的數據中捕捉相關信息,將這些因素與患者診斷後的壽命進行對應,並通過先進的決策樹法(用一系列規則對數據進行分類與回歸)分析患者的特徵與死亡率之間的相關性。經不斷地修改、完善,終於建立起實用的評估模型,稱為MARKER-HF,該模型可根據心力衰竭患者的臨床數據給出患者低危或者未來三個月至一年內死亡的風險等級。MARKER-HF的AUC值達到了0.88 (AUC值用於評定模型預測結果的價值,這個數越接近1則說明該檢測方法的應用價值越高),MARKER-HF的準確率明顯地優於其它已有的風險預測模型。
MARKER-HF給出的心力衰竭患者風險評估
為了對MARKER-HF的臨床有效性進行進一步驗證,研究團隊還用加州大學舊金山分校提供的患者資料庫以及11個歐洲醫療中心的患者資料庫進行了兩次測試,AUC值分別為0.84與0.81,充分表明了MARKER-HF的性能穩定,適應性很強(不存在「過度訓練」的現象)。研究團隊對物理學家和心臟病學家之間的合作夥伴關係非常滿意,雙方都學會了如何從對方的視角來思考,雙方的知識和經驗都是至關重要的。
阿德勒醫生認為此項研究成果證明了跨學科合作的力量,非常有價值,它可以幫助醫生能夠基於行之有效的方法做出明智的決定,對心力衰竭患者實施個性化治療與護理,改善他們的預後,而不必去研究一個「水晶球」了(這是一個幽默的比喻,因西方的魔法師往往通過觀看水晶球來預測未來)。從技術上說,該評估工具還可以為更複雜的疾病風險預測提供參考。格林伯格醫生指出:這標誌著我們邁出了重要的一步,不僅可以準確地預測心力衰竭患者的預後,而且使我們了解了如何利用醫院的資料庫來解決對患者其它至關重要的問題,這太令人興奮了。研究團隊的論文已在2019年11月的《歐洲心力衰竭雜誌(European Journal of Heart Failure)》上在線發表。
雅吉爾又開始了他喜愛的運動
雅吉爾心臟移植後恢復得很好,他和家人一起享受著生活,並且又可以開始他喜愛的運動了。他非常感謝給予他第二次生命的每一個人,也很慶幸自己能擁有這個運用工作經驗與醫生們合作的機會,獲得了能對其他人有所幫助的研究成果。
參考資料
1.After a transplant, a physicist takes on heart failfure
https://www.symmetrymagazine.org/article/after-a-transplant-a-physicist-takes-on-heart-failure
2.Artificial intelligence tool predicts life expectancy in heart failure patients
https://www.eurekalert.org/pub_releases/2019-11/uoc--ait111319.php
3.Machine Learning Predicts Life Expectancy in Heart Failure Patients
https://healthitanalytics.com/news/machine-learning-predicts-life-expectancy-in-heart-failure-patients
4.Improving risk prediction in heart failure using machine learning
https://onlinelibrary.wiley.com/doi/10.1002/ejhf.1628
文中圖片均來自網絡