如何獲取「高質量數據」——大數據於臨床醫學價值的全景剖析

2020-12-27 健康界

對於臨床醫生在日常診療工作的同時,還承擔眾多醫學科研任務這個話題,業內至今仍頗多爭議。

現階段,三級教學醫院醫生將大量的精力投入在病人診治、自身學習以及醫學教學工作中,能夠開展科研項目的時間少之又少,而基層醫院醫生開展科研的能力、接觸有價值病例的機會又相對不足,如此得到的科研成果也差強人意。

臨床醫生到底應該以診療工作為主,還是學術科研為主?兩者在促進臨床診療和科研水平的提高中,本應相輔相成,互相促進,但現實面臨的問題,又困擾著醫生群體、管理部門、乃至整個社會民眾。

隨著醫療大數據領域技術的進步和實際應用的快速發展,這一矛盾能否解決,並充分的互相反哺和促進?基於這樣的問題,動脈網與醫療工作者和大數據領域專家進行了對話,希望能從他們那裡,探索新形式下的思考和方向。

一、臨床診療與科研脫節:數據處理是瓶頸

現階段,國內醫療資源還是集中在大的三甲醫院中,這導致醫生在臨床上的工作強度非常大。要在臨床工作中穿插完成科研工作,時間和精力的分配面臨著巨大壓力。

哈爾濱醫科大學胸外科馬建群教授告訴記者:「我個人科研時間大概佔30%左右,大部分時間還是投入到臨床工作中。明年我們醫院準備引進一位專門從事科研的人員,以提高我們科室的科研效率。

要讓臨床醫生只用30%左右的時間產出高質量的科研成果,顯然不太現實。過去我們寫科研論文先要查閱文獻、參加外部學術會議、了解國際學術動態、確定科研方向,然後要設計研究方案,收集臨床病例數據,查閱病理切片和其他檢查報告,或開展病例治療和隨訪工作。

哈爾濱醫科大學胸外科馬建群教授,專業方向為肺癌和食管癌診治

特殊病例報導由於數量少,分析一般很快,一兩周就能完成;臨床經驗總結的回顧性論文普遍要慢一些,一般花費1到2個月左右時間;如果是科研課題,那麼需要花費的時間就更長了,至少要半年時間收集、整理和分析數據、然後做統計學處理,整個研究基本以年度計算。但從科研價值上看,前瞻性、隨機性的科研課題比起前兩種會更具指導意義。」

哈爾濱醫科大學放療科劉暉教授則認為:「醫生要做臨床研究,隨訪是一個非常核心的部分。如總生存期 (OS,Overall Survival)、五年生存周期、不良反應等評判都需要長期的隨訪支撐,離開了隨訪的數據積累,臨床研究價值根本無從談起。

哈爾濱醫科大學放療科劉暉教授,專業方向為頭頸部腫瘤放射治療

過去我們做科研主要和醫院病案室進行銜接,我們提出申請及患者姓名,由病案室給我們隨訪。一個小型課題至少也得50份病歷,大一些的課題可能就要數百份病歷,就單單調取病案號都要很長時間。病歷調出之後,才是病案室的隨訪環節。假如這數百個患者的隨訪得到的信息不完善,還得重新補充隨訪,這耗費的時間就更長了。」

首先,臨床工作佔據了醫生大部分時間,使得醫生在科研上投入的精力相對有限。

其次,病歷數據的收集和查詢大大延長了醫生的科研周期。由於過去醫生在使用電子病歷時缺乏數據結構化錄入,更多是用文字的形式記錄下來,醫院過往的電子病歷中留存著大段的空白段落,這讓醫院在科研數據利用等方面存在困難。

所以,如何將這些存量數據進行高效、準確地結構化處理,在臨床診療與醫學科研之間建立一條「數據通路」,或許是解決問題的關鍵。

二、從高質量數據獲取到提出臨床科研解決方案

數據是醫生科研的基礎,這一點毫無疑問。但問題是醫生究竟需要怎樣的數據進行支撐?這一點,需要真正明確。

對此,楊海英表示:「目前國內對臨床研究數據規範化、標準化處理的經驗在不斷地積累,並依據和參考一系列的國際化標準。但目前仍然存在著數據標準不一致、各醫院或研究單位數據不能集成共享等問題。高質量、大數量、良好結構化的醫療數據,才會對科研效率的提升和科研成果的產出有重要價值。」

怎樣幫助醫生獲得一份高質量的數據,在楊海英看來,這涉及三個方面:

第一,醫院EMR(Electronic Medical Record,電子病歷)的數據質量。「為什麼一些雜誌上的論文被下架,就是因為這些論文在數據處理過程中,存在弄虛作假的情況。這與醫生書寫EMR的規範性、自律性有關。」

因此醫院在使用臨床數據採集系統時,病曆書寫應儘可能完整和標準,以電子病歷為平臺,建立臨床科研一體化病曆書寫與採集體系,在實現科研數據收集的同時,不增加日常工作量。

第二,醫院EMR數據的處理環節,尤其是數據結構化的過程,這直接決定著科研數據的質量好壞。基於大數據和人工智慧技術的後結構化數據處理,是解決這一問題的主要技術之一。

通過後結構化處理,在保證醫生書寫的原始病歷數據可溯源的基礎上,實現對既往病歷的結構化處理,滿足科研數據採集需求。

第三,數據質控/核查/數據分析環節。醫療大數據企業必須有專業的質控團隊進行數據的核查,包括人工核查、邏輯核查和醫學核查,並且每年都需要對相關人員進行一次資質考核。

此外,醫生採用的統計方法是影響數據質量的重要因素。國外的雜誌普遍對統計方法學十分看重,如該項研究所涉及的人群篩選、統計方法等,因此需要專業的統計團隊針對數據進行統計分析。

楊海英表示:「從標準的數據採集、高效高質量的數據結構化,到數據平臺中心提供的高效率的人工審核、邏輯核查,這一整套框架體系的搭建非常困難,而我們正是基於這樣一整套智能化數據處理體系,來保證處理的海量數據的質量以及為醫生所提供的臨床科研解決方案的規範和嚴謹。」

三、大數據於臨床醫學價值的探索與呈現

在探討完醫生科研的問題和解決方案之後,我們不禁要問,高質量的科研級數據會對整個醫療行業產生何種價值?從醫療機構和企業的實踐案例中,動脈網找到了以下4個方面的答案:

支撐從RCT到RWS的擴展

RWS(Real-World Study,真實世界研究)起源於實用性的臨床試驗,是基於臨床真實的情況採取的一種非隨機、開放性、不使用安慰劑的研究,其得出的結果具有很高的外部有效性。

真實世界研究的大數據來源非常廣泛,可以是患者在門診、住院、檢查、手術、藥房、可穿戴設備等多種渠道產生的海量數據,可納入患有多種疾病、且病情較複雜的患者。

楊海英表示:「在臨床診療實踐中,每年都會有新的藥物和診療手段出現。這些新技術要用於比臨床研究中受試患者更廣泛的人群,還面臨著很多實際應用的問題。因為真實世界人群要遠遠大於藥物、器械等研究環節的人群。因此如何放大到RWS(真實世界研究),還困難重重。」

如藥物聯合其他治療手段的可行性、藥物的治療周期、符合中國人群的劑量等,這些都是臨床醫生每天面臨的問題。這需要醫生從實踐中總結經驗、數據和依據,得出不同患者的最合理的治療方案。

真正要把臨床數據用好,就必然要在數據產生和累積的過程中實現規範化。

吳階平醫學基金會腫瘤醫學部副主任委員姚晨教授在對比RCT(Randomized Controlled Trial,隨機對照研究)和RWR(同RWS)時提出,相對於RCT強調標準化治療,而且一般都在臨床試驗機構實施,RWR更強調真實的治療,且可以在所有醫療機構開展。

2016年底,美國國會通過《21世紀治癒法案》(21st Century Cures Act),以及對可以利用「真實世界證據」取代傳統臨床試驗進行擴大適應症的批准,更是確定了基於大量病例積累數據的真實世界研究(RWS)的重要意義。

推動中國指南建設

所謂臨床指南,是指通過研究生成的證據以及對各種備選幹預方式的利弊評價之後提出的最優指導意見。國外的指南存在大量的臨床依據,常常被中國應用和參考。

但由於人群差異性和基因特徵,不同人種的治療方案存在差異,因此中國必須有基於中國人群證據體系的指南。

在這一點上,數據的價值便凸顯出來,醫生將自己臨床過程中的診療經驗,通過數據進行專業、系統地分析處理,這樣無論是臨床對照研究結果,還是基於病例數據的真實世界研究結果,都構成了高等級的臨床證據。

楊海英稱:「目前基於中國人群的前瞻性臨床研究證據積累不夠,但是可以通過真實世界研究的結果在一定程度上進行彌補,我們希望這些證據可以協助中國的腫瘤專家完善中國的指南,進而指導醫生的診療行為。」

「其實建立了高質量的醫療大資料庫,藉助目前的技術手段,醫生診療和科研的矛盾會得到很有效地解決,」楊海英說。

2017年9月,由吳階平醫學基金會腫瘤醫學部牽頭主持,天津市胸科醫院、四川華西醫院、河南省腫瘤醫院、中日友好醫院等10家醫院共同參與的「胸部腫瘤大數據臨床科研協作」項目,經過對10家醫院近4年的病歷匯集,累積肺癌病歷超過32000份,食管癌病歷超過16000份,依託LinkDoc進行數據處理的真實世界資料庫,憑藉高價值、完整數據處理的科研解決方案,最終在4個半月裡完成10個真實世界研究,並於2018年初向全球最大亦最具影響力的腫瘤組織ASCO(美國臨床腫瘤學會)投稿10篇。

吳階平醫學基金會腫瘤醫學部主委張遜教授指出,不同醫院的數據匯聚到一起對科研效率和成果有顯著提升。

基於真實世界數據的多中心臨床科研協作研究,能快速提升中國胸外科臨床醫生的科研能力和臨床水平,從而加強中國胸外科臨床專家在國際舞臺上的話語權。

支持AI輔助醫生診療

作為國內知名三甲醫院,哈爾濱醫科大學胸外科在應用方面有著不少建樹。據馬建群教授介紹,他們科室採用大數據分析工具,幫助醫生在做患者的精準肺段時,肺段切除與肺楔形切除相比,兩者各自的優勢在哪,可以根據工具提供的結構化資料庫進行科研分析來得出答案。

「假設在一定年齡段之中,在一定的大小範圍(如1cm)之內,患者做精準肺段切除和常規的肺楔形切除無差別,那可能以後我們就不會再對該類患者進行精準肺段切除了。因為肺楔形切除又簡便、又省時、又省成本,對病人的傷害小。」

哈爾濱醫科大學胸外科的應用告訴我們,高質量、多組學數據集的價值並不局限於科研。基於這些數據,可以通過深度學習形成人工智慧輔助診療工具,從而幫助醫生提高診療效率。

據楊海英介紹,目前輔助臨床診療的人工智慧產品,一類是基於知識庫(臨床指南、相關文獻),只能做到按照臨床指南,文獻依據,給出某一類患者固定的診療建議,但由於不同患者的特徵差異,存在一定的局限性。

另外一類是基於病歷數據和算法模型的人工智慧臨床輔助產品,通過將患者真實的病歷數據和算法模型,構建精準的診療模型並提供數據支持,從而可以指導典型病例、罕見病例的臨床診療決策。而完全基於中國病例數據的底層數據和訓練材料,將更利於實現在中國人群及臨床個體病例的應用價值。

加速新藥研發,擴大藥物適應症

利用大數據挖掘和人工智慧技術,從散布在世界各地的大量的專利、臨床試驗結果等海量信息中提取出能夠推動藥物研發的知識,提出新的可以被驗證的假說,從而加速藥物研發的過程。

此外,國家明文規定藥物上市以後5年內,藥企必須要提交藥物安全性監測數據,否則藥物面臨退市的風險。而基於真實世界的大數據則是藥企完成這類法規需求的好方法。

一位醫藥行業從業者告訴動脈網:「藥企傳統上只能通過昂貴的RCT臨床試驗,經歷漫長的時間去發現新的適應症。並且,不僅註冊標準的經費非常高,而且擔的風險也較高。而RWS可以幫助藥企和專家提前做分析,提前啟動實驗。」

另一方面,醫生基於產品說明書來決定藥物的使用範圍。

事實上,很多醫院都會出現超出藥物產品說明書的使用情況,醫生根據自己的經驗判斷去開具藥方,這個情況在看整個藥品行業中並不少見,如果能通過智能化數據處理平臺,不僅可以很好的控制研究費用,且可以最大化的探索臨床療效和安全性,藥企便能夠以此為證據,決定是否需要擴大產品的適應症,從而為藥物打開更曠闊的使用空間。

四、大數據賦能臨床醫學:技術能力是基礎,專業醫學能力是核心

綜上可以看出,醫療大數據企業對於整個醫療行業的賦能關鍵在於兩點:

一是技術能力,包括建立真實世界資料庫、搭建大數據處理系統/平臺,人工智慧平臺等。

二是醫學能力,包括主導疾病資料庫設計,進行標準、規範化數據處理和質量控制,以及真實世界科研設計,數據管理、標準嚴謹的數據統計分析等。

當前,隨著如零氪科技、太美醫療等國內主要醫療大數據企業,相繼獲得了C輪融資,醫療大數據在悄然中,進入了下半場時間。在今年年初,羅氏宣布擬以19億美元收購腫瘤大數據公司Flatiron Health之後,行業的變革訊號正變得越發強烈。

醫療大數據企業,能夠輔助醫生研發臨床科研工作,提供有價值、真正幫助到醫生,乃至患者的醫學解決方案。

如果將這種服務看做是一種賦能,那麼這種賦能是一種結合了技術和醫學雙重維度的價值體現,即以專業的技術和醫學能力為基礎,給予醫療服務方、醫生、藥企、保險機構等提供一整套醫療解決方案,最終幫助到患者的治療,提升患者的就醫體驗,而要實現這個過程,技術能力是基礎,專業醫學能力則是核心。

原標題:打開臨床診療與醫學科研「數據通路」——大數據於臨床醫學價值的全景剖析

相關焦點

  • 打開臨床診療與醫學科研「數據通路」——大數據於臨床醫學價值的...
    所以,如何將這些存量數據進行高效、準確地結構化處理,在臨床診療與醫學科研之間建立一條「數據通路」,或許是解決問題的關鍵。二、從高質量數據獲取到提出臨床科研解決方案數據是醫生科研的基礎,這一點毫無疑問。但問題是醫生究竟需要怎樣的數據進行支撐?這一點,需要真正明確。
  • 獨家 | 北醫三院骨科如何實現醫療大數據「4V」數據收集
    吳雲霞在2014年開始接觸骨科病例和文獻數據分析工作,並肩負科研檔案管理,發表了《2008-2014年脊退、頸退、胸退及腰退住院手術患者的人群特徵分析》、《採用自主創新技術治療寰樞椎疾病治療費用變化的分析》等多篇學術論文,其中數據研究成果值得行業借鑑和深思。此次大會上吳雲霞演講的主題是「大數據在骨科臨床醫學研究中的應用」,並在演講後與數據派參會志願者進行了訪談。
  • 彭曉霞:如何利用真實世界數據開展臨床研究?
    在本期微課堂中,我們邀請到首都醫科大學附屬北京兒童醫院臨床流行病學與循證醫學中心彭曉霞教授,請她為大家講解如何利用真實世界數據開展臨床研究。構建隊列 在獲取真實世界數據後,要對數據進行回顧性或前瞻性採集,構建研究資料庫。在圖2的示例中,研究者構建的隊列信息如下。 研究對象:2008年4月1日~2017年9月30日期間醫保資料庫記錄的18歲以上人口,且至少有一次血清鉀離子測量記錄。
  • 理解數據管理文檔對數據真實可靠性的重要性,如何進行良好的臨床數據文檔管理
    同時闡述了如何進行良好的臨床數據文檔管理,只有在切實地理解臨床數據管理的全過程的基礎上,進行嚴格而有效的文檔管理和定期的質量控制才是高質量數據管理文檔的保證。[ 關鍵詞 ] 臨床試驗主文檔;數據管理;文檔管理;數據真實可靠性臨床試驗質量管理規範(GCP)規定所有的臨床試驗的信息應該被記錄、處理和保存,並能被準確地核查、報告和解釋。
  • 【大數據文摘】高質量數據集哪裡來?
    大數據文摘作品,轉載要求見文末原作者 | Moritz Mueller-Freitag編譯 | 笪潔瓊 萬如苑 一針長期以來,在機器學習中不合理的數據利用效率一直是引起廣泛討論的話題。也有人認為,曾經阻礙人工智慧領域取得各種重大突破的,並不是什麼高深的算法,而是缺乏高質量的數據集。
  • 臨床醫學研究生怎麼寫出高質量SCI論文
    SCI論文的發表已經成為衡量研究生科研能力的重要指標之一,而臨床醫學專業學位研究生在時間、精力和基礎研究上均不佔優勢,撰寫SCI論文更是力不從心。但實際上,只要掌握了臨床科研方法,用心觀察,認真總結,發揮臨床工作中容易獲得一手數據的優勢,亦能夠發表高質量的SCI論文。
  • NMPA推進真實世界研究,探討臨床大數據在藥企的應用與變現
    接下來,我們將探討藥企對於臨床大數據的應用和變現情況,以及真實世界研究的應用場景。 臨床大數據與藥物數據或健康數據不同,臨床數據的獲取具有極高的門檻,從這個角度來講數據本身就具有較高價值。換句話說,誰擁有了數據誰就擁有了發展臨床數據應用的絕對主動權。當前臨床大數據主要服務於政府、藥企、醫院、保險四個類別。
  • 醫惠科技用AI「訓練」醫院大數據
    通過為醫院建設大數據中心,服務1500多家醫院的信息化建設,醫惠科技構建了醫療大數據的生態體系和知識體系,在數據標準化、數據採集、數據治理、數據建模、數據應用領域積累了豐富的經驗。 四年時間打磨出一套AI系統 2015年,醫惠科技迎來了發展的「拐點」。 這一年,通過資本重組,醫惠科技增添了強勁的動能。
  • 投資60億 北科生物國家生物醫學大數據產業園在蓉落地
    6日,深圳市北科生物科技有限公司與成都天府國際生物城籤訂戰略合作協議,將投資60億建設國家生物醫學大數據產業園。
  • 大數據分析技術如何應用在經濟統計中?
    隨著大數據年代的到來,數據資源已經成為一種新的資源方式,在這樣的布景之下,怎麼科學使用大數據,將其價值進行充沛地挖掘、剖析,有用促進社會開展成為各行業開展之下的重要方向。那麼,大數據剖析技能怎麼應用在經濟計算中呢?
  • 緊跟時代,湘雅醫學翻譯網推出大數據版塊,敬請關注
    網際網路上不斷增加的數據為網際網路公司提供了進行數據挖掘和數據分析的物質基礎,網際網路公司可以通過對用戶網絡行為數據的分析來了解用戶的網絡行為習慣,改進服務推廣模式和廣告推送途徑,從而獲取更大的收益。生物醫學研究領域,常使用統計學方法來處理和分析科學實驗或者臨床研究的數據,為了分析結果的準確性,實驗分析抽取樣本的數量越來越大,而網絡和雲計算、雲存儲等信息技術與醫學的結合使生物研究獲得大數據更加方便和迅捷,生物醫學的研究開始基於網絡、雲計算和大數據存儲和大數據樣本進行。
  • 【數據獲取利器】微博POI獲取工具,城市數據派會員專享哦
    城市大數據實操攻略】12月11日北京開營,火熱報名中!面向城市研究和規劃工作者的個性化定製課程,從大數據基礎、網際網路大數據、軌跡大數據、大數據可視化、Python、機器學習、到 R,城市數據師需要具備的一切技能都在此!(點擊看詳情)【派姐說說】親愛的城市數據派會員們,2016年11月的會員福利之新技術教學終於來啦!
  • 科學網:大數據,新希望——點亮生命「美好時代」
    「這些生物醫學大數據是國家基礎戰略資源也是重要資產。」中國醫學科學院醫學信息研究所副所長錢慶告訴《科學新聞》,生物醫學大數據主要包含以下特徵:一是數量大、複雜性高。例如,目前單個樣本的人類基因組和轉錄組測序數據量分別超過了100GB和30GB。二是內容與類型豐富。不僅包括臨床數據、生物組學數據,還包括醫藥研發與管理數據、醫療保險數據、行為與情緒數據等。
  • 如何成為優秀的大數據工程師?
    在大數據布景之下,精通大數據的專業人才將成為企業最重要的事務人物,大數據從業人員薪酬持續增長,人才缺口巨大。那麼,如何成為優異的大數據工程師呢?今天就跟從小編一起來了解下吧!1.從才能上來剖析的,首要大數據工程師是需求有計算機編碼才能的,因為面對海量的非結構化數據,你要從中發掘出有價值的東西,需求規划算法與編寫程序去實現,而程式設計師最牛的才能就是編寫簡練高效的代碼,去實現人們對未來天馬行空的夢想,編碼才能越強的程式設計師越有可能成為優異的大數據工程師。
  • 5G智慧醫療助力臨床醫學發展
    本次活動由北京市人社局主辦,中關村醫學工程健康產業化基地承辦,旨在支持博士後專業人才培養、加速科技成果轉化。北京市人社局副局長都陽出席會議並與參會嘉賓一同為神經遺傳代謝病轉化研究博士後培養基地及中關村生物醫學大數據中心揭牌。
  • 南方科技大學新增臨床醫學、大數據管理與應用兩個本科專業
    > &nbsp&nbsp&nbsp&nbsp原標題:南科大新增兩個本科專業&nbsp&nbsp&nbsp&nbsp深圳商報2020年3月9日訊 近日,教育部公布了2019年度普通高等學校本科專業備案和審批結果,南方科技大學臨床醫學
  • 【綜述文章】大數據點亮生命「美好時代」—新聞—科學網
    「這些生物醫學大數據是國家基礎戰略資源也是重要資產。」中國醫學科學院醫學信息研究所副所長錢慶告訴《科學新聞》,生物醫學大數據主要包含以下特徵:一是數量大、複雜性高。例如,目前單個樣本的人類基因組和轉錄組測序數據量分別超過了100GB和30GB。二是內容與類型豐富。不僅包括臨床數據、生物組學數據,還包括醫藥研發與管理數據、醫療保險數據、行為與情緒數據等。三是存儲分散。
  • 機遇與挑戰: 大數據與人工智慧如何引航醫療未來
    機遇與挑戰: 大數據與人工智慧如何引航醫療未來 原標題:   近年來,雲計算,大數據,物聯網,人工智慧等技術飛速發展,成為各行各業變革與創新的核心引擎。站在時代的風口浪尖,醫療行業也面臨著重要的契機與挑戰。
  • 金域醫學梁耀銘:高效戰「疫」 交出高質量答卷
    「我們要保證第二天一早,檢驗報告能夠及時反饋給各大醫療機構,為醫生治療提供精準的檢驗結果。」近日,上海證券交易所聯合各地方證監局主辦的「誠實守信做受尊敬的上市公司――價值引領投資2020滬市公司質量行」主題調研活動走進金域醫學,金域醫學董事長兼執行長梁耀銘接受了上海證券報記者的採訪。  這裡是一個沒有硝煙的戰場,這裡進行著一場與時間的賽跑,這裡不斷書寫著專業的高質量發展答卷。
  • 如何通過網絡數據的獲取,做出這些數據分析項目?
    作者 | AlfredWu 來源 | Alfred數據室 最近有很多人在問,我是如何收集網絡的數據,如何進行數據處理、數據分析以及可視化呈現的。也有人問的更具體,關於Python數據分析的一些問題。到底應該怎麼學?