要發表高影響力的研究論文,良好的研究設計和執行、準確的數據和統計分析必不可少。(主要)研究者通常會宏觀指導研究設計和執行,但並不直接負責數據採集和交換、統計分析等工作。而研究數據作為整個研究結果和結論的核心,準確和清晰可讀是最重要的保障。良好的數據管理,可以為數據的保存、交換,統計分析乃至進一步在不同研究者間互通有無、同享數據奠定良好的基礎。
1、投稿醫學期刊時,數據共享是大勢所趨
2017年6月,《Lancet》發布一項國際醫學期刊編輯委員會(ICMJE)的聲明:臨床試驗在倫理上有義務共享研究數據。並指出臨床試驗數據規範化共享是趨勢,對今後的臨床研究具有指導作用。
該聲明中, ICMJE對發表在下屬雜誌中(包括NEJM、JAMA、Lancet、BMJ等)的臨床研究的數據共享做出兩項規定:1)2018年7月1日之後,凡是向ICMJE所屬雜誌投稿的臨床試驗文章,都需要加入關於數據共享的聲明;2)2019年1月1日之後開始招募受試者的臨床試驗,必須在臨床試驗註冊時提交數據共享計劃。儘管這些要求尚未強制執行,但期刊編輯部將參考數據共享聲明來做出最終是否刊出的決定。
以NEJM為例,在已發表臨床試驗文章的附件中,可以看到作者投稿時提交的數據共享聲明。
儘管數據共享常態化還需要解決很多問題,但可以預見的是,未來會有更多的期刊,更多的研究類型(如前瞻性隊列研究等)加入數據共享計劃。因此,可以共享準確、清晰可讀的數據,是發表頂級醫學期刊一個重要特徵。
2、要提交的共享數據應該是什麼樣的?
是不是一定要高大上的資料庫格式(如Access的mdb、MySQL的myd、Oracle的dbf)才可以共享呢?並不是。從數據保存格式上來講,共享數據時,提供Excel的xlsx、SPSS的sav和SAS的sas7bdat格式,並沒有區別。但如果你的Excel數據不準確,例如串行、有異常值、邏輯錯誤,那共享的數據以及研究結論可能會受到多方的質疑。
研究數據採集過程中,有良好的數據管理理念和意識,才能採集到準確和清晰可讀的數據。監管機構或行業協會對數據管理有很多要求和規範,此處不展開討論。但一個優秀的研究數據,最基本要求的應該是研究數據集格式統一,有清晰的數據詞典。數據集用於記錄觀測值和統計分析,數據詞典幫助統計師或其他研究者理解數據。
看到上面的數據格式,您是否就有了共享數據的信心了呢?但臨床醫生最熟悉和常用的紙質CRF收集數據、Excel錄入數據,肯定得不到上述的數據。
3、什麼樣的工具才能採集到準確和清晰可讀的數據?
隨著計算機和網際網路技術的迅速發展,新一代數據採集和管理工具——EDC(電子數據採集)系統越來越凸顯了它在數據採集和管理過程中的優勢。能發表高影響力的研究結果,幾乎全部都會使用EDC系統,而極少採用Excel這類工具採集數據的。
在任何一個可以上網的電腦/Pad/手機上,都可以使用EDC錄入和管理數據,甚至可以先離線錄入,等有網絡時再上傳。首先,EDC有清晰明了、簡潔高效的錄入頁面,也可以自動計算衍生變量,減少數據計算和錄入負擔。
其次,EDC可以提供豐富多樣的系統核查功能(比如必填校驗、數據格式輸入約束、數值範圍校驗、日期範圍校驗、變量間的邏輯校驗、條件顯示等),大大降低數據的缺失率,減少大量低級錯誤的發生。
再次,EDC可以多人協作,同時錄入數據並及時發現和處理數據問題,最大可能追回缺失數據,修正錯誤數據。研究負責人也可以實時查看項目進度,實時同步查看最新數據,及時介入管理進度。
最重要的是,EDC可導出多種數據集結構和格式,滿足不同分析群體的需求。導出清晰的數據詞典,有助於統計分析時理解數據。
4、哪裡找EDC系統?
醫咖會的小夥伴們,已經聯合各方面的專業人才,包括研究設計、數據管理、統計分析、IT技術人員,開發了簡單易用的EDC系統——醫維雲。「醫維雲」主要面向醫生發起的註冊登記、隊列、隨機對照試驗等類型的研究,提供數據採集和數據管理服務。「醫維雲」還有豐富的系統核查、源數據在線監查等功能。數據安全也已經通過國內外多項權威認證。
所有錄入員可以隨時通過網頁端登陸EDC系統,並錄入研究數據。項目運行過程中,醫咖會的數據管理人員會協助研究者開展研究數據的邏輯核查、醫學編碼等工作,研究者可以任何時候導入任何想要的數據格式,再加上EDC強大的數據導出功能,滿足統計分析要求的同時,一定是可以滿足共享數據要求的。
而醫咖會的小夥伴,還可以給你的研究設計、CRF表設計提供建設性意見,同時也可以協助你做數據清理和統計分析。