編者按:
在大數據被熱炒的今天,你一定從哪裡聽說過,谷歌用搜索和大數據技術來預測流感發生。大數據粉絲們對此捧紅得不得了,這就是著名的「谷歌流感趨勢」(Google Flu Trends)項目。粉絲們認為,利用大數據預測疾病發生,是公眾健康的福祉。
不過,身在美國的衛生經濟學家陳茁向健康界介紹,這一始於2008年的項目如今在美國遭遇到了很大質疑。
他介紹,儘管「谷歌流感趨勢」在2009年的成功表現讓人大吃一驚,但接下來,項目高估了類流感的發病率,有時甚至比美國疾控中心的數據高出一倍以上。
不過,熟悉統計學的陳茁結合他過去的一些研究,對「谷歌流感趨勢」與美國疾控中心數據偏差產生的原因進行了分析,並對谷歌項目提出了改進建議。
他的觀點很明確,類似項目應該在數據準確方面有所改進,不切實際的過高期望有可能會「捧殺」大數據。但他相信,如果方法得當,大數據對疾病預測依舊有巨大的潛能,還可以在疾病監測防控之外發揮難以比擬的作用。
中國衛生領域對大數據的支持者最近大概是喜憂參半。一方面,中國國家疾病預防控制中心與百度合作,進行疾病預測防控;另一方面,美國「谷歌流感趨勢」項目的準確性遭受到質疑。
「谷歌流感趨勢」是谷歌公司2008年上馬的一個項目。它的想法是,根據美國各州和主要城市對流感短語的搜索,來預測流感的暴發。
項目背後的原理也很簡單:如果某地流感開始流行,那麼相關疾病的谷歌搜索就會增多。谷歌研究團隊2009年在《自然》上發表的文章引起很大反響。他們準確預測了2009年流感流行,讓人大吃一驚。
其實,對於利用搜尋引擎及相關數據預測衛生領域指標,業內早有相關研究。哈佛大學陳怡玲和合作者利用Yahoo的搜索數據,曾預測過肺炎和流感相關死亡數,相關研究於2008年發表在《Clinical Infectious Disease》上。
「谷歌流感趨勢」為何受質疑
2009年以後,「谷歌流感趨勢」項目的表現一直不盡如人意。2011年~2013年間,項目多數高估了類流感發病率,有時候甚至比美國疾控中心的數據超出一倍以上。原因到底是什麼?
我個人認為,其中一個原因就是大家被「谷歌流感趨勢」2009年的成功迷惑了,寄予了它過高的期望值。
現實要遠比原理複雜。谷歌搜索的結果和使用者人群「自我估計」的流感發病率相關。「自我估計」實際上很有問題。這是因為,普通感冒在不同個體身上的嚴重程度上會有差別,有些患者因為擔心,便搜索了相關信息。這些搜索構成了類流感「自我估計」中的「噪聲」。所以,「谷歌流感趨勢」模型中的「噪聲」需要謹慎對待。
另外,美國疾控中心的數據來自各地實驗室或醫療服務提供商,反映的是就診發病率。由於不是每個類流感患者都會去看病,美國疾控中心的數據跟真實發病率也會有差別。
某種意義上說,谷歌流感趨勢的預測和美國疾控中心數據是兩個不同的指標,兩者不一樣並不奇怪。相對於就診發病率,我認為「谷歌流感趨勢」結合傳播動力學來預測流感暴發概率,可能會更好一些。
當然,如果只用「谷歌流感趨勢」,還想準確地預測流感發病率,無疑是歧路亡羊。
「谷歌流感趨勢」項目失誤的另外一個原因是在數據分析方面存在欠缺。哈佛大學GaryKing和搭檔的研究就指出了谷歌項目在分析上的不足。
首先,這個項目沒有儘可能利用傳統的統計分析手段來剔除系統誤差,比如殘差的自相關性和季節性。
其次,「谷歌流感趨勢」忽略了其他數據的作用。如果結合美國疾控中心的數據,谷歌的預測其實有可能被大大改善。我曾在明尼蘇達大學楊宇宏教授的指導下做過「預測合併」的研究,「預測合併」可以改善預測精度,這或許是一個可行的改進方向。
另外,有推測認為,隨著項目開始廣為人知,很多人開始跟進研究。大家都搜索流感相關短語,也增加了不少「噪聲」。這個問題相對來說比較容易解決,因為谷歌可以確定搜索是否源於研究機構子網中,然後進行排除。
而且,Gary King等也委婉地對谷歌研究團隊提出了批評,認為其數據分析不夠透明,沒有將完全的「搜索短語集」公布出來。
中國CDC與百度合作要避免雷區
儘管谷歌的項目遭遇質疑,但我個人認為這種質疑不足以否定大數據對國民健康的潛在貢獻。我也相信,大數據還可以在疾病監測防控之外發揮難以比擬的作用。
根據美國2010平價醫療法案(ACA)建立的循患果效研究所(Patient-centered Outcome Research Institute)曾經資助了一個大數據項目。該項目旨在利用11個不同醫療服務網絡的數據,來找出醫學幹預有可能產生的不同效果,並為找到合適的隨機臨床試驗受試者提供線索。
此外,隨著信息技術的發展和相關軟硬體性價比的提高,相當多的數據服務商和地區醫療服務網絡已開始利用大數據,尋找最有效和最具成本效益的醫學、預防和幹預手段。老牌MarketScan等數據服務機構受到新興機構的挑戰,如醫療成本研究所等。
我相信,中國國家疾病預防控制中心與百度的合作前景可期。百度的數據結合中國國家疾病預防控制中心觀測點的數據,可提供更多更全面的原始信息。如果配合嚴謹的分析,這有可能開闢疾病監測防控的新天地。
對於上述合作,期許之外,我也有一些建議:
一個是應該更加重視分析方法,不能因為有了大數據就放棄對分析方法的重視和探索。沒有合適的方法,大數據也可能導致錯誤的結論。比如,百度的使用人群會有不同的特徵,利用百度數據進行推測疾病,就需要考慮這些特定人群與一般人群之間的差異。
另外,也需要考慮個人隱私和流行病監測之間的平衡。
最後,對標準化的重視會減少大數據應用過程中的錯誤。這一點對醫院和各地疾控機構信息化建設尤為重要。
(本文作者為芝加哥大學衛生促進研究中心博士後學者,資深衛生經濟學者,主要研究領域為衛生經濟學、健康不均等的分析,及政策和項目評估。《中國衛生評論》創刊主任編輯,現任《家庭和經濟問題雜誌》編輯委員會委員。本文僅代表作者個人觀點。)