觀察者網:很高興有這樣一個機會能和賴博士直接對話。我首先聯繫到了塔特姆教授(A.J.Tatem),他幫我聯繫了賴博士。你的專業是地理與環境科學,研究人群遷徙的季節性流動與傳染疾病防控的關聯,可否談一談這個課題是否和某些國家的資料庫基礎設施建設有關?
賴聖傑:我屬於英國南安普頓的WorldPop研究團隊中的一員,這個團隊差不多有四五十個人。Tatem是我們團隊的頭。我本科是武漢同濟醫學院畢業的,學的是公共衛生學院的預防醫學專業,所以對武漢的情況很了解;碩士是在中國疾病預防控制中心讀的,和傳染病和流行病學相關,後來就留在了中心工作了好多年,我是在2017年離開後,來英國讀了地理學博士,主要還是和傳染病和流行病學相關,即人口的流動和傳染病的關聯問題。
你提到的資料庫對我們來說是必需的,而且需要多種不同類型的數據來驗證假設是否精準,比如要分析傳染病是否和氣候環境足夠相關,這就需要對應的地理環境的空間分布的數據,所以我們這個團隊有很多不同類型的資料庫和數據分析中心。
但我們本身不產生數據,我們是從別的來源搜集數據或者採用二手數據,比如武漢對人群流動的管控用到了百度地圖和騰訊的人口遷徙數據,這些平臺公布的數據都可以為我所用,而且我們還可以跟不同的醫療機構進行合作,驗證我們的想法和假設。
Worldpop根據手提電話數據、航空數據等數據,分析近6萬個武漢人於封城前兩星期,乘搭飛機離開武漢的路線圖。估計有834名受感染者由武漢離開至382個非中國城市
觀察者網:如果是這樣的話,某些欠發達國家的基礎設施建設相對比較差,相應的數據搜集和積累能力不足,會不會很影響你們團隊在某些區域的研究分析,比如在非洲?
賴聖傑:電信設施其實很多都做到了全球覆蓋,比如沃達豐和orange等等,有統一的數據服務中心,在非洲很多國家也布置了一些。所以說我們要掌握基於通訊方面的數據並不會很難,我們這個團隊在非洲也做出了很多成果。反倒比較困難的是在發達國家,因為這涉及到數據隱私的問題。所以疫情到來之後,一定要把數據「去隱私化」。很多西方國家擔心有信息洩露的風險,歐盟隱私數據保護條例非常嚴格,所以要拿到相關數據不得不提交一些報告和審查,程序是非常繁雜的。
國內的信息保護機制也是越來越健全,我們之前也和國內的通信運營商有些合作,但問題是其數據中心都分布在各個省份,沒有匯總全國情況的服務中心,想得到這部分數據確實是很難的。但是通過一些手機APP,即用網際網路公司公開提供的數據相對利用起來更快一些。時代畢竟在變化。
另外一點不得不說,這還涉及到信息費用的問題,在國內曾經想去跟移動和聯通合作,但是他們的開價很高。我們也曾和谷歌和非洲當地的通訊運營商合作過,最終以自願的方式無償分享數據,但畢竟還有數據加工的人力費用成本。總的來說,我們不傾向於買數據,首先這個價格會很昂貴,而且還涉及到不同團體的利益衝突。
觀察者網:可否談一談WorldPop團隊目前研究遇到的困難還有哪些?
賴聖傑:很多問題是普遍性的,也不單單是我們團隊遇到的,即數據的整合。比如地理空間與人口數據的整合分析。例如,手機的數據一般只能覆蓋成年人,無法涵蓋到很多幼年的小孩,也就是說做不到覆蓋全人群,由此造成的模型偏差需要進一步去闡釋,這和人口普查不一樣,我們只能儘可能掌握最大的樣本,但畢竟還是有誤差和偏移;另外我們要考慮這個數據是怎樣產生的,它畢竟不是從黑箱裡出來的,是否足夠能闡釋科學問題等等。比如武漢市人口流入流出的數據全貌還是需要和最後全國各省市確診人數的數據比對,空間和時間相結合,來驗證當初我們的假定精確率有多少。所有的傳染病預測模型都像天氣預報一樣,也是不可能百分百準確的。
英國當地時間2月27日下午一點多,賴聖傑博士接受了觀察者網的採訪
觀察者網: 2月27日,國家呼吸系統疾病臨床醫學研究中心主任鍾南山說的一句話在網絡上引起了強烈反響:「對疫情的預測,我們首先考慮中國,沒考慮國外,現在國外出現一些情況,疫情首先出現在中國,不一定是發源在中國。」請問賴博士如何解讀鍾南山院士的這句話?
賴聖傑:鍾南山院士是對整個就是做了一個評估,認為中國未必是新冠病毒的發源地,會讓學界關注更多的可能性。但目前就「病毒來源」這個主題來說,都只能算是一種假說和推測,我個人不敢妄言。就好比我們之前提出來的「零號病人」這個概念,如果這個概念能夠得到釐清,那麼也就能部分回答鍾南山院士提出的問題。追查病毒來源,做出讓人信服的結論我覺得還為時過早。
觀察者網:最近一個星期以來,日本和韓國的疫情突然變得嚴峻起來,從病毒傳播的路線角度分析,兩國是否存在高度的人群散播的關聯性?背後是否和「鑽石公主號」相關?
賴聖傑:導致感染的病人也會越來越多,大量的新增病原在本地的社區中蔓延,病毒本身也有「求生的欲望」,這會導致感染的病人會越來越多。