流感是一種由病毒引起的呼吸道症狀,流感具有傳染性強,傳播速度快的特點。對於流感,如果能提前預測其爆發,將會為衛生部門獲取到寶貴的預防時間,對於降低其危害,減少死亡率具有非常重要的作用。早期的流感監測,多通過醫療門診、住院等方面數據形成報告,但由於很多患者並不會在第一時間進行就醫,使得數據會有一定的延遲性,從而使得衛生部門無法提前預警流感的爆發。隨著信息技術的不斷發展,網際網路已經進入人們生活的方方面面,流感預警部門可以通過對網際網路數據進行分析,提取其中與流感相關的內容,實現流感的預警。
衛生部門對流感進行預警是通過大數據對網際網路中海量數據分析實現的。利用流感患者的搜索行為、發表的狀態等方面信息,通過大數據分析技術,實現對流感的預警。相較於傳統的流感監測方式,大數據流感預警能夠夠在流感爆發之前對其進行有效的預測,為衛生部門進行流感防控贏得了寶貴的時間;此外,因為流感數據大多採集於網際網路,不要建立監測點,使得後期的維護成本低。建立基於大數據技術的流感預警系統,主要包括數據收集、數據處理兩個部分。
利用大數據技術對流感進行預警工作,其相關數據主要來源於搜尋引擎、社交網絡、用戶輸入方面。流感患者對傳感病的查詢頻率一定程度上大於非患者的查詢頻率,預警系統可以基於這個方向,對搜索疫情數據進行採集,分析用戶的搜索數據,從而判斷流感的情況;基於社交網絡的流感預警系統,可以通過對社交平臺數據的分析,提取有關流感的內容,從而推斷流感的發病情況;基於用戶輸入的流感預警系統是需要用戶通過相應的網站將個人、地區等信息進行提交,再對這些數據進行分析,從而判斷流感的情況。
在對流感數據進行處理階段,因獲取的數據種類不同,對應的處理方法也不相同,網際網路上的信息種類多,有文本、圖片、視頻等信息類型,而流感的發生可能在世界任何地方,也使得信息因語言的不同而種類增多,因此流感預警系統需要將不同的文字轉換成可以處理的語言,之後需要對收集到的信息進行相關的分析,從而篩選出流感相關數據,在利用計算機技術流感爆發進行預測。
雖然基於大數據技術的流感預警方法相較於傳統的方法,及時性更好,但是準確性方面仍有待提高,如果錯誤預測了一場流感的發生,會造成很多人力、物力方面的消耗,如果未能進行有效預測,又容易造成其大面積爆發,對經濟、人口等方面產生一定的衝擊。基於大數據流感預警,主要是通過搜尋引擎、社交網絡、用戶輸入這幾個方向,但是這些來源的數據類型多,從而需要通過複雜的處理技術對這些數據進行處理,此外,這些數據之中往往也會包含很多與流感無關的甚至是虛假的信息,需要進行有效的篩選。
基於大數據技術的流感預警方法,其是對傳統流感監測方法的補充,可以為人們應對流感情況提供寶貴的時間,隨著信息技術的不斷發展,將會有更多的數據來源,不僅限於搜尋引擎、社交網絡、用戶輸入,同時也可以引入醫院方面的數據,藥物銷售、門診、住院等方面的數據,在對數據進行預測時候引入專業人員評測,計算機做出預警之後再由專業人員進行審核,提高決策的可靠性。