原創 袁帥 城室科技
現在已經4月了,本土疫情傳播基本阻斷、武漢復甦、學校複課,五一假期即將到來,我們終於可以帶著口罩在街道、商場、公園享受久違的輕鬆。
在本土疫情的尾聲裡(希望如此),我們想拿出數據,和大家一起回顧2020年最開始的——包含了漫長的舉國封鎖隔離的——70天,去看看我們一起經歷了哪些事件,又有些什麼樣的情緒變化。
微博上的相關熱點事件搜索量一定程度上反映著我們對疫情的關注情況,我們收集了這些數據,並且把公眾對新冠肺炎的關注程度分成了四個階段:
階段一:至1月19日止,潛伏。新冠肺炎的消息還未佔據公眾視野中心,以19日的萬家宴為代表事件。
階段二:1月19日到2月17日,高峰不斷。這一階段爆發了三次最高的熱搜高峰。1月26日是70天中熱搜的最高峰,是1月18日的90倍。武漢封城、500萬人離開武漢、李文亮醫生去世、湖北首地清零確診都發生在這個階段。
階段三:2月17日到3月7日,平穩下降。疫情熱度穩步下降的階段,伴隨著各地新增確診歸零,疫情開始逐漸從視線中淡出。
階段四:自3月8日起,小幅回升。隨著疫情在世界範圍的蔓延、加劇、情況變為不確定,疫情事件熱度也再次上升。
在收集到這些文字、圖片信息之後,我們繼續通過基於深度學習的自然語言處理和計算機視覺技術,對熱搜中的文字與圖片數據進行分析,並將每日與新冠疫情相關情緒的正面指數和分歧指數提取出來。
情緒正面指數總體處于波動上升狀態,特別是在第二和第四階段。2月17日前後,出現了明顯的正面指數上升同時分歧指數下降的情況,可能因為疫情爆發期我們終於開始團結一心、開始更加積極的面對疫情。
再來看情緒正面指數TOP10和BOTTOM10的新冠疫情相關話題,「武漢刑滿釋放進京黃某英出院」成功成為了最為負面的話題,同時也可以發現,與疫情數字相關的話題似乎讓大家更為緊張、情緒也更加負面。
一些典型正面和負面話題的圖片是這樣的。
分歧指數排名最高的是「鍾南山談新冠肺炎疫情峰值」,最低的同時也是正面指數最高的則是「法國前總理為中國加油」——對於這種祝福和鼓勵,我們總是會非常感恩的。
這些是分歧指數最高和最低的圖片。
如果把這些事件繪製在情緒坐標系統中,可以看出他們整體呈現出了反C形的分布形態。
我們還可以在這一坐標系中也看到我們對不同主題事件的不同情緒特徵。
以醫護人員和醫療物資的相關話題為例,醫護人員的相關話題主要分布在第二象限,也就是說我們難得的、一致的表達著自己積極的情緒。當然,面對部分女性醫護人員和醫護人員死亡的消息,也存在著更多負面、有爭議的聲音。
涉及醫療物資的話題則多分布在第三、四象限,顯然,對醫療物資短缺的恐懼和擔憂可能是情緒較負面的一個原因——其中最為負面的事件則是「大理扣留口罩事件」,這個之後在世界範圍內也不斷出現的情況,在當時就給整個公眾輿論環境留下了極其深刻的印象。
對國外疫情的情緒也針對不同國家展現出了不同的特徵,韓國疫情數字消息多數落在第三、四象限,以負面情緒為主,但有趣的是涉及美國的疫情數字則較多的落在第二象限,意味著我們體驗著非常一致的正面情緒,這種差異的背後大約有著比較復nan雜jiang的影響因素了。
最後一個有趣的主題則是復學復工——幾乎沒有相關的話題落在第二象限——顯然,我們大約幾乎是不會一致的對開學復工表達出愉悅的感受的。
事實上,絕多數相關話題落在了第四象限,對應著有極大爭議的負面的感受——不知道自己究竟願不願意復工復學,只知道哪種選擇都不會讓人開心起來,這種搖擺不定的樣子大概就是人生吧(什麼玩意)。
最後,我們還嘗試著把情緒的相關指標和疫情數字放在一起做了相關性分析(註:疫情數據來源於丁香醫生,僅包含國內)。
當然,社交媒體的數據不一定能代表公眾的聲音,也許疫情越演越烈時,一些引發負面情緒的話題便從榜單中和發現它們消失的聲音一起消失了,相關性背後也可以有多種的因果解釋作為推測存在,但我們仍然希望做一些嘗試,
整體而言,情緒的正面指數與疫情的累積數量和每日新增數量呈現出大致正相關的關係。這可能是因為隨著疫情的逐漸嚴重,比起表達擔憂、崩潰等負面態度的行為,我們更願意表達出鼓勵、祝願、感激等等正面的態度,這大約對增加社會調動資源的效率、使整個群體獲得更大的生存機會也有著更加積極的作用。
另一方面,八種疫情數字中,與爭議指數的關係最緊密的是新增死亡患者數量,圖中(第二行,第三張)的散點似乎組成了一條拋物線——似乎當日新增死亡患者最多和最少時,我們表達的情緒具有最大程度的一致性。
實際上在分析中我們發現,死亡在某種程度上,似乎才是和情緒正面指數、分期指數關係最為密切的指標。
這可能簡單因為最高的日新增死亡傳遞著最明確的信息,也可能由於社會共同體在災難最緊迫時會團結在一起,或許也因為生與死最能激發出人類的情緒本能。
我們在2020年開頭的70天裡對疫情的經歷是值得被記住、被書寫的。不僅僅因為新冠疫情幾十年一遇的嚴重性,更因為它發生在這個萬物互聯的年代裡:我們在物質環境中的交流停滯了,卻在虛擬環境中保持著聯繫。
虛擬環境存儲了我們存在、交互的大量數據。通過前沿的人工智慧技術,我們的情緒可以從中被感知、提取、整理,以前所未有的規模和速度得到分析、總結、報告。但另一方面,網際網路和社交媒體在疫情期間為我們的心理健康帶來了什麼影響,可能又是另一個問題了。
來聊一聊:你宅家期間的心情歷程,和網際網路信息給你的心情帶來的影響吧!
文:袁帥
算法:姜男、熊鑫、陳彪
編輯:張鼎
原標題:《疫情系列 | 2020年開頭的70天裡,我們到底經歷了什麼?》
閱讀原文