作者 | 蔣寶尚
編輯 | 陳大鑫
自今年年初疫情爆發以來,中國話題一直成為國際媒體領域的熱門話題,有好有壞;這些話題內容也讓我們見識到了國外媒體的無底線、無節操。
那麼,自然而來一個問題:如何用數據來理解國際社會中的「中國形象」?
清華大學計算機系自然語言處理與社會人物計算實驗室與新聞與傳播學院金兼斌教授課題組,近期合作完成了一篇相關研究:「以中國為例的COVID-19疫情期間國家形象」(Country Image in COVID-19 Pandemic: A Case Study of China)。
這篇文章收集了Twitter平臺上關於中國的相關文本,並對之進行了屬性級別的情感分析,進而探索了疫情期間英文推特上不同群體視角下的中國形象。除此之外,他們還進一步闡釋了這些現象背後的機理以及發展趨勢。
1
所謂國家形象,即公眾對一個國家的看法,涉及政治、經濟、外交、文化等多個方面。
正如個人形象影響個人前途,國家形象對一個國家的國際關係和經濟發展也有著十分重要的影響。
近些年來,隨著中國的快速發展及其在全球影響力的不斷提升,中國的國家形象不斷發生改變,而2020年的新型冠狀肺炎疫情爆發進一步在全球範圍內改變了中國形象。
因此,深入了解疫情期間中國形象的特點與變化,對於應對後疫情時代我國對外傳播的新形勢具有至關重要的作用。
此前的國家形象研究,大多數基於新聞媒體數據,以新聞報導的框架作為國家形象的體現。隨著社交媒體的發展,研究者們開始直接從社交媒體平臺中的公眾言論分析國家形象。
然而,他們往往只關注到了,國家形象相關的總體議題分布或總體情感分布。而實際的國家形象紛繁複雜,涉及到政治、經濟、外交等多種屬性,因此,對國家形象採取更細粒度的屬性級別情感分析是十分必要的。
在此次新冠疫情全球化爆發背景下,來自清華大學計算機系和新聞與傳播學院的陳慧敏、朱澤宇等人,利用推特平臺疫情相關數據,構建了一個包含細粒度屬性級別情感標註的中國形象數據集。他們隨後用 BERT 模型實現了屬性級別的情感分析,從而實現細粒度的國家形象挖掘。
2
從研究結果總體來看,疫情期間推特平臺上的公眾,對中國的整體情感經歷了由「非負面為主」向「負面為主」的轉變。
換句話說,推特上的中國話題越來越負面。
圖1:疫情期間,Twitter平臺上公眾對中國的整體情感
研究者分析認為,有兩點主要原因:
(1)推特上,以非負面情感為主的有關中國疫情及抗疫行為的信息,比例在不斷減少;
(2)而以負面情感為主的有關中國政治、外交以及種族主義等意識形態的討論,在不斷增加。
研究者分別從 5 個方面分析了造成這一局面的具體原因,包括政治、外交、疫情狀況、檢測和種族主義。
1.、疫情信息整體不錯,政治外交很徹底地負向
圖 2:1~5月期間,5個方面整體上的負面/非負面情感
如上圖所示,從今年1月份到5月份,期間疫情信息整體來說為非負面情感,但涉及到政治、外交和種族主義,則顯得絕對負面。
2、 疫情信息在消失,政治卻是永恆話題
圖 3:各屬性推文比例變化曲線
從上圖中可以看出,隨著中國疫情的逐漸轉好,關於中國疫情及檢測的信息逐漸下降;而與之對比,政治問題是永恆話題,外交熱度則不斷提升,種族主義則是一波接著一波。這也解釋了為什麼總體情感由非負面轉向負面。
3、政治,完全負面;新冠檢測,好就是好
圖 4:五個方面的負面/非負面情感變化
如上圖所示,在五個屬性方面,政治方面的信息全部為負面,從未改變;外交上也是類似,負面佔據了絕大多數,且基本沒有起伏。而作為對比,我國疫情防控,基本上讓世界範圍內的群眾都感到了滿意。
研究團隊還進一步細分,探究了不同類型的推特用戶對中國形象的呈現,包括美國兩黨議員、英美媒體以及社交機器人。
4、 共和黨情感更為負面
從下圖中可以看出,美國兩黨議員均比較關注中國的政治與外交。民主黨人對種族主義問題非常偏愛;而共和黨則主打政治與外交。
圖 5:美國兩大政黨的國會議員每天在各屬性方面的推文數量。
就情感而言,民主黨人一度以非負面情感佔上風,但隨著大選的臨近,負面情感開始逐漸增多。
相比於民主黨人,共和黨人表達的情感是非常鮮明的負面。而且是從3月上旬突然飆升。
圖 6:美國兩大政黨的國會議員每日情緒統計。
5、英美媒體,還行
從下圖中可以看出,英美媒體在關注議題上,基本相同。
圖 7:在五個屬性方面,媒體的每日推特計數
在情感上,英美媒體以非負面情感為主。但值得注意的是,隨著時間的推進,非負面情感越來越少,而負面情感所佔比例相應增加。媒體理應保持理性客觀,因此這一現象值得警惕。
圖 8:媒體發布推特的情感變化
6、媒體難以影響公眾,預示民粹主義盛行
從下表中可以看出,公眾在六個方面都能影響媒體的關注焦點。
反過來,媒體在疫情、新冠檢測以及種族主義等方面也能或多或少影響公眾對中國的討論,但在政治和外交這兩個方面卻無能為力。
圖 9:美國媒體推特與公眾推特的格蘭傑因果關係檢驗結果。F 統計量越大,p值越小,效果越顯著。
而在情感上,媒體和公眾則更不能相互影響,如下表所示。一個重要原因可能是,西方世界民粹主義逐漸盛行。
圖 10:媒體與公眾之間在負面/非負面的相互影響
7、社交機器人比真人更負面,引人深思
社交機器人比普通用戶更傾向於發表有關中國政治與抗疫行為相關內容,且其情感在疫情信息、抗疫行為與種族主義等屬性上更為負面。
圖 11:機器人發推與一般用戶發推數量的百分比
圖 12:相比來說,社交機器人在中國形象各方面的發推情感更為負面。這裡以負面為「1」,非負面為「2」。
3
以上研究結果從深層次揭示了過去數月中,國際上(以Twitter為主)對中國情感的變化。如果我們日常關注國際事件,那麼對於每個變化背後的原因,我們應該都能夠猜到相應的事件和原因。
除此之外,更重要的是,在學術層面上,這項研究是首次將計算機科學中的「屬性級別情感分析」技術應用到社會科學研究中,為計算機科學和社會科學的深度交叉融合提供了案例。
據了解,研究中構建的有關中國形象的屬性級別情感分析數據集目前已經公開。
目前該研究已經發表在《美國電氣工程師學會大數據學報》(IEEE Transactions on Big Data)上。
論文連結:https://ieeexplore.ieee.org/document/9195107/
這篇文章的通訊作者為清華大學計算機系劉知遠副教授。新聞與傳播學院博士後陳慧敏、碩士生朱澤宇為共同第一作者。共同作者包括計算機系博士生豈凡超、本科生葉奕寧、孫茂松教授與新聞與傳播學院金兼斌教授等。
劉知遠是清華大學計算機科學與技術系長聘副教授。他分別於2006年和2011年從清華大學計算機科學與技術系獲得工學學士學位和博士學位。他的研究興趣包括自然語言處理與社會計算。他已經在國際期刊與會議上發表了超過80篇論文,包括ACM Transactions、IJCAI、AAAI、ACL和EMNLP等。
陳慧敏是清華大學新聞與傳播學院博士後,她從清華大學計算機科學與技術系取得博士學位。她的研究興趣包括自然語言處理與社會計算。她已在ACL、EMNLP、IJCAI等國際學術會議上發表了數篇論文。
朱澤宇是清華大學新聞與傳播學院碩士生。他的研究興趣包括計算社會科學、傳播效果研究以及國際傳播。