隨著大數據時代的到來,網絡輿情在數據體量、複雜性和產生速度等方面發生巨大變化。網絡輿論引導方法已超出了現有常用的框架。習近平總書記在全國宣傳思想工作會議上提出,宣傳思想工作創新,重點要抓好理念創新、手段創新。網絡輿情是網絡輿論引導工作的基礎和晴雨表,以大數據觀念變革傳統網絡輿論引導思維,準確把握網絡輿情的內在特徵及其在演化過程中的潛在規律,對於新形勢下做好網絡輿論引導工作,維護網絡社會安全,具有重要的理論意義和實踐價值。
一、大數據在網絡輿論引導中的價值
大數據是指無法在一定時間內用常規軟體工具進行抓取、管理和處理的數據集合,必須通過深度挖掘、計算、分析才能創造價值的海量信息。大數據的價值不在信息本身,而在於通過分析數據關聯性預測未來。網絡輿論引導的前提是網絡輿情的預測,而大數據技術為網絡輿情的預測提供了支撐和保證。
(一)大數據價值的核心:輿情預測
傳統網絡輿論引導工作的起點,是對已發生的網絡輿情進行監測開始。然而這種方式的局限在於滯後性。
圖1 傳統輿情監測方法的結構
大數據技術的應用,就是挖掘、分析網絡輿情相關聯的數據,將監測的目標時間點提前到敏感消息進行網絡傳播的
圖2 輿情預測阻斷突發輿情發生的結構圖
初期,通過建立的模型,模擬仿真實際網絡輿情演變過程,實現對網絡突發輿情的預測。
(二)大數據價值的條件:輿情全面
大數據技術要預測輿情,首要條件是對各種關聯的全面數據進行分析計算。傳統數據時代,分析網民觀點或輿情走勢時,只關注網民跟帖態度和情緒,忽視了網民心理的變化;只關注文本信息,而較少關注圖像、視頻、語音等內容;只觀察輿論局部變化,忽視其他群體的輿論變化;只解讀網民文字內容,而忽視複雜多變的社會關係網絡。從輿情分析角度看,網民僅僅是信息海洋中的"孤獨殭屍",猶如蟻群能夠湧現高度智能,而單個螞蟻如附熱鍋到處亂竄。
大數據時代,突破了傳統數據時代片面化、單一化、靜態化的思維,開始立體化、全局化、動態化研究網絡輿情數據,將看似無關緊要的輿情數據納入分析計算的範圍。
(三)大數據價值的基礎:輿情量化
大數據預測輿情的價值實現,必須建立在對已挖掘出的海量信息,利用數學模型進行科學計算分析的基礎之上,其前提是各類相關數據的量化,即一切輿情信息皆可量化。但數據量化,不等同於簡單的數位化,而是數據的可計算化。要在關注網民言論的同時,統計持此意見的人群數量;在解讀網民言論文字內容的同時,計算網民互動的社會關係網絡數量;對於網民情緒的變化,可通過量化的指標進行標識等。
(四)大數據價值的關鍵:輿情關聯
數據背後是網絡,網絡背後是人,研究網絡數據實際上是研究人組成的社會網絡。大數據技術預測輿情的價值實現,最關鍵的技術就是對輿情間的關係進行關聯,將不再僅僅關注傳統意義上的因果關係,更多關注數據間的相關關係。按大數據思維,每一個數據都是一個節點,可無限次地與其他關聯數據形成輿情鏈上的乘法效應--類似微博裂變傳播路徑,數據裂變式的關聯狀態蘊含著無限可能性。
二、目前網絡輿情工作的主要瓶頸
近年來,各地高度重視網絡輿情工作,通過創新機制、提升技術、人才培養等多種方式,不斷提高輿情工作水平和能力,有效應對了各種重大網絡突發事件,有力維護了社會穩定。但與日益頻繁和繁重的網絡輿情監測任務,與新時期網絡輿情監測向網絡輿情預測轉型的任務相比,還存在著技術、人才和制度瓶頸。
(一)技術瓶頸
目前,各地輿情監測工作的主要手段仍以人工檢索為主,儘管也使用了市面相對成熟的相關搜索軟體進行輔助搜索,但搜索輿情的技術仍採用傳統的二維搜索方式,即主題關鍵詞和網絡平臺二維坐標,由輿情員對採集的信息進行二次加工成輿情產品。
但搜索的輿情信息結果多為一級文本信息,對於深層次的多級輿情信息,如新聞、微博後的評論,網民的社會關係,網民針對某一事件評論反映出的情緒變化,以及網民煽動性、行動性的言論、暗示等數據無法深度挖掘,仍靠人工採集和分析判斷。受制於輿情員的知識水平和價值判斷的不同,極有可能導致有價值的輿情信息丟失,無法準確及時預測輿情走勢,大大降低了輿情監測工作的效率、準確性,增加了有價值輿情信息發現的偶然性和投機性,為重大突發事件的輿情預測埋下隱患。
(二)人才瓶頸
近年來,各地加大輿情監測人員配備,經過實踐鍛鍊和培訓,輿情工作人員基本掌握了輿情監測的業務技巧和軟體使用技巧,日常網絡輿情監測任務基本滿足需求,基本能夠確保日常淺層輿情信息的發現和上報。但要實現對輿情信息的深度挖掘和分析,實現輿情信息的預測,現有輿情工作人員的水平嚴重滯後,亟需建立一支精通大數據挖掘分析、模型構建等類的專業人才隊伍。
(三)制度瓶頸
按照大數據挖掘技術原理,要實現對輿情數據的深度挖掘,需掌握大量的數據,分析網民情緒變化、社會關係等,推算其階段性行動傾向和軌跡。根據現行制度框架,這些數據將遇到制度性的瓶頸。
三、大數據思維對網絡輿論引導工作的啟示
當前,應實現網絡輿論引導工作由輿情監測向輿情預測轉型,由事發輿論引導向輿論引導前置轉型,大數據技術為這種轉型提供了可能和動力。對網絡輿論引導的啟示可總結為"四個轉變"。
(一)由抽取輿情信息樣本向掌握全部輿情數據轉變
按照大數據的概念,現有的傳統輿情監測方式採集的輿情信息僅為樣本信息。通過大數據技術,突破傳統輿情監測技術瓶頸,深度挖掘目標輿情相關的所有看似不相干的數據信息,如興趣愛好、學歷水平、體貌特徵、社會關係等儘可能全面的數據,為全面分析輿情走向提供基礎。
(二)由追求輿情信息精確性向輿情信息混雜性轉變
大數據的一個重要特徵是數據的混雜性,因此我們不僅要接受多樣化的數據,還要善於利用多樣化的數據,將不同領域數據關聯起來進行分析。不再僅僅關注於網民在幾點幾分發表了什麼言論,而要關注在某一時間範圍,網民的關注人群、關注內容、關注方式的變化,以及他對周圍其他人的影響等數據。
(三)由推算輿情因果關係向計算輿情相關關係轉變
改變傳統的"有罪推論"的輿情監測邏輯理念,不再單純尋找輿情數據間的因果關係,如新浪微博有關突發事件串聯上街遊行言論的原因和後果,更多關注與此類言論相關聯的電話、微信、QQ等通聯手段信息、上街遊行口號等衍生數據,拓展輿情監測、處置視角,為預測輿情走向贏得時間和空間。
(四)由定性推算輿情信息向量化計算輿情信息轉變
量化輿情不等同於簡單的數位化輿情。要將所有相關聯的輿情信息,通過已建立的標準指標體系進行量化處理,將感性的網民評論、情緒變化、社會關係等信息,以量化的形式轉化為可供計算分析的標準數據,通過數據模型進行計算預測輿情走向。
四、運用大數據思維做好網絡輿論引導工作的對策建議
大數據時代已全面到來,面對紛繁複雜的輿情工作形勢,唯有大數據技術才是提升網絡輿論引導工作水平的"核武器"。
(一)優化大數據技術支撐平臺
加強與科研院所的合作,進一步研發大數據深度挖掘、存儲、計算和分析的關鍵技術,研發補充多種類型的業務功能模塊,不斷優化網絡輿情信息處理技術平臺支撐功能,加大輿情計算分析能力,將其打造為絡輿情大數據處理中央平臺。
(二)引進培養大數據技術人才
系統梳理網絡輿情工作所需技術人才目錄,通過招考、聘用等方式,引進亟需數據挖掘、分析人才;通過委託高校培養等方式,培養已有專業技術人才;通過購買服務的方式,短期租賃高精尖大數據技術人才為我所用,不斷健全大數據技術人才體系。
(三)研究制定輿情量化指標體系
組織專門課題組,與輿情專業機構合作,以歷史積累的輿情案例為素材,系統梳理網絡輿論引導業務流程,建立可供量化的輿情指標體系,將網民情緒變化、社會關係、意見傾向、意見影響力等定性內容納入指標體系,並不斷完善。細分輿情類別,有針對性地構建輿情預測模型,按照量化指標體系標準全面計算分析輿情內容,有效預測突發網絡輿情發生。
(四)拓寬大數據挖掘獲取渠道
在加快研發數據挖掘技術同時,加大與人民網、新浪、騰訊、百度、鳳凰網等主要網站的合作,通過合作模式獲取後臺關鍵數據。健全網絡輿情信息歷史數據沉澱機制,將重要關鍵的網絡輿情數據歸類存儲,運用大數據技術進行多次價值開發。建立健全全市大輿情工作機制,制定輿情大數據工作體系,完善市級部門、區(市)縣、媒體、社會舉報、民意調查、社保、社會信用、工商等輿情數據獲取方式,拓寬大數據獲取的渠道。
(五)再造輿論引導業務流程
按照大數據業務需求,再造網絡輿情監測、引導、處置等輿論引導業務流程,以全程化、全員化、全媒化和規範化的思路,實現網絡輿情預測和網絡輿論引導前置。
五、數據挖掘技術在輿論引導工作中的路徑選擇
大數據技術的核心技術是數據挖掘技術。要使數據挖掘技術有效助力網絡輿情監測與引導,首先應根據網絡輿情演化規律,構建適用於網絡輿情挖掘分析的相關模型和技術方法,使之滿足網絡等複雜系統中不同輿情對象間的複雜關係分析,從而為網絡輿情挖掘線路與進程提供理論基礎,實現一般數據挖掘模型和技術方法與網絡輿情挖掘與分析的有機融合。數據挖掘技術在網絡輿情引導中的應用可從以下四個方面展開。
(一)網絡輿情關聯分析
輿情關聯關係是網絡輿情資料庫中存在的一類重要的、可被發現的知識,首先需要分析網絡事件表徵參數間關係,進而發現網絡輿情中隱藏的輿情關聯。為更準確表示網絡輿情間的關聯度,引入網絡輿情支持度和網絡輿情可信度來量化網絡輿情關聯規則的相關性,從而使挖掘結果更準確。如,基於網絡輿情關聯規則挖掘,分析新浪微博中活躍者間關聯強度、堅定支持者人數以及堅定支持者成員的變化頻度等三個時間序列間的關聯規則,挖掘出新浪微博輿情的關聯關係,進而為輿情分析提供重要依據。
(二)網絡輿情級別劃分
網絡輿情級別劃分是根據網絡輿情的特徵判斷該輿情的嚴重程度。在對網絡輿情進行級別劃分時,首先需要構造網絡輿情分類器,然後利用分類器給未知類別的網絡輿情賦予類別。構造分類器的過程一般包括訓練與測試兩個階段。在訓練階段,建立模型描述預定的網絡輿情集的特徵,集合中的每一條輿情信息都屬於一個預先給定的類別(如一般嚴重),利用類標籤屬性來標識類別。用於創建模型的網絡輿情集一般被稱為訓練集,可以用數學公式、分類規則、神經網絡或判定樹等模型來描述一個預先確定的輿情集合,即進行有監督的學習。在測試階段,使用創建的模型在網絡輿情測試集上進行預測,並將測試結果與實際值進行比較,利用測試集中被正確分類的輿情的百分比來估計模型的準確率。經過以上兩個過程,便可以形成性能穩定、準確率較高的網絡輿情分類模型。當新的未知類別的網絡輿情出現後,便可以把該輿情的相關信息輸入到分類模型中,然後由分類模型判斷該輿情的嚴重程度。
(三)網絡輿情聚類
網絡輿情聚類分析是指事先不了解網絡輿情集合中每一個網絡輿情樣本所屬的程度級別,而是根據網絡輿情的主要特徵,如輿情發生時間、評論數量、傳播頻度等,把相同或相近特徵的網絡輿情歸為一類,從而實現輿情聚類。在輿情聚類過程中,分在同一個簇裡的輿情對象具有很高的相似性,而不同簇中的輿情對象之間的相似性非常低。所形成的每個輿情簇都可以看作一個輿情類,由它可以導出規則。與級別劃分不同,聚類只對輿情數據進行分析,由於最初並不知道如何開始,所以訓練輿情數據一般不提供級別標記,但是隨著聚類過程不斷推進,可以自動給不同輿情簇分配對應的輿情級別標記。
(四)網絡輿情傾向性分析
網絡輿情傾向性是指網民對客觀事物或公共事件所蘊涵的感情、觀點、態度和立場。網絡輿情傾向性分析是指通過數據挖掘技術,自動將網絡輿情所包含的褒貶因素挖掘出來,明確信息傳播者的真正意圖和傾向性。網絡輿情傾向性分析主要包括基於語義的網絡輿情傾向性分析與基於機器學習的網絡輿情傾向性分析,目前在技術、方法與模型方面均有深入研究,主要包括序列模式挖掘方法、情感分析、主題分析等。通過這些技術方法,將網絡輿情中豐富的情感傾向進行定性定量分析,及時掌握網絡輿情變化趨勢。在此基礎上,通過對隨時間持續變化的輿情進行分析,可以較好地把握網絡輿情的演化規律。
六、結語
作為網絡輿論引導的晴雨表,輿情監測是做好網絡輿論引導工作的前提和基礎。網絡輿情的紛繁複雜性,需要我們運用大數據技術進行輿情預測。但,大數據技術基於計算機的智能運算,只能作為智能化的手段。網絡輿情大數據源於網際網路的開放、共享,我們不能僅僅憑藉技術構建的大數據平臺去打撈那些可能代表一個群體或一定數量級的"沉默的聲音"。因為如果他們與網絡隔絕,或者由於"沉默的螺旋"心理效應而不提供任何數據,那麼我們所精心分析出的網絡輿情實際上是不全面的,以此來指導社會管理是有偏差的。
因此,面對越來越繁重的網絡輿論引導任務,仍然固守以往傳統工作方式將愈來愈力不從心。但完全寄希望於大數據技術來實現對網上輿論的管控,解放人的辛苦勞動無疑將是天方夜譚。
大數據技術是人發明的,它只是個手段,永遠不能離不開人的把控和分析。