國內數據新聞研究的知識圖譜

2021-01-15 中國社會科學網

隨著數位化技術的進一步發展,作為一種創新的新聞信息傳播形態,以數據挖掘和可視化呈現為基礎的數據新聞被各大媒體所青睞,尤其是在2012年之後,國內數據新聞實踐日漸推廣,引起了新聞傳播學界的持續關注。本文以知識圖譜分析軟體Citespace為分析工具,以數據新聞為主題,以CSSCI為來源類別進行高級檢索,在CNKI資料庫中選出290篇研究數據新聞的文獻(2012—2019年)並進行知識圖譜描繪,以期對我國數據新聞研究的軌跡和趨勢有一個清晰的認識。

國內數據新聞研究現狀

對數據新聞的研究由「熱」變「冷」。發文量是體現一個研究領域發展態勢的直觀數據。2012年以前關於數據新聞的研究成果較少。2013年多是介紹數據新聞在全球新聞界的實踐情況,一些學者將其作為大數據時代背景下的一種新型新聞傳播方式介紹至國內。2014—2015年,相關論文不斷增加,優秀案例不斷湧現,學界將研究重點集中在國內數據新聞實踐的介紹和分析上。在梳理國外優秀作品的基礎上,開始探索數據新聞的本土化發展。2016—2017年,數據新聞相關論文數量逐漸減少,研究選題逐漸集中到生產流程和新聞教育等方面。2018—2019年,數據新聞論文增速放緩,學者們開始對數據新聞進行更為精細化的研究,如一些學者關注數據新聞敘事範式、算法對數據新聞的影響等。

作者及其合作情況的網絡分析。經過對作者發文量及合作發文情況的統計,發表3篇及以上論文的作者人數僅為20位,發表1篇論文的作者數量比例較高。可以看出,數據新聞作為一個研究領域,核心作者群薄弱,高產量的作者數量較少且缺乏穩定性,大多數研究者只是把數據新聞作為一個子研究領域,缺乏持續性研究。從作者的學術經歷看,大部分關注數據新聞的學者長期致力於新媒體的研究,對新興的新聞傳播實踐更敏感。但是,他們很快又會被其他更新的新聞形態所吸引,真正留在數據新聞領域並持續產出研究成果的學者較少。通過Citespace對作者合作網絡進行聚類分析發現,研究者依然以「孤軍奮戰」為主,合作的偶發性較強,大部分是學者與自己的研究生合作發文,這與多數學者只是將數據新聞作為一時的研究興趣密切相關。

研究主題與關鍵詞分析。頻次較高的關鍵詞在某種程度上能夠反映學者們在該研究領域的關注點。通過利用Citespace進行關鍵詞共現聚類分析的結果顯示,頻次較高的關鍵詞主要有「大數據」「可視化」「新聞」「媒體融合」「信息圖表」「衛報」等。在詞頻≥6的關鍵詞中,「大數據」首當其衝,其次為「可視化」。究其原因是國內學者在前期研究中,主要介紹國外媒體經典案例以及數據新聞概念等,導致研究內容過於集中,未向整個新聞學科發散,研究視野相對狹窄。與之相比,國外學者則以「新聞業」為研究核心,從新聞學科的視角探尋數據新聞的歷史源頭、精確新聞、計算機輔助報導,以及與此相關的新聞客觀性,探索數據新聞對傳統新聞價值和報導理念的影響。

 研究特點及現存問題

通過對數據新聞CSSCI文獻的知識圖譜分析發現,國內關於數據新聞的研究有以下特點和待改進的地方。

第一,選題表現出橫向拓展的趨勢,專題性研究有待加強。國內關於數據新聞的研究方向大致有四類:國外數據新聞實踐經驗介紹、數據新聞本土化實踐經驗介紹、數據新聞對原有新聞生產流程的影響、數據新聞人才培養和新聞教育。還有少量文章涉及採集和使用數據所引發的倫理法規問題,如對個人隱私權的侵犯和違背客觀性原則等。相比較而言,國外學者偏向於對數據新聞的若干專題展開縱深性探索,研究對象鎖定在與數據新聞發展現狀與趨勢密切相關的領域,如一些學者從價值層面討論了數據新聞帶來的社會影響,此類議題涉及數據獲取和使用的合法性、新聞工作理念的轉變等。另外,一些學者還關注數據新聞中的開放政府與社區安全、數據使用與記者道德、數據獲取權與隱私保護等話題,揭示數據新聞對促進社會發展、提高政府和公民責任的重要意義。

第二,數據新聞的基本概念亟待完善與規範。儘管國外學者在數據新聞的基本概念上不盡相同,但大都是圍繞著數據新聞的歷史淵源、功能特徵來闡述的,體現出新聞傳播學科的歷史延續性。在確切表述上,國外更傾向於使用「Data」,而不是「Digital」和「Number」,對「數據」與「數字」和「數值」做了明顯的區分,同時還強調「數據」對新聞生產的「驅動性」。數據新聞進入中國新聞傳播界恰逢大數據技術在各行各業興起,業界和學界對「數據新聞」概念的理解不一致,「數據」時而指「大數據」,時而指「小數據」。最直觀的是有些欄目打著「數據新聞」的旗號,實則使用的僅僅是小體量的若干數值而已。可見,我國新聞傳播界還沒有對數據新聞的概念予以規範界定。隨著研究的逐漸深入,有學者認識到數據新聞亟待確立專業規範,消除數據新聞在基本概念上的模糊認知,數據新聞的概念應該與時代背景、技術環境相契合。

第三,研究方法過於單一,影響結論的效果。通過採用關鍵詞分析考察數據新聞論文的研究方法發現:我國的數據新聞論文大多採用定性研究方法,其中的文獻分析法被廣泛使用,其次是個案研究法和訪談法,極少採用實驗法。而在使用定量研究方法的論文中,內容分析法的使用量最高,其次為問卷調查法。在國外數據新聞論文中,定性研究與定量研究的採用比較接近。在定性研究中,文獻分析法主要用於職業倫理、受眾影響等偏理論的論文,個案研究法則多用於生產實踐、編輯室改革等偏實務的論文。國內外研究方法的較大差別,證實了國內學者得出的關於我國數據新聞研究存在重個案探討、少實證數據的結論,由於國內學者在數據新聞的研究上偏重經驗分析,基於科學實驗和量化基礎的探索少,影響到了研究結論的說服力、現實指導性以及學術創新性。

第四,跨學科互動與研究的開放性有待加強。刊發的數據新聞論文基本上均屬於新聞傳播學科,儘管大多包含了「大數據」「數據採集」「數據挖掘」「可視化」等關鍵詞,但囿於刊載期刊的單一性,也反證了數據新聞研究在國內並未得到數據科學、計算機科學、統計學等學科的認可。反觀國外的一些數據新聞論文則分布在統計學、信息學、計算機、人工智慧等學科領域,儘管數量不多,卻反映了數據新聞研究的開放性,體現出學科之間的互動與交融。尤其是數據新聞對數據科學應用情況的研究,從側面反映出數據新聞的專業化程度與發展趨勢等。

技術帶來媒體生產實踐的變革,不少媒體把數據新聞當作媒體轉型的一個「抓手」。與此同時,學界也予以持續關注,產出了很多研究成果。對290篇中文期刊文獻的知識圖譜描繪,有助於我們認清數據新聞研究中存在的問題,拓展視野和思路,發現新的研究選題,進而完善國內的數據新聞研究體系,提升相關研究的學術價值。

(本文系中國人民大學馬克思主義新聞觀研究中心課題(19MXG11)階段性成果;受中國人民大學2019年度中央高校建設世界一流大學(學科)和特色發展引導專項(19RXW137)資金支持)

(作者單位:中國人民大學新聞學院)

來源:中國社會科學網-中國社會科學報 作者:許向東 王怡溪

相關閱讀:

增強黨的新聞輿論引導力

網際網路時代影像新聞探究

優化新聞傳播教學體系

歡迎關注中國社會科學網微信公眾號 cssn_cn,獲取更多學術資訊。

相關焦點

  • 領域大數據知識圖譜專題 《中國科學:信息科學》
    自2012年穀歌推出基於知識圖譜的搜尋引擎以來,知識圖譜在工業、商業、金融、醫療、教育、諮詢等領域都得以不斷應用,並取得了初步的效果。由於不同領域在數據特點、領域需求上具有較大差別,面向領域的大數據知識圖譜仍面臨諸多問題及挑戰。
  • 自動化所腦網絡組圖譜成果入選「2016年國內十大科技新聞」
    自動化所腦網絡組圖譜成果入選「2016年國內十大科技新聞」 2016-12-29 自動化研究所 語音播報   12月27日,由科技日報社主辦,部分兩院院士、資深科技記者和網友共同評選出的2016年國內十大科技新聞揭曉
  • 知識圖譜在金融資管領域的應用、實踐與展望
    專業領域知識圖譜則是聚焦於金融、醫療、能源、農業等行業的深度知識沉澱,二者在眾多環節存在巨大差異。·第一,專業領域知識圖譜的知識結構更複雜並具有層次感。·第二,專業領域知識圖譜對知識抽取的質量要求更高。·第三,專業領域知識圖譜的數據來源更聚焦,因此對知識融合的需求更高。
  • 是時候該關注「知識圖譜」了!
    知識圖譜是什麼通俗地講,知識圖譜就是將複雜的知識通過數據挖掘、信息處理、知識計量和圖形繪製等一系列方式,把所有不同種類的信息連接在一起得到的一個關係網絡。在知識圖譜裡,用節點表示現實世界中存在的「實體」,用邊示意實體與實體之間的「關係」。
  • 【Knewton適應性學習研究】推薦原理+知識圖譜+連續適應性+大數據
    【Knewton適應性學習研究】推薦原理+知識圖譜+連續適應性+大數據 作者:梵人 發布時間:
  • 知識圖譜的皇冠:知識圖譜推理的前世今生
    作者:費斌傑 本文約4200字,建議閱讀8分鐘 本文聚焦於知識推理的理論研究和產業實踐,剖析知識圖譜推理的前世今生以及最近研究進展,以饗讀者。
  • 企業大數據挖掘:為員工構建職場知識圖譜
    職場知識圖譜EDI為何如此聰明?一方面,EDI擁有精準的自然語言理解和對話能力;另一方面,利用深度學習和社交網絡融合等前沿技術,EDI為每個用戶構建了一張關於他們的職場知識圖譜。藉助大數據的力量,這個機器人能夠從主人公男友的社交網絡甚至私人郵件中抽取和整合他的個人信息、關係網絡和語言習慣,構建屬於這位男生的個性化知識圖譜,從而實現對他惟妙惟肖的模仿——如上圖臺詞所說,系統抓取到的信息越多,機器人模仿的語言行為就越和他本人相似。
  • 從ACL 2020看知識圖譜研究進展
    從論文的題目、主題等關鍵詞可以看出,主要的研究方向包括人機對話,多模態、多語言和多領域,圖神經網絡,以及經典的信息提取類問題,包括實體抽取(NER)、事件抽取以及關係抽取等。研究手段則仍集中於各類機器學習的方法,包括:神經網絡、預訓練、注意力、知識圖譜等。還有一些文章特別關注了低資源、少樣本等實際應用中經常會遇到的問題。
  • 國家自然科學基金重點項目「面向領域大數據的知識圖譜構建」啟動...
    「面向領域大數據的知識圖譜構建」項目從面向領域大數據的知識圖譜表示與構建技術、推理與認知技術、分布式管理技術入手,研究基於深度遷移學習、深度強化學習的知識圖譜靜態、動態表示與構建方法,基於圖模型、概率因子的推理與認知方法,基於數據劃分、圖結構的分布式管理方法,並以科技領域和POI(Point of Interest)為例,實現對相關工作的應用驗證,在國家自然科學基金委和百度公司進行示範驗證
  • 試驗知識圖譜分析
    【試驗工程師·公益學習營】第九期第2講【試驗工程師·公益學習營】總第42講,於2020年10月30日如期舉行,本期講師是瑞風協同技術總監,他具有20餘年軟體開發和架構設計經驗,參與多個領域的設計仿真平臺、材料庫、知識庫系統建設,重點研究方向為大數據技術和人工智慧技術,專注於文本挖掘技術、自然語言處理技術在知識庫自動構建、知識自動分類、知識智能推送、知識關聯挖掘
  • 中國疾病保險知識圖譜發布 用大數據「透視」重疾險
    復旦大學中國保險科技實驗室主任、復旦大學風險管理與保險學系主任許閒教授介紹說,中國疾病保險知識圖譜是繼《中國保險科技發展白皮書》(2017)、《人工智慧保險行業運用路線圖》(2018)之後,復旦大學中國保險科技實驗室的又一重大研究成果,標誌著實驗室從理論研究擴展至行業基礎資料庫建設。
  • 基金委發布深時地球科學知識圖譜與知識演化研究項目指南
    ,創建適合多時空尺度、多層次結構、多學科領域知識圖譜構建的關鍵理論與方法,原創性突破全球高精度數字地質年代表、巖相古地理智能分析與編圖等深時地球基礎科學問題,為建設計算機可理解、可推理、可計算、可呈現的全域深時地球知識圖譜奠定科學基礎,為構建「數據-知識-模式」協同的地球科學研究新範式開展先導性研究,促進地球科學研究的變革性發展。
  • 中科院趙軍帶你認識:知識圖譜的關鍵技術
    中科院趙軍為大家帶來報告《知識圖譜關鍵技術及其在推薦系統中的應用》。趙軍,中國科學院自動化研究所模式識別國家重點實驗室,研究員,博士生導師;中國科學院大學人工智慧學院崗位教授。研究領域為自然語言處理、知識圖譜、信息抽取、問答系統等。作為項目負責人承擔國家自然科學基金重點項目等多項國家級重要科研項目以及企業應用項目。
  • 知識圖譜構建的研究已走入下半場,但大規模落地應用仍需時間
    這一年,谷歌發布了 570 億實體的大規模知識圖譜,其宣傳語是「Things, not Strings」給出了知識圖譜的精髓,即,不要無意義的字符串,而是獲取字符串背後隱含的對象或事物,多組研究者也曾獨立地提出過相似的理論。
  • 需要知識的後深度學習時代,如何高效自動構建知識圖譜?
    圖 4:知識圖譜數據建模方法 [3] 知識圖譜構建的核心技術、局限與發展方向 知識獲取是構建知識圖譜的核心與前提條件,也是自動構建知識圖譜最關鍵的影響要素和重點研究領域
  • 愛分析·中國知識圖譜應用趨勢報告
    知識圖譜技術是指在建立知識圖譜中使用的技術,是融合認知計算、知識表示與推理、信息檢索與抽取、自然語言處理與語義Web、數據挖掘與機器學習等技術的交叉研究。知識圖譜技術包括知識表示、知識圖譜構建和知識圖譜應用三方面的研究內容:  知識表示研究客觀世界知識的建模,以方便機器識別和理解,既要考慮知識的表示與存儲,又要考慮知識的使用和計算;  知識圖譜構建解決如何建立計算機算法從客觀世界或者網際網路的各種數據資源中獲取客觀世界的知識,主要研究使用何種數據和方法抽取何種知識;  知識圖譜應用主要研究如何利用知識圖譜建立基於知識的智能服務系統
  • 知識圖譜在推薦系統的落地
    原標題:知識圖譜在推薦系統的落地 本篇文章為大家介紹了什麼是推薦系統、推薦系統運作流程、圖譜應用的優勢、圖譜在推薦中的應用、圖譜推薦的原理、圖譜推薦的難點,並附上實際例子幫助大家進一步了解。
  • 《中國疾病保險知識圖譜》發布 用大數據「透視」疾病險
    原標題:《中國疾病保險知識圖譜》發布 用大數據「透視」疾病險   復旦大學中國保險科技實驗室近日發布了《中國疾病保險知識圖譜》(下稱《圖譜》)。《圖譜》顯示,中國疾病保險發展迅猛,但市場秩序混亂、信息不對稱的問題也凸顯,一方面是疾病保險產品種類多、條款設計複雜,消費者甄選難度大,另一方面是中小險企的重疾險產品容易陷入價格戰的困境。
  • 數據治理和數據智能聯合研討會在蘇舉行 知識圖譜產業白皮書發布
    蘇報訊(駐園區首席記者 董捷)昨天,2020數據治理和數據智能聯合研討會暨2020知識圖譜產業白皮書發布會,在蘇州陽澄湖半島旅遊度假區舉行。來自高校、龍頭企業和科研院所的數據專家,就數據時代的發展分享見解。
  • 2020 WAIC明略科技HAO圖譜Open API 吳信東深度解讀知識圖譜的自動...
    數據圖譜不是知識圖譜吳信東認為,大多數情況下,我們所說的、所用到的圖譜並沒有後臺知識,只是數據圖譜,而不是知識圖譜。知識圖譜應該有三個組成部分,首先是概念,即圖譜的節點。概念跟概念之間是連接,是關係,即圖譜的邊。只有概念和關係還不夠,還需要背景知識解釋概念,和連接的語義。