基於語料庫的人民網對外傳播英文報導特點研究

2020-12-11 人民網傳媒

摘要:當前英語頻道(網站)及世界範圍內各大社交媒體已經成為重點新聞網站對外傳播工作中的標準配置,對外傳播陣地已經大大向前推進。結合人民網對外傳播的問題,本文採用語料庫的研究方法,以人民網twitter帳號@PDChina傳播的人民網英文版文章為主體構建了研究語料庫。結合人民網對外傳播英文報導語料庫利用WordSmith Tools 5.0軟體進行了詞頻統計分析和共詞分析,總結了人民網對外傳播英文報導的5個特點,病探討了應用語料庫研究方法研究新聞文本的問題。

關鍵詞:人民網;對外傳播;英文報導;語料庫

1 引言

隨著中國綜合國力的大幅提升,國際地位也日益提高,已經越來越深入地參與到國際事務的處理當中,中國與世界的關係早已與往昔不同。然而在國際輿論場上,中國卻依舊面臨著西強我弱的舊秩序,主流媒體的對外傳播壓力重重。近年來,中國主流媒體的國際傳播能力建設逐步加強,作為參與國際輿論場競爭的一項重要方式,英語頻道或網站已經成為重點新聞網站的標準配置,這些平臺刊載的英文報導成為向國際社會「講述好中國故事,傳播好中國聲音」的重要渠道。與此同時,因應社交媒體快速發展而造成的人們獲取新聞資訊方式的改變,中國主流媒體也都開始加入其中,在國際熱門社交網站,如facebook、twitter、youtube等上開設帳號,將對外傳播陣地繼續向前推進。

其中,人民網(www.people.com.cn )作為國家重點新聞網站的排頭兵,也肩負起對外傳播的重大責任,極具代表性。人民網英文版(en.people.cn)早在1998年1月14日便已創辦,經過多次改版,目前包含了Opinions、Business、Military、World、Society、Culture、Travel、Science、Sports、Special Coverage、Photo、Video等12個頻道,日刊載文章數百篇,已經成為一家成熟的英文新聞網站。同時,以網站為主體,人民網英文版也形成了自身的社交媒體矩陣,涵蓋國內外最熱門的6大社交網站(facebook、twitter、instagram、youtube、微博、微信),其twitter帳號@PDChina於2011年5月創建,擁有200多萬關注者,是twitter平臺上的「大V」,該帳號雖然以「People’s Daily,China」(人民日報)為名,不過帳號內容還是來自於人民網英文版網站,是人民網對外傳播中的重要角色。

本文即是以人民網英文版中刊載的英文報導為研究對象,通過其twitter帳號@PDChina發布的推文構建英文報導語料庫(corpus or copra),藉助語料庫分析的研究方法,利用相關語料分析軟體對相關文本進行系統分析,主要進行詞頻統計分析、共詞分析等分析步驟,以全面探析人民網對外傳播英文報導的報導特點。

2 文獻綜述:語料庫和新聞文本研究

語料庫分析就是指利用相關分析軟體程序來分析文本中詞彙運用的一種方法,在語言學領域已經發展多年。其最初的研究來自於美國布朗大學的Henry Ku?era和W. Nelson Francis於1964年創建的第一個電子語料庫——布朗語料庫(Brown Corpus),目前「基於語料庫」的研究範式逐漸成為語料庫語言學研究的主流範式和默認範式,主張一切源自語料庫,利用語料庫對已有的理論或假設進行探索,目的在於驗證或修正已有理論,採用普通實證研究的步驟,即「提出假設—分析數據—驗證假設」的步驟。 本文也將採取這一「基於語料庫」的研究範式進行研究。

語料庫分析最基本的單位是「詞彙」,之所以能將語料庫研究引入到對新聞文本的分析,是因為透過詞彙在文本中的組成可以探討其背後所隱含的文化與社會實踐意義。Roger Fowler在對新聞文本進行研究的基礎性著作《新聞中的語言:報紙中的話語與意識形態》(Language in the News: Discourse and Ideology in the Press)一書中,深化了上述觀點,他強調詞彙是一個文化中對外在世界的再現,該世界也是根據一個文化中意識形態的需求而被認知的。 這一觀點將詞彙運用進一步連接到文化、意識形態及人們對外在世界的感知,也暗示了新聞實踐和詞彙選用有關。本文認為新聞工作者在報導的過程中對報導事實的選擇、遺漏或改編,都會體現出對報導對象的態度,媒體文本中詞彙的選用反映了特定的價值觀點與意識形態。故而,我們可以透過分析人民網對外傳播英文報導,得出人民網對外傳播中的態度偏向和論述方式。

目前基於語料庫的新聞文本研究主要有兩種研究取徑。

第一,新聞文本的語言特徵研究(包括語言風格和語法結構等方面)。這類研究取徑將新聞文本視作日常生活中的自然語言之一,與語言學結合較多,可以說是從新聞文本預料可中分析語言運用的問題。第二,新聞文本對社會現實「再生產」的研究。這類研究拓展了語用層面的研究,更加關注新聞文本的結構及社會文化層面的探討,也與新聞傳播專業的研究更加切合。具有典型性的有Paul Baker等人的研究,他們搜集了1996至2005年英國關於難民、政治庇護尋求者、及移民的大量報告,構成了總數達1億4千字的大型語料庫,這項研究發現多數應該媒體對難民或政治庇護者報導都強調負面數字,對移民的報導則使用了「逃脫」、「逃離」這樣具有較多負面情感的詞彙;同時,難民或移民也被用「水的隱喻」來描述(諸如,洪水、洪流、及傾瀉等),這顯示媒體將這些西歐的難民或移民建構成為一種失控、無人管理、不樂見的自然災害。

而近年來大數據炙手可熱,語料庫分析方法也屬於對大量資料進行處理的技術,也被認為是適合用於研究電子化資料庫和分析大量文本資料的方法,因此語料庫分析方法也大有乘風而起之勢。同時,由於大量新聞文本已經實現數位化,完全具備了應用語料庫分析方法進行研究的基礎,也催促著語料庫分析方法的科學運用以探索新知。

在新聞傳播領域採用語料庫分析方法對新聞文本進行分析尚屬新興階段,本文則是聚焦於人民網對外傳播英文報導,通過語料庫分析方法的應用,探析人民網對外傳播英文報導的詞彙運用情況及報導傾向。

3 研究方法

3.1 語料庫的建構

當前社交媒體已經是人們接收新聞資訊的主要方式之一,傳統新聞網站也需要通過社交媒體來「引流」,所以經過社交網站傳播的新聞報導更具代表性,傳播效果也更好。鑑於此,本文藉助twitter提供的高級搜索服務,通過人民網英文版twitter帳號@PDChina來索引英文文字報導。

具體方法則是,首先遍覽@PDChina發布的推文,通過推文中附帶的連結,索引至人民網英文版網站,選取英文文字報導保存下來。由於研究者精力所限,故而將抽樣的時間範圍定在2016年1月1日至2016年6月30日,將此時間範圍內人民網英文版通過其twitter帳號@PDChina向外界傳播的所有英文文字報導搜集起來,構成了本文中所要研究的語料庫。語料庫中包含英文報導1,946篇,總字數超過77萬。

3.2 分析工具及分析方法

本文使用的分析工具是WordSmith Tools 5.0,WordSmith Tools(簡稱WS)這款軟體由詞彙分析軟體有限公司(Lexical Analysis Software Ltd)和牛津大學出版社(Oxford University Press)於1996年首次發布,至今已經走過20年,是當前在語料庫分析領域應用最廣的軟體之一,被廣泛用於語言學、文學、法學、醫學、歷史學、政治學、社會學等領域。 WS中提供了多種語料庫分析技術,包括了量化統計和質化分析方法,在本研究中將應用其中主要的2項功能:(1)詞彙列表功能(Wordlist):該功能支持創建語料庫中詞彙使用的頻率列表,確定其中常見抑或是少見的詞彙或詞串;(2)索引功能(Concord):該功能的主要作用是搜索和統計特定詞彙或短語在指定文本中出現的頻數,是WS中最主要、最常用的功能。

藉助WS的相關功能,本研究對於語料庫中人民網對外傳播英文報導的文本將主要做出如下分析:

(1)詞頻統計分析:詞頻統計分析是大多數語料庫分析的基礎和分析起點,通過對語料庫中詞彙出現頻率的統計,可以分析文本中詞彙分布的情況,並基於此來決定需要對哪些詞彙進行重點分析。

(2)共詞分析:共詞分析則是把詞彙放置在語句所處的前後文當中,以分析詞彙在文本中的實際意義。因此,共詞分析是詞彙形式出現情況的集合,並且將每個詞彙放在各自文本環境中原樣呈現。通過WS軟體的協助,在進行共詞分析的過程中,可以將特定詞彙在句子中出現的詞彙一起列出,並將具體考察的主要詞彙放在中心位置,這也被稱為上下文關鍵詞索引(key word in context,KWIC)分析。共詞分析的核心是在探討關鍵詞處於文本中的位置及意義,在方法上近似於質化文本分析,根據研究目標的不同,共詞分析的範圍可以是一整個句子,也可以是一整段文字,甚至於是一整篇文章的意義。

4 研究發現

4.1 人民網對外傳播英文報導的詞頻統計分析

藉助WS軟體,在詞頻統計中能夠呈現語料庫整體的詞彙使用情況,通過這些詞彙出現的頻率高低,可以看出文本整體的詞彙使用傾向,從而能夠全面地對語料文本進行研究。

經WS軟體分析,本文所研究的語料庫共有詞彙22,351個。這些詞彙包含兩類,第一類是「語法詞彙」(grammar words),用於連接句子的結構,包括了the、of、to、and、in、for、as、at、in等;第二類是「內容詞彙」(content words),構成了報導文本表達的主要內容,而內容詞彙中的be動詞也不具有反映報導特徵的作用,因此,根據研究需要及篇幅限制,僅在表4.1中僅列出除be動詞之外的出現頻次超過1500的內容詞彙。

表4.1中唯一出現的國家名就是「CHINA」,而且高居詞頻統計列表首位,而表示所有性質的詞彙「CHINESE」和「CHINA』S」也都排在前十,從中可以看出人民網對外傳播英文報導絕大多數都是在向外界報導中國,而在中國參與國際事務報導方面可能並不多。而「BEIJING」則是唯一出現在表中的城市名,可見北京作為中國的首都,得到了人民網對外傳播英文報導最多的關注,諸多新聞事件可能都來自於北京。

「SAID」是出現頻率最高的動詞,表明報導常引述受訪對象的說法。此外,動詞「WILL」出現的頻率也很高,排在表中第4位,說明報導中出現了大量未來的信息,同時,可以看到形容詞「NEW」也出現在表中的第17位,這些反映出人民網對外傳播英文報導常常以積極的態度報導未來的景象。

「PERCENT」一詞在語料庫中出現1823次,平均0.94篇報導即出現一次,而經過WS軟體的統計,語料庫中數字出現多達23,555次,可見人民網對外傳播英文報導中多使用數位化和統計化的方式來呈現事實。

「DEVELOPMENT」的出現則反映出人民網對外傳播英文報導的另一個主題,即中國的發展成就。

然而必須指出的是,詞頻統計分析只是對語料庫中詞彙出現次數的純數學統計,雖然具有較高的量化意義,但是對於揭示詞彙在文本結構中的實際使用意義這一層面則顯得力所不能及。以出現最多的詞彙「CHINA」為例,詞頻統計分析並未能揭示出人民網對外傳播英文報導中關於中國的報導聚焦在哪些新聞事件。由此可見,詞頻統計分析將文本的脈絡切割開來,使得詞彙的實際使用意義缺失了,需要後續的共詞分析將詞彙放置回文本中。

(責編:溫靜、趙光霞)

相關焦點

  • 《人民日報》基於Twitter平臺的對外傳播情況研究
    本文基於《人民日報》Twitter(@PDChina)帳號對香港問題的報導內容,將其所發布內容進行編碼內容分析,與此同時,本文將其中每條推文的點讚、轉發、評論數進行量化分析,從數據層面檢驗該帳號內容發布情況。最終,通過一系列的分析來發現其中存在的問題,並提出相關建議。
  • 大數據時代傳播研究中語料庫分析方法的價值
    【關鍵詞】:大數據 語料庫 文本數據 語義挖掘 定量研究 在新聞傳播學視野之下,大數據的分析思維正在對我們的研究形成衝擊,比如新聞業務將實現一些方向性調 整,趨勢預測性新聞和數據驅動型深度報導分量增加。對 於輿情研究來說,問捲髮放和小組訪談等傳統的民意調查 方法,已經不能滿足基於社交媒體平臺的海量信息處理要 求。
  • ...霧霾問題報導模式對比研究——以人民網(英文版)和紐約時報網為例
    並結合我國對外媒報導作出的反應, 反思我國在對外傳播的過程中需要注意的問題。 關鍵詞:霧霾 外媒 外宣媒體 人民網 紐約時報網 一、 研究背景   霧霾,是霧和霾的組合詞。因此,本研究希望分析外國媒體和中國外宣媒體對 中國霧霾問題的關注角度、信息來源、觀點內容等等,從而總結出雙邊對華報導的話語體系 特點和傳播效果。從而為反思我國在對外傳播的過程中需要注意的問題。 二、文獻綜述   1.研究背景與文獻概況
  • 2016年度「人民網獎學金優秀論文獎」獲獎名單揭曉
    ——20位傳統媒體人離職公開信的文本分析 作者:胡曉萍(中國人民大學) 3、信息不對稱·網絡外部性:中國空氣治理議題傳播的供給側變革——以《人民日報》網絡傳播為例的研究 作者:王亞莘(中國人民大學) 4、基於風險社會放大框架下的微博使用對公眾風險感知的影響研究 作者:何地(武漢大學) 5、新聞網站突發事件報導對比研究
  • 近十年基於語料庫的語篇分析研究進展(四)
    三、基於語料庫的語篇分析研究發展趨勢 基於語料庫的語篇分析研究正呈現蓬勃發展的態勢,向更符合時代要求、更豐富和多元化的方向發展。(一)多媒體語篇分析研究出現多媒體和網際網路時代的到來,使音頻和視頻資料大量出現,建立能夠包含音頻和視頻資料的多媒體語篇語料庫成為發展趨勢。語料庫從收集文本語料階段發展到儲備口語語料階段,目前逐漸步入多媒體語篇的發展階段。
  • 近十年基於語料庫的語篇分析研究進展(三)
    (三)基於語料庫的語篇分析研究存在的不足研究領域不夠均衡。基於語料庫的語篇分析研究近十年內發展迅速,但明顯集中於系統功能語法框架下,體裁分析理論框架下的研究僅1篇。而系統功能語法框架下的研究中,有關語篇銜接的研究成果多達10篇,隱喻研究5篇,情態研究4篇,文本研究3篇,評價研究2篇,範式研究、主體間性、話語標記功能研究各1篇。
  • 《人民日報》推特(Twitter)對外傳播的策略分析
    [ 繆曉娟,左為.如何利用境外社交媒體更有成效——以新華社在Twitter上的探索為例[J].對外傳播,2015(03):62-64.]蔣玉鼐以新華社、《人民日報》、中央電視臺的推特(Twitter)英文主帳號2015年發布的習近平主席相關報導作為研究對象,深入分析這些報導所塑造的國家領導人形象。
  • 基於品牌概念地圖的人民網品牌形象研究
    【摘要】本文採用國外最新的品牌聯想測量工具——品牌概念地圖,基於受眾對人民網的品牌聯想,對人民網的媒體品牌形象進行實證研究,進而結合人民網的品牌戰略探討其在品牌形象管理中的得失。近年來,人民網一直致力於塑造其「權威媒體、大眾網站」的媒體品牌形象,本研究通過構建人民網的品牌概念地圖,發現人民網憑藉依託《人民日報》的強勢媒體資源,其「權威媒體」的形象深入人心,在塑造「公眾話語平臺」、「大眾網站」方面雖然也採取了不少舉措、取得了一些成效,但受眾了解、感知到的還不多,對其轉變的認識還處於初級階段。基於此,本研究提出了相應的建議。
  • 人工智慧語料庫技術是什麼?來看科普!
    國際傳播人工智慧翻譯語料庫是指基於網際網路平臺,運用以神經機器翻譯技術為基礎的人工智慧翻譯技術,對國際傳播等相關領域的語料進行數據化處理和加工,建立系統對外傳播黨政文獻,領導人著作、講話及外宣圖書,期刊及網絡新聞等宣傳內容為主的語料資料庫,並在此基礎上建立國際傳播綜合人工智慧語料庫。
  • 基於語料庫的英語寫作教學實證研究
    筆者通過實驗對比分析的方法,發現基於語料庫的教學方式,能緩解寫作教學中費時低效的問題。實驗對象為上海財經大學中外合作項目國際貿易專業1班和2班,人數分別為30名。其中1班為實驗組,2班為對照組。實驗時間長度為一個學期。實驗組採用由清華大學外語系和高等教育出版社聯合推出的「體驗英語寫作」訓練系統。該系統是在80萬字的清華大學英語寫作語料庫基礎上構建的一個寫作平臺。
  • 語料庫研究學術源流考
    這四項設計特徵使得語料庫研究自成一體,也揭示出它與其他領域的學科交叉特點。      除了「用」「量」「器」「聚」幾項設計特徵外,在判別和界定語料庫研究時,還會遇到我們稱之為「大寫的語料庫語言學」(big C Corpus Linguistics,即狹義的語料庫研究)和「小寫的語料庫語言學」(little c corpus linguistics,即廣義的語料庫研究)的現象。
  • 學術書摘 | 《語料庫與學術英語研究》(一)
    全書共分為六章,第一章對語料庫的範式和學術英語的發展與研究路徑作了總體介紹與回顧;第二、三章分別圍繞語言功能和形式、拓展與應用,對國內外學術英語語料庫研究進行了深入細緻的梳理和評述;第四章闡述了學術英語語料庫研究的常見方法;第五章通過基於學術論文語料庫的立場名詞研究、基於歷時語料庫的學術元話語研究兩個案例,完整示範了學術英語語料庫研究的開展;第六章分析了學術英語語料庫研究的發展趨勢並對未來,特別是具有中國特色的研究前景作了展望
  • 基於翻譯教學的評價語料庫與譯文質量評估的實證研究
    學生譯文質量的評價機制一直都是翻譯教學研究及改革的重點及難題之一。在介紹基於雙語平行評價語料庫的學生譯文評價的方法及其驗證效果的基礎上,試圖說明評價語料庫能夠有效的提高評價的客觀性,以便給學生提供建設性的反饋意見,幫助學生提高譯文質量及翻譯能力。評價語料庫對翻譯教學內容及其方法的改善也能夠為學生提供有益的參考和幫助。
  • 甄鳳超:語料庫語言學研究熱點追蹤與思考
    摘要:目前國際上語料庫語言學研究具有什麼特點?有哪些研究熱點?又存在哪些爭議?為了回答這些問題,文章選取國際上具有代表性的語料庫專業期刊International Journal of Corpus Linguistics,述評該刊在2010~2019年十年間發表的所有文章,分析其研究內容,概括其特點,發現研究熱點,並在此基礎上就語料庫短語學、語料庫應用、語料庫與其他學科的交叉、語料庫研究中的統計方法、語料庫研究範式的普適性等系列問題展開探討,以期對國內從事語料庫研究的相關人員有所啟發
  • 人民網、新華網「2017兩會」報導比較研究
    摘要:本文以人民網、新華網2017年2月21日至3月19日的「兩會」報導為樣本,從文字新聞、圖解新聞、視頻直播以及民意調查四方面進行對比研究,分析兩網站「2017兩會」報導在內容、形式和時效等方面的差異,並探究產生這種差異的原因。
  • 2019年度「人民網獎學金優秀論文獎」獲獎名單
    主流媒體對外傳播短視頻比較研究——基於人民網與中國日報臉書主帳號的探討 作者:馮琳琲、萬雨妍(中國傳媒大學) 2. 框架理論視角下對中美貿易爭端報導的比較——以人民網和華盛頓郵報網站為例 作者:白樂天(中國傳媒大學) 3. 從業者對縣級融媒體中心建設的認知研究 作者:嚴為(北京大學) 4.
  • 陸小飛、劉穎穎:基於語料庫的學術英語程式語研究與教學應用 |《外語界》
    梳理和總結學術英語程式語研究成果有助於研究者更深入地了解程式語研究進展, 也有助於學術英語教師根據教學需求選用合適的程式語教學資源。本文通過回顧和剖析基於語料庫的程式語研究, 發現已有研究在程式語修辭功能分析上仍有不足, 進而討論了學術英語研究與教學中程式語的形式分析、功能分析有機結合的重要性與可行性。Wray將程式語定義為連續或非連續的語言序列。
  • 專著推薦 | 許家金《語料庫與話語研究》
    基於電子語料庫開展的語言研究,經過數十年的發展,如今已漸成主流,並且還呈現出語料庫研究與鄰近學科廣泛融合的局面。其他基於語料庫的研究還包括語法(grammar)研究、語法化(grammaticalization)研究和語言習得(language acquisition)研究。這些研究的數據和方法論基礎都是頻率(frequency)。若將觀察的鏡頭推近,我們可以深入了解更為豐富的語料庫研究世界。圖1.2的中觀研究熱點顯示,除了圖1.1中的宏觀熱點外,還可看到在過去十年間,約有20項其他熱點研究話題。
  • [人民網]習近平訪問南非英文專題報導
    ,在南非《每日經濟報》上刊出四塊合作版面落地這些原創文章,實現了有關中非、中南政經關係的原創英文稿件首次集中在南非最大主流財經媒體上落地,取得良好傳播效果,為習近平主席出訪營造了良好輿論氛圍。此次專版共刊出4個版面10篇文章,其中包括中國駐南非大使田學軍發表的題為「中非合作開展新篇章」的署名文章和由人民日報國際部、人民網記者自主採寫的《共謀中非合作光明未來》、《15年,中非合作碩果纍纍》等評論性文章。《每日經濟報》負責合作版面的資深編輯勞倫評價道,每篇文章文字都很乾淨,看得出人民網是非常認真、嚴肅的媒體。
  • 2014年度「人民網優秀論文獎」獲獎名單揭曉
    1、知識分子與微博空間公共性——基於校車安全事件的探索性研究 作者:盧櫻丹 (清華大學) 2、分裂的鏡像——基於紙媒微信公眾平臺的文本分析 作者:方 惠、古俊生、孫小婷(中國人民大學) 3、人民網風險報導優劣分析——以霧霾報導為例 作者:王慶(華中科技大學) 4、從「儀式」到「狂歡」:社會化媒體對