摘要:當前英語頻道(網站)及世界範圍內各大社交媒體已經成為重點新聞網站對外傳播工作中的標準配置,對外傳播陣地已經大大向前推進。結合人民網對外傳播的問題,本文採用語料庫的研究方法,以人民網twitter帳號@PDChina傳播的人民網英文版文章為主體構建了研究語料庫。結合人民網對外傳播英文報導語料庫利用WordSmith Tools 5.0軟體進行了詞頻統計分析和共詞分析,總結了人民網對外傳播英文報導的5個特點,病探討了應用語料庫研究方法研究新聞文本的問題。
關鍵詞:人民網;對外傳播;英文報導;語料庫
1 引言
隨著中國綜合國力的大幅提升,國際地位也日益提高,已經越來越深入地參與到國際事務的處理當中,中國與世界的關係早已與往昔不同。然而在國際輿論場上,中國卻依舊面臨著西強我弱的舊秩序,主流媒體的對外傳播壓力重重。近年來,中國主流媒體的國際傳播能力建設逐步加強,作為參與國際輿論場競爭的一項重要方式,英語頻道或網站已經成為重點新聞網站的標準配置,這些平臺刊載的英文報導成為向國際社會「講述好中國故事,傳播好中國聲音」的重要渠道。與此同時,因應社交媒體快速發展而造成的人們獲取新聞資訊方式的改變,中國主流媒體也都開始加入其中,在國際熱門社交網站,如facebook、twitter、youtube等上開設帳號,將對外傳播陣地繼續向前推進。
其中,人民網(www.people.com.cn )作為國家重點新聞網站的排頭兵,也肩負起對外傳播的重大責任,極具代表性。人民網英文版(en.people.cn)早在1998年1月14日便已創辦,經過多次改版,目前包含了Opinions、Business、Military、World、Society、Culture、Travel、Science、Sports、Special Coverage、Photo、Video等12個頻道,日刊載文章數百篇,已經成為一家成熟的英文新聞網站。同時,以網站為主體,人民網英文版也形成了自身的社交媒體矩陣,涵蓋國內外最熱門的6大社交網站(facebook、twitter、instagram、youtube、微博、微信),其twitter帳號@PDChina於2011年5月創建,擁有200多萬關注者,是twitter平臺上的「大V」,該帳號雖然以「People’s Daily,China」(人民日報)為名,不過帳號內容還是來自於人民網英文版網站,是人民網對外傳播中的重要角色。
本文即是以人民網英文版中刊載的英文報導為研究對象,通過其twitter帳號@PDChina發布的推文構建英文報導語料庫(corpus or copra),藉助語料庫分析的研究方法,利用相關語料分析軟體對相關文本進行系統分析,主要進行詞頻統計分析、共詞分析等分析步驟,以全面探析人民網對外傳播英文報導的報導特點。
2 文獻綜述:語料庫和新聞文本研究
語料庫分析就是指利用相關分析軟體程序來分析文本中詞彙運用的一種方法,在語言學領域已經發展多年。其最初的研究來自於美國布朗大學的Henry Ku?era和W. Nelson Francis於1964年創建的第一個電子語料庫——布朗語料庫(Brown Corpus),目前「基於語料庫」的研究範式逐漸成為語料庫語言學研究的主流範式和默認範式,主張一切源自語料庫,利用語料庫對已有的理論或假設進行探索,目的在於驗證或修正已有理論,採用普通實證研究的步驟,即「提出假設—分析數據—驗證假設」的步驟。 本文也將採取這一「基於語料庫」的研究範式進行研究。
語料庫分析最基本的單位是「詞彙」,之所以能將語料庫研究引入到對新聞文本的分析,是因為透過詞彙在文本中的組成可以探討其背後所隱含的文化與社會實踐意義。Roger Fowler在對新聞文本進行研究的基礎性著作《新聞中的語言:報紙中的話語與意識形態》(Language in the News: Discourse and Ideology in the Press)一書中,深化了上述觀點,他強調詞彙是一個文化中對外在世界的再現,該世界也是根據一個文化中意識形態的需求而被認知的。 這一觀點將詞彙運用進一步連接到文化、意識形態及人們對外在世界的感知,也暗示了新聞實踐和詞彙選用有關。本文認為新聞工作者在報導的過程中對報導事實的選擇、遺漏或改編,都會體現出對報導對象的態度,媒體文本中詞彙的選用反映了特定的價值觀點與意識形態。故而,我們可以透過分析人民網對外傳播英文報導,得出人民網對外傳播中的態度偏向和論述方式。
目前基於語料庫的新聞文本研究主要有兩種研究取徑。
第一,新聞文本的語言特徵研究(包括語言風格和語法結構等方面)。這類研究取徑將新聞文本視作日常生活中的自然語言之一,與語言學結合較多,可以說是從新聞文本預料可中分析語言運用的問題。第二,新聞文本對社會現實「再生產」的研究。這類研究拓展了語用層面的研究,更加關注新聞文本的結構及社會文化層面的探討,也與新聞傳播專業的研究更加切合。具有典型性的有Paul Baker等人的研究,他們搜集了1996至2005年英國關於難民、政治庇護尋求者、及移民的大量報告,構成了總數達1億4千字的大型語料庫,這項研究發現多數應該媒體對難民或政治庇護者報導都強調負面數字,對移民的報導則使用了「逃脫」、「逃離」這樣具有較多負面情感的詞彙;同時,難民或移民也被用「水的隱喻」來描述(諸如,洪水、洪流、及傾瀉等),這顯示媒體將這些西歐的難民或移民建構成為一種失控、無人管理、不樂見的自然災害。
而近年來大數據炙手可熱,語料庫分析方法也屬於對大量資料進行處理的技術,也被認為是適合用於研究電子化資料庫和分析大量文本資料的方法,因此語料庫分析方法也大有乘風而起之勢。同時,由於大量新聞文本已經實現數位化,完全具備了應用語料庫分析方法進行研究的基礎,也催促著語料庫分析方法的科學運用以探索新知。
在新聞傳播領域採用語料庫分析方法對新聞文本進行分析尚屬新興階段,本文則是聚焦於人民網對外傳播英文報導,通過語料庫分析方法的應用,探析人民網對外傳播英文報導的詞彙運用情況及報導傾向。
3 研究方法
3.1 語料庫的建構
當前社交媒體已經是人們接收新聞資訊的主要方式之一,傳統新聞網站也需要通過社交媒體來「引流」,所以經過社交網站傳播的新聞報導更具代表性,傳播效果也更好。鑑於此,本文藉助twitter提供的高級搜索服務,通過人民網英文版twitter帳號@PDChina來索引英文文字報導。
具體方法則是,首先遍覽@PDChina發布的推文,通過推文中附帶的連結,索引至人民網英文版網站,選取英文文字報導保存下來。由於研究者精力所限,故而將抽樣的時間範圍定在2016年1月1日至2016年6月30日,將此時間範圍內人民網英文版通過其twitter帳號@PDChina向外界傳播的所有英文文字報導搜集起來,構成了本文中所要研究的語料庫。語料庫中包含英文報導1,946篇,總字數超過77萬。
3.2 分析工具及分析方法
本文使用的分析工具是WordSmith Tools 5.0,WordSmith Tools(簡稱WS)這款軟體由詞彙分析軟體有限公司(Lexical Analysis Software Ltd)和牛津大學出版社(Oxford University Press)於1996年首次發布,至今已經走過20年,是當前在語料庫分析領域應用最廣的軟體之一,被廣泛用於語言學、文學、法學、醫學、歷史學、政治學、社會學等領域。 WS中提供了多種語料庫分析技術,包括了量化統計和質化分析方法,在本研究中將應用其中主要的2項功能:(1)詞彙列表功能(Wordlist):該功能支持創建語料庫中詞彙使用的頻率列表,確定其中常見抑或是少見的詞彙或詞串;(2)索引功能(Concord):該功能的主要作用是搜索和統計特定詞彙或短語在指定文本中出現的頻數,是WS中最主要、最常用的功能。
藉助WS的相關功能,本研究對於語料庫中人民網對外傳播英文報導的文本將主要做出如下分析:
(1)詞頻統計分析:詞頻統計分析是大多數語料庫分析的基礎和分析起點,通過對語料庫中詞彙出現頻率的統計,可以分析文本中詞彙分布的情況,並基於此來決定需要對哪些詞彙進行重點分析。
(2)共詞分析:共詞分析則是把詞彙放置在語句所處的前後文當中,以分析詞彙在文本中的實際意義。因此,共詞分析是詞彙形式出現情況的集合,並且將每個詞彙放在各自文本環境中原樣呈現。通過WS軟體的協助,在進行共詞分析的過程中,可以將特定詞彙在句子中出現的詞彙一起列出,並將具體考察的主要詞彙放在中心位置,這也被稱為上下文關鍵詞索引(key word in context,KWIC)分析。共詞分析的核心是在探討關鍵詞處於文本中的位置及意義,在方法上近似於質化文本分析,根據研究目標的不同,共詞分析的範圍可以是一整個句子,也可以是一整段文字,甚至於是一整篇文章的意義。
4 研究發現
4.1 人民網對外傳播英文報導的詞頻統計分析
藉助WS軟體,在詞頻統計中能夠呈現語料庫整體的詞彙使用情況,通過這些詞彙出現的頻率高低,可以看出文本整體的詞彙使用傾向,從而能夠全面地對語料文本進行研究。
經WS軟體分析,本文所研究的語料庫共有詞彙22,351個。這些詞彙包含兩類,第一類是「語法詞彙」(grammar words),用於連接句子的結構,包括了the、of、to、and、in、for、as、at、in等;第二類是「內容詞彙」(content words),構成了報導文本表達的主要內容,而內容詞彙中的be動詞也不具有反映報導特徵的作用,因此,根據研究需要及篇幅限制,僅在表4.1中僅列出除be動詞之外的出現頻次超過1500的內容詞彙。
表4.1中唯一出現的國家名就是「CHINA」,而且高居詞頻統計列表首位,而表示所有性質的詞彙「CHINESE」和「CHINA』S」也都排在前十,從中可以看出人民網對外傳播英文報導絕大多數都是在向外界報導中國,而在中國參與國際事務報導方面可能並不多。而「BEIJING」則是唯一出現在表中的城市名,可見北京作為中國的首都,得到了人民網對外傳播英文報導最多的關注,諸多新聞事件可能都來自於北京。
「SAID」是出現頻率最高的動詞,表明報導常引述受訪對象的說法。此外,動詞「WILL」出現的頻率也很高,排在表中第4位,說明報導中出現了大量未來的信息,同時,可以看到形容詞「NEW」也出現在表中的第17位,這些反映出人民網對外傳播英文報導常常以積極的態度報導未來的景象。
「PERCENT」一詞在語料庫中出現1823次,平均0.94篇報導即出現一次,而經過WS軟體的統計,語料庫中數字出現多達23,555次,可見人民網對外傳播英文報導中多使用數位化和統計化的方式來呈現事實。
「DEVELOPMENT」的出現則反映出人民網對外傳播英文報導的另一個主題,即中國的發展成就。
然而必須指出的是,詞頻統計分析只是對語料庫中詞彙出現次數的純數學統計,雖然具有較高的量化意義,但是對於揭示詞彙在文本結構中的實際使用意義這一層面則顯得力所不能及。以出現最多的詞彙「CHINA」為例,詞頻統計分析並未能揭示出人民網對外傳播英文報導中關於中國的報導聚焦在哪些新聞事件。由此可見,詞頻統計分析將文本的脈絡切割開來,使得詞彙的實際使用意義缺失了,需要後續的共詞分析將詞彙放置回文本中。
(責編:溫靜、趙光霞)