本文以CiteSpace軟體做的關鍵詞共現分析為例,進行關鍵詞共現圖譜含義詳細解析。
關鍵詞是一篇論文的核心概括,對論文關鍵詞進行分析可對文章主題窺探一二。
而一篇論文給出的幾個關鍵詞一定存在著某種關聯,而這種關聯可以用共現的頻次來表示。一般認為,詞彙對在同一篇文獻中出現的次數越多,則代表這兩個主題的關係越緊密。
共詞分析法利用文獻集中詞彙對或名詞短語共同出現的情況,來確定該文獻集所代表學科中各主題之間的關係。
統計一組文獻的主題詞兩兩之間在同一篇文獻出現的頻率,便可形成一個由這些詞對關聯所組成的共詞網絡。
如下圖所示,此圖由CiteSpace生成的關鍵詞共現網絡。
【手機點擊放大看】
CiteSpace做的圖譜並不是用的原共現矩陣,而是在原矩陣的基礎上通過COSINE,PMI,DICE和JACCARD標準化後的矩陣,然後利用它們進行網絡可視化,至於具體使用哪種標準化,這裡就要發揮人的主觀能動性啦,即反覆比較,觀看圖譜找出最符合實際情況的標準化方法。
所以,本質上你在做圖譜前已經對該領域有所了解了,否則你並不知道那個圖更好!
那反過來說,既然你對該研究領域已經有了解了,為什麼還要再做圖譜呢?
個人認為你的圖譜除了能發論文外,還可以利用可視化的方式讓那些不了解本領域的人能夠花費最少的時間精力入門本領域。
廢話多了,看圖吧!
首先,我們可以通過左上角的參數看到網絡的節點說、邊數和網絡密度。
其中節點數就是圖中的關鍵詞個數,邊數就是關鍵詞之間的連線數。只要關鍵詞在同一篇文獻中出現過,兩者之間就會有一條連線。【PS.當然與你設置的每個時間切片提取的關鍵詞個數有關係。】
圖中圓圈大小代表的是關鍵詞頻次,頻次越大,圓圈越大。並不是中心性大小。
可以通過左側的表格進行驗證。
科學數據頻次為34,中心性為0.27,
高校圖書館頻次為28,中心性為0.28
科學數據的圓圈明顯大於高校圖書館。
線條代表關鍵詞之間的聯繫,線條顏色與圖中上方年份相對應,用於標誌每一年有哪些主要關鍵詞。
左側列表除了關鍵詞頻次和中心性外還有關鍵詞初次出現年份,這個時間非常重要,它會在時區圖和時間線圖密切相關。時區圖怎麼理解已經詳細講過,看後文連結,其餘圖譜今後講解。
從這個圖中我們可以獲取什麼信息呢?
還是回到了共詞分析的原理上:共詞分析法利用文獻集中詞彙對或名詞短語共同出現的情況,來確定該文獻集所代表學科中各主題之間的關係。
我們目的是為了獲得學科中各主題之間的關係,而主題使用關鍵詞表示的,本質就是關鍵詞之間的聯繫,所以又返回去了,我們本質就獲得了關鍵詞之間的聯繫。聯繫緊密的關鍵詞會相對形成一個個小的團體,進而我們可以將這個小團體中的關鍵詞進行歸納總結,總結出一個個主題,然後對主題進行詳細論述。其實本質就是聚類分析啦!只是過程是人工的而已!
當然CiteSpace軟體自身也具有聚類的功能,下節課再講。
提醒一下:當你人工已經可以很容易的進行歸納後,就不需要再利用CiteSpace聚類功能啦。
該功能是在你看不清,看不懂共現圖譜的時候用的。
上圖為老版本做的圖,下圖為新版本做的圖,喜歡哪個自己抉擇。
拓展
共現分析的方法論基礎是心理學的鄰近聯繫法則和知識結構及映射原則。
心理學的鄰近聯繫法則是指曾經在一起感受過的對象往往在想像中也聯繫在一起,以致於想起它們中的某一個的時候,其他的對象也會以曾經同時出現時的順序想起。
我們常說的關鍵詞共現、作者共現、機構共現、國家共現、論文共現、期刊共現都是共現分析的一種。
其中
作者共現又分為作者合作網絡分析、作者共被引分析【作者同被引】
機構共現又分為機構合作網絡分析
國家共現又分為國家合作網絡分析
論文共現又分為文獻共被引分析【文獻同被引】、文獻耦合
一句話,正如我們在課程中所講的一樣,上述所有的分析本質上就是共現分析,今後將慢慢道來。
需要課程請點擊《【理論+實戰】全面深度講解CiteSpace,解決使用過程中的各種難題,以CSSCI資料庫為例。》
如有錯誤請指正!如需轉載請聯繫本文作者,微信:w2013305084
更多精品:
CiteSpace的時區圖譜含義詳細解讀
CiteSpace同義詞、同機構異名批量合併功能
科研利器與文獻計量原創軟體匯總
相異矩陣一鍵轉化---只有共現矩陣的情況下
精品工作科研效率工具匯總
長按二維碼,關注[學術點滴]獲取更多資訊。