知友優選|CNKI學科分析的方法、指標與工具

2020-12-11 知者匯

中國知網學科服務中心高級分析師 張志輝

各位領導、各位專家下午好,很高興有這個機會圍繞學科方法、指標與工具給大家做報告。我從事的工作內容是學科分析,因此接下來我想從學科分析如何做以及可操作性的角度來為大家進行介紹。

學科分析是建設高水平學科的重要手段。各行各業的管理工作要做到科學化、規範化、精細化越來越需要客觀數據的支撐。尤其是在「雙一流」建設和學科評估的壓力下,高校學科建設想要取得更好的成效,就必須要對自身和對標的高校做到充分的了解。因此,我們要從數據和指標入手做到全方位的分析,這樣才能知己知彼。「雙一流」建設的核心最後還是要落實到一流學科建設上面,遍觀世界一流大學就會發現,他們的大多數學科都是一流的,可見學科建設是一流大學建設的抓手。而學科分析最重要的作用就是幫助學校及時了解學科水平和建設成效,為學科建設、管理與規劃提供客觀支撐。

去年教育部提出破「五唯」,即「唯分數、唯升學、唯文憑、唯論文、唯帽子」,教學成果評價這種全方位、多角度原則對我們學科分析來說同樣適用。我們分析的維度可以包括科學研究、人才培養、師資隊伍、成果轉化等,這種綜合指標的考量,才能使學科評估儘量做到全面和平衡。

學科分析最理想的方案就是將定量和定性分析相結合。典型的案例就有教育部學位中心的學科評估。定量分析和定性分析各有優劣勢。定量分析比較高效、方便,可用的資料庫比較成熟,能夠支撐完成很多客觀分析和對標分析。定性分析則可以做到較好的質量評價,但大家通常認為一篇論文被引頻次跟其質量之間是屬於等同關係,這是不對的。論文被引頻次跟質量之間雖然呈較強正相關性,但並不一定意味被引頻次高的論文質量就高,反之亦然。同時定性分析也存在一些劣勢。其一就是專家同行評議具備較強的主觀性。比如,進行一級學科分析時,分屬的二級學科專家,在同一個問題的看法上會存在比較大的差異。其二是定性分析組織代價較高。因此教育部學位中心每四年才做一次全國範圍內的學科評估,而且就算是對某一所高校進行學科評估,組織同行專家評議的代價也是非常高的。

可以肯定的是,在數據充、分定量評價指標科學合理的前提下,定量評價與定性評價的結果是高度相關的。但從可操作性來說,基於科學計量學的科研水平定量分析仍然是目前最常用的方法,這是因為科學研究的定量評價方法和指標成熟,指標資料庫完善。需要強調的是在具體分析過程中還要考慮不同學科之間的差異,比如自然科學學科在外文期刊發文量較高,人文與社會科學學科相對較低,人文與社會科學學科很多成果以專著的形式發表,其論文的被引頻次較低,因此若干定量指標的運用要謹慎,這種客觀差異就會造成不同學科之間很難直接進行比較。同時,學科之間還存在交叉程度較高,界限比較模糊的問題。例如,「納米」是應該算到化學還是算到材料裡面呢?不同學校和專家的看法就會存在分歧。另外同一學科的學科內涵和特色也存在差異,比如針對教育部劃分的一級學科交通運輸工程在西南交通大學和東南大學就存在研究側重點的不同。

我們在進行學科定量分析時還存在一個誤區,即認為發表在英文期刊上的論文質量較高,所以採集樣本只需要集中在SCI/SSCI論文範圍內就足夠。但是,從統計學的意義上來看,學科分析對論文篇數是有要求的,經過大量的實踐,我們一般會設定一個有效閾值。其中對高校做整體分析要求至少得發表3000篇論文,而學科分析至少要達到300篇論文。目前國內滿足條件的高校是非常少的,大概只有30多所。為了規避發文規模這一衡量指標的弊端而開發的篇均被引頻次意味著不是發文數量越高越佔優勢,當然該指標對論文數也有要求,只有達到一定的規模之後,數據評價才具備可靠性。如果我們不考慮論文發表的數量進行分析會發現,2018年WOS論文篇均被引頻次最高的是廈門工學院,因為該校只發表了23篇論文。只考慮中文期刊論文的話,2018年篇均被引頻次最高的是河北體育學院,只有54篇中文論文。因此,在做學科分析的時候,對成果數量肯定是具備一定要求的。

學科評估也越來越重視中文期刊,習總書記去年組織召開中央全面深化改革委員會第五次會議時就審議通過了《關於深化改革培育世界一流科技期刊的意見》。甚至教育部學位中心學科評估就要求提交30篇代表性論文時,必須包含一定的中文論文篇數。同時中科院也決定從2019年起,院士候選人提供的10篇代表作中,必須包含一篇中文期刊。這一系列的現象都表明,我們對中文期刊和其成果價值越來越重視。

針對學科分析,我們有一些實用的分析工具和資料庫。包括科睿唯安提供的Web of Science、InCites、ESI;愛思唯爾的Scopus,EI,Scival;中國知網的高校科研成果統計分析資料庫、引文庫、學術精要資料庫。InCites、Scival和中國知網的高校科研成果統計分析資料庫都是綜合性的評價資料庫。中國知網收錄的中文資源內容涵蓋自然科學、人文社科,農醫、理工等,覆蓋面較廣。其中,學術精要資料庫甚至被簡稱為中文版的ESI,可以對機構、學者、期刊進行排名分析,同時該庫還包含一些外文的數據包,具備較強的實用性。

外商資料庫和中國知網針對論文的學科分類不一樣。前者是從期刊層面來定義學科的,指定期刊上發表的論文都被默認為同一學科論文,這樣一來就導致綜合性期刊很難劃分學科,比如英文期刊。另外,外商資料庫期刊資源粒度大、精度低,純粹單一的期刊種類比較少,大量跨學科論文導致運用期刊劃分學科的方式不能適用。但不同的是,中國知網區分資源的粒度小、精度高。我們在論文層面上來劃分學科,採取中圖分類號連結學科的方式,因此學科屬性清晰、明確,無論是學報還是中國社會科學這種綜合性期刊,都能得到精確定位。

在學科分析過程中,有兩種學科定義的方式。其一是採取數據平臺中的學科分類方案(用成果定義學科),它的優點是數據清理工作量低,容易進行對標分析。但是也有局限性,有些學科與高校本身的認知有出入,不管按期刊還是論文進行劃分,都存在匹配錯位問題。比如ESI中的工程學,它的內涵是非常複雜的,甚至將國內的項目軟體工程也包括在內。另外部分學科也很難進行分析,如基於SCI的電氣工程跨學科屬性非常強;其二是按學者來定義學科,比較符合學校的認知,但是它有一個局限性,因為A學科教師發表的論文不一定全部屬於A學科,他可能存在跨學科研究的情況。另外這種定義方式的數據清理工作量較大,尤其是對外文數據資源進行抓取時,存在作者簡寫的情況,這就增加了對標分析的難度。

圖1 學科分析框架定量指標

中國知網提供的學科分析服務主要有三種形式。第一種是定製化的分析報告,只要指定分析的指標、窗口和對標的高校,我們就能做一個定量和定性相結合的學科分析。第二種是標準化的學科分析平臺,不管是外商還是知網,都可以直接從平臺上抓取數據。第三種是開發個性化的平臺,比如目前正在為教育部學位與研究生教育發展中心定製的學科動態監測平臺,學科大數據服務平臺,這種綜合性學科信息平臺,能將全國高校跟學科相關的所有信息收集起來,服務於未來的學位評估。

經過長期的學科分析實踐經驗,目前我們總結出了一個系統的學科分析框架,這個框架裡面主要包含一些定量指標。(具體見圖1)

圖2 高校科研成果統計分析資料庫

圖2是基於中文資源的中國高校科研成果統計分析資料庫平臺,以同濟大學為例,主要分析的是中文期刊發文量比較高的學科。通過分析可以發現同濟大學發文量最高的學科是土木工程,其次是交通運輸工程。

我們之前進行學科建設成效的監測和分析主要採取兩種途徑。第一種往往要求學院和教師填報數據,過程中存在學院和教師填報積極性不高,數據準確性無法保證,管理部門審核工作量大,無法進行對標分析等問題,結果也往往依靠單一指標對建設成效進行判定。第二種途徑是從不同資料庫(WOS,In Cites,ESI,Scival,高校科研成果統計分析資料庫)採集數據後線下進行進一步整理和分析。因此,它的數據量很龐大,指標也非常豐富,但是要投入的工作量也較大。

圖3 教師成果推動流程圖

與以往不同的是,知網目前開發的學科動態監測平臺則具備這幾大優勢1、評價指標完備。平臺包括教育部學科評估指標體系、國家「雙一流」建設遴選和評估指標體系、省「雙一流」建設遴選和評估指標體系、大學排名,文獻計量學專家建議等。這些指標主要由學校來決定,同時還能根據學校的需求去自行設置一些指標;2、學科動態監測平臺是半自動化的,裡面公開的數據(論文、基金項目、科技獎勵等),我們能做到自動推送、定期更新,數據能按季進行監測。同時該平臺還支持報告按模板自動化生成;3、數據精準。我們推送的數據經過算法和人工雙重清理,準確度在95%以上。如果要做績效評價的話,可以增加學院/學者的確認操作,保證評價的準確性。但是不採取確認操作,原則上是不影響學科分析的結果;4、學科動態監測平臺屬於個性化平臺,它的指標體系和權重都可以做到個性化,學校能根據自身需求和特色設置具體的學科和對標高校。其次,平臺可以融入學校的工作流程,自動實現教師、學院、學科的績效計算。同時還可以對接校內未公開的數據,包括(財務、專利成果轉化、人事、招生、就業等),根據不同角色(教師、學院、學科、管理部門)設置相對應的權限;5、通過這個平臺能夠幫助學校及時了解學科發展情況,明確自身優勢和短板。圖3顯示的是教師成果管理流程,教師登陸之後,可以對本人成果進行認領,同時也能對自身信息進行審核,如果存在期刊號、版權錯誤問題,平臺會根據反饋進行更改。

圖4 學科/學院用戶分析

該平臺最主要的功能就是可以對學院和相關教師進行綜合分析,上面的「科學研究、人才培養、社會服務」是分析的指標容器,表格會根據選擇的指標呈現對應的信息,同時平臺最左側還可以按「姓名、職稱、學歷」等類項進行檢索篩選。如果要做績效計算的話,表格也會自動生成總分並進行排序。而針對學科辦或者職能部門,可分析的對象也是比較多的。比如從整體的角度進行機構分析,選擇某一個具體機構、學科和對標對象,甚至平臺還提供了自定義學科功能。比如點擊「定義學科」按鈕之後,平臺會列出學校每個院系的師資清單,我們可以在每個院系中選取哪些老師屬於這個學科,點擊確定之後即可完成學科自定義設置。同時表格也會根據自定義口徑完成相關統計信息的呈現。針對學院分析我們可以按實體單位、二級學院來進行統計,而學者分析則可以根據不同學科來遴選相關信息(具體見圖4)。

總之,我們之前做學科發展規劃的時候,是不需要做太多分析的,但是當前背景下,學科分析是必須的,而非可選的。因為,學科分析和監測能幫助我們知己知彼,了解學科建設成效,優化資源配置。充分發揮學科分析的作用,加速「雙一流」建設進程,並助力在學科評估中取得突破。

註:本文根據張志輝在「2019年京滬高校「雙一流」建設交流研討會」的現場演講整理而成,細節內容可能有誤,敬請諒解。

文章轉載自:上海知網

相關焦點

  • 中國知網CNKI文章下載工具:CNKI-Downloader
    不過科研動力本文介紹一個能下載知網 CNKI 全文的工具:CNKI-Downloader。使用方法CNKI-Downloader 的作者應該是 @amyhaber,其給出了一個 GIF 動圖,包含了 CNKI-Downloader 的一般使用方法。其實用法也很簡單,直接打開程序啟動,輸入搜索關鍵詞即可。
  • CNKI技巧|CNKI翻譯助手怎麼用、才好用?
    轉載請來源於微信號「CNKI文教」在撰寫論文時,經常要把關鍵詞翻譯成英文;有時要把鮮見的專業例句翻譯成中文……這時,你需要一個得力的翻譯工具!小知以親身體驗告訴你,在學術追求路上,有CNKI翻譯助手的幫助才堪稱完美之旅。
  • 數據分析的理念、流程、方法、工具
    數據指標拆解 在確定了分析目標後,就需要進行數據指標拆解。明確要分析哪些具體的數據指標,為了避免遺漏關鍵細節,可以先對業務(或某一個活動、使用場景)流程做梳理,得出每一個節點的數據指標項,根據分析目標需要,保留關鍵項,剔除多餘項。3.
  • 文獻題錄信息統計分析工具 - SATI 3.2使用方法
    這裡,林心一分享一下文獻題錄信息統計分析工具 - SATI 3.2的使用方法。①首先,下載所需要的文獻,並以EndNote格式保存。如:以CNKI-123456.txt命名的文件。知網的下載網址:https://kns.cnki.net/kns/brief/result.aspx?
  • APMS成績分析指標詳解
    此指標直觀反映了被測團體的名次的分布情況,以便測試者了解到底哪個班(學校)所屬團隊中頂尖的學生多,哪個班(學校)差生多。 16、成績等級成績等級就是把成績分為幾個等級,具體設置由用戶設定,可以是ABCD等級,也可以是甲乙丙丁。此指標與優秀率、良好率、及格率和低分率等指標用途相類似。
  • 「數據分析」的理念、流程、方法、工具
    數據指標拆解 在確定了分析目標後,就需要進行數據指標拆解。明確要分析哪些具體的數據指標,為了避免遺漏關鍵細節,可以先對業務(或某一個活動、使用場景)流程做梳理,得出每一個節點的數據指標項,根據分析目標需要,保留關鍵項,剔除多餘項。
  • 「詞頻」分析:研究現狀、方法、工具與資源
    詞頻分析(Word Frequency Analysis)是對文獻正文中重要詞彙出現的次數進行統計與分析,是文本挖掘的重要手段。它是文獻計量學中傳統的和具有代表性的一種內容分析方法,基本原理是通過詞出現頻次多少的變化,來確定熱點及其變化趨勢。
  • 「詞頻」分析研究現狀、方法、工具與資源
    今天這篇文章主要介紹詞頻分析研究現狀、方法及工具,並整理和匯總相關軟體和資源供大家學習與研究之用。主要目的是對歷年國家社科基金立項進行詞頻統計可以分析出自己學科領域立項項目特點,更有針對性擬出選題,從標題出發打好國家社科基金申請的第一站。詞頻分析(Word Frequency Analysis)是對文獻正文中重要詞彙出現的次數進行統計與分析,是文本挖掘的重要手段。
  • 如何利用CNKI翻譯助手助力SCI寫作
    在撰寫論文時,經常要把關鍵詞翻譯成英文;有時要把鮮見的專業例句翻譯成中文……這時,你需要一個得力的翻譯工具!
  • 分析方法驗證中的統計指標
    對於所有的分析方法,最基本的要求就是「測得了」,「測得準」和「測的穩」。
  • 2019谷歌學術指標出爐,各學科top期刊列表
    知社整理了榜單上總排名前100以及各學科領域分榜,在文末,還附上了中國期刊榜單的前20名,以饗讀者。Google學術計量中,讀者可以瀏覽100中期刊和會議等出版物的信息,其排序和分類指標是依據五年h指數和h中位數。
  • 詞頻分析研究的現狀、方法及工具,你值得擁有
    今天主要跟大家介紹詞頻分析研究現狀、方法及工具。 詞頻分析是什麼呢?詞頻分析(Word Frequency Analysis)是對文獻正文中重要詞彙出現的次數進行統計與分析,是文本挖掘的重要手段。它是文獻計量學中傳統的和具有代表性的一種內容分析方法,基本原理是通過詞出現頻次多少的變化,來確定熱點及其變化趨勢。 詞頻分析使用現狀如何?
  • 校友會2020第五輪學科評估前瞻分析報告出爐,附23項核心指標排名
    教育部第三輪和第四輪學科評估結果已成為國家和地方「雙一流」建設學科核心遴選標準和考核指標。全國學科評估已成為國家及地方「雙一流」建設成效評價和一流學科增選的風向標,是彰顯中國高校學科建設水平和學科競爭力的晴雨表。教育部第五輪學科評估結果對中國高校的社會聲譽、學科競爭力、「雙一流」建設考核評估、新一輪學位授權點申報都將產生重要影響。
  • 財務分析是什麼?財務分析的目的與基本分析方法
    財務分析是什麼?財務分析是經濟應用學科的專業術語,它通過會計核算和報表資料及其他相關依據,採用專門的分析技術和方法,對企業等經濟組織過去和現在有關籌資活動、投資活動、經營活動、分配活動的盈利能力、運營能力、償債能力和增長能力狀況進行分析和評估的一項經濟管理活動。
  • 股票-投資者如何分析KDJ指標KDJ指標是什麼意思
    KDJ指標又叫隨機指標,是一種相當新穎、實用的技術分析指標,它起先用於期貨市場的分析,後被廣泛用於股市的中短期趨勢分析,是期貨和股票市場上最常用的技術分析工具。那如何分析KDJ指標呢?關於如何分析KDJ指標,接下來就介紹一下如何分析KDJ指標的方法。
  • 校友會2020年第五輪學科評估前瞻分析報告,23項核心指標完整排名發布
    教育部第三輪和第四輪學科評估結果已成為國家和地方「雙一流」建設學科核心遴選標準和考核指標。 全國學科評估已成為國家及地方「雙一流」建設成效評價和一流學科增選的風向標,是彰顯中國高校學科建設水平和學科競爭力的晴雨表。教育部第五輪學科評估結果對中國高校的社會聲譽、學科競爭力、「雙一流」建設考核評估、新一輪學位授權點申報都將產生重要影響。
  • 社區團購產品競品分析:美團優選、橙心優選、多多買菜、興盛優選
    本文作者就對目前市場上的四種社區團購產品進行了分析,看看誰更勝一籌吧。1. 行業發展歷程及現狀1.1 社區團購定義社區團購就是真實居住社區內居民團體的一種購物消費行為,是依託真實社區的一種區域化、小眾化、本地化的團購形式。
  • 橙心優選怎麼申請當團長 加盟橙心優選社區電商方法
    橙心優選也是眾多社區電商中比較火的平臺之一,而且該平臺也推出團長模式,團長可以通過推廣產品來獲取相應的佣金提成,因此不少人對此感興趣。橙心優選社區電商怎麼加盟做團長?橙心優選的加盟入口在哪裡?其實相關的加盟申請挺簡單的,下面給大家具體介紹下。
  • 第五輪學科評估來了!附指標體系框架及官方解讀
    構建以立德樹人成效為根本標準,以「質量、成效、特色、貢獻」為價值導向,以定量與定性評價相結合為基本方法的評估體系,在保持一級學科整體水平評估基本定位和評估體系框架基本穩定的基礎上,堅持繼承創新。突出診斷功能。評估體系和信息服務突出診斷功能,堅持以評促建、以評促升。通過學科發展縱向分析和橫向比較,總結階段性進展,查找結構性短板,呈現優勢與不足,助力學科內部治理能力提升。
  • 修煉筆記 | 人力資源盤點的流程、內容、工具、指標、方法
    1)成立人力資源盤點專項工作檯小組由分管領導、人力資源經理、各部門負責人組成,並確定盤點的範圍和方法;2)制定人力資源盤點計劃有詳細的計劃才能確保進展順利;3)根據盤點內容,收集整理相關的資料查檔案、發問卷、組織討論等