中國知網學科服務中心高級分析師 張志輝
各位領導、各位專家下午好,很高興有這個機會圍繞學科方法、指標與工具給大家做報告。我從事的工作內容是學科分析,因此接下來我想從學科分析如何做以及可操作性的角度來為大家進行介紹。
學科分析是建設高水平學科的重要手段。各行各業的管理工作要做到科學化、規範化、精細化越來越需要客觀數據的支撐。尤其是在「雙一流」建設和學科評估的壓力下,高校學科建設想要取得更好的成效,就必須要對自身和對標的高校做到充分的了解。因此,我們要從數據和指標入手做到全方位的分析,這樣才能知己知彼。「雙一流」建設的核心最後還是要落實到一流學科建設上面,遍觀世界一流大學就會發現,他們的大多數學科都是一流的,可見學科建設是一流大學建設的抓手。而學科分析最重要的作用就是幫助學校及時了解學科水平和建設成效,為學科建設、管理與規劃提供客觀支撐。
去年教育部提出破「五唯」,即「唯分數、唯升學、唯文憑、唯論文、唯帽子」,教學成果評價這種全方位、多角度原則對我們學科分析來說同樣適用。我們分析的維度可以包括科學研究、人才培養、師資隊伍、成果轉化等,這種綜合指標的考量,才能使學科評估儘量做到全面和平衡。
學科分析最理想的方案就是將定量和定性分析相結合。典型的案例就有教育部學位中心的學科評估。定量分析和定性分析各有優劣勢。定量分析比較高效、方便,可用的資料庫比較成熟,能夠支撐完成很多客觀分析和對標分析。定性分析則可以做到較好的質量評價,但大家通常認為一篇論文被引頻次跟其質量之間是屬於等同關係,這是不對的。論文被引頻次跟質量之間雖然呈較強正相關性,但並不一定意味被引頻次高的論文質量就高,反之亦然。同時定性分析也存在一些劣勢。其一就是專家同行評議具備較強的主觀性。比如,進行一級學科分析時,分屬的二級學科專家,在同一個問題的看法上會存在比較大的差異。其二是定性分析組織代價較高。因此教育部學位中心每四年才做一次全國範圍內的學科評估,而且就算是對某一所高校進行學科評估,組織同行專家評議的代價也是非常高的。
可以肯定的是,在數據充、分定量評價指標科學合理的前提下,定量評價與定性評價的結果是高度相關的。但從可操作性來說,基於科學計量學的科研水平定量分析仍然是目前最常用的方法,這是因為科學研究的定量評價方法和指標成熟,指標資料庫完善。需要強調的是在具體分析過程中還要考慮不同學科之間的差異,比如自然科學學科在外文期刊發文量較高,人文與社會科學學科相對較低,人文與社會科學學科很多成果以專著的形式發表,其論文的被引頻次較低,因此若干定量指標的運用要謹慎,這種客觀差異就會造成不同學科之間很難直接進行比較。同時,學科之間還存在交叉程度較高,界限比較模糊的問題。例如,「納米」是應該算到化學還是算到材料裡面呢?不同學校和專家的看法就會存在分歧。另外同一學科的學科內涵和特色也存在差異,比如針對教育部劃分的一級學科交通運輸工程在西南交通大學和東南大學就存在研究側重點的不同。
我們在進行學科定量分析時還存在一個誤區,即認為發表在英文期刊上的論文質量較高,所以採集樣本只需要集中在SCI/SSCI論文範圍內就足夠。但是,從統計學的意義上來看,學科分析對論文篇數是有要求的,經過大量的實踐,我們一般會設定一個有效閾值。其中對高校做整體分析要求至少得發表3000篇論文,而學科分析至少要達到300篇論文。目前國內滿足條件的高校是非常少的,大概只有30多所。為了規避發文規模這一衡量指標的弊端而開發的篇均被引頻次意味著不是發文數量越高越佔優勢,當然該指標對論文數也有要求,只有達到一定的規模之後,數據評價才具備可靠性。如果我們不考慮論文發表的數量進行分析會發現,2018年WOS論文篇均被引頻次最高的是廈門工學院,因為該校只發表了23篇論文。只考慮中文期刊論文的話,2018年篇均被引頻次最高的是河北體育學院,只有54篇中文論文。因此,在做學科分析的時候,對成果數量肯定是具備一定要求的。
學科評估也越來越重視中文期刊,習總書記去年組織召開中央全面深化改革委員會第五次會議時就審議通過了《關於深化改革培育世界一流科技期刊的意見》。甚至教育部學位中心學科評估就要求提交30篇代表性論文時,必須包含一定的中文論文篇數。同時中科院也決定從2019年起,院士候選人提供的10篇代表作中,必須包含一篇中文期刊。這一系列的現象都表明,我們對中文期刊和其成果價值越來越重視。
針對學科分析,我們有一些實用的分析工具和資料庫。包括科睿唯安提供的Web of Science、InCites、ESI;愛思唯爾的Scopus,EI,Scival;中國知網的高校科研成果統計分析資料庫、引文庫、學術精要資料庫。InCites、Scival和中國知網的高校科研成果統計分析資料庫都是綜合性的評價資料庫。中國知網收錄的中文資源內容涵蓋自然科學、人文社科,農醫、理工等,覆蓋面較廣。其中,學術精要資料庫甚至被簡稱為中文版的ESI,可以對機構、學者、期刊進行排名分析,同時該庫還包含一些外文的數據包,具備較強的實用性。
外商資料庫和中國知網針對論文的學科分類不一樣。前者是從期刊層面來定義學科的,指定期刊上發表的論文都被默認為同一學科論文,這樣一來就導致綜合性期刊很難劃分學科,比如英文期刊。另外,外商資料庫期刊資源粒度大、精度低,純粹單一的期刊種類比較少,大量跨學科論文導致運用期刊劃分學科的方式不能適用。但不同的是,中國知網區分資源的粒度小、精度高。我們在論文層面上來劃分學科,採取中圖分類號連結學科的方式,因此學科屬性清晰、明確,無論是學報還是中國社會科學這種綜合性期刊,都能得到精確定位。
在學科分析過程中,有兩種學科定義的方式。其一是採取數據平臺中的學科分類方案(用成果定義學科),它的優點是數據清理工作量低,容易進行對標分析。但是也有局限性,有些學科與高校本身的認知有出入,不管按期刊還是論文進行劃分,都存在匹配錯位問題。比如ESI中的工程學,它的內涵是非常複雜的,甚至將國內的項目軟體工程也包括在內。另外部分學科也很難進行分析,如基於SCI的電氣工程跨學科屬性非常強;其二是按學者來定義學科,比較符合學校的認知,但是它有一個局限性,因為A學科教師發表的論文不一定全部屬於A學科,他可能存在跨學科研究的情況。另外這種定義方式的數據清理工作量較大,尤其是對外文數據資源進行抓取時,存在作者簡寫的情況,這就增加了對標分析的難度。
圖1 學科分析框架定量指標
中國知網提供的學科分析服務主要有三種形式。第一種是定製化的分析報告,只要指定分析的指標、窗口和對標的高校,我們就能做一個定量和定性相結合的學科分析。第二種是標準化的學科分析平臺,不管是外商還是知網,都可以直接從平臺上抓取數據。第三種是開發個性化的平臺,比如目前正在為教育部學位與研究生教育發展中心定製的學科動態監測平臺,學科大數據服務平臺,這種綜合性學科信息平臺,能將全國高校跟學科相關的所有信息收集起來,服務於未來的學位評估。
經過長期的學科分析實踐經驗,目前我們總結出了一個系統的學科分析框架,這個框架裡面主要包含一些定量指標。(具體見圖1)
圖2 高校科研成果統計分析資料庫
圖2是基於中文資源的中國高校科研成果統計分析資料庫平臺,以同濟大學為例,主要分析的是中文期刊發文量比較高的學科。通過分析可以發現同濟大學發文量最高的學科是土木工程,其次是交通運輸工程。
我們之前進行學科建設成效的監測和分析主要採取兩種途徑。第一種往往要求學院和教師填報數據,過程中存在學院和教師填報積極性不高,數據準確性無法保證,管理部門審核工作量大,無法進行對標分析等問題,結果也往往依靠單一指標對建設成效進行判定。第二種途徑是從不同資料庫(WOS,In Cites,ESI,Scival,高校科研成果統計分析資料庫)採集數據後線下進行進一步整理和分析。因此,它的數據量很龐大,指標也非常豐富,但是要投入的工作量也較大。
圖3 教師成果推動流程圖
與以往不同的是,知網目前開發的學科動態監測平臺則具備這幾大優勢:1、評價指標完備。平臺包括教育部學科評估指標體系、國家「雙一流」建設遴選和評估指標體系、省「雙一流」建設遴選和評估指標體系、大學排名,文獻計量學專家建議等。這些指標主要由學校來決定,同時還能根據學校的需求去自行設置一些指標;2、學科動態監測平臺是半自動化的,裡面公開的數據(論文、基金項目、科技獎勵等),我們能做到自動推送、定期更新,數據能按季進行監測。同時該平臺還支持報告按模板自動化生成;3、數據精準。我們推送的數據經過算法和人工雙重清理,準確度在95%以上。如果要做績效評價的話,可以增加學院/學者的確認操作,保證評價的準確性。但是不採取確認操作,原則上是不影響學科分析的結果;4、學科動態監測平臺屬於個性化平臺,它的指標體系和權重都可以做到個性化,學校能根據自身需求和特色設置具體的學科和對標高校。其次,平臺可以融入學校的工作流程,自動實現教師、學院、學科的績效計算。同時還可以對接校內未公開的數據,包括(財務、專利成果轉化、人事、招生、就業等),根據不同角色(教師、學院、學科、管理部門)設置相對應的權限;5、通過這個平臺能夠幫助學校及時了解學科發展情況,明確自身優勢和短板。圖3顯示的是教師成果管理流程,教師登陸之後,可以對本人成果進行認領,同時也能對自身信息進行審核,如果存在期刊號、版權錯誤問題,平臺會根據反饋進行更改。
圖4 學科/學院用戶分析
該平臺最主要的功能就是可以對學院和相關教師進行綜合分析,上面的「科學研究、人才培養、社會服務」是分析的指標容器,表格會根據選擇的指標呈現對應的信息,同時平臺最左側還可以按「姓名、職稱、學歷」等類項進行檢索篩選。如果要做績效計算的話,表格也會自動生成總分並進行排序。而針對學科辦或者職能部門,可分析的對象也是比較多的。比如從整體的角度進行機構分析,選擇某一個具體機構、學科和對標對象,甚至平臺還提供了自定義學科功能。比如點擊「定義學科」按鈕之後,平臺會列出學校每個院系的師資清單,我們可以在每個院系中選取哪些老師屬於這個學科,點擊確定之後即可完成學科自定義設置。同時表格也會根據自定義口徑完成相關統計信息的呈現。針對學院分析我們可以按實體單位、二級學院來進行統計,而學者分析則可以根據不同學科來遴選相關信息(具體見圖4)。
總之,我們之前做學科發展規劃的時候,是不需要做太多分析的,但是當前背景下,學科分析是必須的,而非可選的。因為,學科分析和監測能幫助我們知己知彼,了解學科建設成效,優化資源配置。充分發揮學科分析的作用,加速「雙一流」建設進程,並助力在學科評估中取得突破。
註:本文根據張志輝在「2019年京滬高校「雙一流」建設交流研討會」的現場演講整理而成,細節內容可能有誤,敬請諒解。
文章轉載自:上海知網