圖片來源於科普理論與實踐
導語:
8月20日,中國科普研究所前沿系列學術報告第28期如期舉辦,本期報告人是中國知網副總編輯、高級編輯、知網國際總經理柯春曉博士,報告主題為「基於世界知識大數據的全球學術快報」。
一、基本概念介紹
1. 什麼是好的知識服務平臺?
好的知識服務平臺是全球讀者依賴的平臺,是可以一站獲取的、一鍵查準、查全、查新的。
平臺需面向兩個群體,一個是作者、期刊等媒體,另一個是讀者。因此需要進行兩個方面的工作,一是「聚資源」,要把全世界的資源聚到一起;二是「聚讀者」。
而「聚資源」、「聚讀者」必須在平臺上實現三個目標——快、準、全。「準」是基礎,缺乏「準」的「全」只是堆積;同時滿足「準」和「全」才能做到「快」;同時做到「準」、「全」、「快」,才能真正實現「一鍵查準、查新和查全」。
1.1快
傳播快:最新內容排在前列,優先獲取。
出版快:與出版平臺打通,出版內容第一時間發布。
1.2準
標註準:依賴規範的元數據標註。
畫像準:基於學術畫像的精準推送。
檢索準:精準發現所需知識。
1.3全
檢索全:跨語言檢索,一種語言輸入獲取全球知識。
收錄全:全球知識資源在一個平臺上統一獲取與發布。
2.什麼是世界知識大數據?
「世界知識大數據」綜合國內外出版機構,在全球知名學術出版集團、國際知名學協會、國際知名大學出版社和主流小語種期刊平臺與國內的期刊編輯部、報社、出版社、高校、協會等之間搭建平臺。
通過國內外多種機構的資源聚集,平臺目前累計資源總量約5億篇,平均每分鐘更新166篇,平均每小時更新1萬篇。
3.世界知識大數據的三個層次
「中國知網」運用智能化大數據的結構化與碎片化處理、知識化標註、知識體系化組織、知識關聯關係挖掘等信息技術,形成了由全文作品與碎片化數據構成的「世界知識大數據」。「世界知識大數據」分為以下三個層次:
3.1全文級大數據
全文級大數據在文章層面形成數據,涉及元數據著錄、主題詞標引、國內外兩級引文連結、國內外相關文獻關聯、文內專業術語連結。
3.2段落級大數據
段落級大數據以段落為單元形成數據,主要指段落主題標引、國內外一級引文連結、國內外相關文獻關聯。
3.3知識元級大數據
知識元級大數據提取並標引文中圖形、圖像、表格、表格、公式、概念、原理、思想、方法、研究對象、問題、思路、解決方案、過程、結果、結論、討論、研究者、人物、地點、事件等內容。
二、全球學術快報的用途
全球學術快報是基於世界知識大數據搭建的平臺。涵蓋全球學術期刊7萬種,有出版快,檢索快的特點,並且檢索默認按時間倒序。方便讀者通過檢索獲得最新的信息。
1.如何用知網平臺去鳥瞰一個新的「知識領域」
利用知網平臺了解一個新領域,除了從當前靜態斷面的角度了解研究內容、研究者、研究方法和研究成果發表在哪些研究現狀之外,還可以把研究主題在時間軸上展開,看研究起點、研究來源、研究分支、研究去脈,從而把握研究發展變化。
2.如何用知網平臺「鑽取」特定知識領域的研究點
已經了解一個領域的概括,需要具化研究內容時,可利用知網平臺鑽取研究點。
利用知網平臺可以探尋學科交叉點
平臺上所有的文獻都會被自動分類,把中外文文獻按照統一的學科分類體系進行分類後,就可以直接在學科體系上找到學科交叉點。
利用知網平臺可以跟蹤政策導向
搜索領域關鍵詞後,在邊欄基金選項選中某基金,就可以查看該基金支持的研究主題。這樣,可以更容易地找到國家支持的選題方向。
利用知網平臺可以找到熱點中的忽視點
高被引文章一般是研究的熱點,高下載文章一般是關注度較高的文章,而「熱點中的忽視點」尋找的目標是「高被引」+「低下載」。另外,還可以利用關鍵詞共享網絡尋找熱點中的忽視點。
3.如何用知網平臺選取精讀的文章
寫論文或者做研究,最關鍵的是「問題意識」。選擇精讀文章之前,最關健的一步是確定問題。在確定問題的前提下,要精讀經典文獻、最新文獻、大咖文獻和名刊文獻。
經典文獻可以通過平臺引證網絡分析,尋找中樞文獻;通過被引排序,找高被引文獻來獲得。最新文獻在知網默認主題相關條件下,會排在前列。檢索大咖文獻可通過作者導航、機構導航、學者圈、引文庫等方式實現。名刊名會文獻可通過名刊期刊的導航和指標檢索到。另外,還可以按圖索文,通過學術圖片檢索到該圖片所在的文獻。
三、背後的邏輯
1.數據層級
平臺數據分為4層,第一層是基礎數據,包括文獻數據、大量的實驗數據、讀者的行為數據、大量的統計數據等,這是在全球範圍內採集到的基礎數據。第二層是屬性數據,在行內則稱為原數據,是描述基礎數據的數據。第三層是關係數據,如上下位關係、從屬關係等。第四層是決策數據,是以其他平臺數據為基礎形成的知識圖譜、趨勢分析和決策依據。
我們更希望能夠在這些數據的基礎上來完成趨勢分析、知識圖譜、決策依據。
2.邏輯算法
知網平臺會使用自己的標引技術對每一篇文獻進行畫像,標註主題詞和關鍵詞。讀者在輸入一個詞之後,平臺會對輸入的詞進行檢索擴展,即用輸入的詞與擴展詞進行匹配,實現中英的或者多語言的混合檢索。
過程中使用相關度算法模型,再進行排序算法,最終獲得檢索結果。
延伸閱讀
[1]柯春曉:企業目前未成為創新主體 微觀生態上有問題
https://finance.sina.com.cn/meeting/2019-08-31/doc-iicezzrq2516530.shtml
[2]柯春曉.基於知識服務的科普期刊辦刊模式研究[J].出版科學,2018,26(01):66-70.
[3]張宏偉,宋菲菲,陶紅燕,宋青.基於世界知識大數據的學術期刊出版、傳播與利用[J].科技與出版,2019(06):79-83.
[4]張麗華.知網節與知識網絡[J].現代圖書情報技術,2006(09):85-88.
[5]王雪靜,張麗. 基於碎片化的標準公共服務平臺建設探討[A]. 中國標準化協會.第十四屆中國標準化論壇論文集[C].中國標準化協會:中國標準化協會,2017:4.