新知在哪裡:從學科網絡中發現不同領域的知識關聯

2020-12-08 澎湃新聞

原創 孫燁 集智俱樂部 來自專輯複雜科學前沿2020

導語

對於學科網絡的研究能夠讓我們從更直觀的角度了解不同的學科之間的內在聯繫。本文詳細地梳理了學科網絡的研究歷史,構建方法以及其隨時間的演化特徵。希望通過本文,能讓我們能夠更深入地理解不同學科之間知識交流的基本機制,從而對科學知識的生產以及學科創新產生一定的指導價值。

本文首發於集智班圖,掃碼直達路徑地址

1.學科網絡的研究歷史

學科網絡的研究經歷了漫長的發展歷史,在上個世紀,由於文獻數據可獲得性的限制,科學家在繪製學科網絡時,需要憑藉自身對某個領域多年的研究經驗以及對該領域研究概況的整體性認知。

圖1:Bernard Porter 於1938年繪製完成的物理學地圖

如上圖所示,這幅物理學領域地圖是由著名物理學家、視覺藝術家、詩人及和平活動家Bernard H. Porter,自1932年起耗費六年心血繪製而成的。為了確保這份物理學地圖的準確性,在隨後的幾年裡Porter還將最終成果交給一些傑出物理學家和科學史學家進行審閱。

這個地圖的宏偉之處在於它追溯了公元前6世紀至20世紀的物理學發展歷史,通過它可以追蹤到「力學」、「聲學」和「光學」等關鍵理論的思想源頭。坐落在河流兩旁的「村落」代表艾薩克·牛頓、亞歷桑德羅·伏特、維爾納·海森堡等為物理學的發展做出過重大貢獻的物理學家們。

隨著21世紀計算機網際網路的興起,文獻檢索資料庫的全面推廣, 很多學者開始通過搜集大量的科學文獻數據,來構建學科之間知識流動和知識關聯的網絡。

其中一個比較典型的基於文本分析的知識網絡地圖[1],是由Andre ́ Skupin根據1993年到2002年十年間的美國地理學協會年會提交的2.2萬多篇摘要而構建的。在文中,他將每篇文獻看作是文章關鍵詞的n維向量,基於自組織映射(Self-Organizing Map,SOM)的方法,利用這些向量建立了一個地理知識領域的神經網絡模型,並將該神經網絡模型轉變成兩種信息模式:(1)一種是利用還把高度來量化單個主題集中的程度;(2)另一種則是採用多級文本標籤對不同的可視化區域進行標註。最後,作者採用標準的地理信息信息(GIS)軟體繪製了關於地理學科的領域關鍵詞地圖。

圖2:地理信息可視化地圖

隨後,一些學者開始嘗試通過科學文獻之間的引用關係構建學科知識流網絡,例如,Martin Rosvall等人[2],在2008年基於6128種不同的科學期刊之間的引用關係,構建了期刊所屬領域之間的知識流網絡,並對學科之間的社團結構進行了深入的探究。而在最近的研究中[3],他們通過採用基於引用流的聚類方法,又進一步探討了100多個科學領域網絡中的多層次結構。

圖3:學科網絡的層級結構圖

如上圖所示, 作者們根據不同期刊所屬的領域之間的相互引用關係, 將現代科學劃分為了四個主要的學科,分別為生命科學,物理科學,生態和地球科學以及社會科學。而其中,對於物理科學,他們進行了第二級劃分,將其進一步劃分成兩個內部連接緊密的子類學科。

學科網絡的構建和可視化,不僅能夠幫助我們直觀地了解不同科學領域之間相互聯繫,也同時擴展了我們的研究視野,使我們能夠了解不同學科的演變過程,為我們科學地規劃未來的研究路徑和方向提供了很好的參考價值。

2.學科網絡的構建方法

近幾十年來,文獻計量學家、信息科學家、社會學家、物理學家和計算機科學家們,基於自身所在的研究領域的背景知識和方法創建了各種不同形式的學科網絡,為我們在未來更深入了解學科之間的關係提供了堅實的研究基礎。

在眾多構建學科網絡的方法中,最為常見的方式,是利用不同學科的文獻之間的相互引用關係來構建的網絡。

圖4:學科網絡的構建方法

如圖4所示,學科網絡的構建方法主要可以分為以下三種:

共引網絡(co-citaion Networks): 若兩個來自不同研究領域的文章被同一篇文獻所以用,那麼這兩個不同的領域之間將會存在一條無向的連邊(圖4a);

直接引用網絡(Direct Citation Networks): 若一個研究領域的論文引用另一個領域的論文時,這兩個領域之間存在一條直接的有向連邊(圖4b);

文獻耦合網絡(Bibliograhic Coupling Networks): 當兩個來自不同的領域的論文引用同一篇的其他論文時,則這兩篇論文所屬的兩個不同領域之間就會存在一條連邊(圖4c);

除了通過文獻之間的引用關係,我們在研究領域之間的相互聯繫時,另一種較為可行的方式是基於科學家在不同的領域從事研究的職業軌跡來構建網絡。如圖4d所示,如果一個作者在多個研究領域都發表了文章,那麼這幾個不同的領域之間就會存在連邊,以這種方式構建的網絡可以被稱之為職業路徑網絡(Career Path Networks)。

圖5:職業路徑網絡

如上圖所示,Miguel R. Guevara等人在2016年的Scientometrics論文中[4],通過追蹤31萬多個科學家在整個研究生涯中發表的論文所屬的領域,構建了較為完整的基於科學家職業路徑的學科網絡。

有人也許會好奇, 構建學科網絡的方法多種多樣,那麼,通過不同的方法所構建出來的學科網絡是否會具有高度的相似性呢?為了探討這一問題,Miguel R. Guevara等人在同一個的研究數據下,分別通過文獻耦合和科學家職業路徑兩種不同的方式構建了學科網絡。令人意外的是,作者們發現這兩種不同方式下所構建的學科網絡相似程度非常低。

作者認為這可能是由於,基於文獻耦合的方式所構建的學科網絡更傾向於捕捉了領域之間的關聯性或知識流動的信息,也就是較為顯性的知識關聯性。而通過科學家職業路徑的方式所構建的學科網絡,則更好地體現了在不同領域產生科學所需的知識共享能力,更能揭露生產顯性知識所需的隱性技能和能力。當我們試圖去預測個人或者研究機構未來會選擇進入的研究領域時,那麼基於科學家的職業路徑則將會擁有更高的準確性。

因此,當我們在構建的學科網絡時,需要根據自身所研究的具體科學問題,選擇一種最為恰當而有效的網絡構建方法。

3. 學科網絡的演化趨勢

通過研究學科網絡中的知識流演化,我們可以深入地了解學科知識創新的過程以及演變模式,為今後指導學科的發展提供了重要的理論借鑑價值。

自從2010年以來,很多學者也將目光聚集到了學科網絡的演化過程。例如,Raj Kumar Pan等人[5]基於物理文獻上的學科分類碼,構建了每一年的學科子領域網絡,他們發現隨著時間的推移,物理學各子領域的聯繫變得越來越緊密。同時,跨學科物理學在網絡核心中的所佔的比重正在穩步增加,這反映了物理學研究總體趨勢的轉變。

最近,Ye Sun等人在2020年的Scientific Reports中[6],則提出了一個定量的研究知識流演化的框架。作者們基於美國物理學協會過去30年的物理學論文以及引用關係,構建了隨時間演化的物理學子領域之間知識流網絡, 其中節點代表的是不同的領域,而加權的連邊則代表了在特定時期內知識從一個領域到另一個領域的流動。

對於每個領域來說,它在發展的過程中常常會使用其他領域的知識,同時也會為其他領域提供知識。

圖6:物理學領域的知識流演化過程

如上圖所示,作者們就發現物理學不同子領域間的知識流動存在很顯著的互惠性,並且這種特徵在2000年左右達到了頂峰;其次,不同子領域之間知識流的顯著性隨著時間在不斷下降(平均連邊的權重隨著時間在變小),這意味著跨領域的知識交流變得越來越均勻,這不同於1990年初,每個子領域只在少數幾個聯繫緊密領域之間進行知識交流。 從另一個角度來看,這也反映了物理學領域中跨領域研究的興起。

圖7:學科知識流演化的四種典型模式 (a)不同領域知識流的互惠性 (b)吸收模式 (c)吸收到相互作用模式 (d)反哺模式 (e)相互作用模式

另一方面,作者們通過觀察固定兩個不同學科之間的知識流隨時間演化的過程,總結出了四種典型的演化模式,如上圖所示:

吸收模式:一個領域在整個時間段中一直從某個領域獲得更多的知識;

吸收到相互作用模式(圖5b):剛開始一個領域會從某個領域吸收更多的知識,而後則這兩個領域之間存在比較互惠的知識交流關係(圖5c);

反哺模式:在一開始一個領域會從某個領域吸收更多的知識,而之後另一個領域則開始反過來為其提供更多的知識(圖5d);

相互作用模式:在整個時間段中,兩個不同的領域都保持著知識互惠的關係(圖5e)。這些不同的演變模式清晰地揭示了,知識創造和跨領域知識交流的過程可以是高度異質的。

隨著現今交叉學科的蓬勃發展,跨學科之間的知識交流也變得尤為頻繁。學科網絡的構建及對其演化機制的研究,對於我們在未來尋找不同學科之間的結合點,發現新的交叉性領域,進行突破性的研究具有非常重要的指導意義。

參考文獻

[1]. Skupin, A. (2004). The world of geography: Visualizing a knowledge domain with cartographic means. Proceedings of the National Academy of Sciences, 101(suppl 1), 5274-5278.

[2]. Rosvall, M., & Bergstrom, C. T. (2008). Maps of random walks on complex networks reveal community structure. Proceedings of the National Academy of Sciences, 105(4), 1118-1123.

[3]. Rosvall, M., & Bergstrom, C. T. (2011). Multilevel compression of random walks on networks reveals hierarchical organization in large integrated systems. PloS one, 6(4), e18209.

[4]. Guevara, M. R., Hartmann, D., Aristarán, M., Mendoza, M., & Hidalgo, C. A. (2016). The research space: using career paths to predict the evolution of the research output of individuals, institutions, and nations. Scientometrics, 109(3), 1695-1709.

[5].Pan, R. K., Sinha, S., Kaski, K., & Saramäki, J. (2012). The evolution of interdisciplinarity in physics research. Scientific reports, 2(1), 1-8.

[6]. Sun, Y., Latora, V. (2020). The evolution of knowledge within and across fields in modern physics. Sci Rep 10, 12097.

作者:孫燁

審校:劉培源

編輯:曾祥軒

原標題:《新知在哪裡:從學科網絡中發現不同領域的知識關聯》

閱讀原文

相關焦點

  • 科技文獻語義關聯網絡及其應用探析
    建立科技文獻之間的關聯形成科技文獻知識關聯網絡,是從海量科技文獻資源中挖掘知識的需要,也是改善科技文獻信息服務的需要。科技文獻語義化在一定程度上實現了數字文獻資源的有效組織並為資源利用效率優化奠定基礎。
  • 科技知識網絡中高階結構的湧現|arXiv論文速遞
    :科研網絡中的高階結構 過去一百年間,科研團隊規模越來越大,科研人員需要掌握的知識也越來越多。這意味著要想做好科研,需要更高效地重組已有知識。而將上述直覺反映到科學學的研究中,可以將每一項新研究看成由已知概念、發現或發明為節點所組成的網絡。然而之前的研究,關注的是節點中兩兩之間的關係。
  • PRL:找尋網絡中的創新「守門員」
    Zipf 法則:指自然語言中,一個單詞出現的頻率與它在頻率表裡的排名成反比。即冪律法則在自然語言中的體現。 然而,單個的甕只能反映每個人獨自探索未知的過程——與真實世界中,探尋新知的人組成社交網絡、每個人處在網絡中的不同結構這一特點相矛盾。同時真實世界中的知識發現也非依賴已實現定義的網絡結構,而是由知識探索的過程動態決定的。
  • 中原學關聯學科的討論及學科體系的初步架構(二)
    中原學的關聯學科有甲骨學、黃河學、洛陽學、炎黃學等學科,這些學科的發展是中原學發展的基礎。
  • 深度解析知識圖譜領域幾次發展的主要技術突破
    人工智慧在大體上有三個比較大的分支,一個是神經網絡,叫連接主義學派,另外一個叫統計或者經驗主義學派,後來就衍生出了機器學習,最後一個知識工程這個方向,我們叫它理性主義或者符號主義,是從 1956 年這個學科形成時就有的分支。 在六十年代、七十年代的時候,知識工程這個領域往前發展,不斷的產生出新的邏輯語言和新的實用方法,像描述邏輯是七十年代就興起了的。
  • 名師網絡課堂暨小學英語新知呈現課堂展示及研討活動
    4月19日上午,由虎林教師進修學校初教部舉辦的「名師網絡課堂暨小學英語新知呈現課堂展示及研討活動」在第一小學錄播教室舉行。教師進修學校副校長史偉、第一小學副校長李春芳及全市小學英語教師參加了本次活動。     小學英語教研員張秀麗在直播現場組織了本次活動。承擔本次網絡課堂展示的是市第一小學英語教師高翠翠。
  • 閻光才:學科的內涵、分類機制及其依據
    然而,如果要問起究竟什麼是學科,言說者或憑直覺或憑經驗以及自身的立場,可能都會給出一種自我理解與詮釋。但若細究下去會發現,不同言說者在不同語境中關於其具體所指卻可能存在很大的差異。正因為存在語義上的紛亂,在學科幾乎成為高等教育領域各種理論與政策話語中都無法繞開的一個關鍵詞時,它難免為日常實踐帶來一系列的困惑,甚至會步入誤區。
  • 南京人才地圖出爐,在多個學科與研究領域形成特色優勢
    研究人員指出,該智慧人才系統依託清華大學高質量大規模知識圖譜、深度隱含關聯挖掘算法和認知圖譜等核心技術,服務地方科技產業發展,展示符合地方發展方向的本地、全國和全球人才分布態勢、人才流動趨勢,可以為地方人才引進工作中的尋、評、引、用提供基於大數據的智能化支持,構建全球人才 GPS,實現人才工作的按圖索驥。
  • 「如何突破瓶頸」融會貫通,讓不同知識碰撞出火花
    一個大師善於在不同學科之間創建關聯。 而普通的學生腦海中只是學到的知識的複製,雖然每個知識點跟上一級連結,但這些知識點都是孤立的,分散的。解決實際問題,往往都是將多個目錄下的知識點進行關聯後調用。所以知識融合對於知識運用來說非常重要。最富有成果的往往是距離很遠的知識點。
  • UIUC羅宇男:交叉學科中的人工智慧和科學發現
    承辦單位為中國科學院大學學生會,協辦單位為中國科學院計算所研究生會、網絡中心研究生會、人工智慧學院學生會、化學工程學院學生會、公共政策與管理學院學生會、微電子學院學生會。2020年8月29日,第18期「AI未來說·青年學術論壇」(「AI+X」領域專場)以「線上平臺直播+微信社群圖文直播」形式舉行。UIUC羅宇男帶來報告《交叉學科中的人工智慧和科學發現》。
  • 知乎2021新知青年大會 周源公布知乎長期戰略
    此外,周源還正式公布未來發展戰略:以各個領域的創作者為中心,為廣大用戶創造價值,是知乎的長期戰略。周源公布知乎長期戰略大會上,知乎創始人、CEO周源發表十年演講。他表示,知乎上聚集一大批優秀的內容創作者,他們在知乎解決了一個個問題,分享獨有的知識、經驗和見解,且形成了專屬詞彙、自製公約以及良性友好的社區氛圍。創作者像路燈,在黑夜裡帶來光明,溫暖心窩。
  • 2021新知青年大會開幕 知乎開啟下一個十年
    知乎活躍用戶中,18-35歲的青年佔比約75%,他們正處在人生的「第二個十八年」,正處在從認識世界邁向影響世界、改變世界的關鍵階段。為了更好地為新知青年服務,知乎在過去十年持續內容、產品和技術創新。下一個十年,知乎還將繼續堅守「讓人們更好地分享知識、經驗和見解,找到自己的解答」的使命,進行戰略升級。
  • 中讀:打破知識壁壘,在人文社科中「聽見幸福,讀到美」
    這不僅是一個分享知識的場合,更是人文社科領域的交流盛會。作為依託於《三聯生活周刊》優質內容而誕生的知識付費與深度閱讀相結合的平臺,在三年的發展過程中,中讀更加堅定地把產出精品內容作為平臺擴展的前提,拓寬知識付費領域,並謀求多平臺的媒體融合,最終確定了向人文社科領域深耕的目標。
  • 從語義網到知識圖譜
    其中一個不同之處在於開放性: 正如關聯開放數據這個術語從一開始就暗示的那樣,語義網社區的關聯數據工作大多以開放共享數據為其目標之一,這意味著關聯數據大多可以免費下載,或者由支持SPARQL的服務提供,並且重要的是在社區中使用非限制性許可。wikidata作為一個知識圖譜也是開放共享的。相比之下,圍繞知識圖譜的活動往往是由行業主導的,而主要的應用並不是真正開放的。
  • 從「有用」到「有趣」,知乎「新知大學」顛覆場景營銷
    大學是傳授知識的場所,是一切科學,事實和原理,探索和發現,實驗和思索的高級保護力量。大學一方面訓練求索的習慣,一方面讓我們的個性、修養和人格完整獲取。大學意味著開始自我規劃,明確目標,在很多人心中都意味著成長、難忘。
  • 知乎2021新知青年大會正式拉開帷幕 周源公布知乎長期戰略
    知乎活躍用戶中,18-35歲的青年佔比約75%,他們正處在人生的「第二個十八年」,正處在從認識世界邁向影響世界、改變世界的關鍵階段。為了更好地為新知青年服務,知乎在過去十年持續內容、產品和技術創新。下一個十年,知乎還將繼續堅守「讓人們更好地分享知識、經驗和見解,找到自己的解答」的使命,進行戰略升級。
  • 感恩十年相伴同行 知乎致謝新知答主
    1月13日,2021新知青年大會以視頻形式上線知乎。本屆大會主題為「謝答」,大會發布「知乎十年感恩同行」「知乎十年新知答主」和「知乎2020新知答主」名單,以此向十年以來陪伴知乎的答主表達真摯感謝。
  • 苗煒專訪:為何要離開一手創辦的《新知》
    紙媒生存的空間似乎越來越小,但我仍固執以為,無論什麼媒,彼此傳播方式不同,能生存下來的還是內容。考量的是內容能否跑贏市場。」澎湃新聞因此採訪了苗煒,請他談一手創辦的《新知》雜誌。澎湃新聞:在《新知》最大的驕傲和遺憾是什麼?
  • 高考生,長知識了!學科與專業有哪些區別?
    學科用於學術分類時,是指一定科學領域或一門科學的研究分支,主要依據學科的派生來源、研究對象、研究特徵、研究方法、研究目的和目標等方面對學科進行分類;學科用於教學科目時,是指依據一定的教學理論組織起來的知識體系;學科還用於特指高校教學、科研等的功能單位,是對教師教學、科研業務隸屬範圍的相對界定。
  • 學科課程與經驗課程的不同!
    在教師資格證的筆試中,課程是一個常考考點,而學科課程與經驗課程相關的知識點也是一個考試重點,在考查類型中以客觀題為主