科技知識網絡中高階結構的湧現|arXiv論文速遞

2021-01-08 騰訊網

郭瑞東| 作者

鄧一雪| 編輯

論文題目:

The Emergence of Higher-Order Structure in Scientific and Technological Knowledge Networks

論文地址:

https://arxiv.org/abs/2009.13620

1.發現:科研網絡中的高階結構

過去一百年間,科研團隊規模越來越大,科研人員需要掌握的知識也越來越多。這意味著要想做好科研,需要更高效地重組已有知識。而將上述直覺反映到科學學的研究中,可以將每一項新研究看成由已知概念、發現或發明為節點所組成的網絡。然而之前的研究,關注的是節點中兩兩之間的關係。

研究者使用從1970年至今的科研論文合作者網絡,分學科後,考察不同拓撲維度的貝蒂數(betti number),可以發現在計算機、物理、電子工程中,代表高階網絡結構的曲線顯著升高,同時低維拓撲結構降低。這意味著這些領域近年來的發展,依賴參與者之間緊密的合作和互補。

圖1. 不同學科的論文合作者網絡在不同拓撲維度下貝蒂數隨時間變化的曲線

而考慮每個子學科內部的知識網絡和合作者網絡之間的差異,可以發現學科間,兩種網絡的差異沒有隨時間呈現明顯的趨勢,但在領域內,則出現了高階結構的顯著提升。這指出隨著待解決問題越來越難,需要更大的科研團隊,包含一個領域內眾多子領域的專業技能,而知識網絡與論文合作者網絡的拓撲差異,意味著後者是前者的原因(科研人員創造新知,改變知識網絡的結構)。

圖2. 跨學科與學科內部的網絡在不同拓撲維度上隨時間相似度的變化

圖3. 網絡傳統特徵和拓撲特徵的相關性熱圖,不同的顏色代表皮爾森相關係數

上圖所示,各個傳統特徵(縱軸)和網絡的拓撲特徵(橫軸)之間的相關性都不明顯。這意味著至少對於研究知識探索及信息傳播,網絡的拓撲結構變化也是值得關注的分析方法。

總結來看,該研究除了指出近年來科研合作者網絡中呈現出的高階結構,這些結構對應著更為複雜的概念,更為抽象的詞彙。該研究還證明了使用網絡拓撲,可以描述使用傳統的網絡特徵(如聚類係數、節點中心度等)無法描述的特徵。

2. 方法:網絡拓撲結構

不同於節點之間的兩兩關係,或者描述節點特徵的指標(例如中心度),網絡的拓撲性質是對網絡整體的宏觀描述。這項研究利用的方法是 Persistent homology(持續同調),這裡只做簡單介紹,具體如下圖所示:

圖4. 網絡的拓撲結構示意圖

圖4中A代表的網絡,如果點與點之間的距離分別為i,j,k時,分別能夠連接的邊組成的網絡依次如圖4C所示。而如果n個點之間兩兩都有連接,那麼這樣的群體在圖4b中用不同顏色表示,不同顏色對應的數字對應這些節點在相應拓撲維度上的 homological dimension(同調維數)。而圖中的圓圈被稱為結構洞,指在這樣的距離上,結構洞周圍的節點在拓撲上是等價的。

對網絡拓撲及Persistent homology感興趣的讀者,可以參考下面的論文:

Mehmet E Aktas, Esra Akbas, and Ahmed El Fatmaoui. Persistence homology of networks: methods and applications. Applied Network Science, 4(1):61, 2019.

複雜科學最新論文

相關焦點

  • Arxiv網絡科學論文摘要14篇(2020-09-28)
    >在真實的城市環境中評估出行方式與SARS-CoV-2爆發之間的相互作用;使用時間序列預測模型進行COVID-19大流行預測;網絡博弈中來自簡單局部規則的複雜數據的湧現;COVID-19型病毒的年齡結構修正SIR模型;帶有循環的網絡上概率模型的消息傳遞;在多元時間序列上使用雙向LSTM預測COVID-19病例;
  • 模擬交通網絡和地區之間的相互作用:共同演化方法 | 網絡科學論文速遞5篇
    Raimbault摘要: 交通網絡和領土之間的相互作用是開放式科學辯論的主題,特別是關於網絡結構效應的可能存在,以及與地域發展的關鍵實際問題相關聯。我們通過共同演化提出了一個條目,特別是通過交通網絡和地區之間的共同演化過程建模。
  • Arxiv網絡科學論文摘要9篇(2020-12-03)
    揭示人類流動性的社會經濟方面;通過平均網絡流衡量網絡的穩健性;節約大量公共池資源的集體行動動態;MAUIL:半監督用戶身份連結的多級屬性嵌入;與氣藏定量供應安全相關的重要措施;現實網絡中領導節點湧現的分層路徑;愛與恨一線之隔:使用回聲建模種族主義在線社區的動力學;
  • Arxiv網絡科學論文摘要6篇(2021-01-13)
    混合隨機網絡混合了優先連接和均勻連接機制;後處理分層社區結構:質量改進和多尺度視圖;關於網絡複雜性的估計:圖元的維數;統計物理學啟發的模型,用於驅動市場供需的內在波動;//arxiv.org/abs/2101.04611作者: Tiandong Wang, Panpan Zhang摘要: 由於網絡數據的複雜性,我們提出了一種有向混合隨機網絡,該網絡將優先連接(PA)規則與統一附件(UA)規則混合在一起。
  • Arxiv網絡科學論文摘要12篇(2020-09-25)
    可以控制所有三個網絡維度,即節點,邊和時間,以減少此類混亂並提高可讀性。本文提出了一種在線且非均勻的分時方法,從而考慮了底層網絡結構並解決了流網絡分析問題。我們使用兩個真實世界的網絡進行了實驗,以比較我們的方法與統一和不統一的時間分配策略。結果表明,我們的方法會自動選擇可在事件突發期間有效減少視覺混亂的時間片。結果,基於全局時間模式識別的決策變得更快,更可靠。
  • Arxiv網絡科學論文摘要20篇(2020-11-12)
    科學期刊中出版物數量的重尾分布;在Instagram上表徵和檢測贊助的網紅文章;人群在反制錯誤信息中的作用:以COVID-19信息流行病為例;在不理解網絡微觀結構的情況下影響社會網絡的動態;平衡選民模型中保守和破壞性的增長;小調查事件檢測;將OpenStreetMap與知識圖譜連結-對與模式無關的自願性地理信息的連結發現
  • Arxiv網絡科學論文摘要18篇(2020-07-28)
    該論文模擬了COVID-19在美國德拉瓦州的傳播情況,其中有近一百萬個隨機主體。歷時15周,時間戳為1小時的結果表明,哪些地方成為了感染的中心。該論文還說明了在疫情暴發時醫院如何變得不堪重負。我們的方法包括在不重疊的時間窗口上構建連接序列張量,在這些張量之間進行相似性度量以及在這些時間窗口的相似性網絡中進行社區檢測。經驗時間網絡數據的實驗表明,在有效地揭示可解釋的系統狀態方面,我們的方法優於使用簡單網絡聚合的傳統方法。此外,我們的方法允許用戶分析分層的時間結構,並發現處於不同時空解析度的動態狀態。
  • Arxiv網絡科學論文摘要16篇(2020-08-26)
    我們表明,區域檢疫政策的有效性取決於(i)相互作用的網絡是否滿足均衡增長的條件,(ii)感染的檢測延遲很短,以及(iii)政府控制必要的知識網絡的各個部分(沒有行為洩漏)。由於通常無法滿足這些條件,尤其是在跨界互動時,因此,我們表明,如果政府積極主動,則有可能取得實質性改善:在對鄰居的感染率做出反應時觸發隔離,有時甚至在內部檢測到感染之前。
  • Arxiv網絡科學論文摘要17篇(2020-10-06)
    本文試圖通過從部分觀測到的數據中學習模型來從擴散網絡和網絡結構中推斷出未觀測到的數據。我們開發了一個稱為「 DiffStru」的概率生成模型,以共同發現網絡結構的隱藏連結和被忽略的擴散活動。該方法通過學習耦合的低維潛在因子,利用節點之間的連結與級聯過程之間的相互關係。除了推斷看不見的數據外,學習到的潛在因素還可以幫助解決網絡分類問題,例如社區檢測。
  • Arxiv網絡科學論文摘要17篇(2020-08-28)
    但是,儘管已被廣泛使用,但目前對神經網絡的圖結構與其預測性能之間的關係知之甚少。在這裡,我們系統地研究了神經網絡的圖結構如何影響其預測性能。為此,我們開發了一種新的基於圖的神經網絡表示形式,稱為關係圖,其中神經網絡計算的各個層對應於沿圖結構的各輪消息交換。
  • Arxiv網絡科學論文摘要10篇(2020-10-14)
    在本文中,我們通過觀察關鍵字共現網絡的結構和變化來研究科學的發展。從七個目標物理領域及其由韓國物理學會專家選擇的初始關鍵字開始,我們使用我們提出的方法生成了關鍵字共現網絡,可以更好地刻畫拓撲結構。這樣,我們可以從一小部分初始關鍵字中構建一個更相關,更豐富的關鍵字網絡。通過這些網絡,我們可以通過檢測社區並提取每個社區的核心關鍵字來成功地確定科學子領域。
  • Arxiv網絡科學論文摘要16篇(2020-08-18)
    在這裡,我們通過關注兩個知識社區(發明家和物理學家)研究集體記憶和注意力的時間變化。我們使用來自美國專利商標局(USPTO)的專利數據和在美國物理學會(APS)上發表的物理學論文來量化集體遺忘隨著時間的變化。該模型使我們能夠區分遺忘的兩個分支。一個分支是短暫的,直接從溝通記憶變成遺忘。另一個是長期存在的,從交流到文化記憶再到遺忘。數據分析顯示,隨著信息的增長,兩個社區的遺忘率都在增加。
  • Arxiv網絡科學論文摘要15篇(2020-09-29)
    : http://arxiv.org/abs/2009.13009作者: Federico Forte摘要: 本文提供了阿根廷銀行間貨幣市場的第一個經驗網絡分析。Porter摘要: 在網絡上的傳染病研究中,研究人員計算了流行閾值,以此作為信息手段,有助於預測疾病最終是否會感染大部分人口。網絡的結構通常會隨時間變化,這從根本上影響了傳播過程的動態,進而影響疾病傳播的流行閾值。
  • Arxiv網絡科學論文摘要18篇(2020-11-17)
    我們觀察到,在具有反饋的問題序列中,具有較高專業知識和社會信心的人被賦予較高的人際影響力。我們還觀察到,績效不佳的人往往會低估其績效高的隊友的專業知識。基於這些觀察,我們介紹了三個假設,並為它們的有效性提供了經驗和理論支持。我們報告有關交互記憶系統,社會比較和對社會影響力起源的信心啟發法的長期理論的經驗證據。我們提出了一個受這些理論啟發的認知動力學模型來描述個人隨著時間調整人際影響的過程。
  • Arxiv網絡科學論文摘要6篇(2020-07-27)
    我們提供了許多案例研究,這些案例研究說明了語言,歷史和其他因素如何影響了歐洲的社會網絡。我們還將研究社會聯繫的影響。我們的結果為理論模型提供了經驗支持,這些理論表明社會網絡在個人旅行決策中起著重要作用。我們研究了地區與其他歐洲國家之間的聯繫程度差異,發現歐洲懷疑論與更高水平的國際聯繫之間存在負相關關係。
  • Arxiv網絡科學論文摘要17篇(2020-12-01)
    Cegan, Igor Linkov摘要: 由於全球網絡因單個節點和連接中斷而失敗,因此COVID19大流行凸顯了供應鏈中缺乏彈性。通過對現有針對防災能力的疫苗和藥品供應鏈出版物的概述,以及最近發表的報導跨多個領域的供應鏈防災能力建模的論文,我們發現供應鏈防災力模型很少,而且大多數都針對個體。
  • Arxiv網絡科學論文摘要19篇(2020-07-09)
    因此,在空間網絡內考慮動力學傳輸模型,該模型表徵了不同地點,例如村莊,城市,國家等。分析並定義了節點中的傳輸條件。最後,通過有限體積的IMEX方法在網絡上對模型進行數值求解,該方法能夠保持與擴散極限的一致性,而不受尺度參數的限制。報告了幾個簡單流行網絡結構的數值測試,並證實了模型正確描述流行病傳播的能力。
  • Arxiv網絡科學論文摘要15篇(2020-07-30)
    網絡彈性;穩定社區結構和社會排斥;在引用圖中找到科學共同體:收斂聚類;推薦系統中使用基於頻率的雙哈希減少模型尺寸;墨西哥城市聯繫網絡;多車道多類流量混合系統的平均場極限;CommuNety:預測凝聚性社交社區的深度學習系統;災難調查:了解超級旋風孤兒的後遺症和社交媒體的幫助
  • Arxiv網絡科學論文摘要22篇(2020-08-04)
    校正社會人口統計學選擇偏差,以從社交媒體準確預測人口;TA-Dash:用於時空交通分析的交互式儀錶板——演示論文;使用起步和引導來緩解逆火效應;從值機、犯罪和事件響應數據聯合學習的用於巡邏高風險區域的多警察巡邏路線;用於對比網絡分析的可視化分析框架;100,000,000,000個網絡數據包的多時相分析和尺度關係
  • Arxiv網絡科學論文摘要14篇(2020-09-09)
    為了回答這些問題,我們從連結開放數據提供商YAGO中提取了一個由12,500多名知識分子組成的影響力網絡。我們從縱向角度豐富了該網絡,並分析了整個網絡的時間分段預測,以區分時代內部,時代之間和累積時代的網絡。因此,我們確定了知識分子和時代的各種模式,並及時研究了他們的發展。我們展示了哪些學者在不同時代最具影響力,以及誰扮演了傑出的知識經紀人角色。