網絡科學前沿:尋找複雜網絡中人類信息處理的普遍模式

2020-08-28 集智俱樂部


導語

什麼樣的交流,能夠言簡意賅地傳遞信息?通過實驗,結合對真實世界的文學、科學、音樂所呈現的網絡特徵進行的研究,6月15日,發表在Nature Physics的論文「複雜網絡中的人類信息處理」,揭示了有效交流需要滿足的兩個特徵。

論文題目: Human information processing in complex networks 論文地址:https://www.nature.com/articles/s41567-020-0924-7

1. 如何用網絡科學研究人類交流

在人類社會,不管是交談、寫作還是欣賞音樂,這些交流都有共同點,就是他們都可以抽象為一串離散的字符。由此進一步地將這些字符串分為一個個的組件,而後將這些組件作為網絡節點,並且將連接這些組件的轉折性詞句作為網絡連邊。借鑑這樣的思路,我們就通過網絡科學的工具來研究人類的交流行動。之前的研究中,人們關注的是網絡本身的複雜度和其存在的規律。然而,不論是語言還是音樂,其唯一的目的就是交流思想與情感,而交流是否高效,取決於接收信息的人如何反應。因此該研究的創新點在於首次用網絡科學的工具來研究信息如何被接受,其信息傳播過程中會呈現出怎樣的規律。

不論是閱讀還是交談,我們的大腦總在不斷地,對將要面對的交流內容進行預判,並根據和事實的吻合程度,實時地修正預測。這在認知科學中,這被稱為預測編碼理論。

另一個和該研究相關的,是集智之前介紹過的最優學習率,即在學習新知識時,15%的未知信息搭配85%的熟悉內容,能夠讓大腦最高效地吸收新的知識。而本研究的則將問題翻轉,即探尋所交流所使用到的質料,需要滿足何種結構,才能契合大腦固有的特徵,從而使交流更加高效?在引入網絡之前,對於一個字符串中包含了多少信息,量化的指標來自香農提出的「信息熵」。然而該定義描述的是信息產生者所產生意外的多少,而不是信息接收者所獲取的信息。使用交叉熵,可以量化信息接收者預期和發送者之間的差異。

2. 大腦對交流的預期比想像的複雜

當我們聽到出乎意料的消息時,往往會錯愕得說不出話來。本研究的實驗部分,通過測量受試者在接到信息和做出行動之間的時間差,來研究大腦在接收信息時,如何對信息進行預期管理。

受試者的右手5個手指分別對應鍵盤的Space、H、J、K、L這5個按鍵,根據指令按下按鍵。一共有5組刺激受試者的指令(stimuli),每一組指令要求受試者按下1個或2個標紅的按鍵,如下圖a所示。

圖1:實驗設計示意圖

上圖a中,可能的按鍵為5+5×4/2一共15種,每一組指令,看成網絡中的節點。網絡中節點間的邊,代表可以從該節點轉換到其他節點,具體的轉換順序由隨機遊走決定。每名受試者需完成1500次實驗。

圖2:信息熵和反應時間呈正相關

在一個根據ER模型生成的、包含30條邊的隨機網絡中,從點a到點b的信息熵為該點度數的對數,意味著一個節點的度數越高,在隨機行走中,從這個點出發,下一個節點就對應越多的可能。因此可以說從這點出發,帶來的意外越明顯。例如上圖左邊紅色的節點,其度數為8時對應的意外值為3。

由於實驗會持續1500次,如果節點a總是連接節點b,那麼受試者就能在短期記憶中,存儲這一練習。由此節點間不同的信息熵就對應著不同的反應時間。上圖右邊,橫軸為節點的意外值,縱軸為反應時間,該圖顯示,意外值每增加1,反應時間平均增加32毫秒。

圖3:網絡中的位置影響信息接收的程度

在第二階段的實驗中,網絡從隨機網絡變為了上圖左邊的網絡,圖中所有節點,按照前文的信息熵來看,是相同的。然而如果將連接模式分為三類,可以看到不同模式對應的反應時間差異明顯(右圖)。由此說明,單一的信息熵指標無法反映認知過程的複雜性。

圖4:模塊化網絡示例圖

相比平均度數為4的隨機網絡,上圖的網絡中,每個節點之間的邊,都是對稱的,沒有哪個節點是特殊的。這樣的網絡結構被稱為模塊化網絡(modular network)。該網絡下的反應時間相比於隨機網絡平均高24毫秒,說明在該網絡下,人腦預期的意外更少、交流更高效。

3. 信息接收者與發送者之間存在預期差異

圖5:信息接收者對傳播矩陣的預期

在上述實驗中,最初受試者並不清楚網絡的結構,因此其對於每個新的按鍵序列是什麼,都是「意外」的。如上圖左邊所示,圖中每條邊的顏色,代表受試者對該邊的預期。隨著實驗的進行,受試者對邊的預期逐漸變為中間的圖,而最左邊代表受試者的預期和真實情況完全相同,最右邊的圖則表示受試者的預期與真實情況完全不同。

用數學的語言來定義,信息接收者預期的概率轉移矩陣,也即真實網絡中矩陣的交叉熵(等式左邊),可以拆分為兩部分。一是信息傳播者本身的信息熵(等式右邊第一項),二是兩個矩陣的KL散度(等式右邊第二項)。前者是信息傳播固有的,後者描述了交流過程中所產生的效率損失。

圖6:不同網絡結構下交叉熵與預期係數的關係

將信息接收者對網絡結構的掌握程度,用η來表示,如上圖中橫軸。對比不同情況下的交叉熵,當接收者完全了解網絡的轉換方式時,KL散度為0,當完全不知時,交叉熵是最低值的一倍。之所以代表模塊化網絡的藍色,能夠讓受試者的平均反應時間減少24秒,是因為隨著η的減少,其交叉熵下降更快,交流中預期和真實不符的情況會更少。

4. 真實網絡與隨機網絡的差別

上述實驗,確定了分析工具,部分回答了本文預期要解決的問題,即怎樣的溝通是高效的。例如上文的實驗中,如果溝通的目的,是讓受試者了解網絡對應的轉移矩陣,那麼模塊化的網絡結構是最優的。然而這和真實世界中的交流,又有何種聯繫?

圖7:李爾王和麥克白的人際網絡

上圖是莎士比亞四大悲劇中《李爾王》和《麥克白》對應的人物網絡圖,網絡中的點是戲劇中出現的人物,邊代表人物間的交流。上述的真實網絡,假設其反映的交流模式是高效的,通過將其與具有相同網絡特徵的隨機網絡對比,看兩者在上述的分析工具上,例如在交叉熵和KL散度上,有什麼不同之處,由此可以揭示出高效交流所具有的特徵。

該文研究的真實交流模式,包含了6大類總共40種,分別是傳統文學,語義網,網際網路,論文引用網絡,社交網絡,音樂。包含了大部分基於字符串的人類交流模式。

例如將語句中的名詞作為節點,將名詞間的轉折作為邊。通過在這樣的微觀層次進行建模,網絡科學使得交流過程中所呈現的結構,得以被量化地研究。

將網絡中的連接隨機化後,可以計算兩個網絡對應的轉移矩陣之間的KL散度和信息熵。上述6類中,傳統文學的信息熵和KL散度都最高,而音樂則兩者都相對最低。想想我們閱讀柏拉圖的名著時,覺得其中文字艱深,對接下來預期的內容也一頭霧水;而音樂本來就是用來娛樂的,這也就不難理解了。

上文的實驗說明,模塊化的網絡,能夠降低因為交流中預期和實際有所不同所帶來的低效。因此可以預期的是,真實的網絡也將會具有模塊化的特徵。例如狗、狼和貓這些詞構成的模塊中,會有更多的連接,由此使交流更加順暢。然而如果交流中只有熟悉的內容,那也是沒有什麼信息量的。因此高效的溝通,是要在網絡的異質性和模塊化結構之間找到一個合適的權衡。而真實網絡,相比隨機網絡,同時具有了異質性和模塊化結構,從而證明了網絡結構對交流效率影響巨大。

5. 三種不同的網絡結構,哪種交流效率更高

下面是一道思考題,交流過程中對應的轉移網絡接近哪一種,交流效率會最高?

圖8:無標度網絡,隨機塊網絡,層級化模塊網絡示例圖

上圖中第一個是無標度網絡,其特點是各網絡節點度的分布呈冪律分布。這樣的網絡中,最常出現的詞語對應的連接,是次多詞彙的兩倍。第二個網絡結構是隨機塊網絡(stochastic block network),其中節點的度呈正態分布,每4個節點組成一個組件,組件之類是緊密連接的,而組件之間的連接很稀疏。第三種層次化模塊網絡,其節點分布同樣遵從冪律分布,但節點間存在多個小組,因此其對應的鄰接矩陣,同時具有了上述兩者的特徵:即其中包含4個小正方形,且右上角的連接更多。結合上文所述的在異質性和模塊化結構之間的權衡,可知該思考題的答案是第三種。

具體對應到現實交流過程中,第一種過度強調核心概念,在講解時東一榔頭西一棒槌,導致網絡的模塊化程度太低,接收者會難以找到對下一個話題的預期;第二種將觀點拆分成了幾塊,每塊分別講透,但沒有重點,模塊之間也沒有過渡,接收者會覺得缺乏信息量。

而最好的交流,是將核心概念拆分後,按照輕重緩急,分塊講清楚。這樣讀者就不會覺得這一部分新概念太多難以理解,也能感到每閱讀一節,都能帶來新的意外,由此使溝通最為高效。定量來看,就是相比隨機網絡,信息熵的差更大,KL散度的差更小。

圖9:三種網絡結構下,真實和模擬的信息熵和KL散度之差

上圖中,橫軸代表的信息熵之差,代表了該網絡能傳遞的「意外」相比隨機網絡差距有多少。這個值越大,說明該網絡結構對應的交流模式,能夠承載更多的信息。縱軸代表的KL散度之差,代表了相比隨機情況,該交流模式,避免了多大程度的低效溝通或學習障礙。

圖中表現最好的,無疑是淺綠色代表的層級化模塊網絡。圖中黑色的菱形對應的真實網絡,正好落在了兩種不同參數的層級化模塊網絡的交點處,說明真實網絡的形成遵循層級化模塊網絡的生成方式,在模塊化和異質性之間,找到了最佳的權衡。

將該文的研究結果,應用到生活中。假設你在準備一個十分重要的演講,你可以將要傳遞的觀點,分解成幾個關鍵詞,再將每個關鍵詞進一步拆分,植入到你的思維導圖中:每一個節點代表一句話,每個節點包含幾個關鍵詞。之後你可以通過調整詞句的順序,使得相鄰的自然段之間具有高內聚性,同時讓最重要的核心詞和每個模塊都能建立連接。

在設計人際交互界面時,同樣可以依據本文提出的框架,來定量地考察何種交流模式更為高效。例如APP的界面上,如何讓主界面上的按鈕彼此有所不同,同時在每個子菜單之間的按鈕相互有緊密的聯繫。

人類的交流模式,為何會呈現出本文所發現的規律?是否和大腦本身的結構有關,兩者如何共同進化?這是基於本文的研究,需要進一步研究和回答的問題。除此之外,本研究假設交流中的規律符合馬爾可夫鏈的齊次性假設,即不存在概念間的長程連接。然而現實中並非如此,隨著認知科學的進步,非馬氏的人類交流存在何種規律也是值得研究的。


作者:郭瑞東

審校:劉華林、曾祥軒

編輯:張希妍

相關焦點

  • 網絡科學前沿:尋找複雜網絡中人類信息處理的普遍模式
    通過實驗,結合對真實世界的文學、科學、音樂所呈現的網絡特徵進行的研究,6月15日,發表在Nature Physics的論文「複雜網絡中的人類信息處理」,揭示了有效交流需要滿足的兩個特徵。如何用網絡科學研究人類交流 在人類社會,不管是交談、寫作還是欣賞音樂,這些交流都有共同點,就是他們都可以抽象為一串離散的字符。由此進一步地將這些字符串分為一個個的組件,而後將這些組件作為網絡節點,並且將連接這些組件的轉折性詞句作為網絡連邊。借鑑這樣的思路,我們就通過網絡科學的工具來研究人類的交流行動。
  • 前沿綜述:大腦結構網絡、功能網絡和網絡控制中的物理學
    表徵是如何在腦中傳遞?知識怎樣修正?解答大腦複雜系統的一系列謎題,物理學視角越來越重要。Nature reviews Physics 一篇綜述文章,從大腦的結構網絡、功能網絡和網絡控制的角度,梳理了物理學在腦科學研究中的進展。本文是對這篇綜述的概述。
  • 前沿綜述:大腦結構網絡、功能網絡和網絡控制中的物理學
    、功能網絡和網絡控制的角度,梳理了物理學在腦科學研究中的進展。深入淺出地介紹了統計物理、資訊理論和動態系統控制等模型、直覺和理論在腦結構與功能網絡中的使用。在物理學中,人們普遍認為這樣的結構連接決定了系統的宏觀尺度特徵。
  • 人怎樣理解複雜關係?PNAS刊文提出「圖學習」,認知科學與網絡科學...
    導語  人類的大腦具有很多高級的功能, 例如 接受、存儲和交換信息,並且從很小時候開始,人類就有了把環境抽象成網絡的能力,從而認識各種複雜關係,包括人際關係、事件關係等等人類是如何學習和表示網絡的?這一問題需要認知科學與網絡科學攜手解決。  2020年11月23日發表於《美國國家科學院院刊》PNAS的論文中,作者引入「圖學習」這一交叉領域,探索了人類如何學習網絡結構,網絡結構又如何影響人類認知。
  • 【中國科學報】複雜網絡研究:讓世界變得簡單
    影響廣泛而深遠的複雜網絡  在2016年度國家自然科學獎二等獎中就有一項是關於複雜網絡研究的——由中國科學院數學與系統科學研究院研究員呂金虎牽頭完成「複雜動態網絡的同步、控制與識別理論與方法」。呂金虎向《中國科學報》記者舉例說,「社交網絡通過網絡這一載體把人們聯繫起來,通過社交網絡的人類行為動力學分析,在原本雜亂無章的視頻和事件之間建立網絡關聯,找到關鍵線索—— 一個人有自己特定的社交網絡,具有一些特殊的愛好和習慣,結合起來就有望找到潛在的恐怖分子。」  複雜動態網絡是系統與控制科學的前沿與熱點研究領域。
  • 搭建圖與網絡之間的橋梁:網絡科學的下一個突破在哪裡?
    來自中歐大學的網絡科學研究者,在Nature子刊Communications Physics上發表文章 Bridging the gap between graphs and networks,討論如何將網絡科學解決現實問題的經驗引入圖論運營,同時將圖論中的前沿數學成果帶入網絡科學。在數據驅動下,架起圖與網絡之間的橋梁,網絡科學將有機會迎來更大的突破。
  • 重新定義網絡安全!量子信息科學這麼神奇?
    博士生布萊恩·柯比(左)、丹尼爾·瓊斯(中)和麥可·布羅斯基(右)在美國馬裡蘭州的阿德爾菲市的RDECOM研究實驗室的量子網絡試驗臺旁邊,他們正在為戰場上的作戰人員研發更安全可靠的通信手段。近年來,雷射、納米物理學、量子光學和光子學等領域的長足進步,催生了一門新的學科——量子信息科學(Quantum Information Science,簡稱QIS),它的研究對象是量子系統中的編碼信息,包括了量子計算、量子通信和量子傳感等子領域。學界普遍認為,量子信息科學有潛力在未來帶來一場信息處理方式的重大變革。
  • 怎樣理解複雜關係?PNAS提出圖學習,認知與網絡科學擦出火花
    ,例如接受、存儲和交換信息,並且從很小時候開始,人類就有了把環境抽象成網絡的能力,從而認識各種複雜關係,包括人際關係、事件關係等等。人類是如何學習和表示網絡的?這一問題需要認知科學與網絡科學攜手解決。甚至是只有8個月大的孩子也能發現口語中的統計規律,從而確定單詞之間的界限。這些事件都可以看成複雜的網絡結構,而人腦的這種能力使得我們快速而準確地學習這些網絡結構。人類是如何學習的為了認知人類是如何學習的,讓我們從一個簡單的實驗開始。構建一串由四個偽單詞組成的連續序列,序列中每個偽單詞都由3個音節組成,如圖1A所示。
  • 神經網絡算法原理_神經網絡算法的應用_神經網絡算法實例說明
    神經網絡是一種模擬人腦結構的算法模型。其原理就在於將信息分布式存儲和並行協同處理。雖然每個單元的功能非常簡單,但大量單元構成的網絡系統就能實現非常複雜的數據計算,並且還是一個高度複雜的非線性動力學習系統。   神經網絡的結構更接近於人腦,具有大規模並行、分布式存儲和處理、自組織、自適應和自學能力。
  • 什麼是人工智慧神經網絡? 神經網絡是怎麼應用到各領域的?|什麼|...
    人腦中的神經網絡是一個非常複雜的組織,成人的大腦中約有1000億個神經元,人類至今仍在探索人腦的工作原理。而人們通過對生物神經元的研究和理解,構建了一個模擬人腦的計算模型:人工神經網絡!   那麼,人工神經網絡是什麼?人類通過構造神經網絡,能否給AI賦能,使之自我進化?   什麼是神經網絡?
  • 科學的奇妙世界:肺部細胞形成複雜網絡(組圖)
    肺部細胞形成複雜網絡  照片拍攝的是一個4米高、5米寬、2.5米深的立體模型,代表了肺的內皮細胞在形成血管時所產生的受力網絡。用戶可以控制細胞內參與能量循環過程中的生化系統,探索光合作用和植物呼吸的機制。  人類流動的社區  這是伊利諾州的西北大學複雜系統研究小組的兩名學生製作的視頻作品。作品通過金錢的流動揭示了人類的遷徙。創作人員藉助美元跟蹤網站Where"sGeorge?(美元上有美國首任總統喬治·華盛頓頭像)的信息,創作出美國大眾遷徙的圖畫。
  • 用複雜網絡和群體智慧理解鄧巴數
    原創 郭瑞東 集智俱樂部 來自專輯複雜科學前沿2020導語牛津大學人類學家羅賓·鄧巴,根據實際觀察,發現人類及猿猴的社交網絡,一般來說,大小為150左右,這就是所謂的鄧巴數。
  • JMC|基於網絡的方法在藥物研發中的應用
    引言網絡理論為研究複雜系統提供了有效的分析工具。義大利博洛尼亞大學Maurizio Recanatini教授近期在JMC綜述了網絡科學在藥學研究中的應用。網絡的元素稱為節點(nodes),它們之間的連接被稱為連結(links)或邊(edges)。基於網絡的方法在一定程度上已經影響了尋找新療法的方式。
  • PNAS前沿:遨遊在雙曲空間中的大腦網絡
    多尺度人腦結構網絡的自相似性經過億萬年的演化,人類大腦已發展出了多層次、多尺度且能支持最強腦功能的複雜網絡結構。在單一的觀測尺度下,人們發現大腦網絡具有一系列的結構特徵,如小世界、高聚類、無標度、社區結構、富人俱樂部等。神奇的是,從神經元和神經元連接形成的網絡到腦區與腦區相互作用的網絡,人腦在不同尺度下都呈現出非常豐富的結構特徵,並保持著千絲萬縷的聯繫。
  • 今日Paper|點雲分類框架;多模式Transformer;神經網絡;有序神經元等
    目錄用於行人重識別的三元組在線實例匹配丟失用於DSTC8 AVSD挑戰的帶指針網絡的多模式TransformerPointAugment:一種自動增強的點雲分類框架尋找稀疏、可訓練的神經網絡但這兩個損失函數都有缺點,OIM損失對所有樣本均等對待,沒有關注困難樣本,三重損失以複雜且繁瑣的方式來處理批處理樣本,因此收斂速度很緩慢。針對這些問題,這篇論文提出了三元組在線實例匹配(TOIM)損失函數,該函數能著重於困難樣本並能有效地提高行人重識別模型的準確性。TOIM結合了OIM損失和Triplet損失的優點,並簡化了批處理過程,從而使收斂更快。
  • 《悟空傳》丨從這裡再看網絡文學與網絡新人類
    這樣的文學並不適宜多加閱讀,然而在忙碌的現實中,人們將偶爾的閒暇都投入到網絡中,漸漸失去了深閱讀與深思。這時粗糙構思與敘事的網絡文學便為碎片化的閱讀提供了成長的土壤。這麼看來,網絡文學的存在發展,是與網絡人類相輔相成的。網絡文學因人而發生改變,人也不知不覺受閱讀作品的潛移默化。從這裡反觀當年的《悟空傳》,我想它能夠受人追捧,是因為它符合了很多人的真實心態。
  • 大腦皮層神經網絡測量取得新突破
    來源:科技日報科技日報北京10月31日電 (記者顧鋼)哺乳動物的大腦具有大量神經細胞和極高的通信密度,是已知最複雜的網絡。德國馬普腦科學研究所的一項研究是繪製哺乳動物大腦的腦組織圖,記錄局部結締組織,並對其進行分析,以尋找之前學習過程的痕跡。研究成果發表在近期《科學》雜誌上。大腦研究到目前為止僅能檢查大腦網絡的一部分。「連接組學」這一新領域正致力於測量不同大腦區域和動物中更大的迴路。
  • 全網天下:企業網絡上出現負面信息如何處理
    基本上很多企業都會碰見網絡上出現自己的負面信息,有些是客戶投訴的,有些是競爭對手發布的等等很多出現形式;網上很多朋友諮詢徐國祥,怎麼壓制企業負面信息,其實很多企業想到的就是刪帖,在這裡徐國祥不建議去刪帖,下面具體談下企業網絡上出現負面信息如何處理;全網天下品牌覆蓋
  • 類腦計算:從神經網絡到真正的人工智慧丨 CCF-GAIR 2019
    他表示,計算神經科學在腦科學和人工智慧之間起到了橋梁的作用。目前,深度學習在靜態物體的識別上已經超過了人類,但還有很多的工作是深度學習做不好的,其中之一就是時空動態的模式識別。這個問題對人腦來說是非常簡單的,但深度學習並不擅長這個。為什麼時空動態模式識別特別重要?
  • 模仿人腦視覺處理,助力神經網絡應對對抗性樣本
    當今計算機視覺的主要體系結構是卷積神經網絡(CNN)。當卷積層疊加在一起時,可以學習和提取圖像中的層次特徵。較低的圖層找到一般的模式,如角落和邊緣,而較高的圖層逐漸變得善於找到更具體的東西,如物體和人。神經網絡的每一層都將從輸入圖像中提取特定的特徵。與傳統的全連接網絡相比,卷積神經網絡已被證明是更加健壯和計算效率更高的。