導語
什麼樣的交流,能夠言簡意賅地傳遞信息?通過實驗,結合對真實世界的文學、科學、音樂所呈現的網絡特徵進行的研究,6月15日,發表在Nature Physics的論文「複雜網絡中的人類信息處理」,揭示了有效交流需要滿足的兩個特徵。
論文題目: Human information processing in complex networks 論文地址:https://www.nature.com/articles/s41567-020-0924-7
在人類社會,不管是交談、寫作還是欣賞音樂,這些交流都有共同點,就是他們都可以抽象為一串離散的字符。由此進一步地將這些字符串分為一個個的組件,而後將這些組件作為網絡節點,並且將連接這些組件的轉折性詞句作為網絡連邊。借鑑這樣的思路,我們就通過網絡科學的工具來研究人類的交流行動。之前的研究中,人們關注的是網絡本身的複雜度和其存在的規律。然而,不論是語言還是音樂,其唯一的目的就是交流思想與情感,而交流是否高效,取決於接收信息的人如何反應。因此該研究的創新點在於首次用網絡科學的工具來研究信息如何被接受,其信息傳播過程中會呈現出怎樣的規律。
不論是閱讀還是交談,我們的大腦總在不斷地,對將要面對的交流內容進行預判,並根據和事實的吻合程度,實時地修正預測。這在認知科學中,這被稱為預測編碼理論。
另一個和該研究相關的,是集智之前介紹過的最優學習率,即在學習新知識時,15%的未知信息搭配85%的熟悉內容,能夠讓大腦最高效地吸收新的知識。而本研究的則將問題翻轉,即探尋所交流所使用到的質料,需要滿足何種結構,才能契合大腦固有的特徵,從而使交流更加高效?在引入網絡之前,對於一個字符串中包含了多少信息,量化的指標來自香農提出的「信息熵」。然而該定義描述的是信息產生者所產生意外的多少,而不是信息接收者所獲取的信息。使用交叉熵,可以量化信息接收者預期和發送者之間的差異。
當我們聽到出乎意料的消息時,往往會錯愕得說不出話來。本研究的實驗部分,通過測量受試者在接到信息和做出行動之間的時間差,來研究大腦在接收信息時,如何對信息進行預期管理。
受試者的右手5個手指分別對應鍵盤的Space、H、J、K、L這5個按鍵,根據指令按下按鍵。一共有5組刺激受試者的指令(stimuli),每一組指令要求受試者按下1個或2個標紅的按鍵,如下圖a所示。
圖1:實驗設計示意圖
上圖a中,可能的按鍵為5+5×4/2一共15種,每一組指令,看成網絡中的節點。網絡中節點間的邊,代表可以從該節點轉換到其他節點,具體的轉換順序由隨機遊走決定。每名受試者需完成1500次實驗。
圖2:信息熵和反應時間呈正相關
在一個根據ER模型生成的、包含30條邊的隨機網絡中,從點a到點b的信息熵為該點度數的對數,意味著一個節點的度數越高,在隨機行走中,從這個點出發,下一個節點就對應越多的可能。因此可以說從這點出發,帶來的意外越明顯。例如上圖左邊紅色的節點,其度數為8時對應的意外值為3。
由於實驗會持續1500次,如果節點a總是連接節點b,那麼受試者就能在短期記憶中,存儲這一練習。由此節點間不同的信息熵就對應著不同的反應時間。上圖右邊,橫軸為節點的意外值,縱軸為反應時間,該圖顯示,意外值每增加1,反應時間平均增加32毫秒。
圖3:網絡中的位置影響信息接收的程度
在第二階段的實驗中,網絡從隨機網絡變為了上圖左邊的網絡,圖中所有節點,按照前文的信息熵來看,是相同的。然而如果將連接模式分為三類,可以看到不同模式對應的反應時間差異明顯(右圖)。由此說明,單一的信息熵指標無法反映認知過程的複雜性。
圖4:模塊化網絡示例圖
相比平均度數為4的隨機網絡,上圖的網絡中,每個節點之間的邊,都是對稱的,沒有哪個節點是特殊的。這樣的網絡結構被稱為模塊化網絡(modular network)。該網絡下的反應時間相比於隨機網絡平均高24毫秒,說明在該網絡下,人腦預期的意外更少、交流更高效。
圖5:信息接收者對傳播矩陣的預期
在上述實驗中,最初受試者並不清楚網絡的結構,因此其對於每個新的按鍵序列是什麼,都是「意外」的。如上圖左邊所示,圖中每條邊的顏色,代表受試者對該邊的預期。隨著實驗的進行,受試者對邊的預期逐漸變為中間的圖,而最左邊代表受試者的預期和真實情況完全相同,最右邊的圖則表示受試者的預期與真實情況完全不同。
用數學的語言來定義,信息接收者預期的概率轉移矩陣,也即真實網絡中矩陣的交叉熵(等式左邊),可以拆分為兩部分。一是信息傳播者本身的信息熵(等式右邊第一項),二是兩個矩陣的KL散度(等式右邊第二項)。前者是信息傳播固有的,後者描述了交流過程中所產生的效率損失。
圖6:不同網絡結構下交叉熵與預期係數的關係
將信息接收者對網絡結構的掌握程度,用η來表示,如上圖中橫軸。對比不同情況下的交叉熵,當接收者完全了解網絡的轉換方式時,KL散度為0,當完全不知時,交叉熵是最低值的一倍。之所以代表模塊化網絡的藍色,能夠讓受試者的平均反應時間減少24秒,是因為隨著η的減少,其交叉熵下降更快,交流中預期和真實不符的情況會更少。
上述實驗,確定了分析工具,部分回答了本文預期要解決的問題,即怎樣的溝通是高效的。例如上文的實驗中,如果溝通的目的,是讓受試者了解網絡對應的轉移矩陣,那麼模塊化的網絡結構是最優的。然而這和真實世界中的交流,又有何種聯繫?
圖7:李爾王和麥克白的人際網絡
上圖是莎士比亞四大悲劇中《李爾王》和《麥克白》對應的人物網絡圖,網絡中的點是戲劇中出現的人物,邊代表人物間的交流。上述的真實網絡,假設其反映的交流模式是高效的,通過將其與具有相同網絡特徵的隨機網絡對比,看兩者在上述的分析工具上,例如在交叉熵和KL散度上,有什麼不同之處,由此可以揭示出高效交流所具有的特徵。
該文研究的真實交流模式,包含了6大類總共40種,分別是傳統文學,語義網,網際網路,論文引用網絡,社交網絡,音樂。包含了大部分基於字符串的人類交流模式。
例如將語句中的名詞作為節點,將名詞間的轉折作為邊。通過在這樣的微觀層次進行建模,網絡科學使得交流過程中所呈現的結構,得以被量化地研究。
將網絡中的連接隨機化後,可以計算兩個網絡對應的轉移矩陣之間的KL散度和信息熵。上述6類中,傳統文學的信息熵和KL散度都最高,而音樂則兩者都相對最低。想想我們閱讀柏拉圖的名著時,覺得其中文字艱深,對接下來預期的內容也一頭霧水;而音樂本來就是用來娛樂的,這也就不難理解了。
上文的實驗說明,模塊化的網絡,能夠降低因為交流中預期和實際有所不同所帶來的低效。因此可以預期的是,真實的網絡也將會具有模塊化的特徵。例如狗、狼和貓這些詞構成的模塊中,會有更多的連接,由此使交流更加順暢。然而如果交流中只有熟悉的內容,那也是沒有什麼信息量的。因此高效的溝通,是要在網絡的異質性和模塊化結構之間找到一個合適的權衡。而真實網絡,相比隨機網絡,同時具有了異質性和模塊化結構,從而證明了網絡結構對交流效率影響巨大。
下面是一道思考題,交流過程中對應的轉移網絡接近哪一種,交流效率會最高?
圖8:無標度網絡,隨機塊網絡,層級化模塊網絡示例圖
上圖中第一個是無標度網絡,其特點是各網絡節點度的分布呈冪律分布。這樣的網絡中,最常出現的詞語對應的連接,是次多詞彙的兩倍。第二個網絡結構是隨機塊網絡(stochastic block network),其中節點的度呈正態分布,每4個節點組成一個組件,組件之類是緊密連接的,而組件之間的連接很稀疏。第三種層次化模塊網絡,其節點分布同樣遵從冪律分布,但節點間存在多個小組,因此其對應的鄰接矩陣,同時具有了上述兩者的特徵:即其中包含4個小正方形,且右上角的連接更多。結合上文所述的在異質性和模塊化結構之間的權衡,可知該思考題的答案是第三種。
具體對應到現實交流過程中,第一種過度強調核心概念,在講解時東一榔頭西一棒槌,導致網絡的模塊化程度太低,接收者會難以找到對下一個話題的預期;第二種將觀點拆分成了幾塊,每塊分別講透,但沒有重點,模塊之間也沒有過渡,接收者會覺得缺乏信息量。
而最好的交流,是將核心概念拆分後,按照輕重緩急,分塊講清楚。這樣讀者就不會覺得這一部分新概念太多難以理解,也能感到每閱讀一節,都能帶來新的意外,由此使溝通最為高效。定量來看,就是相比隨機網絡,信息熵的差更大,KL散度的差更小。
圖9:三種網絡結構下,真實和模擬的信息熵和KL散度之差
上圖中,橫軸代表的信息熵之差,代表了該網絡能傳遞的「意外」相比隨機網絡差距有多少。這個值越大,說明該網絡結構對應的交流模式,能夠承載更多的信息。縱軸代表的KL散度之差,代表了相比隨機情況,該交流模式,避免了多大程度的低效溝通或學習障礙。
圖中表現最好的,無疑是淺綠色代表的層級化模塊網絡。圖中黑色的菱形對應的真實網絡,正好落在了兩種不同參數的層級化模塊網絡的交點處,說明真實網絡的形成遵循層級化模塊網絡的生成方式,在模塊化和異質性之間,找到了最佳的權衡。
將該文的研究結果,應用到生活中。假設你在準備一個十分重要的演講,你可以將要傳遞的觀點,分解成幾個關鍵詞,再將每個關鍵詞進一步拆分,植入到你的思維導圖中:每一個節點代表一句話,每個節點包含幾個關鍵詞。之後你可以通過調整詞句的順序,使得相鄰的自然段之間具有高內聚性,同時讓最重要的核心詞和每個模塊都能建立連接。
在設計人際交互界面時,同樣可以依據本文提出的框架,來定量地考察何種交流模式更為高效。例如APP的界面上,如何讓主界面上的按鈕彼此有所不同,同時在每個子菜單之間的按鈕相互有緊密的聯繫。
人類的交流模式,為何會呈現出本文所發現的規律?是否和大腦本身的結構有關,兩者如何共同進化?這是基於本文的研究,需要進一步研究和回答的問題。除此之外,本研究假設交流中的規律符合馬爾可夫鏈的齊次性假設,即不存在概念間的長程連接。然而現實中並非如此,隨著認知科學的進步,非馬氏的人類交流存在何種規律也是值得研究的。
作者:郭瑞東
審校:劉華林、曾祥軒
編輯:張希妍