如何實現可靠的通信?怎樣做出更好的決策?淺談資訊理論之美

2020-11-23 遇見數學

想像一下你的任務是去設計一個幫助聯絡太空站和地面指揮總部的通信系統。該系統將發送和接收二進位編碼的信息,也就是說 1 和 0 的序列。在信息傳播的過程中,有可能會受到其他無線電信號的幹擾,以至於地面指揮部所收到的信息與原始信息並不完全相同。在這種情況下,有沒有可能設計出一種方案來實現可靠的通信呢?

一個簡單的解決方案是增加冗餘:每個比特發送若干次,比如說 5 次:

如果地面控制中心收到 11101 的信息,他們就可以相當確定發出的是 11111。雖然這個簡單的系統可以起作用(在一定程度上),但我們可以看到它是非常浪費的:我們必須對原始信息中的每一個比特發送 4 個額外的比特。因此,實際傳播率只有 20%。我們還能做得更好嗎?

「這裡似乎有一個困境:如果我們想要精確,我們必須降低傳輸速率。」

這就是克勞德·香農在他 1948 年的論文《通信的數學理論》中解決的問題。在書中,他證明了在噪聲信道上進行可靠傳輸的信息速率是存在有一個極限的(香農極限)。然而,在這個限度之下,我是用越來越小的誤差來傳輸信息。這個重要的結果告訴我們存在一種編碼,它允許在給定的信道上實現任意精度,但它沒有告訴我們如何構建它。

更準確地說,假設信道正確發送一個比特的概率為 p,相應錯誤發送一個比特的概率為 1 - p, Shannon 證明了最優傳輸速率為:

該圖形圍繞 p = 0.5 對稱,最大值在 p = 0 和 p = 1 處。p = 0 的情況很有趣,這時候信道有完美的噪聲:它剛好將原始信息中的所有比特取反。但如果我們知道了這一點,那麼信息就很容易被破譯了,我們只要把它們再取反回來就行了。

這個公式通常用「信息熵(information entropy)」來表述,這是香農設計的一種度量,可以被解釋為與信道的「不確定性」或「驚奇」的水平。

我們可以看到,當 p = 1/2 時,信息熵的值最大, H(p)=1。而當 p = 0 和 p = 1 時,熵最小。

更普遍的是,給定一個隨機信息 M, 這個信息 M 可以採取 n 種不同的值,對應概率 p ,i = 1,…, n,我們消息的熵定義為:

關於「猜猜我是誰」遊戲的例子

讓我們採取不同的方法。假設你正在玩「猜猜我是誰?」(Guess Who?)

遊戲的規則很簡單,具體玩法:

玩家各將一組24人物卡裝在遊戲底板上,並讓人物卡都站立。從自己的人物卡中各抽一名神秘人物(不要對方看到〕,此人物為自己的答案謎底。由年齡較小的人開始問對方問題,或來猜測對方到底所選取的哪個人物。問題的回答必須是"是"或"不是"、"有"或"沒有"。例如,"你選的人物是男的嗎?"或者"這個人有戴帽子嗎?"。而回復必須誠實的。一旦猜錯答案,就換對方來問問題或是猜答案。提問者通過一系列問題,逐步縮小猜測的角色範圍,先猜對者勝出。如果想要玩轉這個小遊戲,就應該問自己:我應該按什麼順序提問才能最大限度地提高獲勝機率?直覺而言,似乎首先要問的是大多數角色所擁有的特徵,是這樣嗎?

《猜猜誰》的硬核玩家實際上是要用資訊理論的方法才能獲得更佳成績。如果作為猜測者一方,所要提出好問題最好是能將餘下角色一分為二的問題,也就是說,不管答案是「是」還是「否」,都要能將一半的角色丟棄。這樣也就能通過該問題獲得最佳的信息量。

但如果你不能將角色按他們的特徵進行平均分為 2 組呢?為了回答這個問題,我們首先回顧一下熵的概念。我們可以把一個問題作為一個變量 X。這個變量有 p 的概率可以將人群分為團體 x。例如,考慮一個關於角色眼睛顏色的問題:選擇人物的眼睛是否是藍色?考慮到這一點,問題的熵就變成:

直覺告訴我們, 對於每一個可能的答案, 我們會獲得一定的信息量 log p (x), 這意味著如果我們得到答案發生該事件概率實際上相當低的話(即我們問這個角色有沒有一個很少見的特徵,並且答案是 yes 的話),那麼獲得的信息量就要比發生高概率的情況下更大。

另一方面,熵與不確定性有關。例如,如果我們擲硬幣,p = 0.5 時結果的不確定性比 p 的任何其他值都要高。在我們的例子中,不確定性越大越好。為什麼? 如果我們選擇一個無法使人口分布均勻的問題, 假設分布為 0.7 和 0.3, 很可能我們的角色是在 70%的角色中, 丟棄剩下 30%的回答 no 的團體,但隨著更平均的分布(因此不確定性更高),我們總是傾向於放棄 50%的人口,這從全局而言是更優選擇。也就意味著最好的問題是那些能最大化熵,即不確定性較高的問題。

決策樹(Decision Trees)

熵的一個常見用途是在決策樹中,決策樹的工作原理也與"猜猜我是誰"類似,通過使用一組特徵(將數據分割成不相交集合的特徵)來為分類問題構建決策流程圖(決策樹)。

一般的,一棵決策樹包含一個根節點、若干個內部結點和若干葉子結點。葉子結點對應於決策結果,其他結點則對應於一個特徵的測試。根結點包含所有樣本,每個結點包含的樣本集合根據特徵測試的結果被劃分到子結點中。從根結點到葉子結點的路徑對應了一個決策的測試序列。例如,下圖是挑西瓜的決策樹。

▲ 上圖自周志華老師. 機器學習 [M]. 清華大學出版社, 2016. 73~79

在這裡,一個常見的問題是:我們怎樣找到發揮決定性作用的特徵,並按照什麼順序「應用」這些特徵才能更好地劃分數據? 一種可能的解決方案是始終遞歸地使用最大化信息增益的特性。假設我們處理的數據集為 S ,我們選取的特徵為 X ,那麼在 S 上應用特徵 X 所獲得的信息增益為 I(S,X) ( I(S,X) 也稱為S與X的互信息),計算如下:

其中 H(S|X) 是給定 X 的情況下 S 的條件熵。直觀地,I(S,X) 就是我們知道特徵 X 的取值後數據集 S 熵的減少量。因此,選擇 X 的特性使這個值最大化是有意義的,因為他們將最大程度地減少不確定性,有效地獲取最佳的數據集劃分。

考慮每個節點上的信息增益來選擇下一個特徵的算法被稱為貪婪算法。這些算法並沒有考慮到總體信息增益,可能會導致一些情況下的次優查詢,但它們表現良好,而且有一個簡單的實現方法。

安德森鳶尾花卉數據集,也稱鳶尾花卉數據集,是一類多重變量分析的數據集。它最初是埃德加·安德森從加拿大加斯帕半島上的鳶尾屬花朵中提取的形態學變異數據,後由羅納德·費雪作為判別分析的一個例子,運用到統計學中。其數據集包含了150個樣本,都屬於鳶尾屬下的三個亞屬,分別是山鳶尾、變色鳶尾和維吉尼亞鳶尾。四個特徵被用作樣本的定量分析,它們分別是花萼和花瓣的長度和寬度。基於這四個特徵的集合,費雪發展了一個線性判別分析以確定其屬種。

例如,考慮下圖,在著名的安德森鳶尾花卉數據集上使用決策樹方法並選擇兩個特徵,花瓣寬度,首先設置閾值為 0.8 cm ,然後是 1.75 釐米。先不考慮這些特定的特性是怎麼選擇的,我們先思考為什麼要先使用 ≤0.8 ?通過計算上文所述的信息增益,我們可以找到答案。我們將以花瓣寬度 0.8 釐米為閾值的特徵稱為 X,另一個為 Y。

註:圖中使用的Gini係數與互信息類似,也是信息增益的度量,下文我們將用互信息作為信息增益的度量進行對決策樹的進一步說明。

首先應用特徵 X 劃分 150 個數據點(通常訓練集和測試集是分開的,在這裡為了簡單我們使用整個集合)為兩組: 一個包含整個山鳶尾類 (50 個點,對應於花瓣寬度≤0.8 cm), 另一個包含其餘部分。在這種情況下,計算收益:

另一方面,若先使用特徵 Y 劃分數據點,得到的兩組: 花瓣寬度≤1.75 cm組有50 個山鳶尾, 49 個變色鳶尾和 5 個維吉尼亞鳶尾;另一組沒有 山鳶尾, 1 個變色鳶尾和 45 個維吉尼亞鳶尾。這給我們帶來的收益為:

因此,從 X(花瓣寬度小於或大於 0.8 cm)獲得的信息增益大於從 Y 獲得的信息增益,我們應該首先使用特徵X。這從直觀上想是有道理的,因為先 X 可以完全將 山鳶尾類從其他兩個類中分離出來,而首先使用 Y 則會帶來更複雜的劃分。

總結

香農的工作之重要性再怎麼強調都不為過:信息理論在不同的領域有著廣泛的應用,如統計推斷和機器學習、自然語言處理、遺傳學、數據壓縮、編碼理論和密碼學。這篇《通信的數學原理》有超過 12 萬的引用,很少有論文能有類似的影響力。用信息理論家 Anthony Ephremides 的話來說: 信息理論就像一個地震,而且餘震遠還沒有結束!

作者:[遇見數學翻譯小組]核心成員 方正,小倪同學

相關焦點

  • 更多信息並不一定能幫助人們做出更好的決策
    做出日常決策似乎很容易。人們了解有關健康和財務狀況的基本信息,可用於指導決策。但最新研究表明,太多的知識會導致人們做出更糟糕的決定,這表明我們對新信息如何與先前的知識和信念相互作用的理解存在嚴重差距。這項研究正在幫助重新構想我們如何使用從人工智慧和機器學習算法中提取的大量數據以及醫療保健專業人員和財務顧問如何向他們的患者和客戶提供這些想法。準確的信息不足以使信息有用。假設人工智慧和機器學習將發現大量信息,我們將其提供給人們,他們將做出明智的決定。
  • 如何利用「心口不一」做出正確決策?教你讀懂「態度攻略」
    而我們為了更好地工作如何做出正確的「心口不一」決策呢?以下我將會為大家一一說明。01、從「人格面具論」心理特徵分析我們為什麼會產生「心口不一」的行為人格面具理論本義是指使演員能在一齣劇中扮演某個特殊角色而戴的面具。瑞士心理學家榮格認為,集體無意識的內容主要是原型。原型有四種最為突出:阿尼瑪、阿尼姆斯、人格面具和陰影。
  • 隨機對照試驗能讓企業做出更好的決策
    近年來,在企業決策領域使用隨機對照實驗越為普遍。假設你在谷歌的廣告團隊工作,需要決定廣告應該是藍色背景還是黃色背景。你認為黃色會吸引最多的點擊率;你的同事認為藍色更好。你是怎麼做決定的?在谷歌的早期,你們兩個可能一直在爭論這個問題,直到有人屈服,或者把這個決定推給老闆。但最終,整個谷歌的領導人都意識到,這些爭論和決定中的許多都是不必要的。
  • 「資訊理論之父」——克勞德·香農是如何創造未來的
    在此之後,Shannon將目光投向了一個更大的領域:通信。通信是人類最基本的需求之一。從烽火預警到飛鴿傳書,再到電話、電視、網絡的出現,人類一直在探索能夠讓信息傳遞得更遠、更快、更可靠的通信方式。但是,無論哪種方式,通信系統總是與信號來源以及物理介質相關聯。Shannon卻想打破這一限制,探尋通信的大一統理論。
  • 職場中如何做出科學的決策?四個步驟讓你做出正確的決策
    今天想和大家討論一下如何決策,人的一生中其實沒幾次機會可以做決策,因為我們大多數人都是循規蹈矩的常人,並非開拓者。在職場中,老闆給你一個任務,你下意識的便會根據前人的經驗,或者自己之前的習慣進行操作。這個並不是決策,兩個東西一個質量好,另一個質量差,你選擇了質量好的這也不是決策。真正的決策是面對無法辨別優劣時,做出正確的選擇。可是我們生活中大多都是按部就班,讓幹啥就幹啥,也很少會思考是否有其他不同以往的選擇。
  • Bear談無線通信|資訊理論與香農定理
    在上一節中我簡述了無線通信的傳輸介質—電磁波。我本人也是從頻段開始逐步摸索通信的門檻的。在這一節中,我想更加深入的和大家探討無線通信的本質與極限。信息到底是什麼;在無限接近零誤碼率的情況下怎樣儘可能提高速率?說到信息,你的第一反應會是?
  • 思維模式:做出明智決策的最佳方法(上)
    分享知識,或者去學習其他學科的一些基礎知識,就可以達成更加全面的理解,從而可以更好地做出有關森林管理的初步決策。 1990年代的時候,查理· 芒格曾經發表過一次著名的演講。在那次演講中,他總結了通過理解思維模式來獲得實用智慧方法,他說:「第一條規則是,如果你們只是記得一些孤立的事物,試圖把它們硬湊起來,那麼你們無法真正地理解任何東西。
  • 《簡捷啟發式》如何確保制定決策的合理性
    這些簡捷的規則,為人們適應周圍環境提供了一個功能強大且完備的工具箱,在這裡,傳統的邏輯和概率規則都毫無施展之地。這些簡捷啟發式之所以奏效,是因為從生態學視角來看它們是合理的,即適合於它們所使用環境的信息結構。核心內容1.是不是拿到的信息越多,越能做出更好的決策?
  • 【智庫聲音】淺談5G的軍事應用(三)
    本文是《淺談5G的軍事應用》系列的第三篇文章,主要介紹5G在軍事航天、智慧軍營、反恐領域以及和北鬥導航結合的應用前景,供感興趣的讀者參考。匹配正如火如荼發展的低軌通信衛星星座,5G與構成物聯網的眾多傳感器相結合,將為指揮員提供收集來自天基維度的戰場實時數據,使得系統能夠將正在發生的實時事件、正在做出的決策、即將發生的事情、過去發生的事情,以及所有數據整合在一起,進而做出分析和預測。 5G將極大影響太空的電磁頻譜相關領域。
  • 群體決策的困境:聰明人何以做出愚蠢決策
    正如雅各布·維茨伯格(Yaacov Vertzbe rger)所指出的:較之於個體獨自決策,群體決策可能能夠充分、更為迅速地接觸到新信息和新解釋,以及注意到他們獨自決策可能遺漏的觀點;這種充分接觸和爭辯都提高了群體成員的問題解決和學習的質量[……]群體決策過程中的討論,通過傳播信息和可供選擇的視角,澄清了含糊和矛盾之處,並且可以闡明累積的知識和信念的邏輯結構中的弱點。
  • 為什麼量子通信成新風口?產業鏈機遇該如何把握?
    從定義來看,量子通信是利用量子傳遞信息的技術,主要有兩種形式:基於單量子或糾纏傳遞經典信息的量子密鑰分發,以及基於糾纏傳遞任意量子態的量子隱形傳態。 作為市場新題材,為什麼量子通信能吸引大批資金進場?究其原因還是消息面上的大利好。據新華社消息,10月16日下午,中共中央政治局就量子科技研究和應用前景舉行第二十四次集體學習。
  • 員工培訓:如何制定以數據為依據的業務決策
    這是因為你將使用有關學習者的更多信息,因此你將更好地了解如何使他們保持對新材料的興趣和興趣。2.個性化學習過程個性化學習者體驗對於參與和保留知識至關重要。利用所選培訓軟體中的數據,可以幫助你根據每個學員的學習方式和偏好創建學習路徑。這樣,他們將有效地吸收更多信息。
  • 數學模型論證:當信息不具有公開性時,集體決策最優
    信息是日常決策的關鍵。佛羅裡達州立大學的最新研究表明,當社會成員接收的信息略有不同時,集體決策可能是最佳手段。數學助理教授Bhargav Karamched和同事今天發表了論文,探討如何制定決策以及動態反饋機制,從而快速,準確地制定決策。
  • 世界首個海水量子通信實驗成功,量子通信如何實現?
    出品:科普中國製作:山夕團隊 唐媛監製:中國科學院計算機網絡信息中心近日,上海交通大學金賢敏團隊成功進行了首個海水量子通信實驗,觀察到了光子極化量子態和量子糾纏可在海水中保持量子特性,這是國際上首次通過實驗驗證了水下量子通信的可行性,向未來建立水下及空海一體量子通信網絡上邁出重要一步。
  • 量子通信的問與答(上) 什麼是量子通信
    量子通信為什麼會得到全世界的高度關注,在國際上發展情況又如何呢?墨子沙龍記者特地採訪了中國科學院量子信息與量子科技創新研究院的科學家們,並將採訪內容整理形成了《量子通信的問與答》,分三期分享給大家。 本期提問一覽 1、問:什麼是量子通信呢?
  • 資訊理論創始人克勞德·香農:真正的天才是如何思考的?
    編者按:克勞德·香農(Claude Shannon),美國數學家、電子工程師和密碼學家,被譽為資訊理論的創始人。1948年,香農發表了劃時代的論文《通信的數學原理》,奠定了現代資訊理論的基礎。不僅如此,香農還被認為是數字計算機理論和數字電路設計理論的創始人,也為軍事領域的密碼分析, 包括密碼破譯和保密通信,做出了很大貢獻。
  • 智能駕駛究竟是怎樣實現的?
    智能駕駛究竟是怎樣實現的? 那智能駕駛究竟怎樣實現的呢? 簡單的說,就是給常規車加上智能駕駛模塊,再連上通信網絡。這個模塊主要有三大核心功能:環境感知—計算決策—控制執行,分別對應於人的「眼睛-大腦-神經」。 它們的功能執行邏輯也很簡單,非常像人類:走在路上,首先眼睛發現對面走來了一個人,然後大腦去決策怎麼躲避這個人,最後是神經驅動肢體去繞開這個人。
  • 消費者的決策過程
    最後,本研究還進一步堅定了我們對以下做法之重要性的認識:不僅要使戰略、開支、渠道管理和訊息等所有營銷要素與客戶做出購買決策所經歷的歷程相協調,還要在整個機構內對這些要素進行整合。如果營銷人員了解這一歷程,並將其資金支出和訊息宣傳運用到最具影響力的時刻,那麼,他們在恰當的地方、恰當的時刻讓消費者接觸到恰好適合他們的信息的機會就要大得多。
  • 我國量子通信成功將32cm提到4600Km,美國眼饞了!
    說到量子大家可能並不陌生,什麼量子通信,量子計算,量子成像等等一些方面都有量子技術的支撐,今天我們就著重講述一下量子通信,以及我國是怎樣將量子通信從
  • 孫晨華:讓衛星通信實現「中國創造」
    中國電科首席專家孫晨華是衛星通信領域有名的巾幗英雄。作為我國衛星通信領域、以及天地網絡融合方向的帶頭人之一,30多年來,她一直從事衛星通信、天地通信網絡融合方向系統設計與研發,主持國防和國家多項「首個」、「零突破」和「跨代標誌」的領域重點項目,深度參與我國寬帶、移動、抗幹擾衛星通信全體系研製建設。日前,她被授予全國先進工作者榮譽稱號。