「資訊理論之父」——克勞德·香農是如何創造未來的

2021-01-08 別鬧了機器

https://www.quantamagazine.org/how-claude-shannons-information-theory-invented-the-future-20201222/

David Tse

編譯:文龍

科學是在尋求自然界的基本規律,數學是在原有定理的基礎上尋找新的定理,工程學是在構建解決人類需求的系統。這三個學科雖相互依存但又截然不同。因此,很少有人能夠同時為這三個學科做出重大貢獻,而克勞德·香農(Claude Shannon)就是其中之一。你可能從未聽過Claude Shannon這個名字,但我們現在所處的信息化時代背後的整個通信基礎架構,正是基於他七十多年前發表的一篇富有開創性的論文。

1916年,Shannon在密西根州出生,他的父母是當地的商人和教師。從密西根大學獲得電子工程和數學雙學士學位後,Shannon進入麻省理工學院開始了研究生的學習。在其碩士論文中,他將布爾代數這一數學方法應用到電子領域中的開關電路的分析和綜合問題中。正是這一變革性的工作,將電路設計從一門藝術變成了一門科學,被認為是數字電路的開端。

在此之後,Shannon將目光投向了一個更大的領域:通信。通信是人類最基本的需求之一。從烽火預警到飛鴿傳書,再到電話、電視、網絡的出現,人類一直在探索能夠讓信息傳遞得更遠、更快、更可靠的通信方式。但是,無論哪種方式,通信系統總是與信號來源以及物理介質相關聯。Shannon卻想打破這一限制,探尋通信的大一統理論。他在1939年給導師Vannevar Bush的信中概述了自己的一些初步設想,並最終在1948年發表了著名的論文,「關於通信的數學理論(A Mathematical Theory of Communication)「。

Shannon通信模型的示意圖,取自他的論文。

Shannon提出的理論的核心是一個簡單卻十分通用的通信模型:發送器將信息編碼為信號,該信號會受噪聲影響,然後由接收器解碼。模型雖然簡單但卻包含了兩個十分關鍵的要素:將信號源和噪聲源從要設計的通信系統中剝離,並對這兩個源分別進行概率建模。

在Shannon的理論提出之前,通信問題通常被視為確定性信號的重建問題:如何轉換受物理介質扭曲的接收信號,以儘可能準確地重建原始信號。而Shannon的才智體現在他認為通信的關鍵是信號的不確定性。他假設信號源會生成許多種可能的信息進行通信,每條信息都有一定的概率;而概率噪聲進一步增加了接收器解碼的隨機性。正是這一假設將通信問題從物理層面轉移到了抽象的數學層面,使得Shannon可以使用概率對不確定性進行建模。所以不確定性才是通信的魅力。畢竟,如果我在寫這篇專欄的時候你已經知道我要寫什麼了,那一切便失去了意義。

在這篇具有裡程碑意義的論文中,Shannon分三部分系統地給出了通信的基本限制。有一個概念貫穿始終,那就是「bit(比特)」:用來描述不確定性的基本單位,可以是1或0。儘管Shannon表示這一單詞是由數學家John Tukey(約翰·圖基)在其備忘錄中首先使用的,但他仍是第一個在論文中提出並使用這個詞的人。

首先,Shannon提出了一個用於

表示信息的每秒最小比特數的公式,他稱之為entropy rate(熵率), H。該數量化了特定信號源將生成哪種消息的不確定程度。熵率越低,不確定性就越小,因此更容易將信息壓縮成更短的東

西。

例如,以每分鐘100個英文字母的速度發簡訊意味著每分鐘發送26的100次方

可能的消息,每條消息由100個字母序列表示。

,因此,人們可以將所有的這些可能性編碼成470比特。

如果序列的可能性相同,那麼由Shannon的公式可以得出熵率是每分鐘470比特。

實際上,某些序列比其他序列出現的可能性要大得多,熵率也低得多,從而可以進行更大程度上的壓縮。

其次,Shannon給出了一個可以在有噪聲情況下進行可靠通信的每秒最大比特數的公式,他稱之為系統的容量, C。該數表示接收器可以解析信息不確定性的最大速率,可以視為通信的速度極限。

最後,Shannon表示,只有當H<C時,來自信號源的信息才能在有噪聲的情況下進行可靠的通信。我們可以將信息類比成水流,只有當水流的流速小於管道的容量時,水流才能在管道內正常地流通,信息也是一樣。

Shannon在工作中也有好玩的一面,圖為Shannon與他為電子鼠建造的迷宮(Theseus)的合影

以上理論雖然是一種通信理論,但同時也是信息產生和傳輸的理論。因此,Shannon也被認為是"資訊理論之父"。

Shannon的理論也得出了一些與直覺相悖的結論。假設你在一個非常嘈雜的環境說話,確保你的信息傳達的最佳方法是什麼?你的第一反應或許是重複多次,但事實證明,這不是很有效。當然,重複的次數越多,信息傳達越可靠。但是,為了可靠性,你犧牲了速度。Shannon的理論告訴我們:重複信息是使用代碼傳輸信息的示例,通過使用不同且更複雜的代碼,可以在保持給定可靠性的同時快速通信(直到達到速度極限C)。實際上,目前推出的5G標準使用的是兩套實用的代碼,證實可以達到Shannon的速度極限。

Shannon的理論得出的另一個結論是,無論信息的性質是什麼,在傳輸之前,將其編碼為比特總是最有效的。因此,在無線電系統中,即使原始聲音和通過空中發送的電磁信號都是模擬波形式,Shannon的理論告訴我們,最好先將聲波數位化成比特,然後再將這些比特映射到電磁波中。這一意想不到的結論正是現代數字資訊時代的基石,在這個時代,比特早已成為信息的通用貨幣。

Shannon是一名科學家,他的理論像物理定律一樣具有根本性;Shannon也是一名數學家,他創造了新的數學概念來闡述通信原理,並且這些思想已廣泛應用於數學的其他分支當中;Shannon更是一名工程師,他的理論是受到實際的工程問題的啟發,並且這一理論已經成為現代通信系統的基礎框架。

儘管Shannon於2001年去世,但他遺留的財富仍然存在於構成我們現代世界的技術和他創造的設備(如圖中這種遠程控制線)中。

「最好的研究是修剪已有的知識樹而不是去發展它。」儘管在70多年前,Shannon的理論對於絕大部分工程師來說是難以理解的,但是現在,這一理論已經成為現代通信系統的基礎框架。他是如何做到的呢?通過堅持不懈地專注於問題的基本特徵,而不是問題的各個方面;通過專注於可能的事情,而不是立即可行的事情。Shannon這一統一工作將通信領域的知識枝條修剪成了一棵連貫且整齊的知識樹,為後面幾代科學家、數學家、工程師帶來了累累碩果。

相關焦點

  • 資訊理論之父——克勞德·香農 | 致敬先驅
    如日中天的人工智慧正在或即將引爆整個世界,而那些在上個世紀就預知到人工智慧的未來的先知們,雖然早就在歲月的漩渦裡消失不見,但他們的天才般的智慧和意義非常的碩果,卻將被後人們萬世傳承、永遠銘記。「熵」(entropy)是香農創立的資訊理論中最核心的概念,代表了一個系統的內在的混亂程度。香農本來打算用「不確定性」(uncertainty)來表達這個概念,當他和馮·諾伊曼討論這個問題時,馮·諾伊曼對香農建議說:「你應該把它稱之為『熵』。」並給出兩個理由,一是「不確定性」這個概念已被用於統計力學,二是沒有人知道「熵」到底是什麼,不致引發爭論。
  • 資訊理論創始人克勞德·香農:真正的天才是如何思考的?
    編者按:克勞德·香農(Claude Shannon),美國數學家、電子工程師和密碼學家,被譽為資訊理論的創始人。1948年,香農發表了劃時代的論文《通信的數學原理》,奠定了現代資訊理論的基礎。不僅如此,香農還被認為是數字計算機理論和數字電路設計理論的創始人,也為軍事領域的密碼分析, 包括密碼破譯和保密通信,做出了很大貢獻。他思考的時候,都從哪些角度入手,又如何得出結論?
  • ...今天2001年2月26日美國資訊理論的創始人克勞德·艾爾伍德·香農...
    歷史上的今天2001年2月26日美國資訊理論的創始人克勞德·艾爾伍德·香農逝世 2013-09-02 15:14 來源:網際網路資源 作者:
  • 小樂數學科普:資訊理論之父香農如何發明未來-譯自量子雜誌
    克勞德·香農(Claude Shannon)撰寫了一篇碩士論文,該論文迅速啟動了數字電路設計,十年後,他撰寫了有關資訊理論的開創性論文《通信的數學理論》。——麻省理工學院博物館接下來,香農將目光投向了一個更大的目標:通信。
  • 克勞德·香農:看我如何發明未來
    【導讀】克勞德·艾爾伍德·香農,美國數學家、電子工程師和密碼學家,被譽為資訊理論的創始人。他發表了劃時代的論文——通信的數學原理,奠定了現代資訊理論的基礎。不僅如此,香農還被認為是數字計算機理論和數字電路設計理論的創始人。他不曾捧起過一座諾貝爾獎盃。他的名字也不曾如愛因斯坦、費曼般如雷貫耳,無論是生前死後。
  • 坤鵬論:香農八年磨一劍,磨出一個撬動地球的支點
    否則,當你看到那些寫香農和資訊理論的文章後,完全會被搞暈。有本香農的傳記名字起得相當妙——《遊戲之心:克勞德·香農如何開創資訊時代》!1936年,香農進入麻省理工大學開始了研究生生涯。並有幸進入到了範內瓦·布希的微分分析機項目組。顧名思義,分析機是一種解析微分方程的機械計算機。
  • 坤鵬論:香農說,信息是能夠用來消除不確定性的東西
    ——坤鵬論前兩天,我們充分討論了信息的特徵。今天,坤鵬論主要講幾個與資訊理論、信息熵相關的基本概念,如果沒有它們作為基礎,理解後面的內容會比較困難些。三、如何讓信息傳輸得更快、更準?在搞清楚了信息的傳輸模型後,其實大部分人都能說出怎麼讓信息傳輸得更快、更準。這就是為什麼坤鵬論一直強調,凡事先搞清基礎概念以及本質的原因。可見,在信息傳輸系統中,最關鍵的點就是信道。
  • 香農誕辰百年紀念特輯 | 為什麼說紀念香農如同紀念牛頓?
    1948年,香農發表了《通信的數學理論》文章,提出了信息熵的概念,並創建了資訊理論。這篇文章奠定了香農「資訊理論之父」的地位。後來,香農在1949年繼續發表了《噪聲下的通信》。幾十年來,人類科技在數位化、智能化、網絡化等的推動下經歷了一波又一波通信、信息革命。數十年之後,在信息流、物質流的社會中,香農的論著依然閃爍著智慧之光,並將照耀人類社會今後的數個世紀。
  • 一個頑皮的科學巨匠,香農外傳紀念克勞德·艾爾伍德·香農誕生一百...
    …  資訊理論之父---香農  小時候,香農就熱衷於安裝無線電收音機,痴迷於莫爾斯電報碼,還擔任過中學信使,冥冥之中,與保密通信早就結下了姻緣。特別是一本破譯神秘地圖的推理小說《金甲蟲》,在他幼小的心靈中,播下了密碼種子。
  • 在1024 特殊日子,怎麼能忘記香農及比特 bit
    香農,全名是克勞德·艾爾伍德·香農(Claude Elwood Shannon),美國著名數學家、發明家、密碼學家,資訊理論的創始人。接下來,小棗君就來給大家講講他的傳奇故事。1916年,第一次世界大戰激戰正酣。在該年的4月30日,遠離戰場的美國密西根州佩託斯基(Petoskey),一個男嬰呱呱墜地。這個男嬰,就是香農。
  • 新的實驗室數據傳輸速率達到178Tbps,接近香農理論極限
    更令人印象深刻的是,根據UCL所述,這個速度接近於美國數學家資訊理論創始人克勞德·香農(Claude Shannon)於1948年提出的香農極限。信道的香農極限(或稱香農容量)指的是在會隨機發生誤碼的信道上進行無差錯傳輸的最大傳輸速率。
  • 坤鵬論:訊息?信息?通信?通訊?(下)
    人們之所以需要信息,就是因為存在著認知不確定性。——坤鵬論一、訊息和信息就是消除認知不確定性香農說,信息是消除不確定性的東西。坤鵬論曾掰飭過「不確定性」是誰的不確定性。對的,就是接收者的不確定性。在資訊理論中,接收者是一個被標準化的客觀存在物。如果把視野從資訊理論擴大出來,比如囊括了傳播學。
  • 生命起源百年探索:進化論、資訊理論、熱力學誰是主角?
    即數學家克勞德·香農,資訊理論的創始人。在他1948年的開創性文章「通信的數學理論」中,香農試圖解釋通信的基本結構,並證明信息如何以二進位的形式編碼和傳輸。對於香農來說,信息是一種對不確定性或意外的度量。我們可能認為通信傳遞的就是信息,但是,從香農的觀點來看,信息是關於不確定性的——不確定性或意外越多,我們得到的信息就越多。
  • 數字時代的理論顛覆——讀《知識與權力:信息如何影響決策及財富...
    而本書——《知識與權力》並不是一本純粹的或者說傳統意義上的經濟學著作,作者以香農的資訊理論為基礎,講述了信息、知識、創新、市場、政府、企業家之間的聯繫,其實在一定程度上其實是對傳統經濟學理論的顛覆。而傳統的經濟學理論之所以屢屢失靈,是因為它背離了資訊理論的一條關鍵原則——「價值創造」本是一種比較高級、比較複雜的活動,而在經濟學理論中卻居於低級和次要的地位。相反,「價值衡量與交換」本是比較低級的活動,在經濟學理論中的地位卻超越了「價值創造」的地位。
  • ICLR2020|北大圖靈班本科生滿分論文:計算約束下有用信息的資訊理論
    機器之心轉載來源: 北京大學前沿計算研究中心作者:許逸倫本文是第八屆國際表徵學習會議 (ICLR 2020) 入選口頭展示論文 (oral)《基於計算約束下的有用信息的資訊理論 (A因此我們認為,在人類看來,明文與標註有著更大的互信息,但這與香農互信息矛盾。這個矛盾背後的原因正是因為香農互信息假設了觀測者有無窮的計算能力,從而忽視了什麼是對於觀測者來說的有用信息。
  • 張亞勤:深度學習更近一步,如何突破香農、馮諾依曼和摩爾瓶頸?
    隨著數據的海量爆發,如何突破目前的算力,成為了一代又一代科學家攻克的關鍵,香農定律、馮諾依曼架構和摩爾定律奠定了傳統計算與通訊範式,如何突破已經接近極限的三種理論?張亞勤表示,需要通過對信息的重新定義,制定新的計算範式、計算體系和通訊架構,而他們又給產業帶來了新的機會。為此,中國需要抓住機會,引領數位化的 3.0 時代和第四次工業革命浪潮。
  • 資訊時代的底層邏輯
    對於穀物和鋼鐵,我們可以從數量上衡量它們的多少,同時度量相應的地區和文明的發達程度,但是信息不同,我們很難度量它們。即便我們能夠度量它們,似乎也不能把它們直接和財富、經濟發展或者生活水平掛鈎。因此,我們雖然人人生活在資訊時代,卻很少有人能道得清、說得明信息是什麼,它又是如何決定和影響我們的生活的。這便是促使我寫《信息傳》一書的原因。
  • 坤鵬論:訊息?信息?通信?通訊?(上)
    ——坤鵬論坤鵬論在寫作過程中,越來越體會到搞清楚定義的重要性。特別是學習和分享了信息熵後,我深切地體會到了,科學的世界裡,許多東西和我們的常識不一樣。就像信息和訊息,大部分人將它們視為一個意思。包括坤鵬論也曾如此認為,並且在以前的文章中經常將它們混為一談,傻傻地分不清。
  • 在難以匹敵的信息技術面前,物理世界是否已經黯然失色?
    所謂的信息潛能,就是能給人帶來驚異的新觀念,它能夠促進生產率。在《知識與權力:信息如何影響決策及財富創造》一書中,吉爾德這樣寫道:有史以來,信息超越物理規律,或者說意識超越物質,一直是經濟賴以發展的動力之所在。在過去的年代裡,這個超越過程不太明顯,因為信息的作用主要體現在利用物理規律,而不是超越物理規律。