「資訊理論之父」——克勞德·香農是如何創造未來的

2021-01-11 別鬧了機器

https://www.quantamagazine.org/how-claude-shannons-information-theory-invented-the-future-20201222/

David Tse

編譯:文龍

科學是在尋求自然界的基本規律,數學是在原有定理的基礎上尋找新的定理,工程學是在構建解決人類需求的系統。這三個學科雖相互依存但又截然不同。因此,很少有人能夠同時為這三個學科做出重大貢獻,而克勞德·香農(Claude Shannon)就是其中之一。你可能從未聽過Claude Shannon這個名字,但我們現在所處的信息化時代背後的整個通信基礎架構,正是基於他七十多年前發表的一篇富有開創性的論文。

1916年,Shannon在密西根州出生,他的父母是當地的商人和教師。從密西根大學獲得電子工程和數學雙學士學位後,Shannon進入麻省理工學院開始了研究生的學習。在其碩士論文中,他將布爾代數這一數學方法應用到電子領域中的開關電路的分析和綜合問題中。正是這一變革性的工作,將電路設計從一門藝術變成了一門科學,被認為是數字電路的開端。

在此之後,Shannon將目光投向了一個更大的領域:通信。通信是人類最基本的需求之一。從烽火預警到飛鴿傳書,再到電話、電視、網絡的出現,人類一直在探索能夠讓信息傳遞得更遠、更快、更可靠的通信方式。但是,無論哪種方式,通信系統總是與信號來源以及物理介質相關聯。Shannon卻想打破這一限制,探尋通信的大一統理論。他在1939年給導師Vannevar Bush的信中概述了自己的一些初步設想,並最終在1948年發表了著名的論文,「關於通信的數學理論(A Mathematical Theory of Communication)「。

Shannon通信模型的示意圖,取自他的論文。

Shannon提出的理論的核心是一個簡單卻十分通用的通信模型:發送器將信息編碼為信號,該信號會受噪聲影響,然後由接收器解碼。模型雖然簡單但卻包含了兩個十分關鍵的要素:將信號源和噪聲源從要設計的通信系統中剝離,並對這兩個源分別進行概率建模。

在Shannon的理論提出之前,通信問題通常被視為確定性信號的重建問題:如何轉換受物理介質扭曲的接收信號,以儘可能準確地重建原始信號。而Shannon的才智體現在他認為通信的關鍵是信號的不確定性。他假設信號源會生成許多種可能的信息進行通信,每條信息都有一定的概率;而概率噪聲進一步增加了接收器解碼的隨機性。正是這一假設將通信問題從物理層面轉移到了抽象的數學層面,使得Shannon可以使用概率對不確定性進行建模。所以不確定性才是通信的魅力。畢竟,如果我在寫這篇專欄的時候你已經知道我要寫什麼了,那一切便失去了意義。

在這篇具有裡程碑意義的論文中,Shannon分三部分系統地給出了通信的基本限制。有一個概念貫穿始終,那就是「bit(比特)」:用來描述不確定性的基本單位,可以是1或0。儘管Shannon表示這一單詞是由數學家John Tukey(約翰·圖基)在其備忘錄中首先使用的,但他仍是第一個在論文中提出並使用這個詞的人。

首先,Shannon提出了一個用於

表示信息的每秒最小比特數的公式,他稱之為entropy rate(熵率), H。該數量化了特定信號源將生成哪種消息的不確定程度。熵率越低,不確定性就越小,因此更容易將信息壓縮成更短的東

西。

例如,以每分鐘100個英文字母的速度發簡訊意味著每分鐘發送26的100次方

可能的消息,每條消息由100個字母序列表示。

,因此,人們可以將所有的這些可能性編碼成470比特。

如果序列的可能性相同,那麼由Shannon的公式可以得出熵率是每分鐘470比特。

實際上,某些序列比其他序列出現的可能性要大得多,熵率也低得多,從而可以進行更大程度上的壓縮。

其次,Shannon給出了一個可以在有噪聲情況下進行可靠通信的每秒最大比特數的公式,他稱之為系統的容量, C。該數表示接收器可以解析信息不確定性的最大速率,可以視為通信的速度極限。

最後,Shannon表示,只有當H<C時,來自信號源的信息才能在有噪聲的情況下進行可靠的通信。我們可以將信息類比成水流,只有當水流的流速小於管道的容量時,水流才能在管道內正常地流通,信息也是一樣。

Shannon在工作中也有好玩的一面,圖為Shannon與他為電子鼠建造的迷宮(Theseus)的合影

以上理論雖然是一種通信理論,但同時也是信息產生和傳輸的理論。因此,Shannon也被認為是"資訊理論之父"。

Shannon的理論也得出了一些與直覺相悖的結論。假設你在一個非常嘈雜的環境說話,確保你的信息傳達的最佳方法是什麼?你的第一反應或許是重複多次,但事實證明,這不是很有效。當然,重複的次數越多,信息傳達越可靠。但是,為了可靠性,你犧牲了速度。Shannon的理論告訴我們:重複信息是使用代碼傳輸信息的示例,通過使用不同且更複雜的代碼,可以在保持給定可靠性的同時快速通信(直到達到速度極限C)。實際上,目前推出的5G標準使用的是兩套實用的代碼,證實可以達到Shannon的速度極限。

Shannon的理論得出的另一個結論是,無論信息的性質是什麼,在傳輸之前,將其編碼為比特總是最有效的。因此,在無線電系統中,即使原始聲音和通過空中發送的電磁信號都是模擬波形式,Shannon的理論告訴我們,最好先將聲波數位化成比特,然後再將這些比特映射到電磁波中。這一意想不到的結論正是現代數字資訊時代的基石,在這個時代,比特早已成為信息的通用貨幣。

Shannon是一名科學家,他的理論像物理定律一樣具有根本性;Shannon也是一名數學家,他創造了新的數學概念來闡述通信原理,並且這些思想已廣泛應用於數學的其他分支當中;Shannon更是一名工程師,他的理論是受到實際的工程問題的啟發,並且這一理論已經成為現代通信系統的基礎框架。

儘管Shannon於2001年去世,但他遺留的財富仍然存在於構成我們現代世界的技術和他創造的設備(如圖中這種遠程控制線)中。

「最好的研究是修剪已有的知識樹而不是去發展它。」儘管在70多年前,Shannon的理論對於絕大部分工程師來說是難以理解的,但是現在,這一理論已經成為現代通信系統的基礎框架。他是如何做到的呢?通過堅持不懈地專注於問題的基本特徵,而不是問題的各個方面;通過專注於可能的事情,而不是立即可行的事情。Shannon這一統一工作將通信領域的知識枝條修剪成了一棵連貫且整齊的知識樹,為後面幾代科學家、數學家、工程師帶來了累累碩果。

相關焦點

  • 誰是第一個研究信息的科學家?看資訊理論之父香農的偉大人生
    的確,牛頓的萬有引力定律和運動定律,光學上發現,以及數學上的創造太過燦爛,但是歷史上有如此成果和創造力也不止牛爵士一人吧,麥克斯韋,龐加萊等等,為啥這些後人們都得給牛爵士讓步呢?他就是克勞德·艾爾伍德·香農(Claude Elwood Shannon),我們現在尊稱他是資訊理論之父。
  • 資訊理論之父——克勞德·香農 | 致敬先驅
    如日中天的人工智慧正在或即將引爆整個世界,而那些在上個世紀就預知到人工智慧的未來的先知們,雖然早就在歲月的漩渦裡消失不見,但他們的天才般的智慧和意義非常的碩果,卻將被後人們萬世傳承、永遠銘記。1940年,香農博士畢業後曾在普林斯頓高等研究院工作過一年,和馮·諾伊曼有過不少的交流。「熵」(entropy)是香農創立的資訊理論中最核心的概念,代表了一個系統的內在的混亂程度。香農本來打算用「不確定性」(uncertainty)來表達這個概念,當他和馮·諾伊曼討論這個問題時,馮·諾伊曼對香農建議說:「你應該把它稱之為『熵』。」
  • 資訊理論創始人克勞德·香農:真正的天才是如何思考的?
    編者按:克勞德·香農(Claude Shannon),美國數學家、電子工程師和密碼學家,被譽為資訊理論的創始人。1948年,香農發表了劃時代的論文《通信的數學原理》,奠定了現代資訊理論的基礎。不僅如此,香農還被認為是數字計算機理論和數字電路設計理論的創始人,也為軍事領域的密碼分析, 包括密碼破譯和保密通信,做出了很大貢獻。
  • 「資訊時代之父」香農:用一隻木老鼠奠定人工智慧的基礎
    「大家好,我是貝爾電話實驗室的數學家克勞德?香農,」當攝像機鏡頭逐漸放大時,一位穿西裝、打領帶,身材修長的男人,用活潑輕快的語言做自我介紹。 這發生在1952年。儘管對於工程師和數學家們來說,香農早已是一個不需要介紹的傳奇人物,但對於美國的數百萬觀眾,他仍然是一張陌生面孔――但不久之後就家喻戶曉,人盡皆知了。
  • 後香農時代信息產業發展面臨的十大挑戰數學問題
    後香農時代的通信技術會如何發展?此後,香農定理成為現代資訊理論的基礎理論,在通信和數據存儲領域得到了廣泛應用,並為今天通信的發展打下了堅實的理論基礎。 資訊理論之父克勞德 · 香農。 70 多年過去了,通信行業的發展依然離不開基礎數學理論的支撐。
  • 信息熵是怎樣煉成的 | 紀念資訊理論之父香農
    撰文 | 丁玖(南密西西比大學數學教授)紀念"資訊理論之父"香農的最好方式,莫過於重溫一下他怎樣定義信息熵的數學思想,去理解現代資訊理論這個基本概念——僅用初等代數即可推導,令人賞心悅目,流連忘返!確定性過程在數學裡是司空見慣的現象。
  • 克勞德·香農:看我如何發明未來
    【導讀】克勞德·艾爾伍德·香農,美國數學家、電子工程師和密碼學家,被譽為資訊理論的創始人。他發表了劃時代的論文——通信的數學原理,奠定了現代資訊理論的基礎。不僅如此,香農還被認為是數字計算機理論和數字電路設計理論的創始人。他不曾捧起過一座諾貝爾獎盃。他的名字也不曾如愛因斯坦、費曼般如雷貫耳,無論是生前死後。
  • 華為緣何致敬極化碼之父?
    極化碼之父埃爾達爾·阿里坎(Erdal Arikan)教授日前在廣州GMIC2019全球移動網際網路大會上分享對5G未來的一些看法。他認為,5G時代最突顯的變化是數據海量增長;高性能計算會是首先受益的行業;5G時代運營商獲利更大,中國在5G執行方面領先地位……「您未來在學術上的研究會偏向什麼方向?」面對採訪,阿里坎答道:「我目前想把極化碼做一個延伸,不斷地升華完善。」
  • 信息價值最大化:香農《資訊理論》的生活意義
    一段信息所包含的信息量不僅僅由信息的長短來決定,還決定於這信息克服了多少不確定性。克服的不確定性越大說明得到的信息越有價值。香農的《資訊理論》信息熵熵——物理上表示一個系統混亂的程度,物體越不穩定,熵越值大。而信息熵相似的表示信息中字符的不可預測程度,信息熵越大——可供選擇的範圍越廣,選擇的信息量就越大。這可以是好處,你可以得到更多內容。
  • 坤鵬論:香農說,信息是能夠用來消除不確定性的東西
    ——坤鵬論前兩天,我們充分討論了信息的特徵。今天,坤鵬論主要講幾個與資訊理論、信息熵相關的基本概念,如果沒有它們作為基礎,理解後面的內容會比較困難些。三、如何讓信息傳輸得更快、更準?在搞清楚了信息的傳輸模型後,其實大部分人都能說出怎麼讓信息傳輸得更快、更準。這就是為什麼坤鵬論一直強調,凡事先搞清基礎概念以及本質的原因。可見,在信息傳輸系統中,最關鍵的點就是信道。
  • 天才VS頑童,帶你走近克勞德·香農
    他的頭銜好像太多了:美國數學家、密碼學家、資訊理論創始人、雜耍學博士……沒錯!香農就是這樣一個集英俊與才華於一身的男子,妥妥的別人家的孩子,那麼今天就讓我們來看看香農和他的遊戲人生吧!他們當時都在各自研究自己的專題,圖靈研究如何破解德國的密碼,香農研究如何對華盛頓到倫敦的通信線路進行加密。他們各自的項目都是絕密的,所以大家都不知道對方在搞啥。不過一次貝爾實驗室餐廳的午餐將他們拉到了一起,他們都相信機器可以被賦予思考的力量。
  • 後香農時代,華為提出10大數學挑戰問題,你能看懂嗎?
    機器之心報導編輯:杜偉後香農時代的通信技術會如何發展?又有哪些值得業界關注的數學問題呢?在上月底結束的長沙「數學促進企業創新發展論壇」上,華為董事、戰略研究院院長徐文偉拋出了後香農時代信息產業發展面臨的了十大挑戰數學問題。提到香農定理,通信領域的小夥伴應該是非常熟悉的了,可稱得上是該領域的「金科玉律」。
  • 天才是如何解決問題的——以資訊理論的創始人香農為例
    克勞德·香農是美國數學家、電子工程師和密碼學家,被譽為資訊理論的創始人。不僅如此,香農還被認為是數字計算機理論和數字電路設計理論的創始人。克勞德·香農花了大約十年的時間才完全形成了他開創性的信息理論。從剔除那些不重要的東西開始,你要如何訓練自己去看那些不重要的東西所造成的迷霧背後。那是你找到問題的核心的時候。找到問題的真正形式幾乎和答案一樣重要。2.
  • 一個頑皮的科學巨匠,香農外傳紀念克勞德·艾爾伍德·香農誕生一百...
    …  資訊理論之父---香農  小時候,香農就熱衷於安裝無線電收音機,痴迷於莫爾斯電報碼,還擔任過中學信使,冥冥之中,與保密通信早就結下了姻緣。特別是一本破譯神秘地圖的推理小說《金甲蟲》,在他幼小的心靈中,播下了密碼種子。
  • 他用1和0解決了人類兩大難題,他是資訊理論之父,卻渴望做雜耍博士
    但還有一個人很少被我們提及,他就是帥到令人髮指,成就與牛頓、愛因斯坦比肩,他是資訊理論之父——克勞德·香農。為什麼想到了他?起因是我最近認真讀了《信息簡史》。直到第二次世界大戰結束後,香農發表了一篇《通信中的數學理論》,他將熱力學裡的「熵」引入到信息學,還確定了信息的標準單位——比特(bit)。世界上幾乎任何事物都可以用信息的方式量化,即「萬物皆比特」。所以熵到底是個什麼東西呢?
  • 他用1和0解決了人類兩大難題,他是資訊理論之父,卻渴望做雜耍博士
    但還有一個人很少被我們提及,他就是帥到令人髮指,成就與牛頓、愛因斯坦比肩,他是資訊理論之父——克勞德·香農。起因是我最近認真讀了《信息簡史》。雖然我仍然對熵的概念表示迷惑,但是完全不影響我對香農的崇拜。他真是太牛了!專注自己本職不說,還是一位跨界高手。簡直讓我等渣渣汗顏。
  • 香農,帥又有才的科學家
    今年是資訊理論的創始人香農(C. E. Shannon,1916-2018)誕辰102周年。他於1948年發表了著名的文章「通信的數學理論」(A Mathematical Theory of Communication)創建了資訊時代的理論基礎——資訊理論。香農因而被稱為「資訊理論之父」。
  • 看這位跨界的天才,如何為我們描繪未來
    有了這位孤獨的天才的突破性工作,如今的資訊時代才成為了可能01 香農其人科學尋求自然的基本定律,數學則在舊基礎上構造新的定理,而工程學建造系統來解決人類的需求。這三個學科相互依存,但又截然不同。同時為這三個領域做出核心貢獻的人極為罕見,而克勞德·香農就是如此。
  • 在1024 特殊日子,怎麼能忘記香農及比特 bit
    香農,全名是克勞德·艾爾伍德·香農(Claude Elwood Shannon),美國著名數學家、發明家、密碼學家,資訊理論的創始人。接下來,小棗君就來給大家講講他的傳奇故事。1916年,第一次世界大戰激戰正酣。在該年的4月30日,遠離戰場的美國密西根州佩託斯基(Petoskey),一個男嬰呱呱墜地。這個男嬰,就是香農。