我們經常說:「使用最佳方案」,只有使用最優化的操作方法,才能達到資訊理論所預期的上限。這兒所說的最佳方案,與資訊理論中的「最大信息熵原理」有關。
什麼是最大信息熵原理?它來自於熱力學及統計物理中的熵增加原理。要講清楚這個問題需要太多篇幅,在此只作簡單介紹。
用通俗的話來說,最大信息熵原理就是當你對一個隨機過程不夠了解時,你對概率分布的猜測要使得信息熵最大。熵最大就是事物可能的狀態數最多,複雜程度最大。換句話說,對隨機事件的預測要在滿足全部約束條件下,保留各種可能性。
比如,你的女朋友叫你猜猜她的生日是哪一個月?如果你曾經看過她出生不久的照片,是秋天,那你可以猜測她生日是夏季的機率比較大;如果你對此完全沒有概念,你就最好是對一年中的每一個月都一視同仁,給予相同的可能性。
另一個例子是買股票投資的時候,專家會建議你買各種類型的不同股票。
「不要把雞蛋放在一個籃子裡!」投資專家說。這句話的意思,其實就是警告你要遵循最大熵原理,對難以預測的股票市場,最好的策略是儘可能多地保留各種可能性,才能降低預測的風險。
在老鼠毒藥問題中,儘量讓每個老鼠試喝相等數目瓶子的水;在稱球問題中,儘可能使天平「左、右、下」的球的數目相等,這都是考慮最大信息熵原理而選擇的最優策略。
最大熵原理
熱力學和統計物理中有熱力學第二定律,即熵增加原理,資訊理論中則有最大熵原理。
我們在日常生活中經常碰到隨機變量,也就是說,結果不確定的事件。諸如旋轉硬幣擲骰子,都是例子。還有比如說,球隊A要與球隊B進行一場球賽,結果或輸或贏;明天的天氣,或晴或雨或多雲;股市中15個大公司的股價,半年後有可能是某個範圍之內的任何數值……
但是,在大多數情況下,人們並不知道隨機變量的概率分布,或者說,只知道某個未知事件的部分知識而非全部,有時候往往需要根據這些片面的已知條件來猜測事件發生的概率。有時猜得準,有時猜不準,猜不準損失一點點,猜準了可能賺大錢。事件發生的隨機性及不可知性,就是支持賭城的機器不停運轉的賭徒心態的根源。
人們猜測事件發生的概率,多少帶有一定的主觀性,每個人有他自己的一套思維方法。如果是一個「正規理性」(這個概念當然很含糊,但假設大多數人屬於此類)思維的人,肯定首先要充分利用所有已知的條件。比如說,如果小王知道球隊A在過去與其他隊的10場比賽中只贏過3次,而球隊B的10場比賽贏過5次的話,他就應該將賭注下到球隊B上。但是,小李可能了解了更多的消息:球隊B的主要得力幹將上個月跳槽到球隊A來了,所以,他猜這次比賽球隊A贏的可能性更大。
除了儘量利用已知信息外,還有沒有什麼其它客觀一點的規律可循呢?也就是說,對於隨機事件中的未知部分,人們「會」如何猜測?人們「應該」如何猜測?舉例說,小王準備花一筆錢投資來買15個大公司的股票,如果他對這些公司一無所知,他選擇的投資方案很可能是15種股票均分。如果有位行家告訴他,其中B公司最具潛力,其次是G公司。那麼,他可能將更多的錢投資到B和G,其餘的再均分到剩下的13種股票中。
上面的例子基本符合人們的常識,科學家卻認識到這其中可能隱藏著某種大自然的玄機。大自然最玄妙的規律之一是最小作用量原理,造物主喜歡極值,或者說凡事講究最優化。統計規律中的隨機變量也可能遵循某種極值規律。
如上所述,隨機變量的信息熵與變量的概率分布曲線對應。那麼,隨機變量遵循的極值規律也許與熵有關!信息熵來自於熱力學熵,信息熵的「不確定程度的度量」也可以用來解釋熱力學熵。當然,熱力學中(物理中)不確定性的來源有多種多樣,必須一個一個具體分析。
經典牛頓力學是確定的,但是,我們無法知道和跟蹤尺寸太小的微觀粒子的情況,這點帶來了不確定性。其原因也許是因為測量技術使我們無法跟蹤,也許是因為粒子數太多而無法跟蹤,也有可能是我們主觀上懶得跟蹤、不屑於跟蹤,反正就是不跟蹤,即「不確定」!
如果考慮量子力學,還有不確定原理,那種非隱變量式的,愛因斯坦反對的本質上的不確定。即使是牛頓力學,也有因為初始條件的細微偏差而造成的「混沌現象」,蝴蝶效應式的不確定。此外,還有一種因為數學上對無窮概念的理解而產生的不確定。
總之,物理中的熵也能被理解為對不確定性的度量,物理中有熵增加原理,一切孤立物理系統的時間演化總是趨向於熵值最大,朝著最混亂的方向發展。那麼,熵增加原理是否意味著最混亂的狀態是客觀事物最可能出現的狀態?從資訊理論的角度看,熵最大意味著什麼呢?
1957 年,美國聖路易斯華盛頓大學的物理學家E.T.Jaynes 研究該問題並提出信息熵的最大熵原理,其主要思想可以用於解決上述例子中對隨機變量概率的猜測:如果我們只掌握關於分布的部分知識,應該選取符合這些知識但熵值最大的概率分布。因為符合已知條件的概率分布一般有好些個。熵最大的那一個是我們可以作出的最隨機,也是最符合客觀情況的一種選擇。Jaynes從數學上證明了:對隨機事件的所有預測中,熵最大的預測出現的概率佔絕對優勢。
接下來的問題是:什麼樣的分布熵值最大?對完全未知的離散變量而言,等概率事件(均衡分布)的熵最大。這就是小王選擇均分投資15種股票的原因,「不要把雞蛋放到一個籃子裡」,不偏不倚地每種股票都買一點,這樣才能保留全部的不確定性,將風險降到最小。
如果不是對某隨機事件完全無知的話,可以將已知的因素作為約束條件,同樣可以使用最大熵原理得到合適的概率分布,用數學模型來描述就是求解約束條件下的極值問題。問題的解當然與約束條件有關。
數學家們(Tribus等)從一些常見的約束條件得到幾個統計學中著名的典型分布,如高斯分布、伽馬分布、指數分布等。因此,這些自然界中的常見分布,實際上都是最大熵原理的特殊情況。 最大熵理論再一次說明了造物主的「智慧」,也見證了「熵」這個物理量的威力!
——《從擲骰子到阿爾法狗:趣談概率》
作者:張天蓉
圖片來源:網絡
編輯:茶水
滴水科學
公眾號ID:ydreadtup
關注
滴水科學,點滴時間學科學!