【賽迪網訊】自從1850年德國物理學家魯道夫 克勞修斯首次針對熱力學系統提出熵的概念以來,這個名詞在控制論、概率論、數論、天體物理、生命科學等領域都有重要應用,在不同的學科中也有引申出的更為具體的定義。100年後,香農提出信息熵的概念,解決對信息的量化度量問題。不過熱力學中熵表示的是「系統混亂狀態」;資訊理論中信息熵表示的是信息量;生態學中熵表示的是生物多樣性。
克勞修斯認為,一個系統不受外部幹擾時,具有往內部最穩定狀態發展的特性,這就是熵的早期含義。
熵是克勞修斯設計的,用來表徵系統混亂程度的數學方法,其本身是人的智力活動的結果。這也是熵在不同領域的定義存在差異的原因之一。
熵的概念適用於任何一個存在的系統,無論是物理世界裡的物質系統,或者虛擬世界裡的信息系統。因為對於一個孤立的系統來說,追求內在的平穩是基本的設計要求。
一、認識物質系統的熵和信息系統的熵
物理學家認為人類所處的宇宙是一個封閉的孤立系統。這個系統是通過能量的流動來體現存在價值的,系統的價值是採用熵來描述的。在宇宙形成的初期,是一個熵值很低的系統,一切都在有序的運行,然後按照熱力學第二定律,系統的熵值不斷增加,最終歸於死寂。當然這只是一個現代科學的假設,一個目前比較流行的觀點;也存可能在另外假設,宇宙通過外部能量來維持低熵狀態,確保系統的有序運行。
1、地球水系統的熵
在人類所觀察到的物質系統裡,似乎層次結構的系統是最好的低熵系統,比如人們觀察到的星系的分布,生物系統等。
對於人類的生存來說,水系統是非常重要的,它完美地展示了熵的變化特徵。
直觀的感覺或許不能發現水的層次結構分布形式,但是可以採用邏輯圖象的形式對現實中水的分布進行抽象,這樣就可以獲得清晰的具有層次結構的體系。在一個靜態的瞬間,不同層面的水的能量是不同的。
這是一個有序的、不均勻的系統,因此其熵較小。處於最高位層的水的勢能最大,但是它們的個體單元最小,其本身的價值也是最小的。按照熱力學第二定律,能量總是從高位向低位傳遞,以便達到系統內部的平衡,所以水總是向下流,以便獲得內部的平衡。
水在達到平衡的過程中,我們看到的是水不斷匯集所產生的形狀,小溪、小河、大江、大海等。
對於一個孤立的過程來說,水最終全部匯集在大海,而其它地方將沒有水。但是一個外部能量的介入將打破這個結局,形成一個循環水系統。這個外部的能量來自太陽,它把大海裡的水蒸發,然後通過高空搬運到符合規則的地方。
這個過程的主要特徵如下:
(1)為水系統提供原始資源。這個過程是通過耗費太陽能獲得的。這是最原始的水,處於水體系結構的末端,個體價值得到最最大化的發揮,分布的區域最廣,受益的對象最多。
(2)遵循熱力學第二定律,從高位流向低位。水開始集中,形成了整體價值,個體價值的影響減小,分布區域開始變小,收益對象開始減少。
(3)匯集到大海,過程結束,歸於死寂。整體價值最大,但是個體價值最小。陸地上的對象將無法獲得收益。
(4)開始新一輪的循環。太陽把水蒸發,增加水的能量,運送到不同的地方。
2、信息系統的熵
信息目前有很多種不同的定義,和雲計算一樣,人們是根據自己的觀察角度和需要來定義的。由於雲計算產品的處理對象是信息,因此中國電子學會雲計算專家委員會委員趙文銀也對信息作了定義:
信息是智能對象在其所創建的虛擬世界裡用來表徵「實體」存在的一種形式。比如在以計算機為載體的虛擬世界裡,人們採用一組0、1代碼來表徵一個具體對象的存在。
人們通常有一個習慣性的判斷標準,信息應該是完整描述物理世界存在事物的。然而事實並非如此,在一個確定的虛擬世界裡,信息是獨立存在的,它不是物理世界裡的物質或者能量。虛擬世界裡的信息只所以和物理世界裡的物質存在關聯關係,完全是由人們設計的規則決定的。
信息熵是香農1948年提出來的,他把熱力學的熵概念引入到資訊理論,因此又被稱為香農熵。信息熵被用來衡量一個隨機變量出現的期望值。它代表了在被接收之前,信號傳輸過程中損失的信息量。一個系統越是有序,信息熵就越低;反之,一個系統越是混亂,信息熵就越高。信息熵也可以說是系統有序化程度的一個度量。
3、雲計算時代如何理解熵
每一次的技術革命都會或多或少地修改人們對宇宙的認識觀點,這是因為作為知識傳遞下來的科學理論並不一定是真理,其可能的缺陷來自於創立者自身的局限。
對於一個設計的、合理穩定的控制系統來說,內部的自動運行機制是非常重要的。按照現代科學的概念,人們通常把一個完整的自動運行過程稱為「一個生命周期」。這是一個很簡單的規則:在一個封閉的系統裡,個體的能量總是從高位向低位流動。這個規則的設計理論是這樣假設的,能量是個體對象所承受壓力狀態的量化描述,能量大,則壓力大。一個穩定的個體,其承載的壓力是較小的,釋放壓力是任何存在事物的本能行為。
物理學家克勞修斯採用熵來描述這個現象,熵在希臘語裡意為「內向」,亦即「一個系統不受外部幹擾時往內部最穩定狀態發展的特性」。目前這個概念已經應用到了更多的領域,比如信息領域,社會領域等。佛家的禪修也符合熵的特徵,當大腦的思維形成一個和外界隔離的封閉系統時,壓力就會自然釋放,從而形成一個穩定安詳的系統。
目前在不同領域裡,熵的定義也是存在差別的,這是由觀察者的觀察角度不同引起的。事實上,作為一個基本規律,在其它領域裡所使用的熵的定義可以和熱力學中的熵一樣,只是對能量的理解做些改變就可以了。
化學及熱力學中所指的熵,是一種測量在動力學方面不能做功的能量總數,也就是當總體的熵增加,其作功能力就下降。熵的量度是能量退化的指標。
比如在一個封閉的信息系統裡,處於高位的信息在向低位運動的過程中,會消耗能量,這樣就會導致總體的熵增加,作功能力下降。
比如地球上的水系統,處於高位的水在向下流的過程中,會消耗能量,從而增加系統總體熵,減少作功能力。
又比如在人類社會的物質系統裡,煤炭、石油、核物質攜帶的能量被消耗後,系統總體熵在增加,總體作功能力在下降。
熵是一個人們用來描述系統在一個生命周期裡的內部狀態函數。能否開始一個新的生命周期,是由系統外的能量決定的。地球水系統的生命周期是由太陽的能量決定的。或許可以做出這樣的假設:在一個有生命力的系統裡,個體所攜帶的能量差異是維持系統運行的原動力。人往高處走,水往低處流,就是對熵的直觀描述。
二、從熵的角度設計雲計算的技術方法
儘管人們目前並不知道雲計算革命帶來的具體改變是什麼,但是知道雲計算一定會再一次改變人類發展的進程,使人類的生存環境發生質的改變,幫助人們解決目前面臨的各種重大危機。
1、雲計算的定義和使命
雲計算目前沒有統一的明確定義,人們從不同的角度,參照自己認同的技術、產品、利益,給出不同的定義。
中國電子學會雲計算專家委員會委員趙文銀認為,雲計算是以應用為目的,通過網際網路將大量必要的硬體和軟體按照一定的組織形式連接起來,並隨應用需求的變化動態調整組織形式所創建的一個內耗最小、功效最大的虛擬資源服務集合。
雲計算的使命就是重建以計算機、網際網路為載體的虛擬世界,使其更加接近物理世界,並和物理世界緊密關聯,成為人們生活的一部分。
所以人們構造的虛擬世界必定和物理世界具有基本相同的規則,比如構成元素相同,都是採用兩種狀態,虛擬世界採用0、1,物理世界採用陰、陽(或者開弦、閉弦);同樣採用熵規則來形成生命周期;採用相同的基本數學法則等。
2、雲計算產品系統和熵
作為物理學的概念,儘管信息專家已經開始採用信息熵來分析信息,但是對於軟體技術人員來說,熵似乎還是一個比較陌生的名詞。即便是google、ibm、微軟這樣的國際IT巨頭,在其產品系統的設計過程中,似乎並沒有把熵作為其中的一個設計要求。由於系統內部不具備自運行的生命周期,或者說自運行的生命周期很短,所以系統的運行是完全依靠外部能量維持的,因此消耗了大量的能源。
雲計算需要解決的其中一個重要問題,就是降低IT系統的能耗。而產品結構的改變是降低能耗的主要途徑之一。
一種層次分布的信息系統是一個有序的、能量不均勻的低熵系統,這種系統將會根據自身的能量差沿合適的路逕自動流動,然後在低位形成一個無序、均勻的高熵系統。
如果把物理世界也看成是一個計算系統,那麼物理世界裡存在的系統也可以看成是雲計算產品系統。很難想像人類社會是一個無序、均勻分布的系統,如果沒有負熵的作用,是否可以正常的運行。觀察人類發展的歷史,實際上是在通過負熵的作用,逐步建立一個有序、層次分布的低熵系統的過程。
計算機的出現,使人們有了準確、詳細了解自身所處環境的工具,而雲計算將幫助人們構建一個和現實世界接近的複雜系統,並通過觀察系統內信息的變化來了解人們的行為活動在物理世界裡所造成的影響。
三、從熵的角度分析幾個典型的網際網路產品
IT工程師很少從熵的角度來設計一個系統。事實上其它領域的工程師在設計創建一個新系統的時候,似乎也沒有考慮熵的因素。造成這種想像的可能原因如下:
(1)目前人們並不擔心能源問題,他們相信在他們關心的時間內,可以為這些產品提供足夠的外部能源。比如汽車廠商,他們相信現在的石油可以保證他們生產的產品正常銷售。
(2)在自私的資本市場體制下,人們只需要關心產品帶來的財富,而不需要關心對社會造成的負面危害。比如蘋果公司只關心產品可以賺多少錢,不會考慮會造成人類生存系統熵增加的後果(不斷更換產品,大量的生產垃圾等)。
(3)人們對熵的認識還比較膚淺,可能並沒有意識到熵的真正意義。儘管物理學家提出了一個人們目前普遍接受的假設模型,認為宇宙是一個孤立的系統,初始宇宙是一個低熵系統,然後開始向高熵系統轉移,最後歸於死寂。但是也可以做出另外的假設,宇宙不是孤立的系統,可以通過外部能量重新開始一個熵的循環。比如在地球生物系統裡,如果沒有太陽提供能量,當來自植物的能量完成一次循環後,生物系統將歸於死寂,但是由於太陽提供了外部能量,所以生物系統可以不斷地循環下去。
作為持續運行的軟體產品,儘管是工程師設計的信息處理系統,熵同樣可以作為判斷該系統是否合理的標準。如果一個系統的運行完全依賴外部能量,那麼這個系統所消耗的外部能量是最大的,如果一個系統可以通過內部能量差異來進行自動運行,而外部能量只是用來啟動一個內部循環初始狀態,那麼所消耗的外部能量會減少很多。內部循環的過程越長,所消耗的外部能量就會越少,這個系統就越優秀。
所以在雲計算時代,人們可以從能耗的數量來判斷一個信息管理系統的優秀程度。
1、Google搜索
人們高度關注並研究google,並不完全是因為他擁有大量的財富,而是因為他掌握了全球最多的信息。google通過對信息的處理不僅獲得了物質財富,同時也可以達到影響控制其他人的目的,帶來信息恐慌。比如谷歌街景地圖把一個敏感事件暴露在公眾面前。
Google的技術創新能力以及企業文化活力增強了其在雲計算時代的競爭能力,使其有可能成為雲計算時代的信息霸主。不過要實現這個目標,google需要考慮產品的能耗問題。因為到了未來的雲計算時代,在沒有外部能量補充的情況下,地球系統內部的有效能量在不斷減少,人類需要採用新的科學技術阻止熵增加的趨勢,以便保證生存環境的活力。
目前的google產品系統是一個無序、均勻分布的高熵系統,因此系統的運行基本上是靠外部提供的能量來完成的,比如搜索一個村裡的土豆信息,以及搜索村的上級區域裡的土豆信息,其過程是孤立的,每次搜索都需要外部能量的驅動。
據網上消息稱,google在2010年一共消耗23億千瓦時的電力,約等於21萬個美國家庭一年的用電量。而這種能耗每年都在增加。
2、IBM智慧城市
擁有大量專利技術的IBM將是雲計算時代的主要競爭者之一。智慧城市作為其實現智慧地球這個雲計算戰略的主要產品,充分體現了IBM的全球領導者的水平。
然而目前的智慧城市系統存在的缺陷使得IBM無法實現其智慧地球的戰略目標。其主要原因如下:
(1)智慧城市是孤立的系統,無法形成全球信息生態系統。比如中國的一些城市都在建設智慧城市,通過信息系統來管理和解決現實系統中的問題,提高辦事效率。但是這些城市系統是孤立的,每個系統都是在獨立的外部能量驅動下運行的。
(2)每個具體系統的信息分布是無序、均勻的,處於高熵狀態。比如醫療系統,人、藥品、醫院、醫療機構等信息的分布是均勻的,因此無法依靠內部的能量差異進行流動,每次處理都需要在外部能量的驅動下完成。
3、淘寶網(http://taobao.com)
中國龐大的市場需求為雲計算發展提供了應用土壤,也因此給中國的雲計算企業提供了機會。不過對於中國的本土企業(不受國外資本控制的企業)來說,在賺了很多錢的同時,需要正視一個殘酷的事實:雲計算最終的競爭一定是核心技術的競爭。如果不能掌握具有自主智慧財產權的雲計算核心技術,無論現在有多輝煌,終究會變成明日黃花。
淘寶網是馬雲創造的一個傳奇。淘寶的成功來自馬雲對市場環境各種因素的理解,比如中華文化,中國人的心態,地方政府的需求,輿論的需求等等。
網上資料顯示,淘寶網目前的店鋪數量超過了600萬個。這些店鋪無序、均勻地分布在一個空間內,是一個高熵系統。由於淘寶網只有一個公共信息展示平臺(門戶入口網頁),所以絕大多數的店鋪處於與世隔絕狀態,只有極少數店鋪可以在展示頁面上獲得推薦。一個店鋪的活躍程度是依靠外部提供能量的多少來決定的。能量指店主的付出,比如做廣告、和其它網站交換連結、向用戶推薦、不斷更換好商品等。
4、億盟258網(http://em258.com)
億盟258網是北京乾坤化物公司開發的雲計算網站系統。作為中國雲計算技術與產業聯盟發起成員單位之一,乾坤化物公司目前掌握了幾百項雲計算核心技術,2007年申請了12項原始基礎發明專利,其中兩項在2012年獲得了授權。一些核心技術方法涉及到基礎科學理論方法,比如自然數的非線性處理方法,將修正皮亞諾關於自然數的5條公理系統,皮亞諾描述的自然數只是非線性方法的0階表現形式;又比如IP位址樹方法將可以創建一個包含IPv4和IPv6地址在內的無限IP資源系統,從而幫助人們解決因為空間壓力增加而產生的網絡系統崩潰的危機。
億盟258網是採用層次結構的地理位置服務技術構造的一個有序、不均勻的低熵信息生態系統。按照現有的行政區劃管理方式,原始信息分布在最高位。以中國為例,地理位置樹的分布為中國-->省-->地區-->縣-->鄉鎮(街道辦)-->村(居委會)。其中,中國為根部,處於結構的最低位,勢能最低,村處於樹的最高位,勢能最高。
按照熵的規則,對於一個孤立的系統,如果沒有外部能量的驅動,處於高位的信息將在勢能的驅動下,自動向低位流動。因此在億盟258網站系統裡,將通過6級能量差形成一個生命周期。
當信息匯集到最低位,即中國層面的網站時,系統就變成了一個高熵系統,和目前的淘寶網系統一樣,需要耗費大量的能量來推動系統的運行。但是由於在不同層面的行政區域上有不同的信息匯集,因此用戶可以在不同的層面獲得所需要的信息。如同地球水系統一樣,儘管人們無法直接從大海裡獲得需要的水,但是可以從不同層面的儲水系統裡獲得需要的水,比如水井、水塘、小溪、小河、大江、大海等。
四、熵將成為雲計算產品系統生存活力的重要標誌
一則來自騰訊科技2012年5月1日消息:據美國《福布斯》網站發表特約撰稿人埃裡克-傑克遜(Eric Jackson)的文章稱,由於網際網路領域新老企業之間存在本質差異,因此當新技術趨勢出現時,老企業大多無法適應。這不僅可以得到理論支持,同樣有前車之鑑。因此,谷歌和Facebook很有可能在未來5年到8年內徹底消失。
這種觀點其實在幾年前雲計算剛開始的時候就出現了,只是人們並不認為谷歌也有可能在未來的幾年內消失。事實上正如文章裡所說的,當革命性的技術出現時,傳統的企業如果沒有掌握新技術,就會被淘汰。這符合組織生態學家提出的「過時責任」(liability of obsolescence)的理念:即隨著時間的推移,組織內在的產品戰略越來越難以適應他們所處的環境。這很可能成為對當今全球科技業千變萬化局勢的一種合理解釋。
熵是衡量一個信息產品生存能力的重要標誌。在相同的外部條件下,低熵系統比高熵系統擁有更長的生存時間。
熵本質上是一個強制的規則,在一個封閉的系統裡,其每個成員有平等佔有系統資源的權利,最終達到平衡均勻,平衡意味著死寂。一些科學家推測人類所在的宇宙是一個孤立的系統,儘管目前是一個有序、不均勻分布的系統,但是由於沒有外部能量的推動,宇宙將會按照熵的規則走向死寂。當然這只是其中的一個假設,不一定就是事實,因此也不必杞人憂天。
所以,在雲計算時代,目前的這些國際IT巨頭被淘汰的可能性同樣很大,對於中國的中小微型企業來說,如果能夠掌握真正的雲計算核心技術,充分利用中國的市場環境優勢,成為全球IT巨頭的機會是很大的。
作者簡介:趙文銀,中國電子學會高級會員,中國電子學會雲計算專家委員會委員。