雷鋒網(公眾號:雷鋒網)註:本文作者韓鋒,清華大學博士,比特幣基金會終生會員,曾任清華大學十五規劃重點課題「基於網絡(大數據)的創新人才評價和選拔」項目負責人,美國甲骨文教育基金會中國合伙人。
顧學雍教授在清華課程《超越學科的認知基礎》中說:「一個範式成功的標誌是擁有了自洽的語言系統,包括ontology, structure, orientation.」。
正是在這一理論原則指引下,顧學雍教授向作者韓鋒推薦了《區塊鏈新經濟藍圖》作者Melanie Swan撰寫的一篇論文,講人工智慧和區塊鏈。單純看這個題目,我很難想像區塊鏈和人工智慧有什麼關係?
讀Melanie Swan這篇文章幾遍後,多少覺得從經濟學角度來講有些道理,但是我很困惑作者並沒能對「人工智慧」這個感念有明確的定義。後來我問了世界級的人工智慧專家吳韌,他的回答居然也是:「沒有權威的說法。」
我才明白了:人工智慧學科的範式還在形成過程中。
根據顧學雍教授的說法,一個笵式,成熟的標誌是自洽的語言系統。大家不要小看這個定義,其實非常多的學科沒有達到這個標準。而真正的最高水平的人在努力達到這個標準,而且一旦達到,將面臨巨大的突破。其實回想一下,愛因斯坦《相對論的意義》,這本書寫得太好,其中的很多智慧都有很震撼的感覺。說穿了,牛頓力學到愛因斯坦的時候發展了三百年了,關於時間和空間實際上沒有自洽的語言系統,是說不清楚的。實際上人類的思維很懶惰,大部分時候關於時間空間是什麼,自己並不清楚。如果讓一個人下定義,很大可能會發現那人張口結舌,不知道怎麼說。愛因斯坦無外乎就是把這個概念,用他認為合理的語言自洽地描繪出來。描述完發現,如果站在光速不變的原理下,就一定有一個新的自洽語言的系統:那就是相對論。相對論就是超越牛頓力學學科的利用電磁學為其建立了一套自洽的語言系統。
現在我們超越學科的來看一下「人工智慧」和「區塊鏈」。
| 什麼是「熵」?
之前在清華我們遇到了一位美國的訪問學者,Steven Young。我問他什麼是人工智慧,他的回答是:「三十年人類如果了解大腦以後,我們再回答什麼是智能吧!」他的話讓我覺得很具有代表性,覺得現在不該定義,理由就是我們現在對大腦沒有足夠了解。我們知道人類對自己大腦的研究,進展極其緩慢。相應的很奇怪的是,人工智慧在飛速發展。所以大家都在等著,要等對大腦有足夠了解以後才能定義人工智慧。我們認為這實際上是一個巨大的誤區:先入為主認為只有生物的大腦才能產生智能,而其他機器計算都是大腦的低劣模仿者!但實際上,我們看了費曼的講量子計算的那本書講的麥克斯韋妖以後,得到了巨大的啟發,事實並非如此!
為了能理解費曼的思想,我們首先來闡述一下什麼是 「熵」?
「熵」為什麼是一個成熟的語言系統?上節課我們問大家什麼是熵?大家基本上都能把意思說出來,代表系統混亂的程度。大家都不是來自物理系,但是基本上在語言概念上沒有錯,這就說明熵的語言系統已經很成熟。熵其實是一個很抽象的概念。作者在大學二年級的時候,抱著一本伯克利編的《統計物理學》,學了整整一學期。那本書從物理統計概念和實驗的角度一點點剝絲抽繭講清楚了熵是什麼。
作者曾經和曾蓓聊過,她是清華高研院的高材生,曾在MIT讀博士,現在在加拿大當教授。我們在討論問題的時候,是她脫口而出告訴我,熵是是系統無知的度量。作者關於熵也有自己的語言,好多年前,當時一位UBC的朋友請求給她輔導物理化學。結果很快就碰到了熵這個概念,令作者很頭疼。因為這位朋友不是物理系的。只好用比較通俗的語言講:熵是系統能量耗散均分到最大自由度的數量。作者為了讓她懂,講了一個故事:本來,你從銀行取了一萬塊錢,相當於能量。結果你不小心摔了一跤,然後一陣風把一萬塊錢吹到了街上。而正好街上的一百人就把你的錢一張一百的撿走了,你也只能去報警。而警察也幾乎沒有可能把你的錢找回來。這說明,一萬塊錢的「能量」分散到一百人手裡,若想自然逆變化回來,幾乎不可能,這就是熵增大原理。所以,熵是什麼標度?你這一萬塊錢分散的標度。如果只分散到一兩個人,那熵很小,系統的無知程度也小,那你找回來可能大。但是如果你這一萬塊錢分散到的人越多,熵越大,你找回的可能越小。所以能量分散到原子的自由度的數量,這是用熵來標度的。
後來作者怕講錯,仔細一想,這也是有根據的。你們學過熱力學,知道這個公式麼?
熱力學系統裡熵的變化等於它吸收或者放出熱量Q除以溫度T。這是熱力學的一個著名的公式。下方的分母是溫度,溫度的物理含義是什麼?代表平均分子動能,就是均分到每個分子上的動能(能量)。所以熱量除以溫度,就是系統的能量(對應你從銀行取出的一萬塊錢)被多少原子均分了,熵正好正比於系統中原子的自由度。這就是你的錢丟了,被均分了。
最後給一點物理專業的回答,什麼是熵?熵正比於系統可到達量子組態的對數。
前面的k是玻爾茲曼常數,是系統量子組態數。這個公式就比較抽象了,但是後面我們會用到,所以給大家介紹下。總而言之,「熵」這個語言體系是自洽的,說法可以更換,所以可以超越學科的用「熵」的語言描述一下後面的「智能」。
| 什麼是麥克斯韋妖?
我們就是要用這麼一個成熟的語言體系解釋下面我要講的。什麼是麥克斯韋妖。本來我在給顧老師講什麼是麥克斯韋妖,結果顧老師給我推薦,講這個最好的是費曼的那本講量子計算的書。後來我回過去看那本書,費曼講得更好。
給大家講下什麼是麥克斯韋妖。大家都知道熵增大原理,就是熱力學第二定律。但是搞電磁學的麥克斯韋自己造了一個概念,給已有的熱力學語言體系帶來了很大的危機。他就提出了一個小妖(Maxwell’s demon,見圖1)。
圖1
本來熱力學系統達到平衡,兩邊的溫度是一樣的,但是中間有個隔斷,這個妖有一個控制隔斷的開關,麥克斯韋妖讓超過某個溫度以上的原子可以向右放過,而低於這個速度的原子可以向左放過。而在它掌握下的開關,過一會兒會發生什麼現象?動能高的原子都會跑到右邊,動能低的就會到左邊。我們剛才說了,溫度代表系統中原子的平均動能,如果這個妖也算是封閉體系的一部分,那豈不是系統自然的就讓熱量從溫度低的流向溫度高的?系統等於不需要外加能量的就成了電冰箱,豈不是把熱力學第二定律破壞了?因為根據熱力學第二定律封閉系統最終一定要熵最大,這個體系內的溫度永遠要均衡,能量在各原子自由度上的分布一定要均勻。
別看這麼簡單一個理想實驗,人類探索了一百年。
最終解決這個問題的人是Charles Bennett,他是量子計算機的奠基人之一,來自IBM計算機實驗室。我查了他專門討論這個問題的原始文獻。他的這句話很經典:
「From its beginning, the history of the Maxwell’s Demon problem has involved discussions of the role of the Demon’s intelligence, and indeed of how and whether one ought to characterize an 」intelligent being」 physically.」(從一開始來說,麥克斯韋妖的討論包含了妖的智能,關鍵是怎樣物理地把這個「智能」表述出來」)
C.Bennet嘗試用物理模型討論智能,這是自圖靈機之後的一大突破。我說過,人類的思想禁區,是只有談到生物大腦,才敢談論智能。其他的學科似乎沒有資格談智能。在此之前,只有1950年艾倫.圖靈發表了他裡程碑式的論文《機器能思考嗎?》
其實在Bennett之前,就已經有了鋪墊,1961年時也是IBM的Landauer 提出了Landauer原理【7】,甚至更早還有1929年匈牙利的Leo Szilard的單分子熱機模型【8】,但是都沒有徹底講清楚。Landauer原理就是:「如果需要不可逆的塗消一個比特的不確定性(系統熵減少,或者說產生一個比特信息),最小需要耗散kT ln2的能量(其中k是玻爾茲曼常數,T是溫度)。
解釋一下(見圖2)。
圖2
我們考慮一個熱力學的盒子,盒子裡只有一個分子,把問題最大程度地簡化。一開始我不知道分子是在左邊還是右邊(圖2 a)。你可以定義在左邊相當於0,在右邊相當於1。在完全不知道的情況下,兩個比特的未知,對應的熵應該是kln2。系統未知,你不知道是在左邊還是右邊。你不知道沒有關係,我們假設一個活塞,壓這個分子的空間(相當於一個麥克斯韋妖的智能去識別一個原子的速度是否高於某個速度值之上)。如果你們懂熱力學那就簡單了。如果等溫地往左邊壓,這個系統會怎麼樣?要釋放熱量,這是熱力學第一定律。
我們相當於當了一回麥克斯韋妖,把兩比特的信息的不確定性(原子在左邊還是右邊)壓縮到確定性的左邊,熵減少kln2(原來系統有左和右兩個選擇,假設有兩個量子態選擇,所以熵是kln2,只壓縮到左邊系統熵就變為kln1=0),釋放多少熱量?用熱力學的方法很快能計算出來,如果周圍的熱庫溫度是T的話,就需要耗散這麼kTln2多熱量(用公式1)。如果你已經明確知道原子在左邊了,沒有不確定性了,而你就獲得了一個比特的信息。這個模型告訴了我們非常多的信息:第一,什麼是麥克斯韋妖的智能?我們認為,因為它能減少熵,能產生信息;第二,Landauer原理也告訴我們,產生一個比特的信息最少需要耗費多少能量?也給出來了,kT·ln2,和系統溫度有關。
不過補充一下這個原始的論證是有毛病的。如果盒子內的原子不遵循量子力學,而是牛頓力學,那就得不到後面的結論。你們學過熱力學,熱力學的基本假設在牛頓力學之上。你看他的論述,第一步時,不知道原子在左邊還是右邊,如果遵循牛頓力學,原子的運動有確定性,那完全可以假設其在左邊,只是你不知道。這樣有確定性,不僅是位置的確定性,還有速度的確定性。只要速度是上下的,及可以完全在上下運動,原子永遠不會到右邊。如果是這樣,那進行所謂壓縮,另一邊是真空,如果壓縮的話,不需要做任何功。雖然你不知道,但是確定性就意味著右邊沒有原子,這是證明的疏漏。
為什麼一切要架構在量子非定域上(或者說不確定性上)。這也說明量子力學有了自洽的語言系統多麼重要,否則想不到一起。而他的論述完全在牛頓力學之上。有了量子力學做基礎,大不一樣,這個分子一定能充滿到兩個,且不說有空間的非定域。有這種最基本的不確定性,△s·△p≥ħ。哪怕說一開始限定的原子就在左邊,但是它在速度絕對有不確定性,肯定會往右邊跑。所以,只有在量子力學非定域下,Landauer原理的推理才沒有漏洞。
有了前幾位大師的工作,我們可以定義什麼是麥克斯韋妖的智能?這個妖是對系統無知的壓縮,也就是熵的減少。根據Landauer原理計算,產生一比特信息至少耗散kT·ln2的能量。
接下來我們就至少給一類分布式智能下個定義:麥克斯韋妖在一個系統中非定域分布,但是執行的是同一個「基礎協議」,也就是都在壓縮系統的「熵」,這個系統就分布的存在麥克斯韋妖智能。這就意味著智能是可以比較大小的,有的系統產生的智能高,意味著對系統壓縮的效率就高了,而且不同系統耗費的能量不一樣。有沒有系統耗費更少能量產生更多信息?當然存在。
按這個定義,亞當.斯密定義的「市場」看不見的手,就是一個麥克斯韋妖智能系統,比如一個市場很繁榮,商品平均讓消費者選擇度是五件商品,那每個消費者就是一個麥克斯韋妖,她的一次購買行為就會壓縮系統的熵kln5,這就是亞東.斯密市場的基礎協議.當然,如果對一個權貴肆虐的市場,進行壟斷經營,或者搞計劃經濟,讓消費者每次的選擇度只有一,那消費者就失去了熵壓縮的功能,整個市場的智能就趨於零,這就是一個貧窮的市場。實際上絕不要小看每個消費者的麥克斯韋妖的作用,成千上萬個消費者的購買行為,讓這個市場的「基礎協議」能給我們帶來巨大的繁榮和財富,就比如一百年前的汽車,不外乎牛車上裝一發動機方向盤,但是現在的汽車,在市場智能的作用下都快趕上宇宙飛船了。
這樣看混沌分形系統也有麥克斯韋妖智能。什麼是分形系統?舉個最簡單的例子,就是康託集。一個線段給你,等分成三部分,挖走中間的部分,然後再把每個小段的中間三分之一挖去,然後再把更小的每段的中間三分之一挖掉,以此類推,不斷迭代(見圖3)。
圖3 康託集
表面上看這些跟智能有些風馬牛不相及。可是,我稍微解釋一下,這相當於有一個麥克斯韋妖。其實數學上給你一個線段,潛臺詞的意思就是這些線段上的點每一個出現的概率是一樣的。突然挖掉中間三分之一,就跟麥克斯韋妖的熵壓縮等同。中間的三分之一概率為0了。然後再次挖掉,再次壓縮,相當於執行一個熵減的基礎協議。說到這你們認為這能產生智能,多少可能還有些難以理解,我就給你們看下這個圖。這叫分型藝術,就是靠我剛才說的基礎協議(見圖4)。
圖4 左邊是熵減小的基礎協議形成的分形藝術,右邊是熵最大,顯然左邊的圖擁有智能的美感。
實際上蜂群給了我們一個分布式麥克斯韋妖的例子。如果把一隻蜜蜂和一隻熊比較,高下立判,你們肯定會說熊的智能遠在蜜蜂之上,因為工蜂只能執行的幾個很簡單的動作,基本上是反應式的,決不能指望一隻小蜜蜂有多高的智能。但是蜜蜂再小,她只要能每一步壓縮系統的熵,她就是麥克斯韋妖,一大群蜜蜂,都在執行麥克斯韋妖的協議,會產生什麼?(見圖5)
圖5 左邊是熊窩,右邊是蜂巢
建築師們就會說蜂巢是多麼的偉大,蜂巢是到現在人類都佩服不已的一種建築結構,耗費資源最少,和環境最融洽的,也最符合蜂群的組織需求。很多人類的建築也都在模仿。這就叫群集智慧,分布式麥克斯韋妖的智能。而熊雖然有較高的中心智能,但他築的巢顯然是無法和蜂巢相比的。
再舉一個分布式麥克斯韋妖的例子,大家看這個,飛鳥(圖6)。
圖6 飛鳥的麥克斯韋妖智能系統
大家設想,如果有一個中心智能司令官號召群鳥,可能形成這樣嗎?基本不可能,這需要極其高級的組織能力和協調能力。每個小鳥的智能都很低,不能假設每隻鳥都有飛行員的智力水平。只不過都在執行一個簡單的協議,這個協議可能簡單到,只要求前後左右的鳥之間的距離保持在某個範圍內。就像麥克斯韋妖在康託集中截斷線段一樣,把距離保持在某個範圍之內。就是這麼一個簡單的協議。但是群集智慧就能體現出很高的協同性,這樣一個熵減系統,讓人類也嘆為觀止。
| 比特幣和區塊鏈為什麼具有麥克斯韋妖的智能?
一個自稱中本聰的人2008年希望發明一種完全不依賴中心智能背書的網際網路信用貨幣系統,首先要解決防止重複支付問題,他發現分布式的讓每個網上節點充當麥克斯韋妖是避免造假的最好辦法,就是給每筆交易蓋時間戳,因為時間是最分布的信息,幾乎每個人都可以掌握,所以蓋上時間戳的交易記錄,再作假就很難了。事實上,時間戳是由那些被稱之為「礦工」的節點去蓋的,就是比特幣的挖礦。為什麼叫礦工呢?因為你也不能假設網上全是雷鋒,平時沒事幹、不工作,只給你蓋時間戳。他們需要獎勵。然後就規定,每十分鐘,大家把全網的合法交易都記帳在這個區塊(block)裡,然後大家競爭,全球每十分鐘只有一個合法的記帳人。
什麼是合法的記帳人?有以下幾個條件:第一,他這十分鐘裡記得帳必須經過全網核查,沒有問題,就是時間戳蓋得對,這是大前提,否則沒有獎勵。第二,要在全網證明你的算力是全網最高,解SHA256難題,來證明你的算力最高。所以每十分鐘只有一個幸運兒能搶到,搶到了記帳權就能得到獎勵,每十分鐘25個比特幣。這是一筆很大財富,然後每十分鐘一個合法記帳的區塊又一個一個連結起來,形成一個總帳,這就是區塊鏈。所以,比特幣的信用就建立在這些全網記帳的礦工上,成千上萬的礦工就是比特幣世界的麥克斯韋妖,靠他們蓋時間戳記帳,篩除了可能二次支付的虛假交易,不斷降低了整個比特幣信用系統的熵,最高把比特幣的信用推高到一百億美金,這已經是一個高度智能的系統了。
這本來是一個極客們玩的東西,是開源的協議,就跟我剛才說的小蜜蜂執行的協議一樣,大家共同去挖礦來證明每一筆交易的合法性。不管怎麼說,運行了六年沒有崩潰,這是人類信用史上的奇蹟。完全沒有任何中心,只依靠基本協議,蓋時間戳和記帳,每十分鐘挖出一個block,形成一個單鏈,被稱為blockchain區塊鏈。這是一個典型的麥克斯韋妖智能系統。
阿里巴巴副總裁高紅冰對我說過:「傳統金融的信用建立在鋼筋水泥的大廈上,你看銀行是不是都得蓋大樓?但未來的信用是建立在數據的大廈上」。所以區塊鏈就是靠全網分布記帳,自由公證,建立了一個共識資料庫,這就是未來信用的數據大廈。
為什麼區塊鏈可以產生智能?它讓全網的計算機算力都能成為麥克斯韋妖,這在人類歷史上是前所未有的。每一臺計算機,如果參與了區塊鏈的系統,你都會在幫助它壓縮信息,全網將來會有智能協議。智能協議的自動執行是依靠全網公證。
對未來暢想,比如說原來你的出生證、房產證、婚姻證等,需要政府備書,好像政府才能承認。但一旦跨國,你就會遇到無窮的麻煩,包括合同。跨國以後合同可能就不能認了,或者無法執行。整個傳統的信用執行系統,成本非常高,法院啊、警察啊,而且還有腐敗的可能。這些成本都攤在了我們每個人的頭上。但是,如果全網公證幫你證明,幾乎無法作假。否則就像我剛才說的改時間,除非我有本事把每個人的手錶都改了。將來大家公證一個事情,比如公證你們的情侶關係,一下子就會成為全網的事實,修改的話幾乎是不可能的了,除非到全網的每個礦工那裡去改,成本高到無法接受。現在,要想修改的話,我問過比特幣的礦工,如果他們的世界想要這樣作假,成本大概是幾億人民幣(隨著時間還在迅速的增加)。成本一旦高了,大家就都不想作假了,因為付出的代價和獲得不成比例。
一個新的時代,未來的信用、真假是靠全網公證某個協議,靠全網每臺電腦成為麥克斯韋妖來實現的。這在人類歷史上打開了巨大的空間。它解決了什麼問題?未來構建全球市場,就像北京市金融局霍學文書記說的:「區塊鏈會成為全球金融的基礎架構」,是未來的信用大廈。
雷鋒網特約稿件,未經授權禁止轉載。詳情見轉載須知。