世界似乎在做加速運動,輪子轉得越來越快,一日千裡揚長而去,我時有追不上的恐慌。很多宏大力量在塑造世界的未來,最顯眼的是反全球化浪潮和恐怖主義的興起,因為理解的門檻相對低,老百姓大街小巷茶餘飯後都在討論。還有些力量不易覺察,比如西方發達國家和中國長期低生育率將導致人口萎縮,在長時間尺度上會對人類歷史產生難以逆轉的影響。在所有這些左右我們命運的宏大力量中,人工智慧技術突飛猛進呼嘯而來,未來幾十年會深刻改變我們以及孩子們的生活。但是理解它,需要跨越很高的門檻。
王維嘉:《暗知識:機器認知如何顛覆商業和社會》(中信出版社)
王維嘉博士的新書《暗知識:機器認知如何顛覆商業和社會》為非專業讀者跨越這個門檻用最簡單的語言把人工智慧講得清清楚楚,是近年來我讀到的少見的上乘科普作品。這本書其實覆蓋了兩個不同部分,一部分談形而下對個人的意義,講人工智慧的科學原理,主流學派,怎樣顛覆傳統產業,怎樣改變我們未來工作和生活。另一部分是談形而上對人類的意義,關於人工智慧對人類認知方式衝擊的哲學探討。
作者闡釋了人工智慧的基本科學原理和發展史,認為人工智慧迅猛發展得益於三個推動因素:計算能力空前提高,數據量爆炸,科學研究突破。本書澄清了人工智慧、機器學習、神經網絡、深度學習常被濫用的概念,用很多生動的例子解釋主要技術流派的理念。貝葉斯學派裡最有意思的例子是疾病判定和垃圾郵件判定的居然是相同的方法。類推學派最有意思的比喻是倫敦1894年的霍亂,每8個人死1個,無人知道原因,內科醫生把霍亂病例標註在地圖上,猛然發現所有病例都靠近公共水泵,推斷出病因是水汙染,從而找到防治辦法。最精彩的是解釋AlphaGo的工作原理,人類下圍棋找最優解,好比在群山間找最低谷底,兩千年一直師傅傳徒弟在小山谷裡轉圈,而AlphaGo相當於同時開著數百萬輛越野車在群山中高速搜索,很快找到比人類兩千年來更低的山谷。作者同時解釋了深度學習卷積神經網絡怎樣化繁為簡大幅減少計算量。
本書對數據價值有非常深入的思考。很多人認為中國在人工智慧發展有不可超越的優勢,因為擁有超大規模海量數據,這個說法似乎有道理。但AlphaZero單機用4個TPU,36個小時訓練,不需要任何人類下棋經驗和過往數據,可以完敗所有人類頂級棋手。而GAN「生成對抗網絡」從少量數據可以自動生成新數據,彌補數據的缺乏。這項技術的發展會在很多領域打破所謂數據量大的優勢。作者認為谷歌和百度在AI技術上非常激進的原因之一是,搜索的用戶數據比社交和電商的用戶數據「淺」,挖掘價值沒有社交和電商用戶高。作者不擔心用戶數據目前都控制在網際網路巨頭手中,這些數據是表面沙土裡的淺層金沙。他認為還有對人類用處更大的數據金礦:人類身體和心理數據、自然和社會環境數據、農業工業服務勞動過程的數據。
作者認為人工智慧行業金字塔尖是算法、晶片、和計算平臺,美國目前領先。人工智慧的商業應用上,中國有巨大的成長空間。人工智慧對民眾心理衝擊最大的應用估計是無人駕駛。自動駕駛本質是一個會自己高速運動的機器人,是四個輪子上的一部電腦,將會顛覆10萬億美元的汽車行業。每個自動駕駛的垂直領域比如農場、建築工地、倉庫等封閉場合,都可以培育出市值超過10億美元的獨角獸企業。共享出行的成本中70%是人工成本,自動駕駛會去掉這個成本,每輛自動駕駛共享車可以減少5輛私家車,大部分傳統車廠恐怕面臨關門的威脅。在醫療領域,美國醫生影像誤診每年高達1200萬人,而中國每年5千萬人被誤診,AI將在醫學圖像識別準確度遠遠超過人類醫生。美歐都有用深度學習發現新藥的公司,進行診斷和慢性病健康管理的企業。在金融領域的AI應用,會導致一大批的高薪金融精英失業,瑞銀認為未來會裁員3萬人,高盛已經把紐約現金櫃檯交易員從600人裁減到2人,把IPO的146個步驟全部自動化。如果可以把人工智慧用在城市管理,計算每個街區的人流,就可以避免2014年末上海外灘的踩踏悲劇。而且人工智慧可以替代記者寫作,替代審計師查帳,替代律師搜索整理文件……幾乎可以替代人類絕大部分腦力工作。
人工智慧替代白領工作,引起中產階級巨大的焦慮。我們以後工作怎麼辦?作者舉了一個有啟發的例子,農業人口在1840年佔美國總勞動人口的70%,目前只有2%。在170年中每年減少大約0.7%。目前美國每年仍然有24萬農業人口離開土地,差不多是美國一個月新增的就業人口。工業革命後機器替代體力勞動,沒有出現大規模就業問題,人類順利從農村出逃,開始城市化生活。因替代時間相對慢,給人類從農業文明演化到工業文明適應新生活方式足夠的時間。但人工智慧來勢洶洶,以迅雷不及掩耳之勢出現,今天所有白領工作都可能被替代掉。該怎麼辦呢?
正如作者已經提到,我覺得不斷增加法定假期,是迄今能想到的最靠譜的解決方案之一。人工智慧應用每擴張一大步,公眾就多放一天假。一周工作時間可以從五天減少到四天然後三天。把效率提高對減員的壓力,通過法定假期轉化為工作總時間減少,平均分攤到每個頭上,大家一起承擔效率提高付出的代價並獲得效率提高帶來的好處,避免技術進步的代價只讓一部分人完全承擔。通過逐步消減工作時間,緩解人工智慧大規模應用帶來的衝擊。也許二三十年後,每個人每周只需要工作一天。這麼一想覺得畫面好美,我幾乎能看見聖西門和託馬斯摩爾從歷史遙遠的深處回眸的微笑。
在本書的一前一後,作者對人工智慧做形而上的哲學探討。作者把機器能發現的知識叫暗知識,人工智慧是一場認知革命,其意義會超過文字和印刷術的發明,甚至只有人類產生語言可與之相比。對我來說,暗知識和默知識的存在是不言而喻的,它可以簡潔解釋為什麼光靠讀書學不會遊泳和騎自行車。為什麼考上名牌大學成績最好的學生,不一定總是在人生和工作中取得最好的成就。學校學的考的基本都是明知識。而事業成功與否,人生快樂與否,也需要很多的默知識和暗知識。
王維嘉博士對暗知識定義的兩個特徵,一是不可感知,二是不可表達。這是本書中我唯一沒有被說服的地方。我認同暗知識的存在和重要,也理解人類面對浩瀚未知世界的無力感。但是,我認為暗知識可以感知也可以表達,就如同機器識別發現了一個疾病,圍棋某一步的下法,股票某一種交易策略後,人類沒有理由無法理解。只是象紅外和紫外一樣,沒有輔助工具則難以發現。感知的本質是輸入信號,輸入如果是無邊黑暗中的海量數據,人類的頭腦沒有足夠大的工作內存,也沒有足夠快的運算速度,必然超載而無法工作。而表達就是輸出,一旦人工智慧有足夠大的工作內存和足夠快的運算速度,通過模仿人腦以強大的計算能力就能幫助我們發現各種相關性。按王維嘉博士的思路,他說的似乎是通往暗知識的浩瀚無邊的海洋或者找不到路的暗無天日的叢林,或者連結維度過多過雜,超越了目前人類大腦的容量和能力,這個發現過程難以感知或者表達,而不是暗知識本身不可意會難以言傳。人類三千年前用腳不斷丈量土地,只能量出這是一個很大的平面。假如當時有一個機器人沿著地面瘋狂地跑無數圈,把腳下每個點的信息輸入,人工智慧有足夠大的數據拼出一個球體的樣子。當時的人類是通過月球上的影子和海上的桅杆,猜出了地球是圓的,然後再找其他數據驗證。人類大腦的小容量和低速度註定了,它適合小數據和符號邏輯推理學習。人工智慧是通過大數據和挖掘海量的相關性學習。人腦和人工智慧可以通過不同的路徑,在某些局部區域抵達同樣的理解。
關於機器人能否產生意識的辯論,我傾向於認為能。生命記錄在DNA裡,DNA的本質是可以自我複製和自我表達的信息。從單細胞演化到多細胞到哺乳動物,DNA裡記錄的信息不僅保留原有早期的內容,還不斷加入新的變異信息,並不斷被自然選擇淘汰。記錄在碳基化合物上的能進行自我複製表達的信息序列,後來表達成了高等哺乳動物,發展出了意識,碳基可以,矽基為什麼註定不行?考慮到基因編輯技術和人工智慧都在一路狂奔,兩個加在一起,我覺得,搞得不好我們就是最後幾代野生智人了,眼睜睜看著另一個更高級更強大的物種的登場。
這些憂慮都顧不過來了,還是爭取先實現一個小目標。人工智慧都來了,希望不久的將來,人人每周只需要工作一天。也算踐行了先天下之樂而樂,後天下之憂而憂的理念。