烏鎮智庫搜集了人類有史以來幾乎所有的公開數據,例如所有的專利、所有的學術資源、所有的經濟金融數據、法院判例,還有過去十幾年裡所有語言的維基百科和各種在線百科數據,以及社交媒體數據。我們把這些數據都建成知識圖譜,也整合了IBM著名的Watson系統底層的開源知識圖譜。在我們做的各種行業報告中,最有影響力的確實是關於人工智慧的系列報告。目前,《經濟學人》《金融時報》、高盛等機構關於人工智慧的深度報導大量引用我們的數據。可以說,中文媒體上涉及人工智慧的報導,其數據部分的源頭大多在我們這兒。
《經濟學人》刊載的2005、2010年相關國家AI專利申請數量,以及2016年相關國家AI公司數量。具體來說,從專利看人工智慧,我們可以知道:上世紀八十年代,中國尚沒有專利制度,更談不上人工智慧專利,但到了2012年至2013年間,中國人工智慧的專利總數已經超過美國,但專利的質量還不高。專利質量是可以定量計算出來的,學術論文的結果也類似。
根據我們做的人工智慧的大學排名,前四十名裡沒有中國,但從四十幾名開始,就有清華了。在人工智慧的分支學科中,上世紀八十年代極盛的專家系統,今天已無人問津,這在工業界的反映就是日本第五代計算機項目的衰敗。2010年後興起、今天還十分熱門的人工智慧子學科包括:機器學習、計算機視覺,以及自然語言處理。機器翻譯就屬於自然語言處理。
《金融時報》刊載的AI相關研究論文引用排名我們還可以利用數據做區域的對比研究。中國在人工智慧的投融資已經是世界第二,但也差不多只是以色列的四倍。以色列是個人口八百萬的國家,比上海的一個區還要小。而我們做的物聯網報告顯示,中國的物聯網體量比以色列要大四十多倍。這說明涉及高精尖技術的,以色列很強,而涉及人口和製造的,中國強。
您為什麼要寫人工智慧的歷史?去年來,AlphaGo不斷戰勝人類圍棋冠軍,而AlphaGo Zero還能自己從低階到高階對弈,能談談您和這個團隊的淵源嗎?人機圍棋對決,柯潔不敵AlphaGo。尼克:現在人工智慧這麼熱,需要有本書把它的歷史說明白。另外,國內沒什麼像樣的人工智慧的科普。我看過很多偽媒體人和「磚家」的各種言論,胡說八道的程度令人髮指,可怕的是其中一些人還有巨大的話語權和影響力,控制著各種資源。
我自認還夠格寫這樣一本書。人工智慧發展過程中的不少事兒,我大致都清楚。一方面出於興趣,另一方面,我的老師和大師兄是這個領域的大師級人物,他們發明了「強化學習」算法。谷歌收購的DeepMind團隊裡一半的人都是我大師兄的學生,他們曾經是人工智慧中的少數派,但DeepMind搞的AlphaGo贏了李世石之後,這一派一下又成了顯學。當年把我老師招到麻省大學的是麥可·阿比布(Michael Arbib)。他是控制論創始人維納的最後一個博士生。按照阿比布的一家之言,人工智慧是控制論的替代品。我當年本想投奔的是阿比布,但我到學校,他已轉會去了南加州大學,結果我就跟了我老師研究強化學習。從這個意義上說,我是AlphaGo那幫人的長輩。
麥可·阿比布DeepMind團隊我上學的時候正值人工智慧低潮。一般美國大學的計算機系都是分三夥人:做系統的,做理論的,做人工智慧的。做系統的和做理論的互相看不起,但他們同時看不起做人工智慧的。現在情況不一樣了,做人工智慧的應該都鹹魚翻身了,個個成了公共知識分子。我那時才疏學淺,看不清強化學習的遠景,證明了一個與機器學習相關的理論結果就離開了。其實,在人工智慧的各個分支裡,大概只有強化學習還留了點控制論的影子,也有人認為,強化學習包含了全部人工智慧。
「人工智慧」與「控制論」詞頻對比(引自《人工智慧簡史》)人工智慧學界,國內有一個和美國不同的現象:中國在人工智慧領域最有發言權的是自動化系——對應到中科院就是自動化所(新成立的人工智慧學院就設在這裡),而自動化系主要關注計算機是怎麼用的,並不關注計算機的基礎理論。美國的大學並沒有分得這麼細,加州大學伯克利分校和麻省理工學院到現在還是一個大系:EECS(Department of Electrical Engineering and Computer Science)——這在中國至少能拆成五個學院。中國一個很小的學科分支都是一個學院,而學院之間老死不相往來。
人工智慧這樣的學科,如果不懂點圖靈的計算理論,討論就很難深入。我除了想正本清源,還想鼓勵專家間的互動。
我也希望決策者看看我的書,了解些科普和歷史,也許可以少被偽媒體人和「磚家」們忽悠,少浪費些社會資源。我再說多了就要挨罵了。
西方有對人工智慧歷史的經典書寫嗎?尼克:美國人寫的人工智慧歷史,比較著名的有尼爾森(Nils J. Nilsson)的《人工智慧探究》(
The Quest for Artificial Intelligence: A History of Ideas and Achievements)。尼爾森是人工智慧學科的早期參與者和領導者,擔任過斯坦福研究所(SRI)人工智慧部門的負責人和史丹福大學計算機系主任多年。不過他這本書主要寫的是他自己熟悉的、偏好的領域。麥克達克(Pamela McCorduck)1979年寫的《能思考的機器》(
Machines Who Think: A Personal Inquiry into the History and Prospects of Artificial Intelligence)從今天的角度看則有些過時。
尼爾森:《人工智慧探究》麥克達克:《能思考的機器》另外,明尼蘇達大學的查爾斯·巴貝奇(Charles Babbage)研究所一直在做計算機科學的口述歷史,採訪了很多人工智慧學者。大部分的採訪都有錄音。我聽了近一百小時錄音,從這些第一手資料裡有一些有趣的新發現。
無論中英文,當下都沒有一本合適的人工智慧歷史的讀物。總的來講,我這本書還算公正全面,我兒子正在把它譯成英文。
通過第一手資料,您有什麼關於AI史的新發現?尼克:比如「人工智慧」(artificial intelligence)這個詞最早是誰提出的。普遍的誤解是,「人工智慧」這個詞是1956年達特茅斯學院夏季研討會——人工智慧的起源事件——的召集者麥卡錫(John McCarthy)想出來的,其實不然。麥老晚年回憶,承認這個詞最早是從別人那裡聽來的,但記不清是誰了。後來英國數學家伍德華(Philip Woodward)給《新科學家》雜誌寫信說他是AI一詞的原創者,麥卡錫最早是聽他說的,因為他1956 年曾去麻省理工學院訪問,與麥卡錫交流過。但麥卡錫在1955 年就在其建議書裡使用「人工智慧」一詞了。如今當事人大都已仙逝,此事恐成懸案。其實英國人最早的說法是「機器智能」(machine intelligence),這大概和圖靈1950年在哲學雜誌《心》(
Mind)上發表的傳世文章《計算機與智能》(Computing Machinery and Intelligence——我的譯文作為附錄收在書中)有關。最早Computing Machinery指計算機,而Computer是指人肉計算員,他們用機械計算機從事簡單重複的計算工作。
圖靈的《計算機與智能》發表於1950年10月的《心》另外,我比較詳細地考證了美國人工智慧幾大學派之間的矛盾和論爭。美國最早有三大人工智慧基地:史丹福大學、麻省理工學院和卡內基梅隆大學。三大基地是三夥不同的人弄的,這些實驗室經歷了種種的鬥爭、分裂、重組。這些人事紛爭構成了人工智慧學科的歷史。事實上,當圖靈在1948年英國國家物理實驗室的內部報告中區分了「肉體智能」/「附體智能」(embodied intelligence)和「無肉體智能」(disembodied intelligence),後來的統計派/神經網絡派(造一臺智能機器模擬大腦中的神經網絡)與符號派/邏輯派(用邏輯和符號系統模擬心智)之爭就已經埋下了伏筆。人工智慧的鼻祖之一紐厄爾(Allen Newell)說過,一部AI史就是一部鬥爭史(大意如此)。換言之,在任何時候,每種方法都有個對立面:模擬與數字,知識與邏輯,語義與語法,連續與符號,串行與並行,取代與增強,機械論與目的論,生物學與活力論,工程與科學……
麥卡錫在史丹福大學的人工智慧實驗室司馬賀最早的麥卡錫、司馬賀(Herbert Simon)分別是做邏輯和定理證明的,做統計的人當時不被重視,但現在反而邏輯沒人搞了,都去做統計了。近年來,知識圖譜技術在谷歌的鼓吹下,算是為符號派留下了一支血脈。
自人工智慧起源至今,半個多世紀過去了,它在哪些方面業已取得了突破?尼克:參加了達特茅斯會議的紐厄爾和司馬賀在1957 年曾預測:十年內計算機下棋能贏人,十年內計算機將能證明人還沒有證明的定理。他們太樂觀了。這兩個預測分別在1997年和1996年才實現,花了大概四十年。
1985年4月14日,紐厄爾在舊金山參加美國計算機協會的人機互動大會。2006 年,達特茅斯會議五十周年時,當時的十位與會者中有五位仙逝,活著的五位——摩爾、麥卡錫、明斯基、塞弗裡奇、所羅門諾夫在達特茅斯重聚。從人工智慧的歷史看,確實有很多過去認為是很難解決的問題被慢慢解決,比如人臉識別近五年在國內迅猛發展。目前,藉助「深度學習」(多層神經網絡)的語音識別系統已經達到可實用的階段。過去幾年也有一堆同質的公司冒出來。
機器翻譯難道還沒有突破嗎?尼克:的確,隨著語音和圖像識別技術漸趨成熟,人們普遍認為目前人工智慧裡比較難的問題是自然語言處理。有專家最近有言:懂語言者得天下。機器翻譯就是自然語言處理的一部分。2016 年,谷歌利用深度神經網絡搞的神經機器翻譯(Google Neural Machine Translation)系統,大幅提高了機器翻譯的水平;今年,Facebook利用自己擅長的卷積神經網絡,也進一步提高了機器翻譯的效率。但這距離理想場景——例如人們可以不學外語,人耳中嵌入微型翻譯器,自動譯出聽到的外語——還很遠。
谷歌神經機器翻譯系統翻譯的例句自然語言處理涉及了不少哲學主題,從圖靈測試到塞爾的「中文屋」假想實驗,皆與此相關。每出現一個新的人工智慧工具,都會被用來試試自然語言處理。
除了翻譯之外,自然語言處理的另一個難題是人機對話。現在的對話都是在短場景——十個句子之內,因為問答系統依靠的是常識和淺層的推理;知識圖譜是核心。一個問題總是會涉及who,when,where,how,why,這些要素都可以套到知識圖譜中類和實體的屬性和關係上。當你問2016 年之後的搜尋引擎:「梁啓超的兒媳婦是誰?」答案中至少會有「林徽因」和「林洙」。因為系統底層的知識圖譜知道梁思成是梁啓超的兒子,而梁思成結了兩次婚,第一次林徽因,第二次林洙。當知識圖譜足夠大的時候,它回答問題的能力會驚人:2011 年IBM的沃森(Watson)就在美國電視智力競賽節目
Jeopardy!中擊敗人類選手。但是,目前要達到很長的人機對話場景還很難。
沃森在Jeopardy!中擊敗人類選手這些技術是人工智慧下一步的突破口,我們也努力在這些領域做些有意義的創新性工作。
如《銀翼殺手》這樣的賽博格電影總會關注未來人工智慧的主體意識和人機關係這樣的議題。您是怎麼看「奇點」(singularity)的?尼克:所謂「奇點」——機器超過人,或者用《未來簡史》(
Homo Deus: A Brief History of Tomorrow)作者的話說,有一個全新的物種在智能上超越人類——本身的定義是不嚴格的。如果就某個單項指標論,機器早就超過人類了。討論這個問題,首先要定義智能是什麼、人是什麼。當下,總有一些人會幹而機器不會幹的事,以及機器會幹而人不會幹的事,但不也總有這個人會幹而那個人不會幹的事嗎?能說其中一個就不是人嗎?
我們甚至可以追問:當你斷了一條胳膊、換了一顆別人的心臟,你還是你嗎?如果把你的頭換到別人的身體上,你還是你嗎?這個時候,DNA可能都是別人的了,但意識還是你的。科幻電影總是把人工智慧問題化約為是不是能造出人形機器人,這是低級而庸俗的。界定人或智能是什麼、追問機器是否有智能,需要訴諸計算理論。
2017年6月7日,高考機器人AI-MATHS在斷網斷題庫的情況下完成了北京文科數學卷和全國二卷數學卷,分別用時二十二分鐘與十分鐘,成績分別為一百零五分與一百分(滿分一百五十分)。一直有所謂強人工智慧和弱人工智慧之說:強人工智慧就是能造出全面超越人類的機器,而弱人工智慧是指能造出在某些方面——例如下棋、人臉識別——超越人類的機器。根據丘奇-圖靈論題(Church-Turing Thesis),所有功能足夠強的計算裝置的計算能力都等價於圖靈機,不可能存在比圖靈機更強的計算裝置。除了丘奇-圖靈論題,還有個相似性原則:任何計算裝置之間互相模擬的成本是相似的。這兩個論題隱含著強人工智慧的可能性:智能等價於圖靈機、人就是圖靈機。目前的計算機科學(包括人工智慧)的工作都是建立在這個認同之上的。當服從摩爾定律(每十八個月信息處理能力加倍)的計算裝置進化的速度快過人類進化的速度,那麼就有「奇點」來臨的那一天。那時,自然語言理解、機器定理證明都不是事兒。
可運行的紙帶版圖靈機也不是所有的科學家都相信丘奇-圖靈論題和相似性原則。代表人物就是英國數學家、《皇帝新腦》(
Emperor’s New Mind: Concerning Computers, Minds, and the Laws of Physics)的作者彭羅斯(Roger Penrose)。當下很熱門的量子計算機就有可能不服從相似性原則。量子計算機或許能有效地解決素數分解問題,這是當今公鑰加密算法的基礎,如果量子計算機成功,那當前的電子商務體系就會出現不安全隱患。當然,大規模、可實用的量子計算機的實現,仍然存在困難,目前在這方面最領先的是IBM。
彭羅斯:《皇帝新腦》根據您的理解,人工智慧為什麼會在這幾年進展迅速?尼克:主要原因有兩個,一個是大規模的數據累計,另一個是計算能力的提升,同時達到了拐點。
我想提出一個更普遍的觀點:今天,測度人類文明的標準是全社會的算力。史丹福大學歷史學教授莫裡斯(Ian Morris)在《西方將主宰多久》(
Why the West Rules—For Now)一書中,用能耗作為主要測量參數,比較了東西方文明。但隨著新能源技術的出現,例如前幾年的頁巖氣的開發,能源問題已經在一定程度上得到緩解。在我看來,就過去一百多年而言,測度文明的指標是信息處理能力。具體到這幾十年,信息處理能力可以用計算能力來衡量——全社會的算力是全社會計算設備的數目與單臺設備計算能力的乘積。
計算機科學論文、計算機科學專利、全球資訊網流量、社會算力、人工智慧全球融資總額、摩爾定律及學術出版物的增長趨勢對比(引自《人工智慧簡史》)今年6月,馬雲在天津舉行的首屆世界智能大會上作了《智能改變世界》的主題報告;早先,騰訊也實踐了聊天機器人。人工智慧在中國的前景如何?眼下存在泡沫嗎?尼克:不論是去年中國科學家、企業家群體發起的未來科學大獎(號稱中國的諾貝爾獎,單項獎金一百萬美金),還是今年阿里巴巴成立的探索科技未來的實驗室「達摩院」(宣稱將在三年內投資千億),都讓人感覺中國試圖在科技領域確立世界的領導權。且不論具體的實施,我認同民間資助科技的這個思路和運作方式。
阿里巴巴「達摩院」但上世紀八十年代日本五代機的教訓足以讓我們引以為戒。當時日本在製造業和集成電路上大舉超越美國,五代機便是日本雄心勃勃試圖建立在全球信息產業的領導地位、從製造大國轉型為經濟強國的計劃的一部分。與此同時,美國的費根鮑姆(Edward Albert Feigenbaum)等人也使勁吹捧五代機,目的則是為了給本國政府施壓,要求增加在科技領域,尤其是在自己領域——專家系統的投資。當然,最後五代機是個徹底的失敗。五代機的失敗讓日本整個信息產業一直落後於美國,使得日本最聰明的一批人的黃金十年被耽誤了,也嚴重打擊了當時所謂「日本第一」的民族自信。
1981年第一次五代機會議的會議錄(共二百八十八頁)幾年前,我花時間研究了日本五代機所有會議的論文集。從1988 年的會議錄——一千三百頁的三大卷——可以看出,當時五代機已經成了大雜燴,失去了聚焦點,八桿子打不著的領域也拼命向它靠攏。這就像當下人工智慧領域的創業,一些和人工智慧毫無瓜葛的人一夜間都成了人工智慧專家。很多創業者也是拿到風投的錢之後再考慮做什麼。可以說,現在人工智慧裡面肯定有泡沫。但是不是有很大的泡沫,我不敢說。比較大的問題是同質化,做語音處理的公司有一堆,做人臉識別的也有一堆,都融了巨額的風險投資,它們的估值已經超過了許多上市公司。如果資本沒有預期的回報,就是泡沫。共享單車就是一堆同質公司競爭的例子,目前的合併可以被看作擠泡沫。
人臉識別產品風險投資扎堆投資是不健康的,是泡沫的根源之一。他們理應是前瞻性的,而不是人云亦云。了解些人工智慧的歷史,也許會讓大家對一些潛在的投資領域有更深刻的了解。無論美國還是中國,表現最好的風險投資機構都是對行業有獨到看法的。
中國和美國在人工智慧領域可否一比?美國經歷過幾次科技泡沫,人才和資本都會更成熟些,應對措施也更多樣化。日本在五代機之前沒有經歷過科技泡沫,危機一來,束手無策,最後只好互相掩蓋,不了了之。除了投融資領域的泡沫,中國的科技政策的制定和實施也可吸取教訓。
從整體上說,中國的人工智慧是和美國一道處在第一梯隊裡。我們深入研究過中國的三個經濟區——京津冀、長三角和粵港澳大灣區,中國的人工智慧企業、人才、資本有大約七成集中在北京,這一點類似於美國的矽谷。我們的研究也表明,現在,中國確實在人工智慧的某些方面已經趕超美國,至少體現在公司、專利和論文的數量上,但質量上還有距離。總的來講,矽谷還是全球的燈塔。
(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)