自從AlphaGo 戰勝了人類,獲得了世界冠軍,各種關於人工智慧的威脅論眾說紛紜,人工智慧儼然走在了風口浪尖。如何判定AI的智商?如何評定AI的綜合素質?
出品:"格致論道講壇"公眾號(ID:SELFtalks)
以下內容為《人工智慧學家》主編,《網際網路進化論》作者劉鋒的演講實錄:
人工智慧爆發的今天,特別是AlphaGo 戰勝了人類,獲得了世界冠軍,這讓大家有些困惑,甚至是恐慌,人工智慧會不會超越人類,甚至成為主宰?
關於這個問題眾說紛紜。
包括霍金、馬斯克在內的很多人提出了人工智慧威脅論。
如果要在科學上解決這個問題,我們需要找到一個定量的方法,去分析人工智慧與人類智力的發展水平。
最著名的人工智慧測試是圖靈測試。
但圖靈測試主要是評價一個智能系統能否達到人類的智能水平,並不能夠定量分析智能系統與人類智能的關係。
定量評價智能系統的智能水平
從2012年左右開始,我和科學院的石勇教授、劉穎教授對這個問題進行了持續研究,試圖尋找一個新的能夠定量分析這個問題的方法。
這是我們在2007年開展的研究項目。當時判斷整個網際網路正向著與人類相似的類大腦結構進化的方向發展,並提出了這個模型。
在2012年的時候,我們最初希望去測試一個類大腦系統的智商。
但是經過兩年的研發,最終從類大腦系統的智能智商評測轉變成AI通用的智商評測,這個轉化包含了網際網路和人工智慧關係。
為什麼在很長時間裡沒有關於AI定量的分析?
主要面臨兩個困難,第一是人工智慧系統沒有形成統一的模型,第二就是人工智慧系統與以人類為代表的生命體之間沒有形成統一的模型。
通俗地說,人類和AlphaGo機器人、IBM的Watson系統等很多的智能系統之間沒有一個統一的模型,告訴我們在智能方面有什麼共性。
沒有這樣的模型,就沒有辦法持續深入下去做定量分析,然後評判到底誰優誰劣。
我們在2012年開始研究的時候,困惑了我們長達兩三年。
我們也大量的研究了前人的分析結果。
第一,首先會想到人類的智商和評測。但是我們發現,人類的智商和評測不能直接作為AI的智商評測。
譬如韋特斯勒的評測方法,主要是常識的評測和動手能力,但是很多智能系統連機械臂沒有,沒有辦法進行評測。
但是韋克斯勒的方法給我們一個啟發,就是我們的智力不是單一的要素,它有很多子要素組成,比如常識能力、計算能力、動手能力等等。
第二個給我們啟發的是AI領域和計算機領域中著名的馮諾依曼架構。
它啟示我們,智能系統應該有智能的輸入輸出和存儲能力。
第三,就是知識管理裡面比較著名的KIDW模型,它啟示我們人類的智慧裡面最頂級、最重要的能力是創新能力,而不是我們平時的數據、掌握的信息或者知識掌握多少。
基於前沿研究,我們團隊在2014年發表了第一篇論文,提出了標準的智能模型,認為任何一個智能模型同時具備知識的輸入、輸出、掌握和創新能力。
任何一個智能體是這四個方面的組合,只是能力強弱不同而已。
比如老鷹看的更遠,它識別的更清晰。
像IBM的Waston系統掌握常識能力很強,這就是為什麼跟人類的對抗裡面它能獲勝。
AlphaGo 也是這樣,在人類特定的規則之下,它掌握了規則並戰勝人類,這也是一種知識掌握的能力。
更為重要的是創新能力。
比如偉大的科學家牛頓看到了蘋果落到地上,發現了萬有引力。
門捷列夫在睡夢中想出元素周期表,這些是人類原生出來的創新知識。
這反映出智能系統在不同的智力方向上強弱不同,我們希望用這一套模型去尋找智慧統一模型。
如果把智慧模型和著名的馮諾依曼架構做了關聯,可以看到以紅線劃出來的方框。
給馮諾依曼架構加上創新發生器和雲端共享知識庫,馮諾依曼架構就可以從計算機的模型、AI模型轉變成把人類囊括進去的模型。
基於以上的研究,我們在2014年發表的論文裡面,基於標準智能模型四個大的領域,又模仿、學習韋克斯勒的結構,把它又拆分成20多個智慧的子系統。
上圖中,可以看到輸入和輸出,包括圖像的識別和輸出、聲音的識別和輸出、文字的識別和輸出。
像我們掌握的常識,包括計算能力、翻譯能力、分類能力等,這些劃分為知識的掌握能力。
更為重要的,就是知識的創新能力,可以看到拆分成了若干個重要的分類,譬如發現規律、創新創造能力、猜測預測能力,甚至包括能夠識別敵我能力、撒謊的能力。
這些能力往往會被我們忽略,震驚於AlphaGo的能力,震驚於IBM Waston系統能力,但是這些創新創造能力也許是我們人類真正重要的部分,而且還沒有概括完全,還有一些更深層次的創新能力。
然後,我們基於專家的打分法——德爾菲法,對整個子元素授予它的權重,形成了可以定量測試的方法。
智能系統的智能水平測試結果
在2014年和2016年,我們分別對像Google系統、Siri系統,還有6歲兒童、12歲少年、18歲的成人進行了測試。
當時測試的人工智慧系統比較多,只列出了前十位的名單。
大家可以看到,2016年人工智慧增長確實比較快,但是跟6歲的兒童相比依然有相當的差距。
兩年的測試過程顯示,雖然人工智慧有很快的增長,但是在最重要的知識創新領域,依然進展非常緩慢。
大家也許提問,AlphaGo 的智商怎麼評測呢?
比如,我們把它下棋功能放在知識掌握部分,並為其賦予權重。
但是我們發現AlphaGo在其它方面很弱,甚至創始人被稱之為AlphaGo的人肉手臂,因為它連下棋的能力沒有,還要靠人類幫它下棋。
當然,其它的猜測能力、判斷能力、區別敵我能力,AlphaGo是不具備的,只在下棋這個局部領域非常強大。
如果對AlphaGo進行綜合智商評測,它的得分非常低。
我們所表達的含義,就是從科學的角度看,人工智慧想威脅到人類其實還非常遠。
我們的這項研究在2017年10月份也得到世界範圍內的關注,像麻省理工科技評論、CNBC以及日本、歐洲和中東的媒體,對這項研究給予了報導。
但是這項研究依然處於起步的階段,它背後包括大量的科學問題還需要我們探索,希望將來能把最新的進展向大家進行匯報。
「格致論道」,原稱「SELF格致論道」,是中國科學院全力推出的科學文化講壇,由中國科學院計算機網絡信息中心和中國科學院科學傳播局聯合主辦,中國科普博覽承辦。致力於非凡思想的跨界傳播,旨在以「格物致知」的精神探討科技、教育、生活、未來的發展。獲取更多信息。本文出品自「格致論道講壇」公眾號(SELFtalks),轉載請註明公眾號出處,未經授權不得轉載。