雷鋒網(公眾號:雷鋒網(公眾號:雷鋒網))按:2018 全球人工智慧與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,得到了深圳市寶安區政府的大力指導,是國內人工智慧和機器人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智慧領域最具實力的跨界交流合作平臺。
CCF-GAIR 2018 延續前兩屆的「頂尖」陣容,提供1個主會場和11個專場(仿生機器人,機器人行業應用,計算機視覺,智能安全,金融科技,智能駕駛,NLP,AI+,AI晶片,IoT,投資人)的豐富平臺,意欲給三界參會者從產學研多個維度,呈現出更富前瞻性與落地性相結合的會議內容與現場體驗。
大會第三天的「AI+專場」,中興力維首席技術官曹友盛博士發表了題為「人工智慧和城市智腦」的主題演講,分享了人工智慧技術如何應用到智慧城市、電信和公共安全領域。曹友盛現任力維首席技術官,曾任思科全球研發總監和思科中國研發副總裁,並於惠普、SGI、愛立信等公司擔任技術高管。獲得美國賓夕法尼亞匹茲堡大學物理博士、美國超算中心超級計算科學博士後學位。
在演講中,曹友盛認為,人腦不是簡單的三維體,而是具有極其複雜的結構。我們能不能用多維的腦袋去設計一個城市大腦、人工智慧群體,讓這個群體像人腦一樣可以進行各方面的考量,這就是力維在考慮的問題。
談及智慧城市的發展歷程,他認為,智慧城市1.0基本上都是在做智慧交通,智慧城市2.0實現了信息共享,智慧城市3.0則是要用「城市五官+城市智腦群」實現術業有專攻。
打造「城市智腦」需要用到三方面的技術,分別是「數據使能」、「數據融合」以及「數據分析」,其中數據分析是最難的,。曹友盛認為它要求更高一層的智能,模擬人腦進行分析,作出決策,這就需要業界能夠對自己的業務形成深刻的認識,在此基礎上通過數據分析技術,可以才能得出比較有效的選擇和建議。
以下是曹友盛博士的全部演講內容,雷鋒網做了不改變原意的整理與編輯:
曹友盛:正式演講前,我們先探討下人類是怎麼思維的?現在人工智慧都是基本靠「人工」,投入多少人工才會有多少智能。我們是用人腦訓練人工智慧,實際上這是很不成功的,因為人腦看世界是三維空間,加上時間就是四維。愛因斯坦曾經用超過三維、四維的能力想出一個東西。
以AlphaGo為例,AlphaGo不是靠眼睛、鼻子等五官去全方位判斷事物,而是有點「偏才」。比如有些人是弱智兒童,但計算能力很強。它需要把精力集中到一本書上或者一個算盤、一個計算機上,但這時你會失去眼睛、耳朵等共用的功能。
有時候人們為了進行深度思考會習慣把眼睛閉起來,這個時候五官的功能就也會同時被關起來。我們把人工智慧分成三類,大的範圍是人工智慧,中間的一個子集是機器學習,最核心的部分是深度學習。AlphaGo實際上是機器學習,但最後一級用的是深度學習,就是需要關起門來想一想。
愛因斯坦是十三維的腦袋,據說他有十三維的空間,那到底什麼是十三維?簡單來說,從一開始,上帝就給了我們一組數據:1+2=3,這是一維數據;二維數據是Table、Excel表格;三維數據是資料庫;四維數據是數據倉庫。深度學習就要到N維了,需要超過四維的想像力,所以我們今天無法像愛因斯坦那樣做出他想要的人工智慧。
近年來,AI又引領了一波全球浪潮。不管是中國,還是美國、歐洲、日本,人工智慧都是一個趨勢。2018年我們要怎麼做人工智慧,接下來我們來討論這個問題。
人工智慧」能否達到「人腦智能」?
人工智慧」能否達到「人腦智能」?阿里、百度喜歡用「城市大腦」,為什麼我把它改成「智腦」?正如我剛才所講,具有超強的數學能力的人在某些方面非常強,比如AlphaGo在計算上非常強,但在一些感官等其他方面的感知能力則非常弱,所以我們今天只談大數據、深度學習是不行的,這是我今天要講的主題。
力維如何做「人工智慧」?人腦是如何被機器模擬的?很多人都會問一個問題「人腦是怎麼思維的?」前面我已經講了,人腦思維分成三種思維:
一是人工智慧思維,簡單的由五官作出快速判斷,快速判斷時不需要回到人的腦子裡細想;
二是需要專門針對某一方面進行學習,比如AlphaGo學東西,我們把它稱為機器學習。
三是要進行冥思苦想的,這一類我們稱之為深度學習。在深度學習上,我們認為一定要跟業務相關,不懂業務去做人工智慧或者做深度學習是不可能的。
人腦不是簡單的三維體,它是無窮複雜的結構,做數據科學的人都會跟你說卷積神經、深度神經等。腦神經不是簡單的三維體,是一個多維體,它在思考問題時也不是三維、四維、五維,聰明的人會用N維考慮問題。我們能不能用四維的腦袋去設計一個城市大腦、一個人工智慧群體?要讓這個群體具有各方面考量,比如睜開眼睛就能用人工智慧判斷,針對某一數據能進行機器學習,也能做深度學習,有沒有這麼一個設計呢?這就是力維在考慮的問題,我們認為打造人工智慧,三者都要做。
我們怎麼用人工智慧做智慧城市?智慧城市1.0基本上是在做智慧交通,到了智慧城市2.0,大家知道信息需要共享,共享後可以進行機器學習、數據碰撞。智慧城市3.0怎麼定義呢?以阿里和百度的定義,智慧城市3.0就是城市大腦,即城市有一個大腦,將所有信息到雲端匯總,這個大腦可以做各種各樣的思考,這就是智慧城市3.0的定義。
力維認為,一個大腦不可能解決智慧城市,正如一個城市的管理需要按區域、層級進行劃分,需要市長、區長等級別的管理者。如果真有一個大腦能管理城市,也應該是上帝的大腦,我們認為一個城市應該有一群腦。城市還要有五官,既有五官,又要有一群城市智腦,這樣才能做到城市人工智慧、機器學習、深度學習,並能管理一個城市。
這是百度城市大腦和阿里城市大腦框架,是一個非常完美的城市大腦,自上而下管理城市。
城市智腦的技術路線分為三個階段:過去做城市智腦時,我們希望把各種各樣不同的數據都匯聚到一個中心做機器學習,有點像周末我拿本書,好好學這本書,把這個問題搞明白,將網際網路數據匯聚到一個地方,用偏才的方法學習數據,從中得出一個可以派上用場的結論。
這種做法有一個好處,就是可以學得很深,但它也有很多壞處,數據來源單一,缺乏其他數據。當大腦在深度思考的時候,全部都是腦子內部的數據進行計算。比如我們經過機器深度學習,我們從民政局拿到菜價,菜價的波動居然跟一個城市的安全指數相關,這不就是啤酒和尿布之間的關係嗎?因此,只有把眼睛閉下來,讓機器去做深度學習,才會發現菜價跟城市安全指數非常吻合。
所以在日常生活中,我們既需要往深裡想,把更多維的數據在一個可以思考的腦袋中思考,但有時我們又必須要作出快速判斷。未來我們要按照神經擬態計算,接下來會專門講神經擬態計算,因為我們過去和今天做的並不能完全模擬一個人的神經。
未來我們要依賴三個技術:
一是數據使能。一個城市需要感知設備採集數據,但是採集進來的數據並不能馬上使用,這中間還要有使能過程,何為使能?就是對感知設備採集到的數據進行清洗、處理等。
二是數據融合。把前面使能好的數據融合起來,轉換成一種知識,將有能力的數據融合在一起進行加工,讓它成為能夠被應用的東西。
第三個技術、也是比較關鍵的是數據分析。數據分析是最難的,它要求更高一層的智能,模擬人腦進行分析,作出決策,這個時候我們要結合一些業務,所以必須要對自己所在的行業足夠了解。在此基礎上,通過數據分析技術,可以得出比較有效的選擇和建議。接下來怎麼改進,某種意義上來說,機器在這個時段會作出一些判斷,這些判斷比人腦能想像的東西更深奧。
目前大家都在談人工智慧、機器學習、深度學習。我們認為這裡大概有四個困難:
一是機器學習很多時候是用督導式學習,首先要大量的數據訓練機器,比如AlphaGo,只有進行了很多棋譜訓練的AlphaGo,才能跟李世石下圍棋。但是很多情況下我們沒有足夠的數據, 也不能區分這些數據。這種我們稱之為無標籤數據。
第二是數據樣本太少,甚至零樣本。
第三是訓練機器花的時間很大,要用大量的數據訓練機器。現在市場上有很多人工智慧企業,如商湯、依圖、曠視都做得很好,它們基本上是在做樣本學習,所以需要花費很多時間才能做出一個人臉特徵來。
第四是成本問題。因為計算量、維度越來越大,沒有足夠的數據和維度,這些樣本都很難被計算出來,這種情況下用CPU很難進行計算,所以就會出現GPU,怎麼理解GPU呢?CPU是一維的話,GPU就是二維的,現在又出現了TPU。
這四個問題怎麼解決呢?一是大家比較關心的小樣本,沒有什麼數據怎麼做大數據?這裡又要講到人的淺層學習,即不需要很多數據,人工智慧判斷很快,這種能力我們稱為「元知識」。
小樣本挑戰我們就是用和元知識相關的元學習和關係網絡來進行的。比如這張圖,上面有雞、狗、貓,我們讓機器先把雞、狗、貓的特徵提取出來,讓它學習。當有一隻狗放進去進行識別時,機器就能很快識別出這個東西像一隻狗,這就是小樣本元學習和關係網絡技術。
下面是一些經常用到的技術:K近鄰、深度學習與少樣本學習、弱監督、無監督學習,增強學習,數據增擴技術,生成式對抗網絡。
我們做智慧社區時經常碰到樣本特別小,尤其是公共安全領域的視頻監控,對行人進行再識別,基本上採樣很小,一兩張照片就能把罪犯找出來。
解決第三和第四個問題的辦法基本上有多個。,其中的一個是採用神經擬態計算,人腦判斷一個數據時用的是脈衝形式,而不是一直在想。所以我們需要有一個CPU,它也是以人腦的脈衝形式在想。
其次是期待未來的人工智慧更快、更簡單、更便宜、更智能,更省能耗。其中高性能計算今天已經可用,量子計算機和神經擬態計算網絡即將進入商業化。
最後是我今天的總結:簡單來說,一個城市應該有五官和智腦群。人腦思維時並不是簡單的用腦在想,更多時候是用中樞神經和脊椎神經在思考,中樞神經和脊椎神經直接跟感知設備連在一起,判斷一個事情並沒有連接大腦,是直接在中樞神經、脊椎神經作出判斷。
如果今天有一個人跟你說,一定只能是利用大數據進行深度學習,通過學習和模仿才能做出人工智慧,顯然這是不可能的。這是我們在智慧城市中的機器模擬,首先是五官,各種採集設備;然後通過中樞神經進行數據匯聚,如果這裡能作出判斷就立刻作出判斷,快速作出反應;中樞神經存儲、神經網絡和記憶思維在這一塊,淺層次的做出快速判斷,最後是深度學習,也就是能超出人腦思維能力的這一部分。
近年來,在智聯網領域,力維不斷進行探索和實踐,以力維結合最新智聯網技術推出的智慧社區解決方案為例,基於社區多維數據匯聚融合以及大數據架構的深度挖掘分析技術,為社區主管單位和社區居民提供更豐富的社區級大數據服務,如人像惠民、社區停車、社區聯防、社區指數等,極大提升了社區智能化治理和服務水平。
這就是力維對人工智慧和城市智能的體會。謝謝大家!
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。