這是對中國人工智慧生態系統梳理中關於算法的部分。
文藝復興時期的著名畫家米開朗其羅在西斯廷教堂天頂上創作了一幅壁畫《創世紀》,在那幅畫裡,上帝從天而降,將手指指向亞當,在這個驚心動魄的瞬間,亞當的肉體被注入了智慧。
正如人類被上帝賦予智慧一樣,計算機也正在被人類賦予智慧。而智慧的本質在於算法。
自2016年穀歌的阿爾法狗戰勝圍棋頂尖高手李世石以來,人工智慧已經成為時代的新潮流。不斷有形形色色的新公司湧現出來,它們聲稱自己是搞人工智慧的。這些公司組成了一個紛繁複雜的生態系統。據報導,截止到2017年6月,全球一共有人工智慧企業2542家,而中國有592家,佔比為23%。那麼,是不是所有的人工智慧企業都具備算法設計能力呢?真實情況肯定不是這樣的。
什麼是人工智慧?
笛卡爾曾經在回答「什麼是人?」這個問題的時候一針見血地指出「我思,故我在」。笛卡爾認為,人類的本質在於思考。
那麼,如果一臺計算機也會思考呢?
我們可以把人工智慧認為是一種會思考的機器。但是,到底什麼是「思考?」比如一臺會下象棋的機器算不算在思考?
因此,我們需要更清晰的人工智慧的定義。可惜的是,人工智慧的定義一直是非常模糊的,這個概念從提出來到後來被實踐,前後已經經歷了60多年的時間。
根據2017年李開復與王詠剛先生合著的《人工智慧》一書,對人工智慧這一概念一共有5種定義,其中,第4種定義可能最接近反映人工智慧的本質:人工智慧是會學習的電腦程式。
在這個定義中,人工智慧與學習能力聯繫了起來。這個定義也凸顯了學習型算法對人工智慧的重要性。也就是說,對人工智慧來說,更重要的應該是學習能力,而不是思考能力。
最新崛起的人工智慧,不但具有學習能力,而且還具有「深度學習」的能力。
這裡說到的「深度學習」,其實指的是人工智慧軟體所採用的一種算法。什麼是算法呢?這就好像我們用紙牌算24點,比如有4個撲克牌,每張牌上的數字分別是:2、4、9、6。我們需要用加減乘除四則運算來得到24(每個數字只能參與一次計算)。
我們可以採取兩種不同的算法。
第一個算法是:4x9-2x6=36-12=24
第二個算法是:4x(9-6/2)=4x(9-3)=4x6=24
因此,採取不同的算法,可以從已經存在的數據中得到相同的結果。但很明顯,第一種算法只需要經歷一個中間步驟;而第二種算法需要經歷兩個中間步驟。因此,從計算所花費的時間來說,第一種算法更快速更高效。
同樣道理,深度學習是人工智慧的基本算法之一,與深度學習算法並列的還有專家系統與統計模型等。
學術界給出了人工智慧的三要素:數據、計算能力以及算法。
算法對人工智慧具有與生俱來的重要性。
從人工智慧的三要素來看:數據是人工智慧的原料,人工智慧一般要吃進去一些數據然後才能建立一個理論模型,從而具有智能——這就是阿爾法狗的工作原理,阿爾法狗在看了幾千個棋譜以後,自己與自己實戰對弈,產生了大量數據,在這些數據的基礎上學習總結下棋經驗,最後具有了很高的智能。而計算能力與硬體相關,這包括CPU與GPU、FPGA以及ASIC等硬體解決方式,比如當年吳恩達在谷歌的時候就是動用了上萬個CPU來做「貓臉識別」,取得了巨大成功——計算機開始認識了貓,目前在計算能力上,業界傾向於開發專用的人工智慧晶片來處理相關的問題,比如寒武紀開發的人工智慧晶片就已經用到了華為的手機上。人工智慧的算法也非常廣泛,其中比較重要的算法是深度學習算法,而實現深度學習算法的框架則有Tensor flow、Caffe、MXNet、Keras等。目前來看,華人在人工智慧算法設計上並不落後,其中Caffe與MXNet都是中國人發明的。Caffe的發明人是賈揚清,MXNet的作者是李沐。
深度學習算法到底是什麼?
2006年,深度學習的創始人傑弗裡.辛頓及合作者發表了一個裡程碑的文章《一種深度置信網絡的快速學習算法》,這一論文宣告了深度學習時代的來臨。
深度學習算法能在目前的人工智慧方法中佔據了主流地位,這背後的原因在於深度神經網絡的發展。
深度神經網絡中的「深度」兩個字指的是「多層」的神經網絡。如果把神經網絡看成是一個大樓,那麼深度神經網絡就有一個多層的大廈,它可以有比較多的神經元結構層次,一般來說,我們可以把隱藏層多於一層的神經網絡結構稱為「多層」的神經網絡,也就是深度神經網絡。
如果從「血統」上來說,機器學習是深度學習的父親。而深度神經網絡是深度學習的母親。這對父母一結合,生出來的孩子才是深度學習。
我們可以用公式來表示這個關係:
深度學習=機器學習+深度(多層)神經網絡
與人的學習還是不太一樣的。機器的深度學習一般要依靠大數據,比如計算機要看過幾百萬張汽車的照片以後,才能在圖像識別中確定出汽車的照片。而一個小孩只需要看過兩三輛汽車,就可以把汽車識別出來。從這個意義上來說,人類的學習不太需要大數據。與人類的學習能力相比,這也說明目前的深度學習算法還有很大的進步空間。
人工智慧有哪些應用場景
從人工智慧的應用場景來看,大概可以劃分6大類:自然語言處理、知識表示、自動推理、機器學習、計算機視覺以及機器人學。其中,每一大類又可以分為各個小類,比如計算機視覺又可以具體應用到人臉識別以及自動駕駛等多個垂直領域。
正如石墨烯行業最核心的問題是需要找到合理的應用場景一樣,雖然人工智慧概念如火如荼,但也需要真正落地找到切實的應用場景,實現良性的商業循環。
目前來說,人工智慧的應用層出不窮,湧現了很多企業。比如人工智慧可以用到醫療與教育領域,也可以用到物流與安防領域,甚至可以用到軍事領域。在這個過程中,湧現了非常多的垂直領域的公司,但能夠不依靠融資,在商業上獲得正循環的企業並不多。
因此,我們需要考慮的是這些企業的核心競爭力。正如晶片的核心競爭力是光刻機與EDA工具一樣,人工智慧的核心競爭力在算法設計能力。騰訊副總裁姚星曾經在展望人工智慧行業的發展趨勢時說:「算法,將成為人工智慧時代的『科技原力』」。
國內有哪些企業具有人工智慧的算法設計能力呢?
一般來說,要設計算法,必須要有相關的科學家或者有研究經歷的工程師,否則很難進行人工智慧的算法創新。人工智慧的算法設計對數學與計算機技術都是有比較高的要求,不是一般的程式設計師可以勝任的。
因此,懂算法設計的科學家成為人工智慧公司的核心競爭力之一。
以阿里巴巴公司為例子,2017 年 7 月,阿里巴巴發布「天貓精靈」,其背後的專利包括基於神經網絡的聲紋識別技術。用戶可以使用天貓精靈的對話作業系統,通過語音進行購物和支付,並使用獨特的語音籤名作為身份驗證的一種形式。那麼,阿里巴巴的這些人工智慧算法是怎麼設計出來的呢?據了解,阿里人工智慧實驗室的首席科學家是王剛。王剛2005年本科畢業於哈爾濱工業大學,2010年在伊利諾伊大學香檳分校獲博士學位。王剛此前在新加坡南洋理工擔任教授,他顯然是一名學院派出身的人工智慧專家。
百度公司作為國內人工智慧的領先企業,也曾經聘請了多位人工智慧領域的科學家。百度曾聘請餘凱、吳恩達、陸奇等人工智慧專家擔任高管,這也從側面反應了百度在人工智慧領域有很強的算法設計能力。正是在算法設計能力的基礎上,百度才發布了阿波羅無人駕駛系統等人工智慧平臺。
寒武紀作為國內第一家發布人工智慧晶片的公司,其自主研發的人工智慧晶片已經應用於華為手機。而它的創始人之一陳天石2010年畢業於中國科學技術大學計算機學院,獲工學博士學位。同年陳天石進入中國科學院計算技術研究所工作,研究方向為計算機體系結構和計算智能,他也是一位具有人工智慧算法設計能力的科學家。
曠視科技的聯合創始人與首席技術官唐文斌畢業於清華大學,曾經是清華大學計算機系研究生,他還是全國青少年信息學奧林匹克競賽、首屆「Yao Award」金牌獲得者,他也是具有人工智慧算法設計能力的科學工作者。
大浪淘沙始於真金璀璨,滄海橫流方顯英雄本色
雖然中國有很多人工智慧公司。但從核心技術來說,只有那些擁有人工智慧算法設計能力的公司才是具有核心技術競爭力的。正如在中興通訊被美國禁運晶片事件中我們可以看到的那樣——只有掌握了核心技術,才可以在市場競爭中擁有主動權。而人工智慧的核心之一就是算法設計。
大數據與雲計算以及人工智慧是三個相互獨立的概念。人工智慧的英文是artificial intelligence ,其首字母是A。大數據的英語是big data,其首字母是B。雲計算的英文是cloud computing ,其首字母是C。所以,人工智慧與大數據以及雲計算的關係被簡單形容為ABC的關係,但必須注意,這三個概念是相互獨立的,很多中小企業把這三個概念混為一談,混淆這些概念,胡亂炒作高科技概念是不可取的。只有正確區分ABC的關係,才能捋清楚人工智慧這個生態系統。
在人工智慧紛繁複雜的產業圖景中,猶如石墨烯產業一樣,必須要找到其應用場景。
在任何一個領域,對企業來說,只玩概念是不能走向未來的。
(文/軒中)