3月9日,馬雲在阿里巴巴技術峰會上,首次重磅推出了阿里「NASA」計劃,這非同一般的具有太空感的名字,連同馬雲點名的五大核心技術,一石激起千層浪,引發人們的無限猜想。
阿里採用「NASA」這個名稱的用意何在?阿里要針對五大技術建立新的獨立研發團隊,這會對行業形成什麼樣的影響?阿里反覆強調的「核心技術」是在釋放什麼信號?雷鋒網(公眾號:雷鋒網)AI科技評論本文要解答這幾個問題。
阿里採用「NASA」名稱,用意何在?
首先我們要明確的是,阿里巴巴是在表達要「構建世界第五大經濟體」的願景之下,把即將建立的新研發體系稱為「NASA」的。馬雲是這麼表述的:
「阿里巴巴未來20年的願景是構建世界第五大經濟體,服務全球20億消費者,創造1億就業機會,幫助1000萬家企業盈利。就像美國航空航天局NASA驅動人類科技和生活的極大進步。」
阿里想要成為世界第五大經濟體,這不是馬雲第一次這樣說。在今年2月,馬雲在於四川省政府籤署戰略合作協議的會上,就說了類似的一句話:
「目前我們是世界第21大經濟體,剛剛好超過阿根廷。希望通過20年努力成為世界第5大經濟體。」
雷鋒網獲悉,根據阿里巴巴財報顯示,在2016年財年,阿里巴巴總成交額(GMV)為4850億美元。而2016年世界第五大經濟體是英國,該國的GDP總量為26498億美元。這麼算來,阿里對自己的期望值是:20年內總成交額翻 5 倍。
如果阿里給自己許諾的是這樣一個雄心勃勃的未來,那麼把即將建立的新研發體系賦予「NASA」這樣一個大膽的名字,也頗為合理了。
NASA原本是美國太空總署的英文簡稱,代表著太空、尖端科技,和人類精神上的英雄主義理想。NASA雖然探索者宇宙的奧秘,但這個機構所產生的尖端技術,隨時在對整個社會產生巨大的普惠價值。
1970年,NASA的火箭科學家Ernst Stuhlinger 博士就曾在一封回復 MaryJucunda 修女的信中談及NASA推進整個社會技術進步的價值,他說道:
「每年大約有1000個從太空項目中產生的新技術被用於日常生活,廚具、農具、縫紉機、收音機、輪船、飛機、天氣預報……乃至你我身邊的各種小玩意兒。這些技術為我們的生活帶來了巨大的改變。」
而阿里使用了「NASA」這麼名字,意在強調阿里「NASA」將會對整個社會產生普遍的技術貢獻,同時也想藉助全社會的力量,來促進技術的整體進步。
馬雲說道:
「以前我們的技術是跟著業務走,是兵工廠模式,但手榴彈造得再好,也造不出飛彈來。我們必須思考建立飛彈的機制,成立新技術研發體系,聚焦到幾個核心領域的研究。這些研究的目標是為了解決10年20年後的困難。」
阿里巴巴是一家商業基因很強的公司,其人工智慧技術往往是跟著業務線走的。知乎上「在阿里做機器學習是一種怎樣的體驗?」的提問下面,幾位在阿里從事AI研究的人的回答,都往往指向一個同樣的觀點:業務導向嚴重。這樣固然能直接為阿里巴巴產生巨大的業務價值,但容易讓阿里困囿於已有的商業光環裡,也失去了發現新的價值增長點的機會。建造飛彈是舉全國之力才能辦成的事情,阿里「飛彈機制」意在轉變已有的分部、小團隊的打法,轉向「集中精力幹大事」。
被馬雲點名的五大技術:機器學習、晶片、IoT、作業系統和生物識別,這其中與人工智慧最相關的就是機器學習、生物識別和晶片。在談阿里對這幾大技術的未來部署時,必須結合阿里已有的技術積累來談。
以一種底層的眼光看待「機器學習」
機器學習是任何做人工智慧的公司要掌握的最基礎的技術。阿里在這一領域投入頗多,並且已經推出產品,比如人工智慧ET、電商大腦、阿里小蜜和螞蟻金服智能客服等。
而如今火熱的深度學習技術只是機器學習中的一種方法,在當前的計算資源下產生了很好的效果。南京大學周志華教授曾提到一個非常重要的觀察:如果我們把神經網絡每次熱潮期往前推5-10年,你會發現那時計算機硬體設備上有比較大的改變,他表示:「今後進一步發展的技術未必一定是深度學習,但一定是能夠有效利用現代計算資源的技術」。而阿里巴巴顯然也十分關注下一代最具顛覆潛力的「計算資源技術」--量子計算機。
量子計算機是一種遵循量子力學規律,進行高速運算、存儲及處理量子信息的物理裝置,其運行的是量子算法,處理速度驚人,比傳統計算機快數十億倍。
阿里巴巴在列舉自己過去10年來的「十宗最」技術成就的時候,特地將「量子計算與通信」擺在了第四名,擺在了其「VR技術」和「生物識別」技術前面,可見其重視程度。2015年7月,阿里巴巴與中國科學院成立了一個量子計算實驗室,並且2017年阿里雲正式開放了「雲上量子安全加密數據傳輸服務」。該實驗室還計劃,到2025年,量子模擬將達到當今世界最快的超級計算機的水平。
目前從事量子計算還有很多大公司,IBM、微軟、谷歌都對量子計算展開了研究。谷歌與NASA聯合成立了量子人工智慧實驗室(QuAIL),加拿大D-Wave公司已經在出售退火量子計算機。可以說,阿里是在以一種長期和底層的眼光在看待機器學習技術。
阿里既有業務場景作為試驗田,輸出生物識別技術並非不可能
「生物識別」這一技術含義非常廣泛,既包含我們平常熟知的人臉識別、活體檢測,也包括聲紋識別、指紋識別、虹膜識別等等。315晚會上展示的只是人臉識別技術的一部分。實際上,新技術領域的漏洞攻防戰一直都在上演,央視展示的攻破技術在業界也並非新鮮事物。所以,相關技術在實際應用中會使用「交叉驗證」,比如同時讓用戶輸入密碼,或同時進行指紋、聲紋驗證。
阿里的人臉支付技術入選了《MIT科技評論》2017十大突破技術榜單。同一上榜的還有曠視科技和百度。之前,在2015年3月份德國漢諾瓦博覽會現場,馬雲使用支付寶的「刷臉支付」震撼全場,但當時給支付寶提供此項技術的並非是阿里自身的研發團隊,而是曠視科技。然而到今年,阿里巴巴也在「人臉支付」也在這一技術上位列榜單,說明阿里在這一領域的技術積累已經相當可觀了。
目前在阿里雲上,已經提供了人臉識別服務,據介紹,「阿里雲人臉服務由阿里巴巴圖像算法團隊自主研發,其中識別模塊在LFW上取得了99.48%的準確率。我們的目標不僅僅局限於在LFW上獲得良好的指標,而且致力於應用人臉識別技術去解決社交網絡和網際網路應用中的實際問題」。目前,阿里雲已經有五款相關應用在數據市場上公測,包括:人臉關鍵點提取、人臉年齡識別、人臉特徵提取和人臉性別識別。
另外華先勝博士領導的阿里雲視覺計算團隊一直致力於將相關技術應用於各種場景。比如,用來城市交通領域監測人流、拍立淘裡的「以圖搜圖」、虛擬試衣等等。
螞蟻金服和天貓業務裡包含的豐富應用場景,是阿里生物識別技術最好的試驗田,將其中的一些應用打造成標杆產品,並將這一技術對外推廣和出售,並非不可能。
晶片:提供底層的晶片架構和計算力
結合阿里已有的業務線來看,阿里不太可能要重新造輪子,自己去做晶片硬體。
目前阿里跟晶片比較相關的消息就是在2016年底投資了軟體定義網絡(SDN)晶片公司Barefoot Networks,同時參投的還有騰訊。Barefoot 開發了世界上第一個SDN晶片,這種名為Tofino的晶片比現在市場上任何其他晶片都快,以6.5Tb/s的速度處理網絡數據包。Barefoot 成立於2013年,3年的融資總額達到1.55億美元,曾參投的公司還包括高盛和谷歌。
另一個在晶片方面還存在有所突破的領域,最有可能就是人工智慧專用晶片,而阿里想要從事的領域,可能還是結合阿里雲已有的優勢,在給開發者和企業提供底層的晶片架構和計算能力。
而阿里已經在這方面有所行動。1月21日,阿里雲發布異構計算解決方案:彈性GPU實例和FPGA解決方案。GPU的解決方案比較擅長做AI領域的模型訓練,能夠達到非常高的計算能力,而FPGA的解決方案比較適合做AI領域的在線的預測/分類,能夠達到非常高的吞吐量和非常低的延遲。
在雲上提供深度學習計算解決方案並非一件簡單的事情,世界範圍內能夠提供這種服務的廠商屈指可數,可借鑑的經驗不多,無論是阿里還是其它雲服務廠商,如果想在這一領域有所成就,必須要自己在基礎研發上攻克諸多困難。
2016年財年,阿里雲的營收為30.19億元,佔阿里巴巴總營收的2%。雖然佔比不是很高,但這一業務的增長速度卻十分驚人,2016年營收比2015年增加了75%。
在很多人看來,阿里巴巴與亞馬遜有著很多相似之處,同是電商起家,同是雲計算服務商的領頭羊。亞馬遜從2006年推出AWS,從零發展到佔集團營業利潤的四分之三,去年銷售額達到110億美元。憑藉雲計算亮眼業務,很多人都不再把亞馬遜單純看做為「電商」公司了。
而阿里一直就想要擺脫外界對其「電商」的定義,在2016年10月杭州雲棲大會上,馬雲就曾提出淡化阿里「電子商務」的屬性。這次技術峰會上,阿里巴巴集團首席技術官張建鋒強調的「阿里巴巴的商業做得太成功,掩蓋了技術的光芒」,也意圖轉變阿里電商形象,使其轉變為一家更加具有「技術範兒」的公司。
阿里重磅推出自己的「十宗最」技術,並不僅僅是在公關上秀肌肉而已,我們有理由相信,阿里雲所呈現出來的新的增長點,帶給了阿里巴巴一些新的思路,那就是走「技術輸出」這條路。所謂的「十宗最」技術上的秀肌肉和集中力量建「NASA」,就是在為 2B 業務振臂吶喊。
而阿里巴巴目前已經在 2B 這條道路上越走越遠,阿里ET就是一個典型。2016年10月杭州雲棲大會上,阿里就推出了覆蓋整個杭州市的「城市大腦項目」。阿里能夠做這麼大量級的事情,離不開阿里雲的強大算力。在後續2016年12月深圳的雲棲大會上,阿里雲人工智慧科學家閔萬裡就詳細談到了ET要布局的 9 個城市板塊:
治理城市:智能交通、智能物流、智能水利、城市規劃
賦能企業:智能製造、智能服務
服務市民:智能旅遊、智能醫療、智能停車
閔萬裡在接受媒體採訪時就曾談到阿里做城市大腦的初衷:「事後諸葛亮的分析大家都可以做,但是在線的實時分析,卻需要海量數據的處理能力和計算能力,而在沒有雲計算的時候這是不可想像的一件事情,但是在今天,這個已經成為現實,因為類似阿里雲這樣的雲計算大頭已經起來,所以雲計算的出現使得大數據的分析變成實時在線可能,城市大腦也就自然而然地出來了。」
不僅是市政交通,以9大板塊裡的「智能製造」為例,阿里似乎對AI應用於傳統行業興趣頗豐。在今年年初,阿里與江蘇的協鑫光伏(全球最大的光伏切片企業)合作,用AI技術,實時在線分析整個生產線的節點和參數,及時發現異常,並實時反饋控制這個生產線。這使得協鑫光伏的良品率提升,節省了幾億的成本。而這不是阿里與傳統行業合作的偶然案例,實際上,他們正在追求一種「行業輻射」效應。閔萬裡就曾在採訪中表達了一種以信息流來理解傳統製造業的觀點:
「協鑫的這個案例其實他代表的是一類看上去非常傳統的製造業,尤其是流程製造業,包括半導體流片、印染企業、鋼鐵都是流程製造企業,他們都可以抽象為一種信息流,有不同的節點。從海量的歷史數據當中,去發覺在這個信息流當中最關鍵的節點,以及每一個關鍵節點裡面最優的參數控制,所以協鑫的這個實踐其實是具有很強的行業輻射性。」
可以說,阿里正在以一種新的姿態,對傳統製造行業進行AI應用的啟蒙工作,而NASA的建立,或許就是為全面的 2B 技術輸出做好準備。
AI市場還遠未達到你死我活的境地。相反,這是一塊未被開墾的未來市場。我們看到甚至315晚會在質疑人臉識別技術的可靠性,可見AI公司對於市場的教育之路任重道遠。而阿里通過建立「NASA」進行全面核心技術的整合,推進AI相關技術的應用普及,或許對於其它AI初創公司來說並非一件壞事。畢竟,有更加有力的盟友為AI應用背書,可以加速傳統行業客戶和公眾對AI應用的認可。
阿里要撕掉身上的「電商」標籤了,你準備好迎接這個賣「技術」的阿里了嗎?
更多雷鋒網文章:
谷歌工程師:聊一聊深度學習的weight initialization
從SwiftScribe說起,回顧百度在語音技術的七年積累
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。