移動端和物聯網智能設備的迅猛發展,勢必需要算力從集中向終端分布式部署,最終在中心化和分布式兩者間取得平衡。人工智慧在算法優化階段需要投入大量的算力,Google的明星機器人AlphaGo在擊敗李世石之前,DeepMind團隊使用了48顆TPU對AlphaGo進行了數個月的3000多萬盤對弈訓練。顯然移動時代,大量的數據在本地存儲的模式不在適合。因此,算力一定會隨著行動裝置和物聯網智能設備的發展而向邊緣傾斜,實現算力的分布式部署。服務端與客戶端分離的結構,移動端的分布式機器學習就成為重要的方向,Google在這方面已經獲得產品級突破——Google基於TensorFlow構建了全球首個產品級可擴展的大規模移動端聯合學習系統,目前已在數千萬臺手機上運行。
分布在全球的大量IDC和個人算力節點資源由於網絡和算法瓶頸,其潛能未被充分挖掘。根據IDC和Seagate聯合發布的白皮書,預測到2025年,全球連接數達1000億,為2015年的10倍。全球數據存儲量由2018年的32 ZB擴大5.5倍,達到175 ZB。隨著數據的指數級增長,超大型數據中心作為數據的物理承載,成為信息基建的重要組成部分——同時,遠離網絡入口的IDC和分布在網絡裡的大量計算節點成為一個新的市場主角。過去由於存在網絡時延以及算法效率瓶頸,網際網路巨頭建立集中的、具有網絡出口優勢的數據中心,提供網際網路服務。而如今,在數據計算和存儲等業務領域,無論是大型的IDC還是更加分散的個人節點算力資源,都有極大的待挖掘的潛能未被激發。
以Google聯合學習算法為典型,分布式AI使得移動端分布式機器學習成為現實,分布式算力的潛力被激活。今年2月谷歌宣布實現了全球首個產品級的超大規模移動端分布式機器學習系統,目前已經能夠在數千萬部手機上運行。谷歌基於TensorFlow構建了全球首個產品級可擴展的大規模移動端聯合學習系統,目前已在數千萬臺手機上運行。這些手機能協同學習一個共享模型,所有的訓練數據都留在設備端,確保了個人數據安全,手機端智能應用也能更快更低能耗更新。研究人員表示,該系統有望在幾十億部手機上運行。聯合學習能產生更智能的模型,更低的延時和更少的功耗,同時確保用戶的隱私。這一切都依賴於聯合學習(FL)方法,聯合學習是一種分布式機器學習方法,可以對保存在行動電話等設備上的大量分散數據進行訓練,是「將代碼引入數據,而不是將數據引入代碼」的更加通用化的一個實現,並解決了關於隱私、所有權和數據位置等基本問題。
分布式聯合機器學習使得分散算力可以聯合執行算法任務,並在大規模的分散設備部署,有效突破通信瓶頸,實現分布式算力的聯合協同完成數據計算任務。指數級增長的全球終端節點設備使得算力大量分散在網絡不同節點,而GPU計算性能的提升使得每一個設備都是不可忽視的算力資源。網絡快速增長的數據量是一個價值潛力巨大的資源池,如果能夠將分布式算力、大規模數據和算法結合起來,將創造極具價值的服務市場。
網絡算力資源不僅來自於企業自身、大型雲計算公司,更廣泛的分布式雲算力資源市場有待進一步挖掘。傳統的網際網路巨頭掌握大量的數據、算法和算力資源,閒置網絡算力資源是一種浪費,彈性復用的想法下誕生了雲計算服務。亞馬遜、阿里、騰訊和華為等傳統IT巨頭在雲計算服務的投入使得這些公司獲得了不小的回報。但更為廣泛閒置的是雲算力——畢竟依靠中心化網際網路巨頭集中投入的計算資源只是網絡算力的一部分,我們不應該忽視更為廣泛的分布式節點的計算資源,這些節點可能來自於個人、小團體或其他無意成立專門的部門輸出雲計算服務的公司。大型雲計算平臺的模式仍是是中心化的運作,在商業拓展和數據隱私方面都存在一定的瓶頸。構建一個去中心化的雲算力市場,既保護節點的隱私又能是的雲算力獲得應有的市場回報,是雲算力市場值得挖掘的潛力。
網際網路巨頭的雲計算業務主要以消費網際網路公司為主,更關注實時性消費級業務,雲算力有望成為新崛起的藍海市場。從2018年雲計算市場來看,主要集中在亞馬遜、微軟、谷歌、阿里雲與IBM手中,Cannlys數據顯示,上述五大巨頭佔全球65%市場份額,其中亞馬遜AWS佔全球31.7%市場份額,規模高達254億美元。排在第二的是微軟Azure,營收規模為135億美元,佔全球份額16.8%。亞馬遜AWS業務的頭部客戶主要是蘋果、Adobe、Snap、Lyft和Pinterest等消費網際網路公司,其他雲計算巨頭的客戶同樣集中在社交、娛樂等領域,對實時性交互要求較高。
對網絡實時性不敏感的大規模數據計算和存儲業務,雲算力有望打造藍海市場。基於網際網路大致可以分為三類:一類是實時性強的業務,用戶需要流暢的訪問和瀏覽,比如網頁瀏覽、視頻娛樂、支付等等;一類是需要大規模數據計算的業務,這類業務並不需要太強的實時性,但需要強大的算力資源做支撐,進行大工作量的數據計算,這類業務以加密貨幣挖礦、科學計算等等為代表;還有一類是對實時性和算力要求都不高的冷數據業務,比如存儲備份等。其中對後面兩類業務場景是雲算力最理想的市場。這類業務平臺目前處於發展的初期,典型的項目如BOINC,(全稱Berkeley Open Infrastructure for NetworkComputing,伯克利開放式網絡計算平臺)誕生於2003年,是全球最早、最知名、用戶量最大的分布式計算網絡。目前,全球大約40個科學項目正在使用BOINC。整個網絡包含超過15萬名志願者和65萬臺計算機。這些計算機每秒產生30「PetaFLOPS」的計算能力,或30億次浮點算術運算,與世界上排名第二的超級計算機相當。如果將Folding@Home項目算力計入,BOINC所有志願者的計算量比任何超級計算機都要大。對於大規模數據計算,對時延並不敏感,可以充分調動分布式雲算力,實現算力提供者的資源復用和數據計算的成本優先的雙贏局面。
加密數字貨幣挖礦為雲算力率先開闢了一個快速增長的市場。以加密數字貨幣挖礦為例,經歷數字貨幣市場熊市背景下,比特幣全網算力接近歷史新高。這些算力背後都是分布在全球各地的礦場和礦機,大部分礦場對IT環境和網絡環境要求極低,挖礦的主要關注點和成本就是電力。調動分布在全球的雲算力——無論是大型IDC還是個人節點,都可以為各類數據計算提供保護數據隱私、高效的服務。加密數字貨幣挖礦為雲算力率先開闢了一個快速增長的市場,具備一定的示範效應。將挖礦中的算力消耗引向數據因業務計算,改進共識機制的算法,那麼等於將「挖礦」拓展到數字貨幣外更多的場景和領域——雲算力市場將是一個更大規模更廣泛的挖礦市場。