人們常說,小區保安是世界上最睿智的人,因為他們總是能問出哲學史上的三大靈魂拷問——你是誰?從哪來?到哪去?
這三個問題被稱為是人生的三個終極問題,是人類認識自我與認識世界的終極表現。但是到了數位化時代,面對日益增長的海量數據,我們越來越清晰的認識到誰能夠掌握數據背後和數據之間的奧秘,誰就能給出更好的答案。
以此類推,數據從哪裡來?數據到哪裡去?數據能做什麼?成為了數位化時代我們同樣需要解答的三大難題。不過與廣大哲學家苦苦思索的終極問題不同,關於數據我們已經有了認知,並且找到了初步的答案。
日前,一份由希捷基於著名分析機構IDC調研完成的名為《數據新視界:從邊緣到雲,激活更多業務數據》的報告(以下簡稱《數據新視界》)正式發布。報告對全球1500名企業領導進行了調研,界定了當今最緊迫的數據管理難題,並找出了解決方案。
「數據是人類的潛能,
最敏銳的頭腦會嘗試去駕馭數據的力量」
——希捷科技執行長Dave Mosley
數據從哪裡來?
許多人覺得,這個問題可能是最好回答的,因為絕大多數的數據都由人類的日常活動產生。我們每天接觸的手機、平板電腦、可穿戴智能設備都在源源不斷的產生數據,微信上每一張朋友圈照片、美團上每一個外賣訂單、抖音上每一條精彩視頻,都是人類活動的記錄,也都是我們產生的數據。
這些數據我們稱之為終端數據,因為產生這些數據的設備都是我們日常使用的終端。而相對於終端來說,數據還分為產生在數據中心的核心數據和產生在邊緣側的邊緣數據。那麼你覺得這三大數據中,哪個數據佔據大多數呢?沒錯,就是終端數據。
來自《數據新視界》的調查結果顯示,在2015年有65%的數據在終端創建,其餘35%的數據在核心和邊緣創建;但是到了2025年,將有44%的數據在核心和邊緣創建,這一方面得益於人工智慧設備的應用,另一方面也也得益于越來越多的物聯網設備向企業邊緣輸送數據。
邊緣是什麼,它與終端有什麼區別?許多人都有這樣的疑惑。而按照《數據新視界》的解讀,邊緣是一個抽象的概念,它包括但是不限於生產企業車間、建築物樓頂、戶外手機基站、自動駕駛汽車等等。總體說來,邊緣是一個位置,而不是一個物體,而它最大的特點就是能夠自行決策。
這顯然是手機、平板等終端設備不能實現的。比如剛剛提到的自動駕駛,位於汽車上的攝像頭和傳感裝置可以獲取車輛運行信息,並在第一時間進行判斷,操控汽車的行駛。這也是邊緣處理的最大價值——我們很難想像將汽車數據回傳到數據中心進行計算的場景。
《數據新視界》同時表示,從2015-2025年,新創建數據的複合年均增長率約為 26%。而到了2025 年,新創建的數據總量將高達175.8ZB(2015 年為 18.2ZB),其中企業存儲數據總量將達9ZB(2015 年為0.8ZB)。很顯然這是前所未有的提升,而企業級數據的提升也證明了後端數據核心與邊緣對於數據容量的提升功不可沒。
所以,回答數據從哪裡來的問題——絕大多數數據都得益於人類活動而來,這些數據中的大部分來自於終端設備,也有相當比例來自於後端數據核心和邊緣側。未來,後者所佔據的比例將越來越大,也就意味著有越來越多的數據都具備了應用於企業級環境的條件。
數據到哪裡去?
我們常說一個詞——數據洪流,把數據比喻成水資源一樣寶貴。但事實上,我們對於數據的利用率依然很低,數據的浪費情況卻非常嚴重。正如剛剛提到的,那些產生於終端、數據中心、邊緣側的數據事實上並非都被存儲起來,反而大多數情況下,這些數據都被白白浪費掉了。
《數據新視界》表示,我們每日產生的數據被大量的丟棄或者難以處理。根據受訪者估算,企業僅採集了56%的可用數據,也就是說幾乎一半的數據流失掉了;而在這 56%的捕獲數據中,企業也只是利用了其中的57%。這也就意味著,只有32%的企業數據被激活,而高達68%的企業數據就這樣不知所蹤。
這也代表了很多企業管理者對於數據的基本態度——嘴上說要重視,但是身體卻很誠實。很顯然,大家對於數據的真正價值還沒有明確的認知。或許在機構和媒體的宣傳下,管理者也明白未來的數位化時代數據將是最核心的內容,但是至少在目前我們對於數據的管理依然缺乏必要的措施,從源頭的採集上我們就有所遺漏,更別提後續的分析與應用了。
「每一家企業都是數據企業,但如果不加以利用,那麼這些企業數據就無法體現價值」——希捷高級副總裁兼首席信息官Ravi Naik
而按照《數據新視界》的預測,未來兩年企業數據將以每年42.2%的速度增長,而這勢必將產生更多的數據,也就意味著企業管理者必須馬上行動起來,存儲更多的數據以便能夠分析和管理它們。而比較特殊的是,來自邊緣的數據在增多的同時,也需要在邊緣進行處理,這也更增加了數據利用的難度。
那麼,數據利用究竟要走向何處?我們產生的海量數據究竟能實現多高的利用率?我們又將如何把控數據時代的未來呢?針對這個問題,《數據新視界》給出了一些前瞻性的思考和建議,並提出了數據運營(DataOps)的概念。
數據的價值是什麼?
所謂數據運營,IDC給出的定義是「將數據創建者與數據使用者連接的重要環節」,這也符合當下「運營為王」的理念。按照這個說法,想要數據發揮價值,就需要實現創建與使用者的連接,也就是解決數據從哪裡來到哪裡去的問題。而對於這個問題,我們上面已經有過許多的介紹,其中提到的三大挑戰——多雲環境、軟體與方法論、數據安全。
如今大家判斷,多雲環境將會是未來數位化時代的主流,即我們的數據可以產生並分布於公有雲、私有雲和混合雲等多個層級的雲環境當中。應該說,多雲環境是數據產生的土壤,也是數據應用的土壤,這其中的難點在於數據的存儲和利用。
總體看來,各行業只有10%的企業完全實現了數據運營,而有51%的企業已經部分實現或者有明確目標,另外依然有40%的企業需要付出更多的努力。而具體看來,製造業的問題尤為突出,即便最近幾年一直在強調工業網際網路應用,但是從實際表現來看製造業在數據運營方面仍需要繼續追趕。
根據《數據新視界》提供的內容:只有10%的企業全面實施了數據運營,但大多數受訪者表示,數據運營「非常」或者「極其」重要。這也暴露出企業管理者在數據問題上的「知行不一」,正如我們前面提到的,這其中有IT系統的歷史遺留問題,也有對於新興技術的應用不到位。
但是值得欣喜的是,在意識到這個問題之後,我們已經開始採用越來越多的軟體工具幫助進行數據分析,同時也形成了數據運營的初級方法論。很顯然,海量數據的分析必須藉助於智能化的工具,比如人工智慧就是解決數據壓力的好辦法。但是這其中,人的價值也同樣不能忽略——企業管理者需要建立全局性的標準、全局性的數據架構和全局性的數據管理,並且允許全局性的團隊以相同的方式訪問相同的分析工具。
事實上許多企業都會採用不只一種軟體或者方法論實現數據分析,而這其中就存在安全隱患的問題。不論數據的採集或者處理如何,自始至終數據安全都是最重要的因素,也是企業管理者非常關心的話題。有三分之二的管理者認為自家的數據安全不夠完善,但是在考慮安全措施的時候,大多數管理者都寄希望於軟硬體平臺的提升,而人力因素卻被放在了最後,這一點很有意思。
很顯然,數據管理是全球性的話題,但是不同地區對於這一話題的關注程度和實施力度也不小的差異。《數據新視界》調查發現,中國企業尤其在乎數據的價值,比如上圖中歐洲地區認為數據「不是很重要」的比例高達3%,但是中國區這個數字居然是零。
這個結果的出現可能有以下下幾個方面的原因:首先,中國企業沒有沉重的IT包袱,得益於90年代末乃至2000年後的IT產業快速發展,中國企業站在了與全球相同的起跑線,甚至在網際網路經濟開始之後中國異軍突起,以阿里巴巴、騰訊、字節跳動、美團等為代表的新興網際網路公司風頭正勁,絲毫不遜色於美國YouTube、Facebook、Google等巨頭。
當然這種提升也在很大程度上得益於中國的人口紅利,除了勞動力資源之外,人口紅利還為網際網路時代提供了前所未有的數據,而網際網路公司則抓住了大數據發展的契機實現了騰飛。看看每年的618、雙11乃至於春運期間的12306,巨大的人口紅利和流量壓力倒逼著網際網路企業不斷前進,也讓他們能夠面臨前所未有的一次次挑戰。
結合以上發展,網際網路公司開始了數據運營,藉助於智能化的手段實現數據分析與應用。在這一點上,中國人表現出了前所未有的開放性(與歐美人大相逕庭),購物網站的喜好推送就是數據智能化的最佳體現;而新冠疫情的掃碼識別更讓每一個中國人意識到了大數據時代的到來。
結合以上三點,在未來的數位化時代,憑藉著巨大的數據紅利和已經啟動的數位化進程,中國在數據運營與數據利用領域已經邁出了第一步。《數據新視界》同時也提到了中國企業數據集中化的特性,其中67%的受訪企業都通過一個專門的小組集中履行數據管理,這也更體現出東方文化的特性。而這一點對於有效的數據管理同樣功不可沒。
數字時代,大家對於數據的價值毋庸置疑,受訪的1500企業主管對於數據也很重視。就調查來看,數據的產生越來越多樣化,並且邊緣已經成為了數據產生的重要方式,但是在數據的存儲和管理上,全球範圍都沒有統一的方案,數據的浪費情況很嚴重。這是當下數據應用的危機,但同樣也是未來數據運營的巨大商機。
為此,《數據新視界》提出了數據運營的概念,並指出了數據運營需要針對多雲環境進行有效的軟體支持和方法論指導,並提出強化數據安全的重要性。這其中,人工智慧被提升到了新的高度,因為海量數據必須藉助智能化的方案,而中國在全球智能化走在前列,我們需要不懈努力,儘早提出全新的數據運營方案和平臺,加速數據處理的儘快實現。
數據時代,我們還有無限可能。