數字顛覆的威脅迫使高級管理人員和技術領導者重新思考商業模式、數據資產和分發渠道,以創造更多的創新產品和服務,從而使客戶滿意並贏得競爭。在過去十年中,企業已經徹底改變了他們構建、部署、管理和維護關鍵任務服務的方式,以應對日益增長的數位化。
開發人員通過採用創新技術和實踐來應對企業轉型的挑戰,包括公有雲服務的使用,敏捷和DevOps的快速軟體交付,從單體開發模式向微服務開發的轉變,以及流程創新的機器學習模式。
IT運維團隊歷來通過最小化變更和避免中斷來確保企業工作負載的可用性和性能。鑑於數位化業務的需求,數位化運維團隊需要利用已有的和新興的技術趨勢來推動產品發展,提供出色的用戶體驗,並確保長期的企業生存。
2020年,IT運維團隊需要接受五個轉變,以擴大創新並有效應對數位化顛覆。
在2009年Velocity會議上,John Allspaw和Paul Hammond在Flickr上展示了《10+ Deploys PerDay: Dev and Ops Cooperation》,展示了企業如何通過自動化基礎設施工具、持續集成和部署流程以及共享指標來加快發布速度。這一演講開啟了DevOps運動,呼籲開發和運維團隊之間建立信任、協作和問責制的新模式。
十年後,DevOps得到了廣泛的主流採用,網站可靠性工程師和DevOps專家成為Stack Overflow 2019年開發者調查中收入最高的人。DevOps是實現業務敏捷性和減少摩擦的關鍵——Gartner預測,到2020年,全球100強企業中有90%將通過DevOps實踐提升運維效率。麥肯錫最近的一項研究發現,很少有企業高管認為「IT在促進強勁業務表現做出了有意義的貢獻。「
這些趨勢可能會促使DevOps團隊主動參與數位化體驗產品,從而獲得更多預算和更大的影響力。這是否意味著IT運維部門必須滿足於管理遺留應用程式和基礎設施組合?
要點:IT運維不僅需要關注傳統的可靠性、彈性、安全性和效率,還要關注發布速度、持續改進和以客戶為中心。IT運維的創新可以支持數位化轉型,並確保DevOps的新速度不會使業務面臨風險。
IDC最近的一項研究發現,IT運維團隊是人工智慧工具的最大買家,用於快速模式識別、無縫事件協作和更快解決問題。2020年是利用機器學習和數據科學的力量,進行主動和預防性事件管理的時候。現代AIOps解決方案可以通過以下方式大幅減少識別、日誌記錄、分類、確定優先級、響應和關閉事件的人工時間:
——分析和處理不同監控工具中的各種事件,以便自動抑制重複和噪聲警報
——使用機器數據智能來預處理警報「風暴」,加快根本原因分析並減少服務中斷
——通過IT服務管理工具的雙向集成,向on-call的服務交付團隊發送實時的上下文警報
——使用自動修復解決大規模的常規事故,以便運維人員可以專注於高價值的業務項目
要點:數位化運維團隊應該開始試行AIOps計劃,以了解機器學習驅動的事件管理如何減少在事件檢測、首次響應、警報優先級排序和根本原因分析上花費的人力時間。
Flexera的《2019年雲狀態報告》發現,84%的IT領導者使用五個不同的雲提供商作為其企業雲戰略的一部分。鑑於AWS就在23個產品類別中擁有170多個獨特服務,因此跨雲平臺管理不同的雲服務並非易事。那麼,多雲採用背後的驅動力是什麼?
考慮到AWS在雲基礎設施即服務市場佔有35%市場份額的主導地位,CIO們希望與其他雲提供商(如微軟和谷歌)合作,以防止雲鎖定。選擇多雲平臺的另一個原因是451 Research所說的針對特定類型的業務工作負載選擇正確的雲環境,以便IT團隊可以針對性能和成本進行優化。
以下是雲團隊在部署多雲企業戰略時需要仔細考慮的三個因素:
——資源複雜性:雲基礎設施團隊需要跨數千個雲SKU實例為工作負載選擇正確的實例類型。挑選和優化適當大小的實例是一項持續性的任務,需要根據架構、需求、性能、彈性和成本進行艱難的權衡。
——多雲監控:雖然有大量的原生監控工具,如Amazon CloudWatch、Azure Monitor和Google Stackdriver,但這些解決方案都有一定的局限性。企業應該投資開源工具(Prometheus / Graphite、Grafana)或第三方監控工具,因為這些工具可以輕鬆地集成、捕獲和呈現來自多雲環境的洞察。
——將FinOps嵌入雲計算中心:跨實例類型和定價模型(按需、專用、現場和保留)優化雲成本是一項複雜的工作。FinOps的出現通過匯集優化雲支出的最佳實踐,幫助企業更好地規劃和預測雲預算。FinOps提供了一種新的採購模式,強調跨技術、財務和業務團隊的雲財務管理的責任共享,以便企業獲得更好的雲投資回報。
要點:企業IT團隊應該向FinOps先驅者學習如何在雲服務的成本、性能和彈性之間做出正確的權衡。雲架構師應該同時嘗試開源和商業監控工具,以了解它們如何推動實時可見性並確保更快地響應多雲運維。
企業數據中心越來越多地吸納公有雲基礎設施的屬性,包括按需使用和按使用付費的定價模式。以下三個趨勢清楚地表明了數據中心在雲時代的發展方式:
——混合雲模型:很長一段時間,公有雲平臺拒絕承認某些工作負載由於延遲、安全性或合規性要求而只能在本地運行。不過,雲提供商現在公開表示認同混合雲價值主張——Azure Stack於2017年推出,AWS Outposts2018年推出,Google Anthos於2019年推出。混合雲解決方案允許企業在其數據中心內運行工作負載而不用擔心雲服務提供商過線。
——基於使用的基礎設施模型:企業可以利用一系列創新解決方案(HPE GreenLake、戴爾Flex on Demand、聯想TruScale Infrastructure Service和思科 Open Pay),來實現靈活的數據中心資源支付模式。IT團隊可以控制資本支出,使用最新硬體,跟蹤實時使用情況,並將管理外包給OEM或託管服務提供商,使自己能夠完全專注於業務成果。
——編寫一次,就可以在任何地方運行編排引擎:像Kubernetes、Docker Swarm和Apache Mesos這樣的容器編排引擎已經大受歡迎,因為它們允許IT團隊在任何地方運行雲原生服務,並為構建和擴展分布式應用程式提供一致的管理框架。可以使用容器編排引擎跨數據中心和雲環境部署雲原生服務,確保高度可移植性、更快的發布速度以及通過抽象基礎設施實現更好的運維控制。
要點 :數據中心已經成熟,IT團隊應該將涉及設計、部署、監控和維護任務關鍵型基礎設施的繁重工作外包出去。數據中心管理者應與超大規模和OEM提供商合作,以充分利用混合雲和基於使用的模式所帶來的功能和靈活性。
IDC預計,到2022年,涉及新興技術技能的IT角色中有30%將一直空缺。最近的一項調查發現,94%的IT決策者發現招聘DevOps專業人員、雲原生開發人員和多雲運維人員困難。顛覆性技術趨勢使得IT運維團隊必須不斷提升技能以保持相關性。
雲原生基礎設施的普及需要在生命周期自動化和配置、可觀察性和分析以及安全性和合規性方面的一系列新技能,以推動可靠和可擴展的應用程式。
採用AIOps解決方案需要熟悉高級統計技術的IT從業人員,並能結合數據驅動的洞察力和人性直覺,以減少應用程式停機時間並確保更快的恢復。
要點:CIO需要大力投資技能發展計劃,以吸引和留住員工。IT領導者將使用內部項目、實踐學習和外部提供商的組合來彌補技能差距。
結論
在一個變化是唯一不變的世界中,IT運維需要變得越來越主動和動態,以滿足業務需求。技術運維管理將成為一門更新的學科,其中創新只受想像力的限制。
原文連結:
https://www.cloudcomputing-news.net/news/2019/aug/01/it-operations-2020-five-things-prepare-aiops-multi-cloud-and-more/