#DevOps#
一、何為DevOps (研發運營一體化)平臺?
從企業信息系統規模、複雜程度變化及對信息通信技術應用的深入等方面考慮,IT 運維的發展可以分為以下五個階段:
隨著企業對雲計算、大數據、微服務、容器化等新技術的應用逐漸深入,相關業務架構複雜度提升,產品迭代快速、頻繁,IT 運維進入 DevOps 階段。
Dev Ops (研發運營一體化)助力企業實現軟體生命周期的全鏈路打通,持續運營與優化 。
在此階段,通過對持續集成、自動化測試、持續交付、持續部署等多種相關技術的運用,版本發布周期大幅縮短,效能獲得提升。與此同時,IT 運維通過監控管理、事件管理、變更管理、配置管理、容量和成本管理、高可用管理、業務連續性管理以及體驗管理等技術運營手段,實現了信息系統的質量提升與業務優化。DevOps 將軟體全生命周期的工具全鏈路打通,結合自動化、跨團隊的線上協作能力,實現了快速響應、高質量交付以及持續反饋。
二、Devops 生態體系
我國 IT 運維生態體系總體可分為基礎設施層、平臺與軟體層、服務層和應用層四層以及研究機構組成。以下是中國 IT 運維生態體系示意圖:
基礎設施層的主體為基礎設施提供商,主要提供網絡設備、存儲設備、伺服器等硬體設備。其中,伺服器是提供計算服務的核心設備,也是計算機硬體領域的重要組成部分,從市場規模來看,隨著雲計算、大數據等業務的迅猛發展,對伺服器的需求也在快速增長。
平臺與軟體層為上層提供軟體產品,可分為基礎軟體提供商及平臺和應用軟體供應商。基礎軟體提供商提供作業系統、資料庫、中間件、開發工具等基礎軟體。應用軟體提供商為企業用戶提供 ERP、CRM 等應用系統,其中包括 IT運維管理(ITOM)軟體。平臺軟體提供商則為上層提供 DevOps 一體化平臺、運營管理支撐系統等平臺類軟體。從 2013 年至今,我國軟體市場規模每年已增長超過 500 億元。服務層由原廠運維服務提供商、第三方運維服務提供商、系統集成商和IT 運維解決方案提供商組成。系統集成商將軟硬體資源集成為滿足需求的統一系統作為服務提供給用戶,其中也包括數據中心的設計、集成、運維等服務原廠運維服務商即為軟硬體提供商,其在提供軟硬體的同時也搭配提供相應產品的運維服務。第三方運維服務提供商則指可為企業用戶提供多個軟硬體提供商間的專業 IT 運維支持服務。IT 運維解決方案提供商提供了全面、整體的 IT運維解決方案,包括了軟硬體集成與實施,直接為最終用戶解決 IT 運維相關問題。
除此之外,研究機構進行產業研究,為生態體系提供有力技術、科研支撐。
三、Devops 運維商業模式
當前,由於存在行業、企業規模以及企業決策差異,IT 運維具有多種商業模式,主要有如下四種。
(1) 免運維 模式 ,高度成熟的商業產品往往具備免運維的特點。例如:除了具備高度的可配置化能力以外,還需具備守護進程實現自監控、日誌回收、常見故障處理以及自我優化功能。所以,當企業購買、安裝部署以及聯調後,基本不需要提供後續運行維護支持。
(2) 外包 運維 模式 ,是指 IT 系統由 IT 運維服務提供商提供日常監控、運行維護、升級等保障服務。在單體應用、私有雲以及公有雲等不同建設場景下,分為 IT 運維服務外包和購買雲服務兩種模式。在單體應用、私有雲建設模式下,企業通常採用運維服務外包的模式,大多採取駐場服務,部分企業會採取定期或者按需到場、遠程運維;對於使用公有雲服務、部署在公有雲的場景,則通常選擇購買雲服務來解決一站式運維保障。中型以下規模、安全等級不高或受限於行業特性的企事業單位,往往會採取 IT 運維外包模式。
(3) 自有團隊運維 模式,是指 IT 系統由內部人員來完成日常監控、運行維護、升級等保障服務。網際網路企業、大中型傳統企業或者安全等級較高的企事業單位,即使採購了第三方的運維工具,也要求組建企業自有的運維團隊。在這種模式下,隨著運維經驗、運維團隊以及能力建設的提升,通常會持續開發出適配企業自身情況的運維工具。有的企業會將運維前置到需求評審環節,實現開發運維一體化。例如:對於運營商等超大規模企業,甚至會考慮跨域的能力規劃、平臺建設和能力建設,提高 IT 運維的自主、可控、高效以及集約化運維。
(4 ) 混合運維模式 。是指企業和 IT 運維服務提供商都參與到 IT 上線前後的運維工作中。通常情況下,服務提供商是系統集成商或軟體原廠商;當項目完成交付時,他們與企業共同提供運維服務。企業主要任務是運維管理,而 IT 運維服務提供商的主要任務是運維執行,兩者共同目標是提供可持續的運維服務和運維的持續優化。
四、平臺落地-移動智慧運維體系和技術運營中臺建設
隨著移動「大連結」戰略的深入落實、業務規模高速增長、內外部競爭日趨激烈複雜、IT 技術發展演進日新月異等,北京移動公司上下和內外客戶對 IT 運維管理執行效率和運營精細化管理能力的提出了更高的要求和挑戰:為適應新業務層出不窮、瞬息萬變的市場局面,2018 年集團公司提出「厲行節約、降本增效」活動,引入人工智慧技術,構建低成本、高效率的運營體系,加快「以 IT 換人」戰略的實現,以期在日益激烈的同質化競爭中贏得主動權。
集團公司在 2019 年 IT 工作思路中提出了 「以 IT 主動賦能發展為主線,大力推動從 IT 支撐到 IT 運營轉變」、「著力提升智慧運營能力、運維保障能力、創新發展能力」等要求,為 IT 運營能力的關鍵發展目標明確了方向。 隨著信息部系統雲化、容器化、中心化、微服務等架構調整,帶來了「系統架構和業務調用關係複雜,運維管理難度增加」的痛點因此運維體系也要實時跟進,不斷調整自身發展規劃,向「大運維、集操作、專業務、踐敏捷、智運營、優體驗「思路演進,為生產系統提供更優的運維支撐服務。
【痛點難點 】
運維系統存在重複建設;各個域間隔離運維,響應不及時;雲化之後的 IT 運維的智能化程度不高,仍在演進之中。5G 時代對 T ICT 融合運維挑戰:5G 網元的控制面、傳輸解耦,傳統(2G/3G/4G)運維平臺,無法支撐 5G 網絡資源的集中統一的配置管理和運維;5G 網絡實現 SDN 提供的行業切片服務,現有運維平臺,無法實現端到端的部署、運維和交付;5G 網絡的多層編排、協作,目前沒有可視化的運行管理、維護;對於垂直應用,無法從行業應用、業務以及網絡的端到端客戶體驗、智能運維;5G 大量商用,缺乏 AI 手段,實現網絡故障預警、服務切換以及故障恢復。
【 實踐路徑 】
信息系統部對本省運維領域工作進行了能力梳理和方向規劃,提出了 1 個願景、3 個核心、5 個階段、3 塊基石的「1+3+5+3」 智慧運維能力體系。
(1)1 個願景:IT 運營創造價值是智慧運維體系建設的根本願景。
(2)3 個核心:穩定準確、用戶滿意和風險防控是智慧運維體系建設的三大價值核心導向。
(3)5 個階段:「初始階段-標準化階段-自動化/可視化階段-初級智能階段-高級智能階段」是智慧運維體系建設中各項能力演進路線。
(4)3 塊基石:崗位規劃、文化培育和能力提升是智慧運維體系建設的三大基石。
【 實際效果 】
在自動化、智能化的運維能力和運維場景的建設決策過程中,基於事件管理流程回顧,建立了矩陣式評估模型決策體系,同時在開發、上線、運行、優化環節對運維痛點關聯指標進行跟蹤式管理,形成閉環的效能評估體系。上述體系實現了有限資源的科學合理利用和運維能力、場景建設收益的最大化。
(1)「微服務+能力開放」化的 Paas 級平臺,可快速構建對全局支撐能力。
(2)一站式自助化配置的場景建設,大幅解放人工成本。
(3)「百花齊放」的運維場景成果,成為運營降本增效的催化劑,實現對核心業務系統運維管理的 100%覆蓋。
(4) 團隊軟實力築基,組織文化發展與技術創新打通形成合力