【運維探討】如何建設合理、可落地、持續發展的雲管平臺?

2020-12-12 騰訊網

當我們在談「雲管」,我們在談些什麼?

我們先來看看權威機構對雲管是怎樣定義的。

Gartner對雲管的定義如下:

CMP (Cloud management platforms,雲管理平臺)是一種管理公有雲、私有雲和混合雲環境的整合性產品,讓企業組織能夠統一管理多雲服務及資源。

主要能力包含混合雲、多雲環境的統一管理和調度、提供系統映像、計量計費以及通過既定策略優化工作負載。更先進的產品還可以與外部企業管理系統集成,包括服務目錄,支持存儲和網絡資源的配置,允許通過服務治理加強資源管理,並提供高級監控,提高性能和可用性。

在Gartner2019發布的報告《Critical Capabilities for Cloud Management Platforms》中指出,CMP具備以下7個關鍵能力:

CSCC對雲管定義如下,總結下也包括這麼幾個能力:

· 資源管理

· 用戶服務管理

· 成本管理

· 合規與策略

· 安全

大的方面來說,對於企業雲管是ITOM中的一個運維管理領域。因此在建設雲管的同時,我們可能不得不考慮雲管在ITOM中應該處於怎樣的地位和位置,跟ITOM中其他運維領域如何交互和相互發生作用。說到這裡,我們順帶也翻閱了下Gartner 2020對於ITOM的定義:

從上圖中,可以看到ITOM的定義中是有CMP的。那到底CMP和ITOM是啥關係呢,兩者之間關係該如何考慮呢?這兩者與周邊的例如CMDB、ITSM、自動化工具、各類監控工具之間又該如何統籌呢?

我們知道Gartner是全球最具權威的IT研究與顧問諮詢公司之一,它在IT領域中研究和定義非常多的東西,它出具的報告也都非常有權威性,除了這麼幾點:

· Gartner我只管定義哈~

· 你自己要統籌考慮哈~

· 建設錯了可別賴我~

上面的問題就被留給了每個企業用戶、每個產品廠商、每個服務商自己來考慮了。有鑑於此,我們在著手建設雲管平臺之前,從技術層面來看,最好問下自己下面這三個問題:

雲管定位及功能擴大化帶來哪些問題?

對上述前2個問題,部分甲方用戶和部分廠商的回答是下面這樣的:

然後,實事求是的講,這種對於雲管功能、雲管和ITOM關係以及雲管建設方法的理解,是會帶來很多問題的,這些問題可能直接導致項目的失敗。

我們先來隨便看兩張源自網絡搜索的部分廠商的雲管建設方案架構圖:

結合前面Gartner和CSCC對於雲管平臺、ITOM的定義,從這兩張架構圖中,你發現了什麼?

最為直接的發現就是:這兩張圖,如果不言明,你肯定不會認為是一個雲管的架構圖,很可能會認為是一個ITOM運維體系的功能架構圖。

第一張圖除了雲管功能外,CMDB、服務流程、倉庫管理、作業平臺、自動化運維場景、監控告警等ITOM能力也被一股腦塞入了雲管建設方案;第二張圖也不遑多讓,把CMDB、服務流程管理、自動化運維、多種專業化的監控管理工具等也被塞進了網管的功能架構圖中。

按照Gartner的對於雲管和ITOM的定義,這兩個產品已經遠遠不是雲管的解決方案了,而是一個龐大的ITOM的產品體系。

像這種,在一個原本定位為雲管的項目中塞入大量ITOM功能的建設方法,看起來似乎項目功能齊全、產品功能強大、豐富,什麼都可以幫助用戶實現,但是,卻會帶來很多問題。我們把這些問題總結為四個點:

這些問題對於項目建設可能是致命的,讓我們來逐一剖析給大家。

首先是定位問題:這種功能包羅萬象的雲管項目和雲管產品已經脫離了雲管的內涵,在大的運維體系中難以定位。

這個問題是最麻煩的,在IT資源規模越大、IT管理工具越多的企業中,這個問題越麻煩。由於這些企業現存運維工具眾多,相互之間各有交互,未來可能還要上新的運維工具,就顯得更加麻煩。我們把這個問題說的明白一點,表現為下面這三個點:

其次是建設問題:這類包羅萬象的雲管項目和雲管產品建設的技術風險和項目風險都很高。

這一點很容易理解,功能越多,產品越重,自身功能的建設以及與周邊系統的集成交互建設也就越難、工作量越大、技術風險也就越高;項目周期和費用都是有限的,在有限項目周期內完成這麼複雜的建設,項目風險自然不低。

使用問題:一個豎井式項目產品,功能越多、集成越多,越不好用,這是一定的。

你媽喊你去買口鍋回來炒菜,你要是膽敢買下圖中上面那口,就等著回家跪搓衣板吧~

擴展問題:在這麼一個擁有複雜功能的單一產品(即便是分布式或者微服務化開發架構,本質上依然是一個功能緊耦合的單一產品)上做擴展,難度非常大,而且牽一髮動全身往往帶來新的問題。

可以看到,建設雲管平臺如果不牢牢抓住雲管需要解決的本質問題,而將原本屬於ITOM建設範疇的功能一股腦塞到雲管項目和產品中,是會帶來相當大問題的。輕則項目成果不好用,不願意用,重則項目失敗和爛尾,這樣的項目事故我們都見過不少。既然如此,為什麼這種雲管的建設模式依然局部存在呢?

一碗水要端平,板子也不能光打在一方身上。我們將原因總結為以下三個方面:

解決方法和出路在哪裡?

要避免此類雲管建設問題的出現,真正實現:功能架構合理、敏捷可落地、能持續發展的雲管平臺建設,可能需要從以下4個方面著手:

追本溯源,回歸雲管本質

雲管要解決的就是混合雲管理的問題,儘量不要把雲管建設拔高到ITOM運維體系的維度,否則出現問題在所難免。雲管產品的原本定位,究竟需要解決什麼問題呢?其實很簡單,如下所示:

一旦回歸到雲管的本源,再去思考雲管功能的建設,就不容易超出必要的邊界;原則上,在上述4點之外的功能,比如CMDB、應用自動化運維等等,都是不建議放到雲管項目中去一股腦實現的,可以放到ITOM管理平臺中去建設,並與雲管產品建立必要的數據和運維流程的交互。

清晰定義雲管項目或者產品與ITOM整體運維體系間關係

在建設雲管項目時,除了雲管自身功能,還需要將雲管放到運維管理體系中統籌考慮,明確雲管在運維系統中的位置,以及與ITOM中其他運維領域如何交互,如下所示:

「大」平臺+「小」雲管:運維體系平臺化+雲管場景工具化構建方式

雲管項目的建設本身建議採用運維體系平臺化+雲管場景工具化構建方式進行構建。這樣有多個好處:

運維平臺為雲管提供通用運維能力:

通用的運維管理能力統一沉澱到運維管理PaaS平臺,為雲管功能提供能力輸出。例如通過平臺的統一管控模塊和API網關模塊,能夠實現各種混合雲資源和雲原生運維工具的統一接入和集成;利用平臺的監控告警及接入能力,在雲管工具中實現告警、展示和通知等功能……復用這些通用平臺能力,長出單獨的、個性化的雲管工具。

基於平臺,ITOM多種場景工具間有機集成:

基於運維平臺這樣同一個底座,能夠實現CMDB、自動化運維、一體化監控、ITSM等其他ITOM場景的單獨管理工具;這些工具和雲管工具紮根於同一個平臺,多方之間的交互更加自然、流暢和緊密,同時又彼此相對獨立。

利用平臺的PaaS集成及運維開發屬性,實現雲管平臺的不斷迭代

我們做過一個統計,往往在雲管項目實施工作中,定製化功能開發和客戶化集成的工作量比例至少佔到50%。這意味著希望一個雲管產品或者方案,開箱即用,就能滿足自己的所有需求是不現實的。即便當前滿足了,未來需求發生了變化,同樣需要定製開發。

這樣的話,在選型產品的時候,就需要特別注意產品或者方案實打實的擴展能力如何。這種擴展能力包括兩個方面:外部系統的集成擴展能力和雲管功能的迭代擴展能力。

綜上,我們簡單總結下:要建設一個架構功能合理、技術可落地、能夠持續發展的雲管平臺,可以考慮從以下5個點考慮和發力:

某大型集團雲管平臺項目建設案例分享

某大型集團為了統籌混合雲資源管理,面向用戶提供更加高效、安全、穩定的雲服務,啟動了雲管平臺項目建設工作。我司中標該項目後,基於用戶業務現狀,從客戶的ITOM管理全局出發,統籌考慮雲管的定位以及雲管的功能,經過多輪梳理,輸出了如下的雲管需求:

在明確需求的基礎上,繼續清晰的定義了雲管工具與ITOM運維體系的各自業務範疇和邊界,基於運維體系平臺化+雲管場景工具化進行項目建設,形成了清晰的全局架構:

接下來,雲管具體功能的定義就水到渠成,自然而然了:

最終,整個雲管項目建設大獲成功,實現了集團項目啟動初期的如下建設目標,進一步推動和加快了集團的數位化轉型的步伐和IT運維管理的直接業務效能:

· 雲資源集中標準化管控

· 資源自助化、服務化

· 提升IT資源運營效率

· 提升用戶雲服務使用效率

· 雲管平臺融入運維體系

其他優質文章

這裡有一份關於系統架構知識的匯總 ,請查收...

AD FS是什麼,用在什麼場景,原理是什麼?

【並發操作】協程,線程,進程是什麼,在python中怎麼應用?

恭喜!藍鯨DevOps平臺助中國人保財險通過DevOps持續交付3級!

【愛嬰島】千店千面多元母嬰零售,雲化系統支持業務發展!

相關焦點

  • 「新心數科」新金融搭檔新運維技術,嘉為藍鯨支持普惠金融!
    因此,不僅業務系統和業務運營,運維體系和運維團隊本身也需要跟隨業務需求成長。新心數科基於嘉為藍鯨研發運營一體化平臺,將運維工具SaaS層與體化平臺原子能力層解耦,打造可積木式系統構建運維工具的一體化平臺。
  • 共商能源網際網路加「數」發展 探討東、中、西部地區電網如何因地制...
    為反映國家電網有限公司(簡稱「國家電網」)各單位貫徹落實「建設具有中國特色國際領先的能源網際網路企業」戰略目標情況,本期圓桌論壇對話了國網江蘇信通、江西信通、陝西信通三家公司總經理,探討東、中、西部地區電網如何因地制宜推進數位化轉型發展。
  • 重磅:CARDE電器正式落地數位化雲平臺建設 加速實現「企業上雲」
    【中華集成灶網】近日,卡夢帝電器正式落地數位化雲平臺建設,攜手浙江大學副教授宋燁峰共同打造智能數位化雲平臺項目,進一步驅動卡夢帝在廚電領域實現數位化和智能化轉型升級。這一戰略性舉措是卡夢帝電器在業內率先實現了數據新動能的集中,也是物聯網時代下廚電企業變革的一個縮影。
  • 知名網絡公司前員工刪庫,企業該如何保障雲環境下的運維安全
    但是,企業一方面在充分利用雲計算帶來的敏捷性,創造更大價值的同時,另一方面不得不面臨著如何保障雲運維安全的巨大挑戰。報告同時顯示,在中國,有78%的安全決策者認為,僅靠雲服務商提供的安全工具,是不足以保護其免受雲安全問題傷害的。雲運維是企業高效利用雲資源重要保障,但在技術發展日新月異的今天,雲運維面臨著嚴峻的安全形勢。
  • 2020 Gdevops全球敏捷運維峰會在北京圓滿落幕
    他表示,在我國信息化建設中,IT運維與資料庫技術起著舉足輕重的作用。近年來隨著國內先進企業對運維發展理念和相關技術的不斷深化,以及對開源資料庫改造、國產資料庫研發的成功實踐,中國數位化轉型速度得以領跑全球,中國信息技術的發展未來可期!
  • 富通雲騰輕量級SaaS服務「MSP公有雲管理服務平臺」上線
    2020年5月15日,基於長期服務企業級客戶的積累實戰經驗以及對前沿技術不斷創新的總結,富通雲騰重磅推出輕量級SaaS服務 「MSP公有雲管理服務平臺」,在2020年5月15日—2020年11月15日期間客戶可免費註冊使用本平臺,請登錄富通雲騰官方網站,點擊導航欄「免費試用」進入相應頁面,註冊後即可獲得免費試用機會。
  • 新炬網絡亮相DAMS 2020,助力企業資料庫國產化落地與智能運維轉型
    新炬網絡連續六年助力DAMS峰會的成功舉辦並亮相現場,本次由新炬網絡董事、副總經理程永新,以及新炬網絡運維產品部總經理宋輝帶來主題演講,分別聚焦"構建國產資料庫服務生態"和"智能運維"兩大主題展開探討,分享多年來為大型企事業單位提升數據價值與運維效率的創新思想和實踐經驗
  • JumpServer 堡壘機護航順豐科技超大規模資產安全運維
    挑戰:堡壘機要兼顧海量資產納管與高可用順豐科技現實的運維管理需求,對堡壘機的能力提出了更高的要求:■ 堡壘機需要支持多雲基礎設施。混合雲的持續推廣使用加大了IT基礎設施管理的複雜程度。針對包含傳統KVM、私有雲、公有雲等類型的IT基礎設施,企業需要堡壘機能夠適配和納管不同的IT組件,並進行統一的安全審計;■ 堡壘機需要支持水平擴容。目前順豐科技管理的虛擬機資產已達到數萬規模,後續隨著業務的增長,資產數量也將持續增長。龐大且快速增長的IT資產需要堡壘機在資產納管方面更具可擴展性,並且能夠應對突發性的業務需求。
  • 港珠澳大橋智能運維雲平臺即將建成
    據港珠澳大橋管理局消息,「港珠澳大橋智能化運維技術集成運用」專用雲平臺將於12月底建成。該項目立足雲運用模式下的數據存儲、共享、管理、查詢需求,形成一個支撐大橋業務信息資源的整合共享、多源異構數據處理與服務的一體化平臺。
  • 華為雲立體運維解決方案——雲上一站運維平臺
    隨著越來越多企業上雲,雲上的規模與複雜度日趨增長,對雲上的運維,也提出了新的挑戰。常見的雲上應用的架構雲上應用早期較多的是購買雲服務I層資源(多為基礎設施如主機等計算資源)自建各種集群,運維人員多以主機監控為中心進行運維,同時自己搭建應用及資料庫等監控系統進行應用層和業務層運維。隨著容器技術的普及,越來越多的企業通過微服務框架開發,業務的實現也更多的使用雲上服務,如分布式中間件,函數服務,AI服務等,同時運維也轉向雲上的運維服務。
  • 新鈦雲服,打造最專業的Cloud MSP+,做企業業務和雲之間的橋梁
    根據RightScale的調查報告,96%企業準備使用雲,81%的企業實施了多雲策略,57%的IT領導人期望與MSP合作。企業在上雲、管雲與用雲的過程中,常常會面臨著巨大的風險及挑戰。例如,如何選擇並組合雲供應商、如何將業務平滑遷移到雲,降低過程風險、如何統一管理複雜的多雲和混合IT環境,又如何將雲技術和行業特性結合,驅動業務創新?
  • 騰訊Techo Park開發者大會 5G時代,企業如何更好獲得公有雲一樣的...
    隨著數位化建設的高速發展,企業對無邊界、唾手可得的算力的訴求日益強烈。在強大的雲計算集中式算力基礎上,為企業提供低延遲訪問本地系統的算力服務,實現數據本地化處理和存儲,以進一步滿足安全合規要求,已成為眾多雲產商的重要發展策略。
  • 騰訊Techo Park開發者大會丨5G時代,企業如何更好獲得公有雲一樣的...
    隨著數位化建設的高速發展,企業對無邊界、唾手可得的算力的訴求日益強烈。在強大的雲計算集中式算力基礎上,為企業提供低延遲訪問本地系統的算力服務,實現數據本地化處理和存儲,以進一步滿足安全合規要求,已成為眾多雲產商的重要發展策略。
  • 亮相2020中國數據與存儲峰會 QingStor以存儲進化加速企業落地雲原生
    "2020中國數據與存儲峰會"由百易傳媒(DOIT)主辦,中國數字經濟百人會、中國電子學會信息存儲專業委員會、全球網絡存儲工業協會(SNIA)協辦,特邀中國工程院院士、中國電子學會、中國計算機學會存儲專委會領導,與國內外知名科技企業代表,共同探討新數據時代存儲技術發展趨勢,分享數位化轉型成果,共話智慧未來。
  • 航天信息正式推出全國信創運維服務平臺
    論壇重磅發布「全國信創運維服務平臺」,推出了運維業務全覆蓋、管理大閉環的全新平臺,著力打造信創運維產業新生態。 為了順應產業發展趨勢,完善信創產業生態,推動國家信息安全戰略落地實施,需要建立兼收並蓄、開放包容、融合創新、集約高效的一體化運維體系,保障信創產業安全穩定、高效持續運行。
  • 疫情影響下,嘉為藍鯨如何助力企業IT運維?
    SZ公司是嘉為集團合作最深配合最默契的客戶之一,也是嘉為藍鯨最早的深度踐行客戶之一,基於嘉為藍鯨自動化運維平臺,雙方開展了大量實踐和探索,取得了顯著成果。那麼在疫情影響下,嘉為藍鯨是如何助力SZ公司IT運維的?
  • JITStack智能雲管平臺:為行業智能升級提供無限可能
    從場景需求出發,以數位化、智能化的方式構建企業數位化體系,實現企業數位化轉型和智能化發展。E企研究院「超融合加速季」聚焦超融合落地應用場景,呈現系列細分場景的定製化解決方案,本期解讀的是上海思詢科技基於基於JITStack Enterprise的英特爾 精選開源雲解決方案。
  • 雲安全保障數字經濟高質量發展
    2020雲安全聯盟大中華區大會近日在上海舉辦,包括下一代信息技術安全、網絡空間安全技術創新與成果轉化、5G時代物聯網安全的挑戰與策略等成為大會熱門話題。與會嘉賓表示,伴隨著科學發展和技術迭代,協同辦公、遠程運維等新場景不斷湧現,傳統邊界安全已經失效或作用有限。
  • 星環科技Show出加速企業AI建設的魅力
    星環科技基於大數據存儲和計算能力的基礎平臺建設的上海市數據共享交換平臺,可以支撐每秒至少10萬+的並發查詢,保障「隨申碼」順利上線及運營。「新基建」加快AI落地應用的步伐:「近些年,大數據和AI技術呈現融合的趨勢,多行業場景落地進一步提速。
  • 《醫院後勤管理系統與運維……》發布後,會迎來怎麼樣的建設浪潮?
    網際網路與醫療發展的融合,為提高醫療服務效率、提高醫療質量打開了一扇華麗的翅膀。智能醫院將成為未來的發展方向,要有智能醫院,那就必須要有一個醫院後勤管理雲平臺。醫院智慧後勤管理系統建設與運維指南十月十六日,「2020長三角醫院建設與運維國際論壇」暨《上海市級醫院智慧後勤管理系統建設與運維指南》的「書發布揭幕儀式」如期舉行,圍繞醫院基礎設施