數據中心交換機橫向虛擬化集群漫談

2020-12-11 51CTO

虛擬化技術在數據中心是個時髦詞兒，有橫向虛擬化、縱向虛擬化、一虛多虛擬化、NVO3虛擬化等等。今天重點跟大家聊聊橫向虛擬化，以華為CloudEngine 12800系列為例，讓朋友們了解一下此技術的由來和發展史，深入淺出地介紹下各種橫向虛擬化技術的特點、以及各種場景下的選擇策略。

橫向虛擬化集群由來

在數據中心網絡發展初期，沒有專門的數據中心交換機，那咋辦?先拿園區交換機頂著，使用最傳統的VRRP+STP，湊合著用吧，就是下面這張經典的園區網絡。

這個網絡模型，透著濃濃的經典、可靠的園區味道。可時間久了，問題就來了：

◆流量越來越大，STP阻斷導致鏈路利用率低;

◆非最短路徑轉發，樹根存在帶寬瓶頸，轉發時延大;

◆VRRP單活網關，備節點設備閒置;

◆STP網絡規模受限，收斂性能較差;

◆管理節點多，邏輯拓撲複雜，維護麻煩。

這些問題帶來橫向虛擬化的訴求，框式交換機集群率先登場。

堆疊

典型的框式交換機堆疊，有CISCO的VSS(Virtual Switch System)、華為的CSS(Cluster Switch System)、H3C的IRF(Intelligent Resilient Framework)。VSS、CSS、IRF在本質上都是堆疊，只是穿了不同的馬甲而已，當然各廠家也發展出一些差異，這是後話。

堆疊技術，本質上就是合併，管理平面、控制平面、轉發平面的全面合併。堆疊系統的主控板，管理兩臺物理設備的所有線卡和網板，變成一個邏輯的大交換機。

但需要注意，堆疊目的不僅僅是為了變大，從網絡角度看一下邏輯拓撲，一下變得「高富帥」!

「高富帥」的主要表現：

◆幾乎兩倍交換能力的超級節點;

◆二三層轉發流量完全負載分擔，充分利用所有鏈路;

◆邏輯單節點，業務支持全面，網絡方案設計簡單;

◆通過部署跨框link-agg，支持物理節點的故障保護;

◆網元二合一，有利於網絡管理和維護。

還有零零碎碎的好處也不少：

◆最短路徑轉發，時延低;

◆相對傳統STP，可以組建更大的二層網絡;

◆link-agg的收斂性能，網絡故障收斂塊。

在堆疊系統中，堆疊鏈路的帶寬相對於業務埠，帶寬總是不夠的。這就要求轉發的業務流量儘量避免經過堆疊鏈路，這就是所謂的流量本地優先轉發。

如上圖所示，華為數據中心交換機堆疊系統，對三層ECMP、鏈路捆綁支持本地優先。本地優先轉發節省了堆疊鏈路帶寬，同時也達到減少轉發時延的目的。

除了上述通用的堆疊技術，華為CloudEngine 12800系列數據中心高端交換機，還針對堆疊的可靠性，做了重大的體質性的優化。

堆疊的優化

可靠性優化(轉控分離的堆疊)

轉控分離的堆疊，也稱為帶外堆疊，這個優化主要目的是高可靠性。

業界大部分框式交換機的堆疊，堆疊成員間的控制通道和轉發通道都使用一個通道。華為的CloudEngine 12800系列數據中心交換機***性的開發了轉控分離的堆疊系統。這裡的「轉」指的是業務數據轉發通道;「控」指的是控制消息(也稱為「信令」)通道。

傳統的框式堆疊系統，業務數據通道和控制消息通道都使用相同的物理通道，即堆疊鏈路。如下圖所示：

這種堆疊系統，控制消息和數據混合在一起運行，如果堆疊通道的數據通信量大，則可能導致控制消息受到衝擊而丟失，進而影響控制面的可靠性。嚴格來說，這種設計沒有滿足「數據、控制、管理平面分離」的設計要求。此外，堆疊系統的建立，依賴線卡的啟動，導致軟體複雜度的提高，以及影響堆疊的啟動速度。

轉控分離的堆疊系統，採用如下所示架構：

該硬體堆疊架構帶來一系列可靠性的提升：

◆控制消息通道和業務數據通道物理隔離，保證業務數據不影響控制消息;

◆三重的雙主故障防護，包括堆疊管理鏈路(4路)、堆疊轉發鏈路(至少2路)、業務埠/管理埠DAD;

◆堆疊系統建立，不再依賴線卡的啟動，無軟體時序依賴，簡化軟體實現，而簡單意味著可靠;

◆堆疊系統建立，不再等待線卡/網板的啟動，縮短堆疊系統建立時間;

◆控制消息通道路徑短，故障點少，時延低。

堆疊改良的局限性

堆疊系統帶來了前述系列的好處，但慢慢的，令人不爽的問題也逐漸暴露出來，這是由堆疊原理本質決定的。

如上圖所示，兩臺交換機通過管理平面、控制平面、數據平面的緊耦合，形成邏輯上的一臺交換機。這導致了如下三個風險或者問題。

◆整系統級可靠性風險

對於普通的故障，堆疊系統可通過鏈路切換、主備板切換、框切換等完成故障保護。但是由於整個系統的兩臺物理switch在軟體(管理平面、控制平面)是緊耦合的，這就增大軟體故障從一臺switch擴散到另一臺Switch的可能性。一旦出現這種類型的故障，將導致整個堆疊系統的故障，影響堆疊系統接入的所有業務。

◆版本升級的業務中斷時間長

由於堆疊本身承擔了業務保護功能，因此當堆疊系統升級時，不能像VRRP的成員節點升級時由另外一個節點進行流量保護，中斷時間比較長。

對此，各廠商開發出了兩框RoundRobin和ISSU的升級方式，這些升級方式縮短了升級時的業務中斷時間，但並不解決下面所說的升級風險，甚至因為技術複雜度、軟體工程複雜度的提升，放大了升級風險。

◆整系統升級風險

設備軟體版本升級，即使採用最傳統、簡單的升級方式，也是一個帶風險的網絡操作。設備升級失敗將導致該設備所帶業務失效，這種情況下，要採用包括回退在內的一切手段儘快恢復業務。

堆疊系統由於成員交換機間的緊耦合，只能是兩臺設備一起升級，升級失敗將導致堆疊系統下所有業務網絡中斷。而堆疊系統，在接入層往往承擔伺服器雙歸保護接入的角色、或者在匯聚承擔高可靠性網關的角色，這意味著升級失敗很可能導致整個業務的癱瘓。

Link-agg虛擬化(M-LAG)

橫向虛擬化，從需求角度是為了滿足接入層、匯聚層的二層跨設備冗餘、匯聚層L3網關的跨設備冗餘。那是否還有其他技術，支持橫向虛擬化，又沒有堆疊的哪些問題?

答案當然是有，華為CloudEngine系列數據中心交換機的M-LAG(Multichassis Link Aggregation Group)就支持這樣的虛擬化技術。該技術只在兩臺設備的link-agg層面實現二層虛擬化，兩臺成員設備的管理和控制平面是獨立的。

註：維基百科稱此技術為MC-LAG(Multi-Chassis Link Aggregation Group)，CISCO稱之為vPC(Virtual Port-Channel)。下文都採用維基百科的術語，即簡寫為MC-LAG。

MC-LAG，支持的跨設備鏈路捆綁組網，支持Dual-Active的L3GW。在接入側，從對端設備視角、伺服器視角看，MC-LAG與堆疊類似。

但是，從三層網絡角度看，MC-LAG的兩個成員節點擁有自己獨立的IP位址，兩個節點有自己獨立的管理和控制平面。從架構角度看，MC-LAG的兩個成員設備僅存在數據面的耦合，以及協議面的輕量級耦合：

MC-LAG的架構，決定了此技術方案不存在堆疊難解決的三個問題：

那麼，說了MC-LAG的這麼多好處，是不是就沒有缺點了?當然不是，寸有所長，尺有所短。***一節比較堆疊與MC-LAG的優缺點，以及場景選擇建議。

堆疊和MC-LAG的對比和選擇建議

根據上面的對比表格，堆疊和MC-LAG各有優缺點。總的來說，對於網絡設計/維護人員，堆疊勝在管理維護簡單，MC-LAG勝在可靠性和低升級風險。

在數據中心網絡方案設計時，需要權衡考慮，有如下策略可以選擇：

◆策略一：匯聚層優先考慮可靠性、升級方便性，選擇M-LAG;接入層因為設備量大，優先考慮業務部署和維護方便性，選擇堆疊。

◆策略二：優先考慮可靠性、升級低風險，匯聚和接入都使用M-LAG。

◆策略三：優先考慮業務部署和維護方便性，匯聚和接入都使用堆疊。

【責任編輯：

藍雨淚

TEL：（010）68476606】

點讚 0

相關焦點

華為數據中心專家職業認證HCIE-DC V1.0模擬試卷

華為數據中心專家職業認證HCIE-DC V1.0模擬試卷（多選）以下關於CE6800系列設備描述錯誤的是？A. CE6850U-48S6Q-HI交換機在V100R500C10版本默認支持FC功能，且不需要申請license就可以開啟該功能。B.
華為數據中心交換機2016上半年中國市場份額第一

國際權威調研機構IDC最新中國區數據中心交換機市場報告顯示，華為數據中心交換機在2016上半年收入位列中國第一，增長勢頭迅猛，同比增長56%，憑藉優異的產品和解決方案，贏得眾多客戶青睞。作為2012年至今連續4年全球增長速度最快的數據中心交換機廠商之一，華為數據中心交換機在全球頂級數據中心交換機供應商中也表現非常搶眼，2016年Q2收入已躍居全球第三位，成為華為在網絡市場最主要的收入增長點之一。如此驕人成績，一方面依靠的是華為強大的研發實力和技術優勢，另一方面與高性能高可靠的產品、數據中心網絡SDN解決方案、和堅持開放生態產業鏈構建密切相關。
網絡虛擬化技術:VSS、IRF2和CSS解析

VSL承載特殊的控制信息並使用一個頭部封裝每個數據幀穿過這條鏈路。而所有的控制層面的功能，包括管理(SNMP，Telnet，SSH等)，二層協議(BPDU，PDUs，LACP等)，三層協議(路由協議等)，以及軟體數據等，都是由活躍交換機的引擎進行管理。
【獨家】華為數據中心、雲計算課程重點分析

集群計算資源調度原理 6. NUMA原理7. CPU虛擬化原理8. 虛擬化存儲棧9. 華為融合資源池解決方案10. 融合資源池解決方案-服務能力特性介紹11. 融合資源池解決方案-資源池管理能力特性介紹12.
什麼是數據中心網絡扁平化?

它支持原生模式，確保通過乙太網Fabric的多條路徑有同樣的服務質量，還能自動發現活動鏈路，要是某臺交換機斷開了，還能自動重新選擇路由。DaveStevens補充說：「隨著交換機的不斷添加，它會相應擴大，實際上最後得到的是一個很龐大的數據中心雲。」他強調說，VCS集群可支持1000個萬兆乙太網埠和1萬臺虛擬機。
西北工業大學數據中心虛擬化系統擴容項目中標公告

西北工業大學數據中心虛擬化系統擴容項目中標公告 1、項目名稱：西北工業大學數據中心虛擬化系統擴容項目投標人須知前附表第5條2陝西和生科技有限公司符合性審查未通過:未提供有效的光纖交換機的CCC國家強制產品認證。
多交換機3大核心技術:級聯、堆疊、集群

在多交換機的區域網環境中，交換機的級聯、堆疊和集群是3種重要的技術。級聯技術可以實現多臺交換機之間的互連；堆疊技術可以將多臺交換機組成一個單元，從而提高更大的埠密度和更高的性能；集群技術可以將相互連接的多臺交換機作為一個邏輯設備進行管理，從而大大降低了網絡管理成本，簡化管理操作。
敏捷為王華為S7700智能路由交換機解析

華為S7700系列交換機全家福華為S7700系列智能路由交換機廣泛適用於園區網絡、數據中心核心/匯聚節點，可對無線、話音、視頻和數據融合網絡進行先進的控制，幫助企業構建交換路由一體化的端到端融合網絡
雲計算和大數據分析正向數據中心滲透

為了便於清晰地了解虛擬化數據中心的結構，賽迪時代對數據中心的虛擬化的關鍵模塊進行分步解讀。按照數據中心整體基礎架構從後端到前端依次為「存儲——計算——網絡」，通過虛擬化技術，所對應的就是「存儲資源池——計算資源池——網絡資源池」。
文件虛擬化:四種管理非結構化數據方法

【IT168 技術】你將從本文中學習到：探索四個文件虛擬化策略，幫助你管理非結構化數據。　　主要有4種虛擬化文件訪問策略：文件系統虛擬化，集群文件系統，集群NAS和NAS網關。每一種文件虛擬化方法的目的是幫助IT部門掌控非結構或者基於文件的數據，這些數據往往遍布在整個系統的各種位置。目前面臨的挑戰很嚴峻，圍繞非結構化數據存取的技術在過去15年中一直沒有改變。　　但是現在正在發生巨大的變化。NAS系統架構正朝更具擴展性，多節點向外擴展並且支持全局命名空間的架構發展。
揭秘職業院校數據中心建設的發展趨勢

圖職業院校數據中心高可用、彈性計算的三個層次伺服器、存儲的磁碟冗餘，一個磁碟出現故障不丟失數據，RAID 1、RAID 5、RAID 6；伺服器、存儲、核心交換機冷卻風扇及電源冗餘，一個出現故障不影響系統正常運行
關於軟體定義數據中心的原因、原理和方法(上)

軟體定義的數據中心（SDDC）是架構數據中心的一套總體性的思路。其為當前的企業組織機構帶來了諸多的商業利益，並且有助於提升保護數據中心的實用性。SDDC是建立在經過驗證的虛擬化技術的基礎之上的，同時也對使用虛擬化數據中心資源的一些傳統方式進行了重新思考。
網絡虛擬化，看這一篇就夠了

一般採用「1+1」的冗餘設計，網絡規模要靠增加交換機來擴大。現代的數據中心沒有這些負擔，設備的同質化很高，網絡可以集中在Unicast和三層路由，從而大大簡化網絡的負責程度。現代的數據中心網絡一般採用全三層設計，路由網絡協議，沒有二層的橋接，組播和廣播的功能。Overlay本質上就是在三層網絡上跑二層的協議。
華雲大咖說丨安超虛擬化平臺介紹

安超虛擬化平臺是擁有自主智慧財產權的虛擬化平臺,支持多芯多棧的伺服器架構,通過整合數據中心的IT基礎資源,為企業數位化轉型提供更敏捷、更高效的軟體定義數據中心。安超虛擬化平臺包括雲管理平臺、軟體定義計算(ArCom)、軟體定義網絡(ArNet)、共享存儲虛擬化(ArSSV)、軟體定義安全等功能。
堆疊概述(堆疊指多虛一虛擬化有關的特性)

為了解決這樣的問題，許多廠商都提出了各自的網絡設備的N:1虛擬化技術。在另外一種場景中，也有些用戶希望將成本低廉的盒式設備虛擬化成一臺虛擬設備，從而使盒式設備之間互相冗餘備份，提高網絡的可靠性，簡化網絡的管理。這也需要通過N:1虛擬化技術來實現。
中國聯通基於CORD的雲數據中心演進解決方案

現網環境中，4臺核心交換機和40多臺接入交換機，部署在位於不同物理位置的兩個機房中，通過橫向虛擬化、縱向虛擬化技術，虛擬成一臺邏輯設備，簡化了運維的工作; 通過虛擬化技術消除了生成樹，避免了環路會導致的二層網絡風暴問題
大數據的左膀右臂!

在眾多大數據解決方案中，Hadoop成為了人們實現大數據分析的首選，然而，它仍然離不開虛擬化和雲計算技術和平臺的支撐。發展成熟的虛擬化和有著廣闊前景的雲計算，將成為大數據價值實現的左膀右臂。面對海量數據的增長，傳統架構雖然能夠進行擴充，但它卻面臨著不能實現水平橫向擴展的局限性，傳統的IT架構和數據處理方式無法有效地應對大數據環境。
Cisco交換機集群技術:可伸縮的堆疊體系結構

Cisco為Catalyst 3500 XL系列和具備千兆位性能的Catalyst 2900 XL系列交換機提供業界最靈活、可伸縮、可管理的推疊體系結構。您可以在同一配線間中創建交換機堆疊，或者利用Cisco交換機集群技術創建一個延伸到配線間之外的集群。無論哪一種方式，所有交換機均通過一個IP位址管理。兩種選項都能使您創建結合現有和新Cisco設備的堆疊，從而保護您的區域網投資。
虛擬化漫談:桌面虛擬化究竟指的是什麼

應用桌面虛擬化有很多的好處，支持的論據也是非常充分的：傳統的桌面計算機要消耗大量的硬體資源，並且要面臨更多的風險，每一臺筆記本和臺式機都有遭遇黑客而丟失數據的機會。管理較為複雜，即使採用遠程桌面管理，管理員在升級或者排錯的時候都要把員工「驅逐」走，佔用了員工工作的時間。
基礎虛擬化架構大比拼:Hyper-V 對陣 VirtualBox

硬體虛擬化和軟體虛擬化Hyper-V支持硬體虛擬化。硬體虛擬化是一種使用虛擬機管理程序在軟體和物理硬體之間創建抽象層以計算機虛擬技術。使用特殊軟體模擬計算機正常功能所需的所有設備。VirtualBox支持硬體和軟體虛擬化。軟體虛擬化只支持x86體系結構的32位客戶機作業系統。

數據中心交換機橫向虛擬化集群漫談

相關焦點

華為數據中心專家職業認證HCIE-DC V1.0模擬試卷

華為數據中心交換機2016上半年中國市場份額第一

網絡虛擬化技術:VSS、IRF2和CSS解析

【獨家】華為數據中心、雲計算課程重點分析

什麼是數據中心網絡扁平化?

西北工業大學數據中心虛擬化系統擴容項目中標公告

多交換機3大核心技術:級聯、堆疊、集群

敏捷為王 華為S7700智能路由交換機解析

雲計算和大數據分析正向數據中心滲透

文件虛擬化:四種管理非結構化數據方法

揭秘職業院校數據中心建設的發展趨勢

關於軟體定義數據中心的原因、原理和方法(上)

網絡虛擬化，看這一篇就夠了

華雲大咖說丨安超虛擬化平臺介紹

堆疊概述(堆疊指多虛一虛擬化有關的特性)

中國聯通基於CORD的雲數據中心演進解決方案

大數據的左膀右臂!

Cisco交換機集群技術:可伸縮的堆疊體系結構

虛擬化漫談:桌面虛擬化究竟指的是什麼

基礎虛擬化架構大比拼:Hyper-V 對陣 VirtualBox

敏捷為王華為S7700智能路由交換機解析