近日,西班牙電信德國公司(Telefonica Germany)宣布,他們正在和愛立信、AWS合作,準備在公有雲上部署愛立信提供的5G核心網(以下稱「5GC」),預計將在2021年商用。
消息一出,業界震動。
雖然電信業一直在講NFV、核心網雲化,但此前相關實踐都集中在新興運營商和專網應用上,供應商主要是IT側廠商,底層硬體基本是私有雲。
這是第一次有國際主流運營商把傳統設備商的核心網部署在公有雲上,創造了通信網絡雲化的三個「第一」:
第一個部署雲原生5GC的主流運營商,第一家提供5GC公有雲部署支持的傳統設備商,第一家承載規模商用5GC的公有雲廠商。
本文將就這一事件,進行深度分析和研判。
3GPP規範中的5GC,設計之初的目標,就是希望成為雲原生應用。
從架構上來說,轉發和控制分離的5GC,就是一個有著雲原生控制器的SDN網絡。
5GC的系統架構
控制面的SBA架構,就是IT領域常講的微服務架構。5GC新引入的NRF,就是微服務架構中的註冊中心。
5GC各服務之間的信令,採用的是IT領域通用的http2協議,而非此前核心網常用的diameter等專用協議。
5GC的各個服務,在設計上就是無狀態的,因此可以隨時在伺服器之間無縫遷移。
控制面採用雲原生部署,而轉發麵UPF,因為功能非常單一,採用白盒轉發設備也完全可行。
這樣的架構設計,使5GC實現了充分解耦,支持分布式部署,從而幫助5G網絡支持兩大殺手級特性——邊緣計算和網絡切片。
理想很美好,但現實往往很骨感。
目前,國內已經有不少省份部署了5GC,並且承載了業務。從現場反饋來看,主要存在以下幾個問題:
一、通用硬體適配性不足。
某運營商在某省部署A廠的5GC,硬體方面採用A廠的伺服器(包括虛擬化層和作業系統),B廠的交換機以及C廠的磁碟陣列。
雖然這已經是一個縮水版的硬體解耦(因為最關鍵的伺服器和中間件都是A廠自己的,連兩層解耦都算不上),但部署過程中還是出了一大堆問題。
其中大部分問題,都是硬體驅動的問題。雖然驅動問題是小問題,但小問題多了,就是大問題。
而之所以會有這麼多小問題,歸根結底還是當前通信產業鏈的開放程度不足。
反觀IT領域,一個典型IDC中涉及的廠商更多,所需要的驅動也更多,但異廠商不兼容的問題卻少得多。
二、未能融入雲原生的生態。
從高度集成的單體架構轉向雲原生,隨著解耦的充分,必然帶來複雜度的提升。例如Netflix的整體IT架構,就是由數千個互相依賴的微服務組成。
知名流媒體平臺Netflix的複雜架構
這種新增的複雜性,需要有效的管理。
目前5GC開局和運維的複雜程度被廣為詬病,一是因為運營商維護人員本身技能和意識都還在轉型中,沒有從傳統網絡維護完全轉向雲原生應用維護。二是因為廠商提供的核心網本身開放性就很差,未能和雲原生領域成熟的全套DevOps工具鏈相結合,其配套的網管還是按傳統思路在做。
這就好比馬達換成了特斯拉的馬達,但整套控制系統還是傳統燃油車的,自然給運營造成了較大困難。
三、轉發控制分離不徹底。
在5GC中,UPF和控制面之間的N4接口是由3GPP定義的。但因為各種原因,N4接口的解耦並不充分。
目前,第一批商用的5GC控制面和UPF均是同廠商,UPF仍然是專用設備。
考慮到未來UPF會下沉到大量邊緣節點,UPF白盒化和異廠商兼容,對運營商來說是一個剛需。
因此,我們可以看到三大運營商均在大力推動N4接口解耦,並且已經取得了一定成果。
目前來看,西班牙電信和愛立信的官方消息更多是商業性質的宣傳,對於具體的技術方案,並沒有進行披露。
但是,AWS今年發布的白皮書《AWS使能5G演進:構建可擴展、安全、可靠、高效的雲原生核心與邊緣網絡》中,卻對相關部署方案有較為詳細的闡述。初步預計,西班牙電信的整體技術方案會以此為藍本。
從總體架構來說,5GC的控制面功能會承載於AWS區域的中心機房(AWS Region),而UPF以及5G NR的CU部分控制面,可以通過部署在邊緣節點的AWS Outpost承載。
AWS Outpost,是AWS推出的可以部署在客戶側機房的一體化機櫃。
這個機櫃內部根據客戶訂單預集成了伺服器和交換機,運送到客戶機房後,連通電源和網絡即可使用。
儘管Outpost部署於客戶機房,但其本身是AWS公有雲服務的一部分。客戶對設備本身不享有產權,也不負責設備的維護。
Outpost通過專線或者public VPN與AWS Region連接,在邏輯上作為AWS Region的延展。
對於控制面,AWS推薦的是EKS(亞馬遜的託管版K8S)承載。其在白皮書中,詳細描述了如何通過水平擴展來應對5GC的高性能需求。
而對於轉發麵,AWS推薦的是虛擬機承載(轉發能力達100Gbps,支持SR-IOV、DPDK等的網絡優化實例)。
鑑於AWS目前採用的Nitro虛擬化技術,通過講虛擬化的相關負荷卸載到專用硬體板卡上,基本實現了虛擬機性能等價於物理機。
因此,從性能上講,也可以看作是物理機在直接承載。
考慮到西班牙電信的業務需求,不排除用白盒交換機作為UPF,實現Tbps級別轉發(例如Facebook自研的白盒交換機,由4塊至強CPU加上高性能轉發ASIC組成,基本上等同於高性能伺服器插上了Tbps級別的轉發ASIC,完全可以滿足UPF需求)。
值得注意的是,AWS並未針對5GC的部署推出任何定製化產品,整個方案用到的組件全部是AWS的成熟產品。
這也就意味著,AWS現有運維和DevOps工具鏈可以完美適用於AWS承載的5GC。運維這樣的5GC,將和運維任何一個AWS上的IT應用一樣簡單。
在白皮書中,AWS還專門討論了如何將其總結的雲上運維最佳實踐框架應用於5GC運維。從相關內容看,在AWS眼中,5GC作為一個雲原生應用和其它雲原生應用的共性遠遠大於特性。
目前,AWS和運營商合作的MEC產品Wavelength,已經在多地試商用,為MEC應用的開發者提供和在AWS Region上進行應用開發相一致的體驗和工具鏈。
如果西班牙電信此次真的能把5GC放在AWS上,它的5G行業解決方案將取得巨大的規模優勢。
網絡雲化已經提出很多年了。
通信行業一直在說NFV和SDN,5G在相關技術架構上也基本體現了雲原生的設計理念。但即使是各大廠商交付的最新5GC設備,對雲原生的支持和其本身的開放程度仍然不足。
在筆者看來,這無外乎三個原因:
一、即得利益者對改革的牴觸非常大。
進一步說,就是以四大設備商為首的力量,非常抗拒網絡雲化導致的生態開放趨勢。畢竟要論利潤率,肯定還是封閉最好。
當然,面對潮流,大家也不能全然無動於衷。
目前的形勢,是在傳統領域實力越弱的企業,改革的步伐越大。
例如諾基亞,目前應該是四巨頭裡面唯一一個把基站前傳的eCPRI接口都開放給運營商的設備商,好像也是最早在5G基站晶片中推廣FPGA的設備商。
可惜,早走一步是先驅,早走兩步就成了烈士。因為FPGA的性能和成本問題,諾基亞產品性價比落後,最終導致股價大跌。
愛立信相對在技術路線上比較穩健,但最近也在加快向雲原生演進。
這次愛立信願意配合把產品部署在公有雲上,也說明了他的態度。
至於無線領域當之無愧的大哥,一直以性能和成本為由批判雲原生理念,繼續推銷自己不解耦或者假解耦的方案,以此來全方位服(suo)務(ding)客戶。
二、整個行業對網絡雲化認識仍然不到位。
很多人說運營商的員工技能不行,無法勝任雲原生網絡的運維。
但其實更重要的是態度問題。
IT的技能並不比傳統通信更複雜,只要願意學,轉型不是問題。問題在於很多人壓根就不認為雲原生代表未來,認為還是高度耦合的一體化方案性能好,其他都是吹牛。
歐美運營商解決這個問題的方案比較粗暴。比如AT&T,就是全員學習,然後年紀大不學習的員工裁掉。我國運營商相對來說比較溫和,主要還是以鼓勵內部學習和人員自然迭代為主。
三、泛政治化帶來的陰影。
目前,除了思科還在無線市場佔有一定份額之外,美國已經沒有無線設備商了。
為了實現MAGA(Make America Great Again)的願景和打壓華為,美國政府出面鼓吹open-RAN的同時,又把全球無線設備最大的生產國和消費國——中國排斥在外。
這樣既人為割裂了技術社區,也給技術選型強加了政治因素。從長遠上看,對網絡雲化的發展負面影響是相當大的。
沉舟側畔千帆過,病樹前頭萬木春。
核心網的雲化是大勢所趨,整個通信網絡都在朝這個方向發展。
幾日前,阿里巴巴XG實驗室和浙江聯通合作的5G輕量級核心網,在浙江舟山港落地。這也是一個強烈的信號,不僅國外的競爭對手會行動,國內的廠商也不會錯過網絡雲化的機會。
相信隨著5G建設的不斷深入,產業網際網路會誕生更多的網絡雲化需求。核心網的市場格局,將發生翻天覆地的變化!
本文僅代表作者觀點,不代表鮮棗課堂觀點。