「變革」在信息技術快速發展的今天已經成為了常態。
雖說如此,但對於很多已經達成「共識」的「痼疾」,很多人雖然都能看到,但囿於各種困難、阻礙,很多人也都選擇了視而不見。
敢於捅破「窗戶紙」的無疑是勇者,但顯然,只有能夠打破「潛規則」的才是箇中翹楚。
雲計算的「潛規則」
如今,雲計算的重要性已經不需要再過多的強調。但在 10 年前的,雲計算卻在很多人看來是一個「雲裡霧裡」的概念。
說起雲計算的發展,人們都不會繞過 2018 年 BAT 三位「掌門人」在深圳激辯雲計算未來的故事。
那時只有「不懂技術」的馬雲認為雲計算時代很快就會到來,因此,阿里走在了中國雲計算發展的最前列。
相信關注云計算發展的都知道,「創業之初」的阿里雲走的極其艱難,創始人王堅在那時不僅被稱之為「騙子」,同時也在被「挖牆腳」,技術人員被阿里其他部門「盯得」死死的。
可能連阿里雲自己人都沒想到的是,走過了艱難創業階段的他們,在那時給阿里雲注入了一個「基因」,一個敢於「挑戰」的基因。
2016 年年底「雙 11」復盤會上,時任阿里巴巴集團首席技術官的張建鋒波瀾不驚的向阿里雲提出了一個技術方向:
我們要定義哪些是核心問題,然後根本性地解決它。比如,虛擬化損耗問題就是之一。我們的目標很簡單,必須想辦法把損耗降到「0」。
這句話,在那時放在整個雲計算行業中,很多人聽完了都會有同一個想法:幾個菜就喝成這樣了?。
事實上,當時在場的幾個技術大牛的感覺也差不多是這樣,而其背後的原因是,行癲所說的虛擬化損耗問題,其實就是雲計算技術上的一個「潛規則」,也就是前文中所說的已經在行業內達成「共識」的痼疾。
我們可以用一個簡單的公式來表達:雲計算=物理機+虛擬化,物理機是計算的載體,可以如樓房一樣大,也可以如一個衣櫃大小。虛擬化則是雲計算背後的一個重要技術,它可以把無數臺計算機「組合」成一臺超級計算機,或者把一臺整計算機「切割」成無數小計算機。
而虛擬化所帶來的損耗則是雲計算發展的痼疾所在。我們以一個 32 核的物理伺服器為例,在正常情況下,一個 32 核的物理伺服器,雲廠商只能把 16 核或者 20 核給到客戶,剩下的 12 核則需要用來對存儲、網絡進行虛擬化。
因此這個 32 核伺服器所能提供的算力也是很少的,為了得到更多的算力,廠商必須要購買更多的 IAAS 資源,成本自然也隨之提升。
此外,性能瓶頸會影響整個存儲、網絡的虛擬化,帶來穩定性的降低,也無法支持裸機服務。這也是當時為什麼很多企業上雲後兜兜轉轉又用回了傳統的物理機。
上汽集團就曾希望用雲計算來解決汽車仿真的大算力場景需求,但實測結果讓公司大跌眼鏡,虛擬化性能損失高達 60%,最終不得不放棄計劃。這樣的例子比比皆是。
然而,這個「痼疾」 成為了雲計算「房間裡的大象」,人人都能看到它,卻沒人有能力除掉它。以至於到後來, 晶片廠商、虛擬化廠商、雲廠商,整個產業鏈對此諱莫如深,從來沒有人捅破這層窗戶紙。
例如英特爾等晶片商提供了硬體層面的支持,虛擬化軟體技術本身也從 Xen 演進到了 KVM,但由於軟體廠商、硬體廠商、系統集成商各司其職,這種層層之間割裂的模式最終未能在根本上解決問題。
打破這個「潛規則」
正如前文中所說,阿里雲具有敢於挑戰基因的。
但即使如此,這也並不是一件簡單的事情,要完全解決虛擬化損耗的問題,需要將雲、虛擬化和晶片的技術大融合,而要解決這個問題需要從四個方面入手
虛擬化軟體開發;
軟硬體銜接的中間層;
核心晶片設計;
硬體(板卡、伺服器)設計。
目標明確,路線清晰……
[圖片]
阿里雲副總裁李津
2017 年的 10 月 12 日。雲棲大會。
阿里雲副總裁李津雲淡風輕得在臺上發布了「神龍雲伺服器」,並且宣布神龍是「現貨」——從當天開始,客戶就可以購買神龍雲伺服器做為硬體底層的阿里雲計算資源。
而在一個月之後,坐在全球雲計算頭部「交椅」的亞馬遜也發布了類似的硬體虛擬化技術 Nitro。毫無疑問,這一次阿里雲走在了全球雲計算最前列。
神龍到底是怎麼解決這個「痼疾」的呢?
事實上就是從那四個方面入手,通過研發專用的晶片、定製的專用主板,開發了專用的 MOC 卡,並開發了從 BIOS 到應用層支撐軟體,再到整體調度軟體等一整套複雜的系統。通過軟硬結合的方式攻克了業務應用上雲之後虛擬化相關的性能開銷問題。
在此之後,為了解決裸金屬伺服器和傳統的虛擬機融合的問題,阿里推出了第二代神龍伺服器,它做到了「一套軟硬體,三種服務(裸金屬伺服器+虛擬機服務+容器)」,實現了「虛擬機性能接近裸金屬」。
2020 年 7 月,阿里雲又推出了第三代神龍雲伺服器,基於神龍架構再次將算力逼向極限,相比上一代整體性能提升了 160%,提供最多核、最大 2086TB 內存,在多項性能參數中斬獲世界第一:雲盤 IOPS 高達 100 萬、網絡轉發高達 2500 萬、網絡帶寬高達 100G。
就在近日,烏鎮世界網際網路大會·網際網路發展論壇上,神龍雲伺服器架構入選世界網際網路領先科技成果。
大會表示:神龍架構是雲計算行業第三代虛擬化技術的典型代表,它為雲而生,不僅解決了雲上虛擬化性能損耗的痛點,更讓雲伺服器的性能超越了物理機。
[圖片]
如今,神龍架構承載了中國超 80% 的科技企業上雲,廣泛應用於醫療、新政務、智能製造、網際網路、教育等多個行業。
就在 2019 年雙 11 期間,阿里將集團核心業務遷移到神龍架構上,通用類的業務承載提升了 20~30%。
工欲善其事必先利其器
2010 年雖然馬化騰和李彥宏都不看好雲計算,但大家看到的是,BAT 都在大力發展雲計算,現如今運營商、以及通信設備商也都重點布局雲計算這條賽道。
12306 上購票告別火車站排隊;微博上「吃瓜」;雙十一痛快的「剁手」,買買買;出門無需再帶U盤,雲存儲就可以了;城市的道路也不再像以前那樣擁堵;去政府辦事兒,手機就可以辦理了……
現如今,人們所感知到的這些已經「常態化」便捷方式,雲計算都是其背後功臣,更不用說,疫情期間的在線辦公、在線會議、AI 測溫……
而正是這些應用需求的不斷誕生,則讓阿里云為代表的雲廠商去不斷打磨著「雲計算」這把利器。
「雲計算是數字經濟發展的底座。」正如張建鋒這句話而言,在國家大力發展數字經濟的今天,雲計算成為了不可缺少的技術底座,而對於阿里雲等雲廠商而言,其重擔可想而知。而正是在這樣的重擔之下,我們也看到了更多諸如神龍一樣的技術創新不斷湧現。
十年,雲計算產業已經從創業期進入成熟期,其也正在成為一張國家名片,而這十年中,正是由於有著像阿里雲的這樣的雲廠商在,才能取到今年的成果。
正如一些行業人士說到:不能說沒有阿里雲就沒有中國雲計算產業的今天,但至少可以說阿里雲縮短了中國雲計算產業和世界先進水平接軌的時間。