作者:董指導
出品:遠川研究所科技組
美國有兩個大會,格外受國內從業人士關注,一個是伯克希爾哈撒韋的股東大會,投資人士踴躍前往聆聽股神巴菲特的經驗智慧;另一個則是亞馬遜雲服務(AWS)的re:Invent全球大會。
AWS作為全球規模最大、技術領先的公司,從2012年起,每一年都會召開峰會,分享其科技方向、業務規劃;這個峰會成為行業標杆,也影響著各行各業的發展。因此,每一年峰會上,都會有全球的開發者、觀察者、企業客戶等,前來了解雲服務的前沿科技。
re:Invent全球大會往常都需要1799美金註冊費,但仍一票難求。而今年,亞馬遜雲則首次將峰會搬到了線上,並且完全免費向全球公開。更難得的是,減價不減質。今年的峰會從12月1日召開,整整三周時間、百餘場分享,全面闡述了亞馬遜雲在「重塑」之路上的堅定步伐。
雲業務由亞馬遜做大,既是偶然也是必然。電商流量的波峰波谷,導致彈性計算成為剛需。而亞馬遜的堅定投入、對需求本質的追求,則促使雲業務從自用走向了市場,開始重塑IT成本。
比如當年率先使用AWS的奈飛。2008年,隨著海量視頻快速上線,奈飛的IT資源撐到了極限。隨後又遭遇了一場自然災害,導致其自建的數據中心幾乎三天都處於休克狀態。而繼續擴大數據中心建設,將會帶來極大的IT支出。亞馬遜雲,通過彈性擴容、按需收費,完美解決了奈飛的憂慮。
可以說,奈飛發展途中一個重要選擇,便是從自有投資數據中心,轉向了採購雲服務,重塑了自己的IT成本。而這個「重塑」這個技能,也是每家公司要實現基業長青的重要措施。
根據統計,50年前的《財富》500強企業,如今只剩下17%、83家還在榜單上;20年前的《財富》500強企業,如今也只有50%還在榜單上。要保持活力,必須能夠自我革命,不斷重塑,尤其能採用最先進的技術,來武裝企業,來降本增效。這在疫情期間更為重要,也是AWS所持續打造的優勢。
比如,在資料庫方面,傳統的資料庫價格不菲、配置昂貴、但又擴容困難。而AWS最新推出的資料庫服務Aurora Serverless v2,可以做到實時擴容,在不到1秒的時間內,即可瞬間擴展到支持幾十萬個數據處理事務。如此,開發者不需要買大量伺服器來匹配峰值的運算需求,而是按需擴容,可以節省高達90%的成本。
這個量級,在業內領先,也推動了資料庫服務的演進。與此同時,已經有35萬個資料庫遷移到了AWS,以應對消費經濟激增、業務流量頻發。而且AWS還以開源形式推出了Babelfish for PostgreSQL,讓用戶直接在雲上運行SQL Server應用程式,降低傳統資料庫開支,提升資料庫上雲後的應用交付效率。
在數據分析方面,一直有個痛點,不同端的數據難以流動分析,就像成千上萬個太平洋小島被水面隔絕,難以形成高經濟價值的共同體。而這次峰會,AWS也推出了Glue的新功能AWS Glue Elastic Views。它可以從多個不同數據源創建實例化視圖,簡單、高效地將數據孤島連接起來,形成統一的數據視角。
當數據源發生變化時,AWS可以在在幾秒鐘內完成同步。讓數據像血液一樣流動起來,為企業業務運轉提供生命力。
而這幾年,容器技術大為流行,但容器和無伺服器應用都由非常小的代碼段組成,每個代碼段通常由不同的團隊開發和運維,有獨立的基礎架構。隨著業務發展,在基礎設施、開發、運維等團隊之間,協調架構配置、代碼部署和運維監控等工作也日益複雜,會拖慢應用開發速度。因此,管理容器又成了一個難題。
針對這種情況,AWS推出了容器開發利器AWS Proton,可以提供了更細顆粒度的雲服務應用部署管理工具。只需要建一個調用棧,就可以自定義模板,填上相應參數。AWS的容器工具,相當於雲服務界的「一鍵」快捷功能,省去了平時多個團隊在多個環節的繁雜流程。
資料庫、數據分析和容器開發這三個工具,只是AWS強大武器庫的冰山一角。細看這三個工具,都是那種不起眼、卻直擊痛點的雲服務利器。而這些工具的出現,都改變了企業IT部署的形態、成本,也大幅提高了企業的效率。讓AWS成為值得信賴的「大管家」。
Alpha Go打敗李世石帶來的震撼才剛剛過去,無人駕駛等技術又借著新能源的熱潮成為社會焦點。AI正在各行各業快速普及,據德勤數據顯示,到2025年,世界人工智慧市場將超過6萬億美元。而在這大潮中,機器學習則是核心研究領域之一,覆蓋89%的人工智慧專利申請和40%的人工智慧相關專利。
所謂人工智慧,先有人工,再有智能。這其中的一個核心問題在於,人才的增長,跟不上AI的發展。比如在我國,人工智慧人才的供求比例為1:10,缺口超過500萬。對於那些傳統產業以及創新型小企業而言,使用機器學習、完成AI轉型是一項「急切卻又困難」的夢想。
而這次發布會上,亞馬遜依託20多年的經驗,公布了四大舉措,為機器學習擴圈,為中小企業圓夢。
首先,提供開箱即用的工業領域機器學習解決方案。市面上,開源的算法與公開論文並不少,但對於AI的工業化應用而言,漫長的調參與針對特定配置修改,其實才是影響算法最終可用性的根本保障。為了降低用戶的部署成本,AWS發布了五項服務,就像家用電器一樣,開箱即用。
其中,Amazon Monitron可以為用戶提供從傳感器、網關到機器學習服務組成的端到端機器監控系統,檢測異常並預測何時需要維護工業設備;Amazon Lookout for Equipment面向已經擁有傳感器的客戶,提供機器學習模型並返回預測結果,檢測異常設備行為。這兩項服務,可以支持預測性維護。
AWS Panorama一體機可以連接到工業場所的網絡中,自動識別攝像頭數據流,與工業攝像頭進行交互。AWS Panorama軟體開發套件(SDK),方便工業相機製造商在新相機中嵌入計算機視覺功能。這兩項服務,可以改善工業運營和工作場所安全。而Amazon Lookout for Vision通過機器學習技術為工業客戶提供高精度、低成本的產品質量異常檢測解決方案。
其次,針對不同需求客戶,提供包羅萬象、有針對性的工具箱。
工具箱包含三個層面:針對技術能力超強的客戶,主要提供機器學習框架、處理器等工具集的底層;針對技術能力較強的客戶,通過提供包含各種工具的全託管機器學習集成開發環境,幫助降低機器學習門檻;而針對技術能力相對薄弱的客戶,AWS開箱即用的AI服務則可以實現各種AI業務需求的快速部署。
再次,將機器學習能力跟資料庫進行嫁接,把機器學習覆蓋人群拓展到資料庫開發者和數據分析師。
一般來說,資料庫開發者、數據分析師群體的人數,比機器學習開發人員群體大得多,而且也更容易培養,因此,「爭取到他們」,將會大力促進機器學習發展。因此,AWS推出了包括Aurora ML、Athena ML、Redshift ML等在內的多項功能。讓資料庫開發者、數據分析師沿用資料庫查詢的方式,讓他們的機器學習想法落地到業務應用中。
比如,當電商公司做出海業務時,需要為多國用戶制定相應語言的服務,這就需要把資料庫中的商品信息變成多種語言。在傳統資料庫模式下,這個工作量會很大。但是,通過AWS的新服務,資料庫開發者只管查詢商品信息、選擇多語種翻譯,返回的結果就會自動包含商品信息的多語種翻譯。難度下降、效率提升。
再比如要了解公司業務增長時,在傳統模式下,開發者需要在模型中預先定義增長率、再更新模型、處理數據,整個流程可能是幾天甚至幾周。但依託AWS的服務,可以採用自然語言,直接在查詢框中輸入問題,幾秒鐘之內就可以得到高度準確的答案。
最後,發展機器學習的中間力量,不斷提升Amazon SageMaker的性能。
Amazon SageMaker是面向機器學習開發者的集成開發環境、全託管服務。它依託多項工具,化繁為簡,使開發人員和數據科學家能夠從根本上更輕鬆、更快速地構建、訓練和部署機器學習模型。可以說,SageMaker性能越提升,機器學習發展也會越快。
因此,AWS也在不斷提升託管服務。在過去一年,SageMaker交付了50多項新功能。而在今年的re:Invent大會上,AWS再次發布數據特徵提取器Data Wranger,數據特徵存儲庫Feature Store,自動化工作流Pipelines等9項新功能。
比如Data Wrangler內置了300多個數據轉換器,讓客戶無需編寫任何代碼,就可以機器學習用到的特徵進行規範化、轉換和組合。Pipelines是第一個專為機器學習構建的、方便易用的CI/CD(持續集成和持續交付)服務。大型複雜深度學習模型的分布式訓練,將當前的速度提升了兩倍。
這些不斷更新的功能,深受用戶喜歡。在推出的3年內,已經擁有了3M、ADP、阿斯利康、Avis、拜耳等幾萬家客戶。AWS將積累了二十餘年的機器學習經驗全部上雲,幫助無數客戶完成了更快、更高效向AI轉型的步伐,重塑AI進程。
儘管上雲的趨勢是顯著和必然的,但過程卻是曲折的。比如有些領域的一些工作負載需要在本地保留數年,有些應用對網絡延遲非常敏感,而且需要接近本地資產,例如金融高頻交易、製造支持系統、在電信邊緣提供網絡功能虛擬化 (NFV)服務等等。在這些領域,哪怕是一秒鐘的延遲,帶來的效果可能都是天差地別。
總結起來一句話,用戶希望在本地也能用上AWS的工具,運行計算、存儲等功能,享受到同等便利。在意識到用戶需求和現有公有雲產品之間的差異後,AWS認為,一切要從用戶需求出發,於是有了「混合雲」。
在業內,不少人認為混合雲就是本地基礎設施加上雲,但AWS並不認可。AWS團隊對於混合、本地(on-premise)再次進行了思考,本地不僅僅局限在本地數據中心,工廠、旅店甚至偏遠地區的農林田地的IT需求,都應該算作本地。
於是,混合基礎設置便演化為「雲+各種邊緣節點」。AWS便按照這個思路開始重塑混合雲領域,圍繞著用戶需求,層層迭代,推出了一系列服務。
在過去幾年中,AWS提供了Amazon VPC (虛擬私有雲)、AWS Direct Connect(雲直連)和Amazon Storage Gateway(存儲網關)等服務,方便客戶在使用AWS的同時運行本地數據中心。
而許多用戶的本地數據中心是基於VMware虛擬化的,因此,為了減少用戶學習成本,2017年,AWS與VMware協作,發布VMware Cloud on AWS,客戶可以在AWS使用同樣的VMware軟體和工具,管理其AWS上的基礎設施。
與此同時,對於必須駐留在本地的工作負載,客戶也希望能夠將AWS部署到本地。於是,在2018年,AWS開創式地推出了Outposts。這是一款和AWS雲數據中心一樣的伺服器硬體,上面有計算、存儲、數據分析等AWS服務,而且,仍然由AWS全託管,負責安裝和維護等等。用戶可以使用跟AWS雲上相同的API、控制面板、工具、功能。
AWS Outposts有兩種形態:一個 AWS原生形態(現在已經可用),它允許客戶在Outposts使用與AWS公共區域完全相同的API和控制面板;另一個形態是VMware on AWS Outposts。藉助AWS Outposts,客戶可以選擇計算優化、存儲優化或圖形優化的EC2(彈性計算雲 )實例,這些實例可以有本地存儲,也可以沒有本地存儲,還可以選擇EBS(彈性塊存儲)卷。
針對時延敏感領域,AWS推出了本地區域,它是AWS區域的,可以讓計算、存儲和資料庫服務靠近大城市,將本地終端用戶的訪問延遲進一步降低。基於5G網絡,AWS Wavelength可以實現5G全程加速,讓用戶釋放5G低延時的商業紅利。
而針對環境惡劣、網絡連接有限的地區,例如山區、船舶等,AWS推出了Snow系列設備,可以連續計算、數據存儲和數據轉送。搜集數據完成之後,可以帶到總部去處理。
在本次re:Invent大會上,AWS CEO Andy Jassy宣布了1U和2U兩款小尺寸的Outposts,1U尺寸像Pizza一樣大小,和經典型號功能一模一樣,但體積縮小至1/40。小尺寸的Outposts可以很好地適應醫院、飯館、商店、工廠等等,這些IT設備空間受限的場所。
可以說,AWS的混合雲,並不是一個「本地+雲簡單混合」的結果,而是一個不斷迭代的過程,就像打怪升級一樣,不斷遇到挑戰、解決挑戰。
AWS從問世到實現第一個100億美元收入,用了123個月;第二個100億美元增長,用了23個月;第三個100億美元增長,則用了13個月;如今,第四個100億美元增長,只用了12個月。
收入快速增長的背後,源自於AWS的不斷「重塑」。2011年,AWS發布了80多項重要服務和功能;2012年,發布了近160項;2013年,發布280項;2014年,發布516項;2015年,發布722項;2016年,發布1017項;2017年,發布1430項;2018年發布1957項;2019年,發布2345項。
今年re:Invent,AWS在計算、存儲、資料庫、數據分析、容器、機器學習運維、工業機器學習等多個方面推出了143項更新。根據Gartner在2020年8月發布的《2019年全球公有雲IaaS和PaaS市場份額報告》,AWS的市場份額為45%,超過第二、第三、第四、第五名的總和(34.3%)。
而事實上,雲服務也仍處於發展早期,Gartner發布的IT關鍵指標數據《2020:Industry Measures》顯示,在全球IT總支出中,雲上支出僅佔4%。因此,無論是雲產業,還是AWS,都會迎來廣闊增長空間。而驅動力,則來自於創新。
創新很困難,而創新者不斷顛覆自己來實現創新,則更為困難。AWS用雲顛覆了傳統IT,但仍以重塑姿態,不斷顛覆自己。而這個秘訣,也許正是源自於貝索斯(Jeff Bezos)的思考「keep the vitality of Day 1」:永遠客戶至上customer obsession。