智能計算、邊緣計算環境下的雲原生進化之路

2020-12-05 DOIT

雲計算的發展,經歷了虛擬化、商業IaaS、商業PaaS,到開源IaaS、開源PaaS、雲原生等階段,核心組成部分也經歷了從伺服器到虛擬機再到容器的演變。

2015年創立的CNCF發布的開源平臺Kubernetes,讓雲原生技術得到長足發展,越來越多的行業、場景採用雲原生技術,企業和個人開發者4年增長了近20倍,來自超過2k個公司的3.5萬多個開發者向開源社區貢獻了14萬餘行代碼。

今天,在5G、AI &大數據應用日漸普及的背景下,為適應多雲混合雲、智能計算、邊緣計算、異構計算等計算環境,雲原生正在迎來新的進化。

在華為開發者大會2020(Cloud)期間,來自華為雲、才雲科技、中國聯通的技術專家,帶來了雲原生技術的最新發展成果和趨勢走向。

Kubeflow + Volcano 加速機器學習平臺容器化進程

近10年來,AI發展迅速。在AI訓練過程中,涉及到硬體、作業系統、驅動、程式語言和運行時、存儲和資料庫、框架、上層應用預算法等多層技術堆棧,應用K8s,則能讓用戶屏蔽程式語言以下的所有堆棧,更多關註上層技術實現。

K8s長於任務調度,在分布式AI訓練過程中,能把訓練任務分布到不同的集群上執行。但K8s默認的調度器存在諸多問題,如:

•資源的爭搶問題

•Head-of-Line Blocking問題

•優先級問題

•部分任務的親和性問題

•PS Worker 的帶寬很大程度上影響訓練問題

•拓撲問題

另一方面,隨著AI應用需求的增加,人們開始考慮如何進一步簡化上層的存儲、框架技術堆棧,讓AI訓練更加容易,Kubeflow應運而生。

Kubeflow定位於K8s平臺上ML工作負載管理工具,如數據存儲、框架選擇均能通過Kubeflow獲得管理,實現分布式訓練、分布式實驗、分布式服務、管道服務等功能,進一步簡化堆棧。

使用Kubeflow,流程更加清晰簡單,用戶只要關心業務邏輯、算法、模型代碼的開發,就能完成從模型訓練到模型發布一整套流程,不必關注底層。

Volcano是在Kubernetes 上針對大數據、深度學習等場景設計的調度系統,能夠解決部分分布式訓練任務調度的痛點問題。Volcano基於K8s,具有高擴展性,且容易學習上手。

才雲科技機器學習平臺工程師、Kubeflow開源社區維護者高策介紹,分布式AI訓練任務的資源爭搶成本極高,等待時間長達10秒級,採用Volcano PS-Worker 親和性調度之後, PS和Worker之間的通信速度變快,任務執行效率提高,等待時間有大幅度下降。

高策分析這一顯著提高來自兩個方面原因:一方面任務執行時間縮短,資源很快被釋放,其他任務獲得資源的等待時間變少;另一方面與默認調度器比較,Volcano解決了資源爭搶問題,不會再發生任務無謂等待甚至鎖死的情況。

基於 KubeEdge 的邊緣計算平臺幫助客戶降本增效

隨著5G通信的商用,萬物互聯時代快速到來,網絡邊緣的設備數量、產生的數據爆發增長,集中式的數據中心(包括公有雲服務)將面臨實時性、帶寬、能耗、數據隱私的挑戰,越來越多的場景需要應用邊緣計算。

在K8s上,可以通過K3s、Microk8s、KubeEdge三種架構實現邊緣計算,KubeEdge以雲邊協同、邊緣側的輕量和邊緣自治能力而獲得更多應用。

聯通雲計算有限公司容器團隊負責人、KubeEdge開源社區Approver張杰,負責在聯通雲的容器和KubeEdge落地工作,他介紹了一個汽車保養門店車位績效AI識別的典型應用案例:

客戶是一家汽車保養連鎖機構,每個門店都有多個保養車位,每個車位都需要記錄車輛維護數量、時間,以評估每工位、每門店的業務績效。如果採用通常做法,額外購置智能攝像頭或者使用雲識別服務的話,成本會非常高昂。

聯通雲計算通過KubeEdge部署的邊緣計算系統,採用工位攝像頭來抓取車輛進出的照片,實時識別車輛信息、計算車輛停留保養時間,實現全天統計無遺漏,最後匯總報表推送至雲端的運營中心,實現門店乃至車位的業績效率統計、實現KPI考核,以及門店地域的汽車維修熱點統計分析,實現門店資源的全局調度等功能。

這一邊緣計算方案,繼續採用原有系統的IP攝像頭,不需額外購置智能攝像頭,只需一次性投入,運營過程中每次識別幾乎不產生使用費用,很好地保護了客戶投資。

這是一個典型的雲端向雲邊端遷移的過程中,聯通雲在邊緣側加入幾臺arm 伺服器,實現就近計算,只上報統計結果,即解決了延遲問題,又提高了敏感數據的安全性問題。

系統改造後,在雲端會有應用服務的管理平臺以及業務的運營平臺。控制層面由k8s master和kubeedge的cloudcore管理。每個線下門店的ARM伺服器上都安裝kubeedge的邊端組件:mqtt、edgecore服務等,管理pod的生命周期以及對應的終端管理。

所有的應用都經過容器化改造,使用KubeEdge統一管理和下發。使用KubeEdge本身提供的能力,既能最大化發揮容器的快速部署的優勢,也能實現雲邊協同和邊緣自治的能力。很好的滿足了客戶對於運維和運營的需求。

藉助邊緣計算系統,單張圖片識別時間開銷 < 50ms,且在網絡質量不佳時,也可以離線使用。同時,利用IoT感知技術,可以實時監控輪胎等可燃物料存儲區域的溫度狀態,如果店面出現明火及煙霧時,會及時推送報警短視頻到門店管理人員及運營平臺,達到自動報警的目的。

火了這麼久,2020年雲原生將走向哪裡?

王澤鋒是華為云云原生開源負責人、KubeEdge項目聯合創始人,他是國內最早的一批K8s Maintainer,是KubeEdge項目和Volcano項目開源的主導者。

王澤鋒預測了2020年雲原生在企業落地的3大趨勢,他認為:更多企業採用多雲混合雲,以避免廠商綁定;更多的AI &大數據應用開始雲原生開發;5G + AI +邊緣將成為雲原生向外延伸的新機遇。

近年來K8s在中國的發展迅速,5G、AI、邊緣計算正在創造新體驗、新應用、新產業,促進智能在諸多行業的普及和應用。KubeEdge和Volcano正是在這個過程中創立,並在應用實踐過程中,逐漸得到完善。

邊緣計算具有連接的廣泛性、數據帶寬優化、邊緣的自治性、業務的實時性、安全與隱私保護等優勢。但在落地實現中,每個應用場景的具體設備、網絡通信等條件都不盡相同,需要面對資源有限、網絡不暢、離線自治、設備接入和管理等現實問題。

KubeEdge是K8s上更好地實現邊緣計算的工具,針對邊緣側的實際環境做了諸多優化:實現了邊緣側節點的離線狀態自治;雲邊消息傳輸默認使用websocket,支持雲邊協同;同時支持雲端集群和邊緣端集群的管理;在邊緣側節點Edgecore 的內存暫用率大約是70M,極致輕量;同時兼容k8s 的核心api功能等等。

KubeEdge由華為開源並於2019年3月捐給CNCF基金會,是K8s IoT Edge Working Group 的關鍵參考架構之一,目前有超過250位貢獻者參與維護。

以KubeEdge為核心構建的華為雲智能邊緣平臺,具有大規模、輕量化、邊緣智能、超強算力等特點。平臺支持十萬節點、百萬應用,雲端統一管理、配置、升級;資源佔用小於128mb,支持輕量化容器和函數管理;集成40+ AI算法,邊緣流計算以及時序型資料庫;支持華為鯤鵬/華為昇騰算力調度,邊緣AI推理算力提高3倍。

AI&大數據近年來成為新的熱點,雲原生能帶來諸多好處:實現自動化、標準化、易擴展;支持異構硬體,降低複雜度;提高利用率和性價比等等。

但AI&大數據的雲原生技術還不完善,目前主要解決了各個計算框架容器化的問題,仍有許多能力需要完善,如:改善資源分配的孤立性,避免作業死鎖;針對資源的拓撲優化;作業任務間的依賴關係支持。

Volcano開源項目基於K8s構建Batch系統,提供針對AI大數據的複雜作業管理和高級調度能力。

Volcano項目基於華為雲容器平臺大規模高性能計算應用管理的最佳實踐,在原生 K8s 的基礎上,補齊了作業 (Job) 調度和設備管理等多方面的短板。目前,Volcano 在華為雲上對接了包括一站式 AI 開發平臺 ModelArts、雲容器實例 CCI、雲容器引擎 CCE 在內的多款服務,是整個高性能計算領域不可或缺的基座。自開源以來,項目已經吸引了來自騰訊,百度,快手以及 AWS 等多個公司的貢獻者。

雲原生代表了新一代的技術方向,其在中國的發展如火如荼,CNCF的會員數量從2015年只有華為1家初創&白金會員,到今天已經發展到50家。全球1/4認證的K8s服務提供商來自中國;全球1/3的K8s培訓發生在中國。

在雲原生熱度持續上升的過程中,其生態獲得發展,超過90個廠商提供了認證的K8s的雲服務或者發行版,Kubernetes的南向有多種運行時、存儲、網絡等插件供用戶選擇,北向的應用管理和數據服務生態也持續豐富——業界主流的CICD工具鏈、資料庫、消息中間件等都支持對接K8s或直接在K8s上運行。

2020年已經過去四分之一,雲原生在多雲混合雲,邊緣計算,智能計算等領域的強勁發展勢頭,值得所有開發者關注。

_____END_____

未經允許不得轉載:DOIT » 智能計算、邊緣計算環境下的雲原生進化之路

相關焦點

  • 邊緣計算與智能家居
    一方面,有了邊緣計算的支持,物聯網對設備的控制,就相當於人對於手的控制,可以直接通過大腦意識控制,因為當設備之間的聯動通過區域網內的邊緣計算實現時,邊緣計算內的邏輯在雲計算上早有備份。傳感器通過連接雲平臺、區域網將處理後的數據傳輸至智能終端,促使各個子系統做出適應環境的調整。智能家居傳感器以微型化、智能化、多功能化、網絡化等趨勢向前發展。未來,傳感存在於智能中,全屋智能會像空氣般存在,像呼吸般自然,用戶可以在不知不覺中感受到智能家居帶來的便捷化體驗。何為邊緣計算?
  • 邊緣計算是什麼?下一次信息技術的變革
    如何理解邊緣計算近年來,大數據、雲計算、智能技術的快速發展,給網際網路產業帶來了深刻的變革,也對計算模式提出了新的要求。大數據時代下每天產生的數據量急增,而物聯網等應用背景下的數據在地理上分散,並且對響應時間和安全性提出了更高的要求。
  • 融入AI,邊緣計算按下升級鍵
    在5G浪潮的驅動下,智能設備、自動駕駛、VR/AR、智能製造等對於實時性、本地性有著較強需求的場景日益豐富,邊緣計算應運而生,有效提升了用戶體驗。但是,隨著強實時數據量的迅速攀升,且數據形態更加多元,邊緣計算面臨的技術挑戰更加複雜。在這一趨勢下,融入AI能力的智能邊緣計算應勢而起。
  • 融入AI 邊緣計算按下升級鍵
    原標題:融入AI,邊緣計算按下升級鍵   在5G浪潮的驅動下,智能設備、自動駕駛、VR/AR、
  • 邊緣計算總結 - CSDN
    根據中國邊緣計算產業聯盟的定義,邊緣計算是指在靠近物或數據源頭的網絡邊緣側,融合網絡、計算存儲、應用核心能力的開放平臺,就近提供邊緣智能服務,滿足行業數位化在敏捷聯接、實時業務、數據優化、應用智能安全與隱私保護等方面的關鍵需求
  • 對於邊緣計算的要求是什麼
    大數據時代下每天產生的數據量急增,而物聯網等應用背景下的數據在地理上分散,並且對響應時間和安全性提出了更高的要求。雲計算雖然為大數據處理提供了高效的計算平臺,但是目前網絡帶寬的增長速度遠遠趕不上數據的增長速度,網絡帶寬成本的下降速度要比 CPU、內存這些硬體資源成本的下降速度慢很多,同時複雜的網絡環境讓網絡延遲很難有突破性提升。因此傳統雲計算模式需要解決帶寬和延遲這兩大瓶頸。
  • 百度發布全自研崑崙雲伺服器等智能計算領域20個新品
    鞭牛士 8月29日消息,今日百度在「ABC SUMMIT 2019百度雲智峰會」上,發布了智能計算領域20個新品:百度崑崙雲伺服器、CDN邊緣計算節點BEC、邊緣AI伺服器、彈性裸金屬伺服器、GPU虛擬化實例、容器實例BCI、歸檔存儲、主機安全企業版、雲顧問Cloud Advisor、百度機器學習BML4.0、邊緣函數CfC@Edge、雲原生微服務應用平臺、效率雲、邊緣融合解決方案
  • JITStack講解:什麼是邊緣計算?邊緣計算是靠近數據源的計算基礎
    在IIoT的背景下,「邊緣」是指靠近數據源存在的計算基礎設施,例如,工業機器(風力渦輪機,磁共振(MR)掃描儀,海底防噴器),工業控制器(SCADA)系統和時間序列資料庫聚合來自各種設備和傳感器的數據。這些邊緣計算設備通常遠離企業雲端的集中計算。維基百科是這麼定義:邊緣計算是將計算應用程式,數據和服務的前沿從集中式節點推向網絡的邏輯極端。
  • 邊緣計算的優秀用例和優勢
    邊緣計算用例的數量在未來幾年將進一步增長,Gartner預測,到2023年底,將有超過一半的大型企業至少部署六個邊緣計算用例。2019年,在大型企業中,只有1%企業有六個或更多邊緣計算部署。這就需要車載計算能力和邊緣數據中心來進行關鍵任務處理,以進行導航、車對車通信以及與新興智能城市的集成。邊緣計算還可以幫助市政當局(例如交通部門、公共轉型部門和私人運輸公司)更好地管理其車隊和總體交通流量–通過基於實時實地狀況進行快速調整。例如,部署用於處理車輛數據的邊緣計算平臺可以確定哪些區域正在發生擁堵,然後重新導航車輛以減輕交通流量。2.
  • 字節跳動火山引擎加入 Linux 雲原生計算基金會(CNCF)
    2020 年 11 月 18 日,在北美舉辦的 KubeCon + CloudNativeCon 上,雲原生計算基金會(CNCF)宣布字節跳動旗下的數字服務與智能科技品牌火山引擎正式成為 CNCF 白金會員。
  • 一文了解邊緣計算和邊緣AI
    眾所周知,AI晶片分為雲端和邊緣端,雲端晶片要求高性能,邊緣端晶片由於應用場景眾多,對於環境和能耗等也有更多要求。事實上,當前邊緣AI晶片已不再是個小眾領域,除地平線以外,包括谷歌、英偉達、英特爾、高通、華為、寒武紀均於近兩年推出邊緣AI晶片,AI晶片的戰火已經由雲端蔓延到了邊緣。
  • 《ECII白皮書1.0》聚焦異構計算助力邊緣計算行業標準化
    該白皮書重點定義了邊緣伺服器的需求、技術方案和產業生態,闡述了在數據多樣性和業務多樣性的產業趨勢下,作為邊緣伺服器主要計算架構的異構計算在多核並發,綠色節能以及雲、邊、端協同等方面的獨特優勢。ECII由邊緣計算產業聯盟(Edge Computing Consortium,簡稱ECC)和綠色計算產業聯盟(Green Computing Consortium,簡稱GCC)聯合成立,面向邊緣計算分散、多樣化的應用部署特點需求,從邊緣計算設備架構、運維需求、環境要求、產業生態多個方面提出了標準化要求,涉及邊緣伺服器、智能邊緣一體機、邊緣網關的晶片支持、運維管理、安全可靠性、運行環境等標準化要求
  • 乾貨丨邊緣計算應用、現狀及挑戰
    傳統的雲計算模型是將所有數據通過網絡上傳至雲計算中心,利用雲計算中心的超強計算能力來集中解決應用的計算需求問題。然而,雲計算的集中處理模式在萬物互聯的背景下有 3 點不足。(1)萬物互聯實時性需求。萬物互聯環境下,隨著邊緣設備數量的增加,這些設備產生的數據量也在激增,導致網絡帶寬逐漸成為了雲計算的一個瓶頸。
  • 2019MWC | 重拳出擊,中國移動邊緣計算C位再出道
    IDC預測顯示,2018年將有40%的數據要在網絡邊緣側分析、計算與存儲。可見,未來邊緣計算有廣闊的應用前景,範圍會涉及智慧城市、智慧家居、智慧醫院、在線直播,到智能泊車、自動駕駛、無人機、智能製造等各個方面。
  • 光格網絡SD-WAN亮相雲數據企業家海口峰會 打造面向5G和邊緣計算的...
    在企業數位化轉型的大浪潮下,數據的重要性日益凸顯。與此同時,數據的總量越來越大,如何實現龐大的數據實時收集和高效傳輸、存儲管理成為企業亟需解決的難題。馬志強認為,龐大的數據如同城市擁堵的道路,網絡就像交通路網,不僅需要精細化運營,即網絡領域的極致軟體定義能力,也需要豐富的交通路網,以實現城市中心與分中心的連接,即中心雲與邊緣計算節點的網絡連接。
  • 如何應對邊緣計算的四大挑戰
    技術、拓撲結構、環境條件、電源可用性、連接的事物和/或人員、重數據處理與輕數據處理、數據存儲與否、數據治理約束、分析樣式、延遲要求等方面都有要求。一般來說,邊緣計算越接近端點,它就越具有特殊用途、用戶化和針對性。通過這種多樣性,標準將需要數年時間來發展。
  • 5G成為邊緣計算的較強推動力
    邊緣計算是數字世界中最令人興奮的新概念之一。利用佔用空間很少的微型數據中心網絡,邊緣計算使系統能夠實時收集並分析重要數據,而不會增加現有基礎設施的負擔。在物聯網系統中,通常以端到端的方式,在特定的高度傳感器密集型環境中獲得大量數據,且數據是在邊緣生成並處理的,以降低延遲並減輕數據中心的負載。
  • 邊緣計算和邊緣AI是什麼?兩者有什麼區別?
    如果將邊緣設備產生的大量數據全部傳輸至雲計算中心,會給網絡帶寬造成極大的壓力。例如,飛機波音787每秒產生的數據超過5GB,但飛機與衛星之間的帶寬不足以支持數據的實時傳輸。總之,單純依靠雲計算這種集中式的計算處理方式,不足以支持以物聯網感知為背景的應用程式運行和海量數據處理。在這種應用背景下,邊緣計算應運而生。它與現有的雲計算集中式處理模型相結合,能有效解決雲中心和網絡邊緣的大數據處理問題。
  • 加速場景化落地 青雲QingCloud邊緣計算與IoT產品持續進化
    從2005年物聯網概念正式誕生以來,物聯網的技術進化和應用落地一直在緩步前行,這一技術並沒有像網際網路那樣給我們的工作和生活帶來翻天覆地的變化。但在數字經濟逐漸成為經濟發展核心驅動的今天,一切已經悄然改變。作為新基建的核心要素之一,物聯網正在成為下一個最有望爆發的新技術領域。
  • 日本邊緣計算協會事務局長德永雅樹:以邊緣計算為核心 構建跨產業...
    11月24日,日本邊緣計算協會事務局長德永雅樹先生在「世界網際網路大會•網際網路發展論壇」的分論壇「工業網際網路的創新與突破——數字賦能新智造」上表示。日本邊緣計算協會事務局長 德永雅樹德永雅樹認為,圍繞著社會的大環境,世界各國都致力於將製造業的發展作為國家戰略考慮,以產業的高度、國際競爭力為重點