作業系統配置參數難題
作業系統作為銜接應用和硬體的基礎軟體,如何調整系統的參數配置,充分發揮軟硬體能力,從而使業務性能達到最優,對用戶至關重要。然而,運行在作業系統上的業務類型成百上千,應用形態千差萬別,對資源的要求各不相同。
困境一:參數對象龐大,業務複雜度高。
當前硬體和基礎軟體組成的應用環境涉及高達7000多個配置對象,隨著業務複雜度和調優對象的增加,調優所需的時間成本呈指數級增長,導致調優效率急劇下降,給用戶帶來巨大挑戰。
困境二:並非所有的系統能力都能通用。
作業系統作為基礎軟體,提供了大量的軟硬體管理的基礎能力,每種能力適用的場景不盡相同,並非對所有的應用場景都通用有益。
困境三:實驗室無法完成所有應用負載的模擬測試。
實際業務場景成千上萬,計算、網絡、存儲等硬體配置也各種各樣,實驗室無法遍歷所有的應用和場景,以及不同的硬體組合。
l AI技術帶來的新思路
為了應對上述挑戰,解決用戶的難題,作業系統急需一顆智能的「大腦」,一顆能夠感知上層業務類型,能夠「懂」業務的「大腦」,而A-Tune就是這樣一顆大腦,它通過使用AI技術,對業務場景建立精準的系統畫像,感知並推理出業務特徵,進而做出決策,匹配並推薦最佳的系統參數配置組合,使業務處於最佳運行狀態。openEuler適時推出了這顆智慧大腦A-Tune。
c
l AI技術與作業系統碰撞出「新火花」
A-Tune利用AI技術,通過對業務系統的底層性能數據進行分析和建模,構建精準的場景系統畫像,針對負載模型匹得出合適的資源模型,並制定對應的調度優化策略,對業務進行更細粒度的調優,讓應用程式發揮出極致性能。
A-Tune強大的調優能力讓系統運維更簡單,讓IT運維人員更輕鬆,它能夠滿足入門到專業級開發者的不同需求:
1) 對於初級用戶,儘可能屏蔽硬體和作業系統的底層細節,降低調優門檻,實現用戶無感知的系統優化;
2) 對於專業用戶,可以針對具體的業務場景進行定製,如豐富優化經驗庫,訓練自己的模型,實現更精細的調優。
A-Tune核心技術框架如下圖,主要包括智能決策、系統畫像和交互系統三層。
l 智能決策層:包含感知和決策兩個子系統,分別完成對應用的智能感知和對系統的調優決策。
l 系統畫像層:主要包括標註和學習系統,標註系統用於業務模型的聚類,學習系統用於業務模型的學習和分類。
l 交互系統層:用於各類系統資源的監控和配置,調優策略執行在本層進行。
l A-Tune應用實踐
以Web業務場景為例,SSL/TLS加解密的過程對於CPU計算能力的消耗相對較高,對於Web每次的數據交互都要進行建鏈,也就意味著每一次的數據傳輸都要進行RSA加解密,CPU的計算能力決定了Web伺服器的處理性能。基於SSL/TLS的加解密任務,消耗CPU計算能力在Web服務中佔比高達80%。
A-Tune通過感知Web業務特徵,自動將加解密計算卸載到鯤鵬晶片的加速器中,從而降低CPU使用消耗,優化後Web服務端處理性能提升200%,對比其他處理器的吞吐量提升顯著。下圖是Nginx作為Web伺服器,通過A-Tune優化後的性能提升效果:
*測試結果來源於A-tune團隊實驗室測試數據。
更多關於A-Tune項目信息,可在openEuler開源社區獲取。
openEuler開源社區:https://openeuler.org
A-Tune項目源碼:https://gitee.com/openeuler/A-Tune
A-Tune項目文檔:https://gitee.com/openeuler/A-Tune/tree/master/Documentation