蘑菇街是中國的女性時尚社交電商平臺,成立於2011年,總部位於浙江杭州。本文介紹它的運維發展歷程和雙十一期間使用的關鍵技術,供大家參考!
關於蘑菇街
中國***的女性時尚社交電商平臺,成立於2011年,總部位於浙江杭州,目前(2015.Q3)擁有1.3億註冊用戶,雙十一日UV超2000萬。2015.11.21日宣布完成D輪融資,並實施"一街雙城"戰略,杭州+北京,杭州偏電商方向,北京偏社交媒體方向。
蘑菇街業務架構-導購期(2011-2012)
運維早期情況
早期階段(2011-2012年)
– 兩位數機器、個位數網絡設備。
– 沒有運維,開發即運維,靠牛逼的腳本和一些開源工具搞定。
蘑菇街業務架構-轉型期(2013)
運維的發展
中間階段(2013年-2014年)
– 三位數伺服器、兩位數網絡設備
– 2-3名專職運維同學(主機&網絡&DB&緩存&......) – 問題響應式的工作方式
– 工具化的運維平臺
蘑菇街業務架構-社會化電商
我們應該怎麼辦
思路:
關於應用服務管理
案例介紹
讓我們看一個從伺服器管理—申請—代碼發布—線上監控的案例。
關於應用伺服器-Hestia服務和資源管理
關於應用服務管理-Mops流程申請系統
關於應用服務管理-發布系統
以trade_ordership_service為標示,進行代碼發布。
關於應用服務管理-監控系統Sentry
通用+自定義監控,運維+開發可以時刻關注自己的服務狀態和質量。
運維的現狀
專業的運維團隊 – 系統運維
– 應用運維 – DBA
– 運維開發
– PHP+Java持續集成發布平臺
– 統一的監控平臺
– 全鏈路服務質量分析平臺 – 穩定性平臺
– 容量評估平臺(待做)
– 從問題響應式,向整體解決方案提供方向發展
雙11技術保障,運維做了什麼?
雙11關鍵技術分享—全鏈路系統
全鏈路背景
全鏈路技術架構
全鏈路應用-快速發現問題點和瓶頸點
全鏈路應用-調用合理性分析
沒有明顯的瓶頸點,每一次調用RT也很正常,但是全鏈整體的RT卻很高,問題又出在哪裡了呢?
全鏈路使用後的收益和後續
使用全鏈路後的收益
– 提升問題的定位效率 – 準確的評估容量
後續
– Mogu-Watch,與前端打通,實現用戶全鏈路的分析 – 壓測做到平時,與容量評估平臺和資源分配打通。
– 引入雲資源彈性擴容,避免應對峰值的批量機器採購。
壓測之後,關鍵技術改造-ATS靜態化方案
靜態化方案背景和簡介
– 主鏈路(首頁-詳情&活動-交易-支付),降低RT,提升容量。
– 資源類的如圖片、CSS、JS等的靜態化方案都會採用CDN技術。
– 對於頁面內容類的數據,如商品名稱、商品詳情等都屬於靜態數據,而 商品的庫存、優惠等則需要獲取動態結果。
– 對於活動頁面、H5活動推廣頁面等,則可以完全靜態化。
ATS(Apache Traffic Server)靜態化技術方案-Cheetah
ATS靜態化案例-商品詳情頁
ATS靜態化使用後的收益和後續
– 詳情頁(全站流量的30%+)靜態化在雙11期間的***率達到95%,換言之,減少了後端服務接近30%的流量壓力。
– RT從原來200ms降低到50ms,用戶體驗大大提升。
– 容量提升,減少了後端伺服器的數量。
– 藉助雲資源搭建雲上的ATS,更貼近用戶 – ATS Cluster方案。
– 支持HTTPS。
– 回源流控和容災控制。
限流&降級開關推送和WEB應急擴容方案
– 限流,Web層,防止被流量打垮。
– 降級,App層(服務化),保障核心應用。
– 選擇Docker 容器,批量生成效率高 – 啟動速度快。
– 資源利用率提升明顯。
【編輯推薦】
【責任編輯:
私語琴聲TEL:(010)68476606】