資料庫作為IT基礎核心軟體之一,存儲著企業生產經營的核心數據,各行各業的信息化發展對其依賴程度都很高。對於複雜的業務系統,一旦資料庫性能降低,會導致依賴於資料庫的應用系統運行緩慢,或者根本無法使用,最終引起企業的客戶流失和經營利潤的損失。
Oracle Database,簡稱Oracle,在資料庫領域一直處於領先地位。其系統可移植性好、使用方便、功能強,廣泛應用於各類大、中、小、微機環境。隨著企業應用系統規模的擴大,運維管理人員需要維護的資料庫數量不斷增加,在日常運維工作中面臨著眾多挑戰:
資料庫實例分散,指標查詢操作繁瑣,性能分析問題發現不及時;影響資料庫性能的因素較多,監控指標不完善,出現問題後,難以快速定位;對資料庫性能缺乏便捷的觀測手段,資料庫調優效率低;因資料庫告警日誌格式複雜,分析困難,無法快速分析故障詳情,系統穩定性難以保障;缺乏對資料庫審計日誌的利用,難以發現不合規的數據訪問行為,存在安全隱患。Oracle資料庫運維分析方案
可管控的Agent,多源數據實時採集
通過web頁面將Agent批量部署到Oracle主機上,可採集指定路徑的AWR報告數據和告警日誌。Agent代理實時監控Oracle的AWR報表狀態,一旦產生新的告警日誌文件,實時採集同步至AnyRobot平臺。AnyRobot內置了基於ODBC協議進行資料庫指標遠程採集的規則,通過這種方式可採集一些AWR報告中所不包含的指標,全面了解Oracle資料庫的系統狀態。異常事件行為分析,精準實時告警
對反映Oracle當前運行狀態的指標數據進行監控,如會話數、每秒處理的事務量、死鎖數、緩存命中率等;設置告警規則,當指標達到閾值時,AnyRobot立即產生告警記錄,及時通知運維人員。Oracle的用戶登錄行為和操作行為監控:在AnyRobot監測到不合理的登錄和操作行為時產生告警,如遠程登錄的主機名、IP位址不在合理範圍、手工登錄查詢敏感數據的數據表等,運維人員在接收到告警通知後,及時採取措施,避免安全風險隱患。優化分析資料庫性能,提升資源利用和業務響應速度
Oracle資料庫作為企業IT應用最為廣泛的核心技術,其性能瓶頸關係著企業核心數據資產的是否安全。通過以下AnyRobot平臺內的圖表分析展示,可以快速找到異常的SQL語句,分析造成性能瓶頸的原因,對資料庫性能進行調優,提升資源利用率,確保對業務運營的響應速度。
01
在AnyRobot平臺上設置對oracle性能指標的監控,運維人員可直接點擊告警記錄查看Oracle實例視圖中資料庫的大致情況,查找異常的資料庫實例。
02
運維管理人員可在Oracle負載儀錶盤中篩選該實例所在的主機IP以及Oracle實例ID,查看各性能指標詳細的變化趨勢,例如重做日誌量情況、SQL解析的相關指標等。
03
在「Oracle緩存命中率」視圖中可以查看緩存使用情況,在「Oracle內存使用情況」可以查看SGA各區域內存使用量的變化,判別是否存在潛在風險。
04
在「Oracle表空間「視圖中查看表空間的分布及使用情況,判斷資源使用的合理性。
05
在業務量沒有明顯增長的情況下,資料庫性能瓶頸有比較大的機率與資料庫存儲過程的修改有關。在Oracle SQL分析視圖中,可以查看到使用資源最高的SQL語句,例如哪些SQL語句使用資料庫時間、CPU時間佔比、IO時間佔比等資源最多。
資料庫告警日誌分析,快速定位分析故障根源
在「資料庫安全」分析視圖中,運維人員可以快速檢查資料庫安全狀況,包括資料庫實例安全、資料庫告警消息等。
對「資料庫告警定位」和「ORA錯誤碼分析」進一步分析,按錯誤碼、告警主機、告警實例,統計告警信息的產生次數、隨時間的分布等信息,深度探究告警原因。
資料庫告警定位
ORA錯誤碼分析
用戶行為分析
用戶行為分析,是資料庫安全審計的重要一環。可直接分析查看用戶的增刪改查等操作行為,分析用戶登錄、註銷、授權等帳戶管理行為,判別用戶行為是否合規,確保數據資產安全。
用戶登錄行為分析
用戶操作列表,可列出增刪改查等操作行為的詳細記錄。
用戶選擇行為詳細列表
提高Oracle資料庫運維分析效率
降低管理風險成本
提高性能瓶頸分析效率
AnyRobot實時監控分析資料庫性能問題,及時定位異常的Oracle實例,在詳細指標頁查看各個性能指標的變化趨勢和性能風險,快速分析性能瓶頸點,並進行優化。
規避安全風險
及時發現用戶的異常登錄行為、對敏感數據的查看行為、刪除數據表等危險操作行為;如果確認上述行為為非法入侵行為,及時通過修改密碼、調整安全策略的方式,確保數據資產安全。
降低故障發現時間
AnyRobot基於流處理引擎,在Oracle日誌實時採集分析過程中,實現故障告警秒級響應;支持郵件、HTTP、Syslog以及第三方系統等轉發方式,第一時間通知運維人員,有效減少故障發現時間。