詳解十三款運維監控工具

2021-01-12 精通全棧linux小運維

縱觀我們部署在基礎設施當中並始終保持運作的全部測量機制,監控系統無疑是重要性最高的機制之一,但它卻常常遭到我們的忽視。如果能夠建立起一套堅實的監控系統來針對可能發生的災難加以警示,我們就有機會迅速啟動災難響應方案或者著手排除複雜的性能故障,這對於任何規模的企業而言都極具巨大的實際價值。

有效的運行監測體系,最終離不開相關技術平臺的支撐,而我們需要了解監測技術平臺

詳解十三款運維監控工具一、開源工具介紹ZabbixNagiosGangliaGrafanaZenossOpen-falconCacti天兔開源監控(只適用於mysql、redis、oracle)二、商用運維監控系統篇若有補充請email: cyh@abcdocker.com or右擊掃碼加群@管理員監控寶聽雲360網站服務監控阿里雲監控百度雲觀測

一、開源工具介紹

Zabbix

官方網站:https://www.zabbix.com/

推薦星級:★★★★★Zabbix是一個基於WEB界面的提供分布式系統監控以及網絡監控功能的企業級開源運維平臺,也是目前國內網際網路用戶中使用最廣的監控軟體,雲智慧遇到的85%以上用戶在使用Zabbix做監控解決方案。

入門容易、上手簡單、功能強大並且開源免費是雲智慧對Zabbix的最直觀評價。Zabbix易於管理和配置,能生成比較漂亮的數據圖,其自動發 現功能大大減輕日常管理的工作量,豐富的數據採集方式和API接口可以讓用戶靈活進行數據採集,而分布式系統架構可以支持監控更多的設備。理論上,通過 Zabbix提供的插件式架構,可以滿足企業的任何需求。

可以直接查看我們zabbix相關板塊:https://www.abcdocker.com/abcdocker/category/zabbix/

用戶群:90%以上中小型的泛網際網路企業

優點:

1. 支持多平臺的企業級分布式開源監控軟體2. 安裝部署簡單,多種數據採集插件靈活集成3. 功能強大,可實現複雜多條件告警,4. 自帶畫圖功能,得到的數據可以繪成圖形5. 提供多種API接口,支持調用腳本6. 出現問題時可自動遠程執行命令(需對agent設置執行權限)

缺點:

1. 項目批量修改不方便2. 入門容易,能實現基礎的監控,但是深層次需求需要非常熟悉Zabbix並進行大量的二次定製開發,難度較大;3. 系統級別報警設置相對比較多,如果不篩選的話報警郵件會很多;並且自定義的項目報警需要自己設置,過程比較繁瑣(但是網上的模板比較,也可以使用模板導入的方法);4. 缺少數據匯總功能,如無法查看一組伺服器平均值,需進行二次開發;5. 數據報表需要特殊二次開發定義;

Nagios

官方網站:https://www.nagios.org/

推薦星級:★★★★☆

Nagios

是一款開源的企業級監控系統,能夠實現對系統CPU、磁碟、網絡等方面參數的基本系統監控,以及 SMTP,POP3,HTTP,NNTP等各種基本的服務類型。另外通過安裝插件和編寫監控腳本,用戶可以實現應用監控,並針對大量的監控主機和多個對象 部署層次化監控架構。

Nagios最大的特點是其強大的管理中心,儘管其功能是監控服務和主機的,但Nagios自身並不包括這部分功能代碼,所有的監控、告警功能都是由相關插件完成的。

用戶群:適合複雜IT環境的企業

優點:

1. 出錯的伺服器、應用和設備會自動重啟,自動日誌滾動2. 配置靈活,可以自定義shell腳本,通過分布式監控模式3. 支持以冗餘方式進行主機監控,報警設置多樣4. 命令重新加載配置文件無需打擾Nagios的運行

缺點:

1. 事件控制臺功能很弱,插件易用性差2. 對性能、流量等指標的處理不給力3. 看不到歷史數據,只能看到報警事件,很難追查故障原因4. 配置複雜,初學者投入的時間、精力和成本比較大

Ganglia

官方網站:http://ganglia.info/

推薦星級:★★★★☆

Ganglia是加州大學伯克利分校發起的一個開源集群監控項目,設計之初是用於監控數以千計的網絡節點。Ganglia是一個跨平臺可擴展的,高性能計算系統下的分布式監控系統。它已被廣泛移植到各種作業系統和處理器架構上。

用戶群:適用於大型伺服器集群用戶。

優點:

1. 適合監控系統性能,通過曲線很容易見到每個節點的工作狀態2. 可以自定義監控項,監控展示有表格和圖像兩種,支持手機版3. 部署方便,通過不同的分層管理上萬臺機器,無需逐個添加配置

缺點:

1. 沒有內置的消息通知系統2. 沒有報警機制,出現問題不能夠及時報警

Grafana

推薦星級:★★☆☆☆官方網站:http://grafana.org/

Grafana可以用在任何需要數據可視化的地方,如果有一天老闆需要你做一份漂亮的業務數據圖表,你無需頭疼用什麼繪圖庫去開發,你要做的僅僅是將業務數據稍作加工存入Grafana支持的DataSource,點幾下滑鼠即可配製出一份完美的數據圖表。

因為這款工具除了繪圖比較好看,其他的功能不如我們的zabbix。我們這裡就簡單的說一下,以後會有相關文檔,請繼續關注abcdocker!

Zenoss

推薦星級:★★★★☆

Zenoss Core是Zenoss的開源版本,其商用版本為ZenossEnterprise。作為企業級智能監控軟體,Zenoss Core允許IT管理員依靠單一的WEB控制臺來監控網絡架構的狀態和健康度。Zenoss Core的強大能力來自於深入的列表與配置管理資料庫,以發現和管理公司IT環境的各類資產。Zenoss同時提供與CMDB關聯的事件和錯誤管理系統, 以協助提高各類事件和提醒的管理效率。

優點:

1. Zenoss比較出色的地方在於它的Dashboard,可以配置很多portlet2. 每個用戶的界面都是分開管理的,自定義dashboard不會影響其他用戶3. 強大監控功能支持伺服器、路由交換、防火牆、存儲、資料庫、中間件監控4. 採用基於HBASE的opentsdb存儲任意時間段的數據5. 將狀態監控,性能監控,資源管理,良好的報告機制進行有機的整合

缺點:

1. 對資源要求較高,即使只管理少數幾臺設備,也需要消耗大量硬體及內存等附加資源。2. 針對windows系統,開源版只提供SNMP,通過WMI檢測CPU,Disk,軟硬體和性能只在收費版提供。

Open-falcon

推薦星級:★★★☆☆

Open-falcon是小米運維團隊從網際網路公司的需求出發,根據多年的運維經驗,結合SRE、SA、DEVS的使用經驗和反饋,開發的一套面向網際網路的企業級開源監控產品。

Open-falcon架構

用戶群:目前有幾十家企業用戶不同程度使用。

優點:

1. 自動發現,支持falcon-agent、snmp、支持用戶主動push、用戶自定義插件支持2. 支持每個周期上億次的數據採集、告警判定、歷史數據存儲和查詢3. 高效的portal、支持策略模板、模板繼承和覆蓋、多種告警方式、支持callback調用4. 單機支撐200萬metric的上報、歸檔、存儲5. 採用rrdtool的數據歸檔策略,秒級返回上百個metric一年的歷史數據6. 多維度的數據展示,用戶自定義Screen7. 通過各種插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交換機監控。

缺點:由於發布時間較短,很多基礎的服務監控插件(如Tomcat、apache等)還不支持,很多功能還在不斷完善中,另外由於缺少專門的支持,雖然有開放社區,但是解決問題的效率相對較低。

Cacti

推薦星級:★★★☆☆

官方網站:http://www.cacti.net

提示:近幾年cacti和nagios已經基本被zabbix代替

Cacti 在英文中的意思是仙人掌的意思,Cacti是一套基於PHP、MySQL、SNMP及RRDTool開發的網絡流量監測圖形分析工具。它通過snmpget來獲取數據,使用 RRDtool繪畫圖形,它的界面非常漂亮,能讓你根本無需明白rrdtool的參數能輕易的繪出漂亮的圖形。而且你完全可以不需要了解RRDtool複雜的參數。它提供了非常強大的數據和用戶管理功能,可以指定每一個用戶能查看樹狀結 構、host以及任何一張圖,還可以與LDAP結合進行用戶驗證,同時也能自己增加模板,讓你添加自己的snmp_query和script!功能非常強大完善,界面友好。可以說,Cacti將rrdtool的所有「缺點」都補足了!下圖是Cacti運行的主界面,

Cacti 工作流程

步驟一,snmp協議收集遠程伺服器的數據步驟二,將snmp收集的數據內容保存到rrd資料庫中 步驟三,若用戶查看某臺設備上的流量或其它狀態信息 步驟四,在mysql資料庫中查找該設備對應的rra資料庫文件的名稱 步驟五,通過rrdtool命令進行繪圖即可

提示:cacti的圖確實不好找,只能官網截一個

還有很多不出門的監控工具,這裡就不在介紹了。

天兔開源監控(只適用於mysql、redis、oracle)

推薦星級:★★☆☆☆

官方網站:http://www.lepus.cc/

簡潔、直觀、強大的開源資料庫監控系統,MySQL/Oracle/MongoDB/Redis一站式性能監控,讓資料庫監控更簡單

優點:中文開源軟體,裡面監控mysql和redis可以精確到sql語句缺點: 因為只有監控資料庫和非關係資料庫,監控項不能統一,不能結合其他監控平臺

二、商用運維監控系統篇

監控寶

推薦星級:★★★★★官方網站:http://www.jiankongbao.com

監控寶是雲智慧為用戶提供IT性能監控(IT Performance Monitoring)的SaaS產品,包含網站監控、伺服器監控、中間件監控、資料庫監控、應用監控、API監控和頁面性能監控等功能。包含免費版、暢 享版和企業版,目前用戶約40萬,監控寶app也是國內唯一提供移動監控服務的產品。

我個人網站也在使用

免費的監控有限,但是報警確實不錯

報警也是相當快的,有簡訊有郵件

優點:

作為國內最早提供基於SaaS服務的網絡監控平臺,監控寶不但為初級用戶提供免費的標準服務,企業用戶還可以按需購買所需的監控、告警資源,最大限度的節省企業運維成本;

監控寶通過遍布全球的300多個分布式監測節點,對網絡進行穩定性和可用性的主動監控和實時分析,支持http(https)、ftp、ping、udp、tcp、smtp、traceroute等多種協議,測量CDN效果及DNS狀態,全網全地域性能趨勢分析。

優點太多了,反正花錢的就是好的

缺點:除了花錢,沒有不好的地方

聽雲

推薦星級:★★★★★官方網站:http://www.tingyun.com

聽雲是幫助客戶實時監控定位從崩潰報錯、慢交互到網絡環境出錯等多維度複雜的性能問題。聽雲致力於用戶視角的IT管理創新服務,為不同行業提供最終用戶端到端的完整應用鏈的性能管理解決方案,幫助客戶不斷優化系統性能及用戶體驗,提高用戶滿意度和企業競爭力。

360網站服務監控

推薦星級:★★☆☆☆

360網站服務監控是一款面向廣大站長的網站監控產品,提供免費的網站、伺服器監控。http://jk.cloud.360.cn/

用戶群:個人站長

優點:服務免費,支持網站HTTP監控、PING監控、域名DNS監控和伺服器監控 提供網站訪問全景數據和簡單配置信息

缺點:只支持簡單的網站和伺服器監控,歷史數據保留15天,且免費監控點數量僅為四個 最後一次產品更新是2014年9月,目前已停止更新和運營支持 價格也不是很便宜

阿里雲監控

官方網站:https://aliyun.com推薦星級:★★★★☆

阿里雲監控是一款免費網站監控產品,可監控站點和伺服器,並提供多種告警方式:簡訊,旺旺,郵件。

用戶群:阿里雲用戶

優點:

與阿里雲服務捆綁緊密,允許用戶自定義數據監控阿里雲多IDC間內網數據傳輸,不佔用客戶公網資源支持對業務數據的通用統計,從各個角度反應服務的運行情況

缺點:

所有服務基於阿里雲,功能單一,擴展性差功能不夠強大,只能滿足基礎監控需求

百度雲觀測

推薦星級:★★☆☆☆官方網站:http://ce.baidu.com/

百度雲觀測是百度推出的一款雲服務產品,類似於360雲監控、阿里雲監控,主要是為站長提供免費的一站式網站監測、預警服務,功能覆蓋網站運行狀況、安全和訪問速度等多個方面。

用戶群:個人站長

優點:對於用戶每日訪問的站點進行安全檢測 國內各大城市雲節點覆蓋,支持CDN、DNS狀態和主機監控

缺點:

需要進行網站認證監控點少,功能簡單,只能監測網站狀態,不支持伺服器、應用監控。

http://www.drscrewdriver.com/349.html

相關焦點

  • 雲運維的核心是什麼?
    傳統層面的運維,接觸的都是硬體,如伺服器、設備和風火水電,但是在雲時代,運維人員已經無法見到物理的任何設備,運維人員不再需要被束縛於物理硬體的穩定和可靠性,雲運維的核心變成了對應用的監控和管理。 如何在雲平臺上實現應用的快速部署,快速更新,實時監控?
  • 智和網管平臺政企信創網管監控運維可視化方案
    隨著網絡規模的不斷擴大,碎片化程度越來越高,沒有有效的工具協助信息中心管理IT網絡,就需要不斷投入更多的運維人力應對新型網絡基礎設施、數據智能基礎設施、智慧應用基礎設施、可信安全基礎設施大幅激增的管理難題。
  • 機房監控子系統是怎樣運維操作呢?
    大榕樹多機房集中管理系統是隨信息化建設應運而生的,它是集機房動力、環境、安防以及伺服器、網絡設備等,專為現代計算機、網絡通信機房及無人值守變電站而設計的多機房、集中管理的多功能遠程集中管理系統,其監控對象構成機房的各個子監控模塊:動力監控、環境監控、安防監控、IT監控等,主要監控對象包括:供配電
  • 一文詳解 Ansible 的自動化運維
    一、Ansible 概述Ansible 是近年來越來越火的一款開源運維自動化工具,通過Ansible可以實現運維自動化,提高運維工程師的工作效率,減少人為失誤。Ansible 通過本身集成的非常豐富的模塊可以實現各種管理任務,其自帶模塊超過上千個。
  • 監控攝像頭安裝詳解 監控攝像頭推薦
    監控攝像頭是一種半導體成像器件,具有靈敏度高、抗強光、畸變小、體積小、壽命長、抗震動等優點。監控攝像機安全防範系統中,圖像的生成當前主要是來自CCD攝像機,也可將存儲的電荷取出使電壓發生變化,具有抗震動和撞擊之特性而被廣泛應用。
  • 8款伺服器和應用性能監控工具
    這些方法都不是錯誤的,找到適合你需求的正確伺服器監控是網絡優化的重要組成部分。伺服器性能監控沒有「一刀切」的解決方案,以下我們將介紹從開源解決方案到企業級付費實施10大解決方案。每個都有自己的優點和缺點,目的幫助你找到適合網絡的正確工具。如何選擇伺服器監控工具?
  • 華雲大咖說 雲計算雲運維淺談
    隨著企業上雲成為共識,企業在享用雲計算帶來快捷服務的同時也要面對傳統運維帶來的挑戰,那麼如何對雲服務進行規劃與設計?如何讓運維體系更加適應雲的變化?如何快速部署、監控雲資源?本期華雲大咖說,華雲數據資深售前方案顧問李志明基於多年的雲建設雲運維管理經驗,為大家分享了雲運維管理解決方案,從管理架構、人員、流程及技術角度出發,幫助企業更敏捷、更自動化、更高效地實現持續交付,加速智能運維的轉型。
  • Linux性能監控工具集之vmstat命令:監控內存和CPU
    Linux性能監控工具主要包含以下4中:top命令,vmstat命令,iostat命令,pidstat工具。在上一篇文章Linux性能監控工具集top命令:顯示系統整體資源使用情況中我們介紹了top命令的使用方式和作用,這裡我們繼續介紹vmstat命令。vmstat命令是Linux下一款功能比較齊全的監測工具。
  • 攝像頭監控軟體哪一款比較好 攝像頭監控軟體推薦
    隨著人們的安全意識增強,更多人會在家安裝攝像頭監控,以便隨時查看家中情況。那麼,大家可知,攝像頭監控軟體哪一款比較好呢?下面就為大家推薦幾款不錯的攝像頭監控軟體,以供參考!攝像頭監控軟體哪一款比較好攝像頭監控軟體推薦1:智能雲監控電腦版等級:v1.3.1.4官方版2018-08-304.8M簡體推薦理由:智能雲是一款高性能的遠程監控管理軟體
  • 博銳尚格物業集中監控解決方案
    要點二:三大中心統籌監控基於BIM的運行響應中心設置設備、安全和品質三大監控方向,統籌整個J集團運維管理的應急性工作,優化能源、空間管理運營模式,提升安保、工程、客服和保潔四大部門的運維流程,打破了孤島效應。
  • 企業電腦屏幕實時監控軟體哪個好用
    企業電腦屏幕實時監控軟體哪個好用呢?安在軟體的Ping32和溢信科技的IP-guard都不錯,在行為審計和桌面管理方面無論是創新力和功能穩定性在同行業內都是比較靠前的,兩者都可以選擇,如何選擇一款好用的實時監控軟體,我覺得可以考慮以下幾點:
  • i春秋&老男孩聯合線上開班:0基礎學Linux安全運維
    而且這個Linux安全運維課程是線上培訓,隨到隨學,非常適合你這樣的新手小白。快速諮詢通道↓↓↓本期課程是i春秋與老男孩教育首次合作,引入具有多年Linux運維教學經驗的老男孩經典Linux雲計算運維課程,為0基礎學員提供優質、豐富的Linux運維課程,運維知識是學習Web安全技能的基石,給Web
  • 鯨自動化運維項目_雲計算運維自動化ansiblepuppet等 運維自動化...
    Opsmanage介紹OpsManage 是一款進行設備資產、代碼部署、應用部署、計劃任務的管理平臺,結合ansible進行自動化運維,可以在很大程度上解放運維工程師的雙手。類似的運維平臺還有騰訊的藍鯨運維管理平臺。
  • 今天聊聊系統監控的那些事
    手機APP監控伺服器基礎資源,監控應用系統,隨時查看生產環境追蹤問題。所以監控是一個業務系統的重中之重。今天就跟大家聊一聊監控的這些事。怎麼去加強監控,從哪些方面入手呢?監控第一階段監控的第一階段即人工監控,如何操作的呢?首先需要運維人員定時登錄伺服器,檢查伺服器各項資源是否正常,檢查應用有沒有正常運行,有沒有出現宕機的情況。然後打開本地或遠程其他地區的計算機,最後打開應用的網頁或客戶端,看是否能夠正常打開,是否能夠正常登陸等等。
  • 力控智慧管廊一體化運維平臺,守護城市運行「生命線」
    摘要力控科技智慧管廊解決方案是利用先進的傳感器、物聯網、大數據、雲計算、GIS(+BIM)等技術,構建可視化、數位化、智能化綜合管廊管控平臺,實現管廊和管線的自動感知、實時監控、智能報警、在線運維、應急處理等,提高綜合管廊的安全管理水平,減少各類事故的發生,推動城市向「新型智慧城市
  • 9個最佳SSD狀態監控及性能優化工具
    SSD測試工具在監控固態硬碟的運行狀況和性能方面發揮著重要作用,使用這些工具可以幫助你做很多應對措施,來最大限度地減少性能下降。最有效的此類軟體通常是SSD製造商自己提供的免費工具:三星、英特爾和東芝的OCZ等,都會為其SSD產品提供有效的工具。此外,還有其他一些SSD測試工具可與任何製造商的SSD一起使用。本文將就這兩種類型,為大家介紹9款高效軟體。
  • 如何深入監控華為網絡設備運行狀態
    華為公司作為中國最大的網絡設備製造商,旗下的網絡設備產品線齊全,產品類型多,包括交換機、路由器、無線設備、防火牆、安全產品等,現在國內單位使用華為的網絡產品非常多,包括政府、教育、交通、醫療、企業等各行各業,網絡是業務系統的橋梁,其重要性不言而喻,對網絡設備進行有效的實時監控預警,是非常必要的
  • 數碼乾貨:家庭監控攝像頭如何選?
    我們有個誤區,當聽到監控安防就覺得比較貴並且還麻煩,需要網絡布線,又要買監控主機。誠然有些商戶這樣設置監控安防網絡很有必要。但我們日常家庭使用這套商用監控方案又未免有點殺雞焉用牛刀的感覺,那接下來小編給大家說一說怎樣挑選適合家庭使用的網絡攝像頭?希望對您有幫助。
  • 你與運營大神之間,只差這14款運營工具
    下面就推薦一款能提高運營人員撰寫、共享和校對運營文案的文檔協作工具。,可以幫助運營人員實時監控各種運營數據。這時,一款能讓設計小白也能輕鬆製作精美圖片的工具應該能俘獲眾多運營人員的心。這裡給大家推薦一款比較好用的H5製作工具:秀堂。通過H5邀請函進行活動曝光、報名統計等已成為如今活動運營中最常見的傳播方式。秀堂是一款簡單易用的H5製作工具。運營人員在秀堂上能像製作PPT一樣輕鬆製作H5。使用秀堂,只需通過簡單的圖文替換,即可生成集排版、動畫、音樂和特效於一體的H5,還能直接導出活動報名人的聯繫方式。秀堂目前有數百款活動邀請函模板,涵蓋了20多個行業及數十種場景。
  • 2017年5個最佳網絡監控工具 你知道哪些
    但與其他任何技術一樣,網絡很容易面臨中斷和其他挑戰,而這些網絡問題可能對企業帶來極大不便,這就是為什麼需要網絡監控工具的原因。網絡監控工具可幫助企業監控網絡,當問題發生時以不同方式發送警報。Pulseway  易於使用的網絡監控解決方案  平臺: 桌面、行動裝置| 特點: 實時通知 | 儀錶板: Yes | 免費試用: 是  Pulseway是一個易於使用的工具,它允許你通過智慧型手機、平板電腦或者將數據實時監控、管理和控制所有