python爬蟲學習:可視化監控你的爬蟲

2021-12-25 python教程
點擊藍字python教程」關注我們喲!

相信大家在跑爬蟲的過程中,也會好奇自己養的爬蟲一分鐘可以爬多少頁面,多大的數據量,當然查詢的方式多種多樣。今天我來講一種可視化的方法。

1.成品圖 

這個是監控伺服器網速的最後成果,顯示的是下載與上傳的網速,單位為M。爬蟲的原理都是一樣的,只不過將數據存到InfluxDB的方式不一樣而已, 如下圖。

可以實現對爬蟲數量,增量,大小,大小增量的實時監控。

 

2. 環境

InfluxDb,是目前比較流行的時間序列資料庫;

Grafana,一個可視化面板(Dashboard),有著非常漂亮的圖表和布局展示,功能齊全的度量儀錶盤和圖形編輯器,支持Graphite、zabbix、InfluxDB、Prometheus和OpenTSDB作為數據源

Ubuntu

influxdb(pip install influxdb)

Python 2.7

 

3. 原理

獲取要展示的數據,包含當前的時間數據,存到InfluxDb裡面,然後再到Grafana裡面進行相應的配置即可展示;

4. 安裝    4.1 Grafana安裝

     

安裝好以後,打開本地的3000埠,即可進入管理界面,用戶名與密碼都是admin。

     4.2 InfulxDb安裝

這個安裝就網上自己找吧,有很多的配置我都沒有配置,就不在這裡誤人子弟了。

5. InfluxDb簡單操作

碰到了資料庫,肯定要把增刪改查學會了啊, 和sql幾乎一樣,只有一絲絲的區別,具體操作,大家可以參考官方的文檔。

influx 進入命令行

CREATE DATABASE test 創建資料庫

show databases 查看資料庫

use test 使用資料庫

show series 看表

select * from table_test 選擇數據

DROP MEASUREMENT table_test 刪表

6. 存數據

InfluxDb資料庫的數據有一定的格式,因為我都是利用python庫進行相關操作,所以下面將在python中的格式展示一下:

其中:

measurement, 表名

time,時間

tags,標籤

fields,欄位

可以看到,就是個列表裡面,嵌套了一個字典。其中,對於時間欄位,有特殊要求,可以參考這裡, 下面是python實現方法:

所以,到這裡,如何將爬蟲的相關屬性存進去呢?以MongoDB為例

那麼現在我們已經往數據裡存了數據了,那麼接下來要做的就是把存的數據展示出來。

7.展示數據7.1 配置數據源

以admin登錄到Grafana的後臺後,我們首先需要配置一下數據源。點擊左邊欄的最下面的按鈕,然後點擊DATA SOURCES,這樣就可以進入下面的頁面:

點擊ADD DATA SOURCE,進行配置即可,如下圖:

其中,name自行設定;Type 選擇InfluxDB;url為默認的http://localhost:8086, 其他的因為我前面沒有進行配置,所以默認的即可。然後在InfluxDB Details裡的填入Database名,最後點擊測試,如果沒有報錯的話,則可以進入下一步的展示數據了;

7.2 展示數據

點擊左邊欄的+號,然後點擊GRAPH

接著點擊下圖中的edit進入編輯頁面:

從上圖中可以發現:

7.2.1 配置數據

在Data Source中選擇剛剛在配置數據源的時候配置的NAME欄位,而不是database名。

接著在下面選擇要展示的數據。看著就很熟悉是不是,完全是sql語句的可視化。同時,當我們的數據放到相關的欄位上的時候,雙擊,就會把可以選擇的項展示出來了,我們要做的就是直接選擇即可;

設置右上角的時間,則可以讓數據實時進行更新與展示

因為下面的配置實質就是sql查詢語句,所以大家按照自己的需求,進行選擇配置即可,當配置完以後,就可以在中間的面板裡面看到數據了。

 

對Python開發技術感興趣的同學,歡迎加下方的交流群一起學習,相互討論。

python交流學習扣扣群:934109170,多多交流問題,互幫互助,群裡有不錯的學習教程和開發工具。學習python有任何問題(學習方法,學習效率,如何就業),可以隨時來諮詢我

好啦!文章就給看官們分享到這兒

最後,如果覺得有幫助,記得關注、轉發、收藏喲


相關焦點

  • Python爬蟲之selenium可視化爬蟲!最詳細的教程!
    之所以把selenium爬蟲稱之為可視化爬蟲主要是相較於前面所提到的幾種網頁解析的爬蟲方式
  • Python開發簡單爬蟲【學習資料總結】
    一、簡單爬蟲架構簡單爬蟲架構運行流程
  • python爬蟲——寫出最簡單的網頁爬蟲
    我們可以通過python 來實現這樣一個簡單的爬蟲功能,把我們想要的代碼爬取到本地。下面就看看如何使用python來實現這樣一個功能。筆者使用的工具是sublimetext3,它的短小精悍(可能男人們都不喜歡這個詞)使我十分著迷。推薦大家使用,當然如果你的電腦配置不錯,pycharm可能更加適合你。
  • Python網絡爬蟲學習資源整理
    通過在各大Python學習群和論壇的學習,我發現學習Python的人大部分都對網絡爬蟲很感興趣。下面給各位介紹下Python的學習流程,並且會給出對應的學習教程。第一步——學習Python不管你有沒有程式語言基礎,也不管你其他語言是多厲害的大神,學習爬蟲,還是要了解一下Python滴。
  • Python爬蟲的兩套解析方法和四種爬蟲實現
    對於大多數朋友而言,爬蟲絕對是學習python的最好的起手和入門方式。
  • 1小時入門 Python 爬蟲
    從而爬蟲工程師、數據分析師、大數據工程師的崗位也越來越受歡迎。爬蟲則是 Python 的一個應用領域,Python 還有諸多應用領域,如 Web 全棧開發、圖形界面開發、大數據、人工智慧、系統網絡運維、雲計算系統管理……學習好 Python 基礎對於學習 Python 爬蟲具有事半功倍的效果。
  • Python學習之路----爬蟲
    爬蟲的學習是超級有趣的啦,可以爬一些闊闊愛愛的小姐姐的照片(tips:得看看網站爬蟲協議喲~)~如有問題請大佬多多指教,筆芯芯♥~
  • python爬蟲入門:什麼是爬蟲,怎麼玩爬蟲?
    兩隻爬蟲兩隻爬蟲跑得快跑得快一隻沒有..不好意思跑題了...別誤會,今天不是要教你怎麼玩上面這兩隻沙雕玩意。今天,我們正式從0到1輕鬆學會 python 爬蟲接下來...將是學習Python的正確姿勢!
  • python教程網絡爬蟲 數據分析師視頻
    我買了這套課程,如果你也有需要,歡迎聯繫我,一起學習一起進步。C#教程視頻零基礎入門到精通全套自學編程設計項目實戰串口上位機2020廖雪峰python教程網絡爬蟲 數據分析師視頻 數據挖掘商業爬蟲室內水電圖紙講解專業課程 cad系統識圖工家裝弱電路施工視頻教程3D遊戲編程完整全套零基礎入門自學unity 3D視頻教程源碼項目實戰PyQt5視頻教程全套源碼實戰項目python GUI開發
  • Python使用requests+re簡單入門爬蟲
    作者:sergiojune個人公眾號:日常學python專注python爬蟲,數據可視化,數據分析,python前端技術
  • Python 爬蟲入門
    從而爬蟲工程師、數據分析師、大數據工程師的崗位也越來越受歡迎。爬蟲是 Python 應用的領域之一。有 Python 基礎對於學習 Python 爬蟲具有事半功倍的效果。就像學英語一樣,一個對英語一概不通的人聽完別人讀英語,自己也能讀出來,但要把英語讀好,學好音標非常有必要。
  • 推薦一條高效的Python爬蟲學習路徑!
    那些所有你認為必須的前置知識,都是可以在完成目標的過程中學到的。這裡給你一條平滑的、零基礎快速入門的學習路徑。1.學習Python包並實現基本的爬蟲過程2.掌握各種技巧,應對特殊網站的反爬措施3.學習scrapy,搭建工程化爬蟲4.學習資料庫知識,應對大規模數據存儲與提取5.分布式爬蟲,實現大規模並發採集
  • Python爬蟲——培訓
    Python這門程式語言包羅萬象,可以說掌握了python,除了一些特殊環境和高度的性能要求,Python 越來越適合於做科學計算。網絡爬蟲(又被稱為網頁蜘蛛,網絡機器人,在 FOAF 社區中間,更經常的稱為網頁追逐者),是一種按照一定的規則,自動的抓取全球資訊網信息的程序或者腳本。
  • 精通 Python 網絡爬蟲:網絡爬蟲學習路線
    隨著大數據時代的到來,人們對數據資源的需求越來越多,而爬蟲是一種很好的自動採集數據的手段。那麼,如何才能精通Python網絡爬蟲呢?學習Python網絡爬蟲的路線應該如何進行呢?在此為大家具體進行介紹。
  • Python爬蟲之urllib庫—爬蟲的第一步
    帶著這個問題我也就開始了urllib庫的學習。首先不得不提一下爬取數據的過程,弄清楚這到底是怎樣一個過程,學習urllib的時候會更方便理解。  其實,爬蟲的過程和瀏覽器瀏覽網頁的過程是一樣的。道理大家應該都明白,就是當我們在鍵盤上輸入網址點擊搜索之後,通過網絡首先會經過DNS伺服器,分析網址的域名,找到了真正的伺服器。
  • Python爬蟲學習教程 bilibili網站視頻爬取!【附源碼】
    Python爬蟲學習教程,萬物皆可爬!每個技術大牛都是從基礎慢慢的提升上去的,基礎知識越深以後的發展越牛!
  • 實戰|手把手教你用Python爬蟲(附詳細源碼)
    大家好,我是J哥,專注原創,致力於用淺顯易懂的語言分享爬蟲、數據分析及可視化等乾貨
  • 【Python爬蟲】Urllib的使用(2)
    寫在前面這是第二篇介紹爬蟲基礎知識的文章,之前的文章【Python爬蟲】初識爬蟲(1)主要是讓大家了解爬蟲和爬蟲需要的基礎知識
  • 通過python非常簡單的實現一個功能強大的爬蟲
    這是一篇寫給想學習python,而又下不了決心的零基礎的小白們的。如果你是業內人士,或者你是python大牛,那麼看到這篇文章請一笑而過!
  • 精通Python網絡爬蟲(0):網絡爬蟲學習路線
    那麼,如何才能精通Python網絡爬蟲呢?學習Python網絡爬蟲的路線應該如何進行呢?在此為大家具體進行介紹。1、選擇一款合適的程式語言事實上,Python、PHP、JAVA等常見的語言都可以用於編寫網絡爬蟲,你首先需要選擇一款合適的程式語言,這些程式語言各有優勢,可以根據習慣進行選擇。