模擬人的操作讓計算機自動瀏覽網頁內容(適用範圍你懂得)

2021-01-07 python高手養成

今天,我們實現一個有意思的話題,就是讓計算機間隔一段隨機時間(為什麼是隨機時間呢?自己思考),自動打開並瀏覽一個網頁(當然了,這個網頁可以是文章、也可以是視頻網站了,自己發散思維)。這個自動化的過程適用範圍也很廣哦,大家自己思考……

這是一個自動化工程

下面開始我們今天的內容吧,我準備分下面幾步實現。

【材料準備】

當然了,說到Python自動化的課題,我們不得不討論一個神級庫,那就是Selenium,這個庫是為Python提供了一個調用接口,當然,它還為其它程式語言也提供了相應的接口,不要指責它的花心,這不影響我們使用Python調用它。使用之前,我們先要安裝這個神級庫,安裝方法當然是這樣了:pip install selenium。但是,今天我是用的是Pycharm,在Pycharm上如何安裝Selenium呢?安裝方法如下圖所示。

Pycharm下安裝Selenium

安裝完成Selenium之後,只是萬裡長徵走完了第一步。更複雜的是環境配置,對於瀏覽網頁的自動化測試案例,我們的環境當然是瀏覽器咯。今天,我們使用IE這個老牌瀏覽器。配置方法如下圖所示。當然,在配置之前,我們必須在本地環境安裝好IEDriver,這個東西類似我們電腦中的驅動程序。比如,Python要調用IE瀏覽器,IE瀏覽器是不認識它的,我們通過一個IEDriver來和Python溝通,不知道我的解釋對不對,大神勿噴!IEDriver的安裝和IE瀏覽器的具體配置過程,請大家自行搜索,網上已經爛大街了,在這裡不做贅述。環境配置好後,我們接下來繼續。

首先配置好我們的環境

【分析原理】

我們通過Selenium庫打開一個網頁,如何隨機的時間段內進行操作,比如瀏覽一個網頁,如何獲取一個隨機時間呢?對了,聰明的童鞋已經猜到了,通過random.randint(min, max),讓計算機在這個時間段內生成一個隨機整數,然後呢,我們讓程序休眠這樣一段時間,time.sleep(random.randint(min, max))。之後,我們再打開一個網頁,這樣,是不是就瀏覽時沒有規律可循呢?這樣,聰明的電腦也就不可能判斷出來我們是人在瀏覽還是電腦在瀏覽了……到這裡,你可以仔細想一想它的用處了。至於使用Selenium瀏覽網頁的方法,我就不多說了,大家肯定知道咯……接下來,我們呢進行編碼。我們以某一個新聞網頁為例,打開網頁後,獲取該新聞網頁的某一欄目下的內容,然後逐個隨機打開這些新聞頁面,每個頁面瀏覽隨機時間,模擬滑鼠滾動操作。這個也可以是隨機的。最後關閉頁面即可。

還可以模擬讓滑鼠自己動

【編碼實現】

具體內容如下圖所示。

定義兩個比較重要的函數

然後創建一個Webdriver類傳入定義好的函數,即可使程序有效。

最終調用主函數實現模擬人操作的功能

原始碼展示完畢。

【總結提高】

此處效果省略

至於程序效果,我這裡就不再浪費篇幅展示了,大家可以自行測試下,程序當然也存在一些問題。比如:

沒有演示登錄過程,現在大多是網站是需要登錄的。程序只是對某一項目內容進行了隨機瀏覽,沒有對其他可以閱讀的項目瀏覽,容易被認為是電腦在瀏覽。可不可以更加智能化一點呢?操作滾動條的內容過於簡單,沒有結合頁面實際內容進行,部分頁面可能會出錯。歡迎大家留言討論,可以有很多擴展思路,自動化可以節省不少人力,比如模擬人登錄某個網站自己進行學習,由於調用本地驅動打開瀏覽器,因此,伺服器是很難判斷這個操作是否是認為操作。這樣,豈不是節省的我們的時間?對於大多數網絡課程的學習,都是可以使用這種辦法模擬登錄進行學習的,我們只需要開著電腦,讓電腦自己學習就可以了……

轉載請註明出處(百家號:Python高手養成)

相關焦點

  • 分享下自動從Excel填寫網頁表單的方法,教你實現批量自動註冊
    現在大多數朋友都有要在某個網頁進行註冊或者填寫網頁表單的場景吧,比如經常從Excel表格裡提取原始數據,再填寫到網頁中,這種操作每天重複的話,肯定是很繁瑣的。大家不妨藉助《阿衝全能點擊王》軟體來自動化填寫網頁表單、批量自動操作,能讓你輕鬆享受腳本自動化的便利。
  • 手把手教你一鍵快速提交,自動填寫網頁表單內容
    現在很多朋友都有經常要在網上一些表單進行填寫,大量內容的手工輸入,肯定是很慢很繁瑣的。這時不妨通過一款高效靈活的腳本工具「阿衝全能點擊王」軟體來替代,它能幫你一鍵快速提交,自動填寫網頁表單內容,批量填寫錄入都不在話下。
  • 手把手教你自動複製粘貼,Excel表格網頁自動輸入,網頁自動點擊
    這時有沒一種簡便、高效的工具軟體可以替代呢,當然是有的,推薦大家去試下「阿衝全能點擊王」這款軟體,它是專門為各種辦公重複操作而生,支持滑鼠自動點擊,鍵盤自動按鍵,自動數據錄入,自動複製粘貼等等很多功能任務。使用阿衝全能點擊王,就好像是一個智慧機器人一樣,你在它裡面設置好一次要重複的動作,它就能自動化幫你循環執行的,大大提高工作效率。
  • 2017年全國計算機一級考試Msoffice模擬操作題
    為了幫助各位網友們能更好的通過全國計算機一級考試,以下是YJBYS小編整理的關於2017年全國計算機一級考試Msoffice的模擬操作題,歡迎大家閱讀查看
  • 你不知道你在瀏覽色情網頁,卻是在給別有用心的人挖礦!
    現如今是網際網路的時代,電腦手機已經成為我們日常生活工具,人們不僅可以用電腦來工作,還可以用電腦上網聊天,打遊戲,看視頻等,如今手機也就可以上網瀏覽網頁,聊天,打遊戲,還有看視頻,其中有不少人用手機瀏覽器看視頻。
  • 如何匿名瀏覽網頁?
    你確定你的上網活動是隱私嗎?再想一想。據《今日美國報》網站報導,不僅是你的瀏覽過程被網站、搜尋引擎和社交網絡跟蹤,還會被你的網絡服務提供者,網頁瀏覽器,政府以及上百家網絡追蹤公司所追蹤。不論是收集可貴的市場營銷數據,或者是防範犯罪活動,所有你認為你在家裡私下做的事情絕不是保密的。
  • 網絡教育統考:計算機模擬題1-2
    網絡教育統考:計算機模擬題 6--7遠程教育統考:計算機 模擬題3-- 4現代遠程教育:計算機統考
  • 把網頁「釘」在桌面上 新鮮資訊自動更新
    筆者非常愛看IT168網刊中的「牛哄哄」系列,但由於「牛哄哄」每天的更新時間不定,而筆者又是撥號上網,每早上都要很多次地登錄網站去瀏覽查看,並不時地刷新,很是麻煩。經過一番研究之後,終於找到一種方法:把相關的新聞網頁搬遷到桌面上,實現跟蹤監視,隨時都可看到。
  • 在哪可以找到計算機操作記錄?怎麼查看計算機的使用記錄?
    計算機在工作過程中會產生各種各樣的臨時文件和歷史記錄,近期使用的程序、文件、計算機開關機記錄等,都是有跡可循的,假若用戶急於尋找最近使用過的文件可以閱讀下文了解 查看計算機操作記錄的方法 。呵呵)  5、查看最近刪除了什麼:  這就要用到硬碟恢復工具啦~把你曾經以為徹底刪除掉的東西都給你翻出來~  二、怎麼刪除電腦歷史操作記錄?   1、 自定義刪除(即想刪除哪條歷史記錄就刪除哪條)  在百度搜索網頁裡的搜索欄中,點擊滑鼠左鍵兩次,會出現以前搜索過的歷史記錄。
  • 2019年專升本計算機模擬試卷與答案
    如果不按分類欄位排序,將無法執行分類匯總命令D.分類匯總完成後,還可以對匯總之後的結果執行排序操作17.在 Access2010 系統中,若需顯示錶中內容時使某些欄位不能移動顯示位置,可以使用的方法是( )。
  • 網頁禁止複製粘貼?教你5招,繞過網頁限制,免費複製全網內容!
    說到網頁禁止複製粘貼,相信很多人都有過這種經歷:在網上辛辛苦苦地去查找一些資料,好不容易找到了,但是不能複製,真是「竹籃打水一場空」!因此,難倒許多人的問題就出現了!在網上遇到一些無法複製的文章時,到底有什麼辦法可以繞開網頁限制,成功複製自己需要的內容呢?下面小電就來分享5種方法,教大家繞過網頁限制,免費複製全網內容!
  • 瀏覽網頁錯誤信息全揭秘
    瀏覽網頁錯誤信息全揭秘 佚名 發表於 2010-01-14 11:46:32 瀏覽網頁錯誤信息全揭秘
  • 物理老師瀏覽歷史網頁被處罰:辦公時間瀏覽與教學無關的網頁
    教師行業同樣也是在促作風的行列,教育部門規定,老師在辦公時間內不允許用手機、電腦打遊戲、炒股、聊天、購物等,也不允許瀏覽與教學無關的網頁,否則將會受到處罰。近日,一位物理老師王老師在辦公時間做課件,打開了電腦正在認真瀏覽網頁查找需要的材料。
  • 網頁內容禁止複製怎麼辦?教你8種方法輕鬆搞定,全網最全
    在瀏覽器地址欄中輸入: javascript:void($={}); 然後按回車鍵,然後網頁上的內容就任由你複製啦,注意要手動輸入,複製無效哦。如果輸入後還是無效的話,可以先將這個網頁按F5鍵刷新一下,再在瀏覽器中輸入上面的代碼。
  • 用linux命令瀏覽網頁:用Wget命令來瀏覽網頁
    用linux命令瀏覽網頁:用Wget命令來瀏覽網頁 以下是在liux模式下用linux命令瀏覽網頁的方法,可以用linux命令:lynx,links瀏覽web,linux命令:lftp,wget,curl等上傳/下載軟體。
  • 網頁內容禁止複製怎麼辦?教你8種方法輕鬆搞定,全網最全!
    在網頁上查詢數據經常會遇到一些文字無法複製的情況。好不容易找到了需要的文字卻複製不出來,確實讓人很鬧心。那麼有什麼辦法可以繞開這種限制,將網頁的文字複製下來為我所用呢?實際上只要明白了其中的原理,想要複製這些文字並不是什麼難事。
  • 2020年12月份計算機統考模擬訓練四
    A.存儲記憶B.自動編程C.無須記憶D.用十進位數記數答案:A4.在計算機領域,未經處理的基本素材稱為______。A.數據B.數值C.模擬量D.信息答案:A5.利用計算機來模仿人的高級思維活動稱為______。
  • 簡述火車頭自動抹牆粉牆機的適用範圍自動保護
    火車頭自動抹牆機有效的將現代化電器與機械有機結合,針對抹牆的特點開發而成,完全可以取代傳統的人工抹牆方式,大大提高了工作效率。新型抹牆機機改變過去現場組裝的弊端,無需組裝直接使用,該機分為兩種移動方式,一種採用可變底輪,方便找平。
  • 《計算機基礎》2020年12月統考模擬題-計算機試卷9
    A.存儲記憶能力B.無須記憶C.用十進位數記數D.自動編程答案:A4.計算機領域中,______是客觀事物的屬性。A.信息B.數值C.模擬量D.數據答案:D5.用來表示計算機輔助工程的英文縮寫是______。
  • 周知| 開啟無痕瀏覽模式真能保護個人隱私嗎?
    文章轉載自公眾號保密觀,作者郝耀鴻蘇慧在訪問網站頁面時,你是否有過這樣的疑慮,自己訪問的會不會是山寨網站?用公用電腦上網,個人信息會被別人看到嗎?這時,有人會說,使用瀏覽器的「無痕瀏覽」模式不就行了,可以在操作中不留下「蛛絲馬跡」,但,真是如此嗎?