前言:
科技在不斷進步,人們需求也追求多樣化,尤其網際網路給我們的生活帶來了翻天覆地的變化,尤其Python,能讓我們的生活中的做事效率大幅提高。下面看看它的威力有多大?
爬取豆瓣電影Top250,在家看熱門電影而且不用會員充值
有對Python感興趣的小夥伴?小編整理【一套Python電子文檔及源碼】,感興趣者可以關注小編後私信「Python」(是關注後私信哦)反正閒著也是閒著呢,不如學點東西啦
3. 採集更多電影
上面代碼只是幫我們輸出第一頁25部電影信息,要採集第二頁可以把requests請求的連結地址更換一下html=requests.get('https://movie.douban.com/top250?start=25'),每頁25個遞增,第三頁就是start=50,以此類推。
最後把全部250個電影數據反覆10遍粘貼到Excel表格就可以了。
當然我們有更好的方法,比如利用for循環自動採集10個頁面的數據
4.生成統計數據
我們把採集到的數據粘貼到Excel文件中,最頂上插入一行【影片名、年份】
Excel數據
接下來我們利用這些數據研究一下哪些年盛產好電影。
如上圖,點擊B欄全選這一列。然後選擇【插入-數據透視表】
插入數據透視表
然後彈窗中選擇【新工作表】,其他保留默認,點確定。
拖拽到行
同樣再拖拽到值裡面。
拖拽到值
然後點擊表格裡面的【求和項:年份】,再點擊【欄位設置】,彈窗中選擇【計數】,然後確認,就能統計出每個年份上映的電影數量。
很多年份都是1或2,但表格滾動到下面就會看到1994、1995哪些年上映的電影比較多。
最終統計圖如下,可以清楚的看到全球最佳電影的年份分布情況,可以得到一些結論,比如上個世紀90年代初開始電影製作水平有了明顯的提升,至90年代中期以後,雖然一直處於較高水平,但沒有太大幅度的提高了;2010年貢獻了最多數量的好電影,此後至今的8年雖然佳片不斷(12年除外),但整體走低,2017年觀眾認可度達到最低點。
利用Python獲取了熱門電影可以觀看,自己也了解了網際網路知識辦公技能,做到了高效辦公,提高了工作效率。