13分鐘,教你python可視化分析20W數據,找到妹子最愛的內衣

2020-12-15 數據分析不是個事兒

最近正值「618活動」,阿里、拼多多、京東等都在發力,商品的價格也下降了不少。我打開某寶首頁,頓時想對某些商品的評論進行一次爬取分析。

一提到爬取,我們肯定先想到python,那可真的是利器,不過我提醒一句,不允許爬的千萬不要碰。python雖然爬取簡單,但是做可視化分析需要費不少力氣,雖然有 Matplotlib 和 Seaborn 兩個包就足夠了。

如果只調用基本的函數可能做出來的圖會比較簡陋,要達到好看的效果還是需要很多的精力和代碼的,不適用於零基礎小白。

所以我想到了當下最火的BI分析工具,有了數據,直接拖拽就能得到可視化分析,完全就是零代碼,python+BI在手,打遍無敵手。原理也很簡單,數據獲取是通過Python進行的,然後得到Excel表,BI可以直接連接數據源,負責最後應用層的數據處理、加工和可視化。

那分析什麼呢?想來想去,我選擇了女性的內衣。

不要想歪,不要懷疑,這就是一個數據可視化項目,純屬娛樂,大家看看就行,重要是我分析的過程,如果能學到東西我就更開心了,我只用了13分鐘。

話不多說,進入主題。

一、數據獲取

數據來自python爬蟲獲取,淘寶約50個文胸商品的20W條評論數據,原始數據是txt格式,為了方便處理,這邊轉為Dataframe~

由於篇幅的限制,這裡只放部分代碼,感興趣的可以到文末。

二、分析目的

這裡先給大家做一個科普,對於很多隻知道A/B/C的紳士們,我們在看數據之前可能先得了解點知識,內衣是有上圍和下圍的區分的。

通過上圍與下圍的差值,我們就可以確定大小了。

雖然我沒買過,但是對分析維度還是了解的:

顏色與膚色的對比款式尺碼大小評價分析三、數據可視化

雖然獲取到的數據數量不是很大,才20W,但是Excel分析這個體量,肯定是會卡死的,而且Excel的可視化圖表簡直一言難盡,還需要各種函數...

上面說到BI工具,那市面上這麼多BI工具,怎麼去挑選呢?市面上知名的有Tableau、FineBI等,這兩個也是在知乎最受好評的工具,我從下面幾個方面簡單給你們講一下。

部署安裝:都是基於瀏覽器端即可使用的工具學習教程:FineBI更全面使用體驗(上手難度)和需求符合度:FineBI更適合小白產品功能:Tableau更佔優一點,但有些功能並不是國內企業所看重的,FineBI能做複雜報表報價和服務:FineBI的性價比很高,Tableau很貴所以我選擇FineBI進行這次可視化分析,先通過下面這個來了解一下:

不要單純的以為它只是個可視化工具,它的本質是數據分析工具,能通過數據對業務產生指導:

1、評論裡出現最多的關鍵詞

可以看見,內衣的顏色和膚色還是有很大關係的,不過據數據統計,妹子喜歡黑色佔大多數,因為在人的印象裡,好像粉色、紫色都有點怪怪的?

知道給自己女朋友/老婆買什麼顏色了嗎?不對,你們不一定有....

2、哪個尺寸的妹子最多?

D的數量很少,符合我們的認知。B的數量等於A+C的總和,這數據應該是準確的,穿B不代表就是B,就像你買衣服也喜歡寬鬆的,自己體會。

3、具體大小受什麼影響?

我從上下圍兩個角度來分析A/B/C/D的分布,這個應該是迄今為止最全面的內衣分析了,想說的都在圖裡。

4、她們喜歡什麼時候買內衣?

高峰期在上午和晚上,這也可以理解,大家都在玩手機,但是夜裡3點買的人,我想問問,你圖啥?

5、內衣的評價如何?

圖片來自於網絡

這是詞雲圖,字越大,代表佔的比重就越大,FineBI也能做,方法也是一樣,有了數據直接拖拽,然後選擇合適的圖表類型即可。

內衣畢竟是衣服,女性關注的點肯定是效果與舒適度,男性的話我就不知道了。

關於代碼和數據可視化工具,關注我,並轉發該文章,回復「內衣」即可獲得!!!

各位紳士,你們怎麼看?

相關焦點

  • python爬取+BI分析5000條內衣數據,發現妹子最愛這款文胸
    生活中我們經常會用python進行數據爬取,但是爬取簡單分析難,很多人喜歡用echarts圖表接口或者是python的第三方庫進行數據可視化,甚至是用matlab,基本上都需要用代碼實現,在數據展示上十分繁瑣,效率不高。
  • 【Python教程】用Python進行數據可視化
    因此,我們的要求功能的實現,更是要多去思考不同的解決方案,評估不同方案的優劣,然後使用在該場景下最優雅的方式去實現。所以,我們列出的參考資料未必是實現需求所必須的。有的時候,實現題目的要求很簡單,甚至參考資料裡就有,但是背後的思考和親手去實踐卻是任務最關鍵的一部分。在學習這些資料時,要多思考,多提問,多質疑。相信通過和小夥伴們的交流,能讓你的學習事半功倍。
  • python數據分析專題 (7):python數據分析模塊
    也就是這些python的擴展包讓python可以做數據分析,主要包括numpy,scipy,pandas,matplotlib,scikit-learn等等諸多強大的模塊,在結合上ipython交互工具 ,以及python強大的爬蟲數據獲取能力,字符串處理能力,讓python成為完整的數據分析工具。
  • 2組語法,1個函數,教你用Python做數據分析
    DataFrame:DataFrame可以簡單理解為Excel裡的表格格式。>        dataTop1_sum[:20].iloc[::-1].plot.barh(figsize = (6,10),color = 'orange')    name=pf+'top20分析'    plt.title(name)    定義函數後,批量出圖so easy:
  • Python數據分析可視化教程學習
    來源:博學谷 作者:照照隨著數據分析與數據挖掘行業的日益火爆,Python數據分析可視化教程也成為了許多人提升職業競爭力的必修課。本文將詳細為大家介紹Python數據分析可視化教程的具體內容,全文會圍繞著為什麼學?學什麼?學了有什麼用?
  • Python視頻教程網課編程零基礎入門數據分析網絡爬蟲全套Python...
    項目 15flask框架 17愛家租房項目 18通用爬蟲模塊使用 19Mongodb資料庫 20爬蟲scrapy框架及案例 21數據分析 22機器學習 23深度學習 24數據結構和算法 25python網絡爬蟲 26機器學習入門篇 27
  • 15種獨一無二的創新數據可視化方式
    全文共5489字,預計學習時長11分鐘可視化能解答那些尚未發現的問題。本·施耐德曼(Ben Shneiderman)掌握數據可視化技術會打開新世界的大門,帶來更多機會。精心設計的可視化能幫助程式設計師找到原始數據集的核心。 這是成功的數據科學項目和普通的數據科學項目之間的區別。 因此,本文旨在展示數據可視化的強大功能。
  • 推薦: 一本「高顏值」的Python語言數據可視化圖書
    另外,《R語言數據可視化之美》基於R中的ggplot2包及其拓展包等,系統性地介紹了幾乎所有常見的二維和三維圖表的繪製方法。所以很有必要系統性地介紹python的繪圖語法系統,包括最基礎也最常用的matplotlib包、常用於統計分析的seaborn、最新出現類似R ggplot2語法的plotnine以及用於地理空間數據可視化的basemap包。
  • Python數據可視化教程之基礎篇
    經過學習之後,我總結了利用python實現可視化的三個步驟:確定問題,選擇圖形轉換數據,應用函數參數設置,一目了然python中最基本的作圖庫就是matplotlib,是一個最基礎的Python可視化庫,一般都是從matplotlib上手Python數據可視化,
  • 超適合Python小白的乾貨,Python數據分析50個實戰項目
    ——人力資源分析9.大眾點評評論文本挖掘10.手機微博榜單數據爬蟲與分析11.貓眼電影爬蟲及分析12.漫威電影宇宙英雄綜合實力對比分析13.20 秒看懂中國大學 10 年排行榜變化14.航空公司客戶價值分析15.電子商務網站用戶行為分析及服務推薦16.關於地震的爬蟲數據分析實戰
  • Python爬50W數據,BI做出可視化後,我有了答案
    一次完整的python數據分析流程是怎麼樣的?使用python從網站抓取數據,並將這些數據保存到SQLite資料庫中,然後對數據進行清洗,最後對數據進行數據可視化分析。可是熟悉的人應該知道,python爬取簡單,但是分析起來是很困難的,SQL語句、Pandas和Matplotlib這些十分繁瑣,一般人也不會。
  • Python的數據可視化:對比7種工具包
    Python 的scientific stack(一個介紹Python科學計算包的網站)已經完全成熟,並且有各種各樣用例的庫,包括機器學習(連結:machine learning),數據分析(連結:data analysis)。數據可視化是探索數據和清晰的解釋結果很重要的一部分,但是Python在過去卻相對於其他工具比如R落後一點。
  • Python學習第89課-數據可視化之直方圖繪製
    【每天幾分鐘,從零入門python編程的世界!】假設你想投資某一個城市的房地產,你肯定需要對這個城市的人口分布、增長潛力做一個調查,這時我們就需要做一個直方圖(histogram plot)。實例:假設我們有一份C城市的人口年齡的數據,我們為方便起見,在這裡只列出很少的一部分數據,用一個列表City_C_Age表示這個城市的人口年齡數據:City_C_Age=[2,3,1,7,4,5,3,1,7,6,9,8,13,16,12,17,15,14,18,,20,23,28,25,23,27,25,29,26,24,25,30,34,37,36,38,32,35,37,36,41,42,47,47,48,43,46,44,53,54,58,52,51,55,56,69,60,63,67,64,72,74,78,75,89,85,83,90,93
  • 數據人必備!史上最全的數據分析可視化工具!
    藉此,學姐整理了史上最全的數據可視化分析工具盤點!涉及數據分析、商業分析、軟體分析及圖像處理,可能涉及到所有可視化相關領域,行業裡的學習夥伴趕緊看看有沒有自己正在學習的吧!簡潔明了的數據分析工具,優點是零代碼可視化、可視化圖表豐富,只需要拖拖拽拽就可以完成十分炫酷的可視化效果,擁有數據整合、可視化數據處理、探索性分析、數據挖掘、可視化分析報告等功能,更重要的是個人版免費。
  • 手把手教你使用Python進行高級數據可視化
    數據可視化能力已經越來越成為各崗位的基礎技能。領英的數據報告顯示,數據可視化技能在2018年中國最熱門技能中排名第一。就數據分析而言,可視化探索幾乎是你正式進行數據分析的第一步,通過SQL拿到數據之後,我們需要使用可視化方法探索和發現數據中的模式規律。數據分析界有一句經典名言,字不如表,表不如圖。實際上除掉數據挖掘這類高級分析,不少數據分析就是監控數據和觀察數據。
  • Python的可視化工具概述
    Matplotlib 是python可視化庫的祖父.它非常強大,但是太過複雜.你可以使用Matplotlib 做任何你需要做到的事情,但是並不容易弄明白.我不打算通過純Matplotlib 樣例講解,因為許多工具(尤其Pandas和Seaborn)是Matplotlib的thin wrappers.
  • Python數據可視化—Seaborn
    今天為大家分享的小技巧是python的可視化畫圖庫Seaborn。相信很多小俠客用過matplotlib、pyecharts等可視化庫,可是為什麼還要介紹Seaborn呢?因為它修復了上述兩個庫的一些缺點,比如Seaborn提供了大量的高級接口和自定義主題,而matplotlib沒有這些接口使得很難確定哪些設置來自定義圖表。
  • 匯總版|最全數據分析資料匯總(趣味Python、商業數據分析、爬蟲等等)
    •如何利用Python處理JSON格式的數據接口•太贊了!只要五招就可以讓Python代碼這麼優雅!•教你5招,大幅提升Python數據處理速度!Python趣味篇•用Python做一個微博熱搜榜的語音播報•Python幫你把B站上喜歡的視頻下載下來•致青春!一行Python代碼勾起了滿滿的童年回憶!•對不起,分手吧,我愛上了你做的聊天機器人!
  • 「乾貨」產品經理教你用Python+Flourish搞掂超酷的數據可視化
    近日,小路通過python自動獲取全球各國新冠肺炎確診歷史數據,利用可視化工具,製作動態排名數據可視化圖表,廢話少說,先來看看最終的展示效果,talk is cheap, show me the demo:看起來有木有很炫酷,其實做起來也不複雜,都有套路可循,小路這就為你奉上套路
  • 掌握數據分析最重要的軟實力:數據感知能力
    入門不難,所以成為目前發展最好的語言之一零基礎初學python的朋友,一般很快會被網上的免費資料帶入python爬蟲的坑裡。;已經工作的人們,如需數據研究,所在公司也一般會花錢購買商業資料庫。如果研究共享單車數據,大部分人都會想到和它和房價、城市相關聯,只有少數人會想到共享單車曾經有過學生證的記錄,從而可能獲知中國大學生的流動情況: