pandas與seaborn可視化對比小案例

2021-03-02 頂級程式設計師

Python網絡爬蟲與文本數據分析(視頻課)

之前分享過pandas也是可以作圖的,今天複習一下pandas作圖,並與seaborn做對比,熟悉下各自繪圖的特點。

導入用到的庫

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

%matplotlib inline

plt.style.use('fivethirtyeight')

plt.style.use('bmh')

讀取數據

business = pd.read_csv('data/business.csv')

business.head()

評分分布

查看用戶對yelp平臺內店家評價的分布情況。使用pandas繪圖

colors = sns.color_palette()

#stars是series數據類型

stars = business['stars'].value_counts().sort_index()

stars.plot(kind='bar',

figsize=(10, 5),

color=colors[:9],

rot=0,

title='Distribution of rating')

也可以用seaborn作圖,代碼如下

plt.figure(figsize=(10,5))

sns.countplot(business['stars'])

plt.title('Distribution of rating')

我們發現大多數用戶店家評分都是4分及以上

最常見的店名和坐標

我們看看店鋪的最常見的店名、最常見的坐標。使用pandas繪圖

fig, ax = plt.subplots(1, 2, figsize=(14, 8))

business['name'].value_counts()[:20].plot(kind='barh',

ax=ax[0],

color=colors[:20],

title='Top 20 name of store in Yelp')

business['city'].value_counts()[:20].plot(kind='barh',

ax=ax[1],

color=colors[:20],

title='Top 20 of city in Yelp')

f,ax = plt.subplots(1,2, figsize=(14,8))

cnt = business['name'].value_counts()[:20].to_frame()

sns.barplot(cnt['name'], cnt.index, palette = 'RdBu', ax = ax[0])

ax[0].set_xlabel('')

ax[0].set_title('Top 20 name of store in Yelp')

cnt = business['city'].value_counts()[:20].to_frame()

sns.barplot(cnt['city'], cnt.index, palette = 'rainbow', ax =ax[1])

ax[1].set_xlabel('')

ax[1].set_title('Top 20 of city in Yelp')

plt.subplots_adjust(wspace=0.3)

從上面兩個例子看,pandas和seaborn繪圖各有千秋,有時候pandas簡潔,有時候seaborn簡潔。

-END-

假期無法出門
不如在家學習

世界正在獎勵堅持學習的人!

相關焦點

  • Python數據可視化—Seaborn
    小俠客們好呀,我是oubahe。今天為大家分享的小技巧是python的可視化畫圖庫Seaborn。
  • 數據科學 | 可視化神器Seaborn的超全介紹
    我們導入seaborn,這是這個簡單示例所需的唯一庫。在幕後,seaborn使用matplotlib繪製圖片。許多任務只能通過seaborn函數來完成,但是進一步的定製可能需要直接使用matplotlib。下面將更詳細地解釋這一點。
  • 如何用pandas更快地進行數據可視化?
    作者:劉早起來源:早起Python(公眾號)如果你經常使用Python進行數據分析,那麼對於pandas一定不會陌生,但是Pandas除了在數據處理上大放異彩,隨著版本的不斷更新,Pandas的繪圖功能在某些情況下甚至要比matplotlib更加適用,本文就將介紹如何用Pandas更快的進行數據可視化!
  • 用數據可視化工具Seaborn繪製圖表
    為了更好地理解本文,你需要了解pandas和matplotlib的基礎知識。如果沒有,可以參考以下文章:用Pandas進行數據分析:https://towardsdatascience.com/pandas-for-data-analysis-142be71f63dc使用Matplotlib進行可視化:https://towardsdatascience.com/visualizations-with-matplotlib-4809394ea223
  • 5個可以幫助pandas進行數據預處理的可視化圖表
    在本文中,我將討論五個強大的數據可視化選項,它們可以立即提供數據特徵的感覺。即使在正式建模或假設測試任務之前,執行EDA就可以傳達大量關於數據和特徵之間關係的信息。 第1步-我們將導入pandas、matplotlib、seaborn和NumPy包,我們將使用這些包進行分析。我們需要散點圖、自相關圖、滯後圖和平行圖。
  • 百川歸海,四類圖統攬統計圖:Seaborn|可視化系列03
    ,需要較多數據處理過程,語句就變得繁瑣,因此seaborn針對這類需求,基於matplotlib提供了更高層的接口,擅長統計數據的可視化。seaborn可視化的寫法和matplotlib基本相同。seaborn可視化效果圖seaborn對pandas數據結構的支持非常好,能充分利用DataFrame的特點而不需要做格式轉換。
  • pandas數據可視化原來也這麼厲害
    作者:小伍哥 來源:AI入門學習(公眾號)在python中,常見的數據可視化庫有3個:matplotlib:最常用的庫,可以算作可視化的必備技能庫,比較底層,api多,學起來不太容易。seaborn:是建構於matplotlib基礎上,能滿足絕大多數可視化需求,更特殊的需求還是需要學習matplotlib。pyecharts:上面的兩個庫都是靜態的可視化庫,而pyecharts有很好的web兼容性,可以做到可視化的動態效果。並且種類也比較豐富。
  • 可視化工具 Seaborn的6個簡單技巧
    讓我們使用Seaborn內置的penguins數據集作為樣本數據:# 導入包import matplotlib.pyplot as pltimport seaborn as sns# 導入數據df = sns.load_dataset('penguins
  • 好享學丨Seaborn:一行代碼生成酷炫狂拽的數據集可視化
    之前看其他大佬的項目,只在意他們通過可視化的數據集,對數據特徵挖掘的思路,但沒有在意他們做可視化的工具。輪到自己做的時候就發現,wtf!matplotlib可以更難用一點嘛?別人酷炫狂拽,坐標軸上還有直方圖的可視化究竟是怎麼弄的?今天碰到了Seaborn的庫,一行代碼就出圖,愛了!Seaborn介紹Seaborn是Python的數據統計圖形庫。它基於matplotlib構建,並與pandas數據結構緊密集成。Seaborn功能簡介
  • pandas數據可視化教學,一招即懂
    常見的數據可視化庫有:matplotlib 是最常見的2維庫,可以算作可視化的必備技能庫,由於matplotlib是比較底層的庫,api很多,代碼學起來不太容易。seaborn 是建構於matplotlib基礎上,能滿足絕大多數可視化需求。
  • 7款 Python 可視化工具對比
    數據可視化是發現數據和展示結果的重要一環,只不過過去以來,相對於 R 這樣的工具,發展還是落後一些。 幸運的是,過去幾年出現了很多新的Python數據可視化庫,彌補了一些這方面的差距。matplotlib 已經成為事實上的數據可視化方面最主要的庫,此外還有很多其他庫,例如vispy,bokeh, seaborn,  pyga, folium 和 networkx,這些庫有些是構建在 matplotlib 之上,還有些有其他一些功能。 本文會基於一份真實的數據,使用這些庫來對數據進行可視化。
  • Pandas數據可視化原來也這麼厲害
    >一、可視化概述在Python中,常見的數據可視化庫有3個:matplotlib:最常用的庫,可以算作可視化的必備技能庫,比較底層,api多,學起來不太容易。seaborn:是建構於matplotlib基礎上,能滿足絕大多數可視化需求,更特殊的需求還是需要學習matplotlib。pyecharts:上面的兩個庫都是靜態的可視化庫,而pyecharts有很好的web兼容性,可以做到可視化的動態效果。
  • 使用Seaborn和Pandas進行相關性分析和可視化
    r值公式讓我們通過一個簡單的數據集進行相關性的可視化它具有以下列,重量,年齡(以月為單位),乳牙數量和眼睛顏色。眼睛顏色列已分類為1 =藍色,2 =綠色和3 = 棕色。讓我們使用以上數據繪製3個散點圖。
  • 【Python基礎】Pandas數據可視化原來也這麼厲害
    一、可視化概述在Python中,常見的數據可視化庫有3個:matplotlib:最常用的庫,可以算作可視化的必備技能庫,比較底層,api多,學起來不太容易。sseaborn:是建構於matplotlib基礎上,能滿足絕大多數可視化需求,更特殊的需求還是需要學習matplotlib。pyecharts:上面的兩個庫都是靜態的可視化庫,而pyecharts有很好的web兼容性,可以做到可視化的動態效果。
  • Python數據可視化-seaborn Iris鳶尾花數據
    我們將紙鳶花數據集中不同種類花的petal length和petal width做swarmplot可視化。Boxplot箱形圖,主要包含六個數據節點,將一組數據從大到小排列,分別計算出上邊緣,上四分位數Q3,中位數,下四分位數Q1,下邊緣,還有異常值。
  • Python Seaborn綜合指南,成為數據可視化專家
    在本文中,我們將了解什麼是seaborn以及為什麼應該使用它而不是matplotlib。然後我們將使用seaborn在Python中為數據生成各種不同的可視化。目錄什麼是Seaborn?我們都準備好了詳細地探索seaborn。用於數據可視化的數據集我們將主要處理兩個數據集:之所以選擇這兩個,是因為它們包含多個變量,因此我們有很多選擇可以使用。這兩個數據集還可以模擬現實情況,因此你將了解數據可視化和了解業內的數據可視化方式。你可以在DataHack平臺上查看這個和其他高質量的數據集。因此,請在繼續之前下載上述兩個數據集。我們將一起使用它們。
  • python繪圖之美:seaborn統計數據可視化
    seaborn提供的功能包括:散點圖# 導入seaborn庫import seaborn as sns# 應用默認的seaborn主題、縮放和調色板sns.set()# 加載一個示例數據集tips = sns.load_dataset
  • python數據科學系列:seaborn入門詳細教程
    seaborn 5種內置風格與matplotlib繪圖風格對比相比matplotlib繪圖風格,seaborn繪製的直方圖會自動增加空白間隔,圖像更為清爽。seaborn 4種繪圖環境對比可以看出,4種默認繪圖環境最直觀的區別在於字體大小的不同,而其他方面也均略有差異。詳細對比下4種繪圖環境下的系列參數設置:
  • 長文乾貨|數據可視化必備Python Seaborn綜合指南,一文搞定可視化!
    在本文中,我們將了解什麼是seaborn以及為什麼應該使用它而不是matplotlib。然後我們將使用seaborn在Python中為數據生成各種不同的可視化。目錄什麼是Seaborn?你曾經在R中使用過ggplot2庫嗎?它是任何工具或語言中最好的可視化包之一。Seaborn給了我同樣的感覺。
  • Seaborn庫常用圖形
    seaborn庫其實是在matplotlib庫的基礎上進行了更高級的 API 封裝,從而使繪圖更容易、更美觀。本文主要通過鐵達尼號數據集,來演示seaborn庫常用可視化圖形。鐵達尼號數據.csv')# 查看前5行數據train_data.head()# 常規的數據信息查看train_data.info()<class 'pandas.core.frame.DataFrame