python-數據分布型圖表-箱形圖系列-多數據系列箱形圖

2021-03-06 益添與書

多數據系列的箱形圖多數據系列的箱形圖:多數據系列的箱形圖

使用geom_boxplot()函數,只需要將兩組變量映射到填充顏色(fill);

使用position=position_dodge(width)控制箱形之間間隔;

使用geom_jitter()函數添加抖動散點圖;

通過position=position_jitter(width,heigth)使散點沿著箱形中心線分布;

雙數據系列小提琴圖,只需要保留兩個小提琴圖的一半;

使得左邊為一個數據的核密度估計曲線圖;

右邊為另一個數據的核密度估計曲線圖;

繪製多數據系列箱形圖

tips = sns.load_dataset('tips') #從網絡環境導入數據tips

https://www.cnblogs.com/zzhzhao/p/5269217.html

import pandas as pd

data_url = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv" #填寫url讀取

df = pd.read_csv(data_url)

多數據系列的箱型圖

import pandas as pd

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

from plotnine import *

#tips = sns.load_dataset("tips")

#tips = pd.read_csv('d:/python/out/seaborn-data/tips.csv')

tips = pd.read_csv('tips.csv')

#多數據系列的箱型圖

box2_plot=(ggplot(tips, aes(x = "day", y = "total_bill"))

+ geom_boxplot(aes(fill="sex"),position = position_dodge(0.8),size=0.5)

+ guides(fill=guide_legend(title="Gender"))

+scale_fill_hue(s = 0.90, l = 0.65, h=0.0417,color_space='husl')

+theme_matplotlib()

+theme(legend_position='right',

text=element_text(size=12,colour = "black"),

aspect_ratio =1.01,

dpi=100,

figure_size=(4,4)))

print(box2_plot)

box2_plot.save("box2_plot.pdf")

帶抖動散點的多數據系列箱型圖

import pandas as pd

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

from plotnine import *

#tips = sns.load_dataset("tips")

#tips.to_csv('tips.csv', index=False, header=True)

tips = pd.read_csv('d:/python/out/seaborn-data/tips.csv')

#帶抖動散點的多數據系列箱型圖.

x_label=['Thur','Fri', 'Sat', 'Sun']

tips['x1']=pd.factorize(tips['day'],sort =x_label)[0]+1

tips['x2']= tips.apply(lambda x: x['x1']-0.2 if x['sex']=="Male" else x['x1']+0.2, axis=1)

box2_plot=(ggplot(tips, aes(x = "x1", y = "total_bill",group="x2",fill="sex"))

+ geom_boxplot(position = position_dodge(0.8),size=0.5,outlier_size=0.001)

+geom_jitter(aes(x = "x2"),position = position_jitter(width=0.15),shape = "o",size=2,stroke=0.1)

+ guides(fill=guide_legend(title="Gender"))

+scale_fill_hue(s = 0.90, l = 0.65, h=0.0417,color_space='husl')

+scale_x_continuous(breaks = range(1,len(x_label)+1),labels=x_label,name='day')

+xlab("day")

+theme_matplotlib()

+theme(legend_position='right',

text=element_text(size=12,colour = "black"),

aspect_ratio =1.01,

dpi=100,

figure_size=(4,4)))

print(box2_plot)

box2_plot.save("box2_plot2.pdf")

帶抖動散點的多數據系列小提琴圖

import pandas as pd

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

from plotnine import *

#tips = sns.load_dataset("tips")

#tips.to_csv('tips.csv', index=False, header=True)

tips = pd.read_csv('d:/python/out/seaborn-data/tips.csv')

#帶抖動散點的多數據系列小提琴圖

sns.set_style("ticks")

fig = plt.figure(figsize=(5,5.5))

violinplot=sns.violinplot(x="day", y="total_bill", hue="sex",

data=tips, inner="quartile", split=True,

linewidth=1,colors=["#F7746A", "#36ACAE"])

violinplot.despine(left=True)

plt.legend(loc="center right",

bbox_to_anchor=(1.5, 0, 0, 1))

violinplot.set_axis_labels("day", "total bill")

#inner:控制violinplot內部數據點的表示,

#有「box」, 「quartile」, 「point」, 「stick」四種方式。

fig.savefig('violinplot_split2.pdf')

多數據系列的豆狀圖

import pandas as pd

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

from plotnine import *

#tips = sns.load_dataset("tips")

tips = pd.read_csv('d:/python/out/seaborn-data/tips.csv')

#多數據系列的豆狀圖

#flatui = ["#F7746A", "#36ACAE", "#95a5a6", "#e74c3c", "#34495e", "#2ecc71"]

#sns.set_palette(sns.hls_palette(2, s = 0.95, l = 0.5, h=0.0417))

sns.set_context("notebook", font_scale=1.5,

rc={'font.size': 12, 'axes.labelsize': 20, 'legend.fontsize':15,

'xtick.labelsize': 15,'ytick.labelsize': 15})

fig = plt.figure(figsize=(5,5.5))

violinplot=sns.violinplot(x="day", y="total_bill", hue="sex",

data=tips, inner="box", split=True,

linewidth=1,palette=["#F7746A", "#36ACAE"])

plt.legend(loc="center right",

bbox_to_anchor=(1.5, 0, 0, 1))

plt.savefig('violinplot_split.pdf')

相關焦點

  • excel如何畫箱形圖 EXCEL箱形圖繪製圖文教程
    形圖原理: 箱形圖可以用來觀察數據整體的分布情況,利用中位數,25/%分位數,75/%分位數,   原標題:excel如何畫箱形圖 EXCEL箱形圖繪製圖文教程   excel如何畫箱形圖?大家都知道excel的功能很強大,那麼大家是否知道EXCEL也可以做箱形圖呢?還不清楚的網友可以看看本文。
  • Excel 箱形圖製作
    關於組間分布比較,一般會想到組間的方差比較Anova分析,不過這個分析是建立在數據呈正太分布的假設條件下的,而箱形圖儘管比較相對粗一些,但是圖表比較更加形象使用更加寬泛,在人力資源中的1/4分位,3/4分位其實也與箱形圖分布計數是一樣的(人力資源調查報告一般顯示分位比較),所以我利用箱形圖進行人員薪資分布的比較。
  • 【孫老溼畫圖系列--第一彈】 箱形圖 Boxplot
    箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數據分散情況資料的統計圖。因形狀如箱子而得名。 其繪製須使用常用的統計量,能提供有關數據位置和分散情況的關鍵信息,尤其在比較不同的母體數據時更可表現其差異。
  • 箱形圖、小提琴圖、直方圖……統統可以卡通化!
    這一穀物數據集較好地融合了兩者。分布族這是一個幸福的大家庭——箱形圖、直方圖、小提琴圖、箱形圖。雖然它們長相各異,但如果深入了解,你就會發現每種圖形都以相似的方式揭示數據集的構成。爸爸媽媽:箱形圖Borat和Wanda這個圖表家庭會告訴你,用大量不同的數據樣本測量同一個值的意義何在。無論數據集是正常或是已被扭曲,這些圖表都能找出樣本的中位數(三個孩子甚至可以判斷樣本是否為多模態分布)。
  • Python繪製箱形圖全解
    作者:小dull鳥來源:Python數據分析之禪Python繪製箱形圖全解數據挖掘工作中的第一步就是異常值檢測,異常值的存在會影響實驗結果。箱形圖主要是為了檢測異常值,箱形圖最大的優點就是不受異常值的影響,能夠準確穩定地描繪出數據的離散分布情況,同時也利於數據的清洗。
  • 最受歡迎的 50 個數據可視化圖表
    關聯圖表用於可視化 2 個或更多變量之間的關係。也就是說,一個變量如何相對於另一個變化。1. 散點圖(Scatter plot)散點圖是用於研究兩個變量之間關係的經典的和基本的圖表。如果數據中有多個組,則可能需要以不同顏色可視化每個組。
  • 數據可視化最有價值的50個圖表 | 網際網路數據資訊網-199IT | 中文...
    在數據分析和可視化中最有用的 50 個 Matplotlib 圖表。 這些圖表列表允許您使用 python 的 matplotlib 和 seaborn 庫選擇要顯示的可視化對象。這些圖表根據可視化目標的7個不同情景進行分組。 例如,如果要想像兩個變量之間的關係,請查看「關聯」部分下的圖表。
  • 50 個數據可視化圖表
    這些圖表列表允許您使用 python 的 matplotlib 和 seaborn 庫選擇要顯示的可視化對象。這些圖表根據可視化目標的 7 個不同情景進行分組。例如,如果要想像兩個變量之間的關係,請查看「關聯」部分下的圖表。或者,如果您想要顯示值如何隨時間變化,請查看「變化」部分,依此類推。
  • 50個最有價值的數據可視化圖表(推薦收藏)
    本文總結了在數據分析和可視化中最有用的 50 個 Matplotlib 圖表。這些圖表列表允許您使用 python 的 matplotlib 和 seaborn 庫選擇要顯示的可視化對象。這些圖表根據可視化目標的 7 個不同情景進行分組。例如,如果要想像兩個變量之間的關係,請查看「關聯」部分下的圖表。
  • 50個最有價值的數據可視化圖表
    這些圖表列表允許您使用 python 的 matplotlib 和 seaborn 庫選擇要顯示的可視化對象。這些圖表根據可視化目標的 7 個不同情景進行分組。例如,如果要想像兩個變量之間的關係,請查看「關聯」部分下的圖表。或者,如果您想要顯示值如何隨時間變化,請查看「變化」部分,依此類推。
  • 數據可視化,職場數據分析都需要哪些常用的圖表?
    我們將常用的圖表類型歸類為基礎圖表和高級可視化圖表。  基礎圖表  柱形圖、折線圖、餅圖、條形圖、面積圖、散點圖、股價圖、雷達圖、氣泡圖、曲面圖、組合圖等  高級可視化圖表  樹狀圖、旭日圖、直方圖、排列圖、箱型圖、瀑布圖、漏鬥圖、Map地圖、動態圖表等。
  • 數據可視化,你真的會了嗎?
    關聯圖表用於可視化 2 個或更多變量之間的關係。也就是說,一個變量如何相對於另一個變化。1. 散點圖(Scatter plot)散點圖是用於研究兩個變量之間關係的經典的和基本的圖表。如果數據中有多個組,則可能需要以不同顏色可視化每個組。
  • 推薦: 一本「高顏值」的Python語言數據可視化圖書
    所以很有必要系統性地介紹python的繪圖語法系統,包括最基礎也最常用的matplotlib包、常用於統計分析的seaborn、最新出現類似R ggplot2語法的plotnine以及用於地理空間數據可視化的basemap包。在先介紹數據可視化基礎理論後,本書系統性地介紹了幾乎所有常見的二維和三維圖表的繪製方法,包括簡單的柱形圖系列、條形圖系列、折線圖系列,地圖系列等。
  • 深入了解數據統計圖-樹狀圖
    :樹狀圖,旭日圖,直方圖,箱形圖和瀑布圖。圖表種類越來越多,並不需要都掌握的,有些圖表屬於比較專業的領域,你不會也沒什麼關係。只要知道常用的圖表怎麼用,就OK了!當然我們也可以改為柱形圖比較各省市人口數量(數據來源:第六次人口普查)
  • Tableau 技巧(84):使用盒須圖查看你的數據分布
    如果你想顯示一組數據的分布情況:例如:一目了然地理解數據,查看數據如何向某一段偏斜,查看數據中的異常值。建議使用盒須圖,它是顯示數據分布情況的重要方式。盒須圖,從名稱上可以看出,這種圖表包含兩個部分:在很多分析工具裡,盒須圖的製作過程非常繁瑣,經常令數據粉望而卻步。
  • 數據分析入門系列教程-常用圖表
    當然也有三維散點圖,不過使用的並不是很多折線圖折線圖可以很好的呈現數據隨著時間遷移的變化趨勢直方圖直方圖把橫坐標等分成一定數量的區間,然後再每個區間內用矩形條展示該區間內的數值,可以很好的查看數據的分布情況條形圖條形圖可以查看數據中不同類別之間的分布請求
  • 數據可視化圖表的使用方式及最佳做法,你用對了嗎?
    編輯導語:我們在工作中經常會用到數據,如今為了更加方便的數據圖表,一些企業採用數據可視化圖表,製作數據可視化大屏;本文作者介紹了數據可視化圖表的使用方式以及最佳做法,我們一起來學習一下。
  • Python數據可視化-seaborn Iris鳶尾花數據
    StripplotStripplot的本質就是把數據集中具有quantitative屬性的變量按照類別去做散點圖(Scatterplot)。我們將紙鳶花數據集中不同種類花的sepal length做stripplot可視化上邊左側的圖片便是在默認風格下用stripplot繪製的散點圖。
  • python數據科學系列:seaborn入門詳細教程
    python數據分析三劍客進行了逐一詳細入門介紹,今天推出系列第4篇教程:seaborn。2. 多變量分布單變量分布僅可用於觀察單一維度的變化關係,為了探究多變量間分布關係時,如下繪圖接口更為有效:joint意為聯合,顧名思義jointplot是一個雙變量分布圖表接口。
  • 【數據分析必備】十三種數據可視化圖表,哪一個適合您?
    箱形圖又稱盒須圖,是顯示數據分布情況的重要方式。其名稱顯示這種圖的兩個部分:盒,包含數據的中位數,以及第 1 和第 3 個四分位數(比中位數分別大、小 25%);須,一般代表四分位距 1.5 倍以內的數據(第 1 和第 3 個四分位數之間的差)。「須」也可用來顯示數據內的最高和最低點。什麼情況下使用箱形圖?