Seaborn可視化-箱型圖 seaborn.boxplot

2021-01-11 騰訊網

箱型圖的作用:

1.直觀明了地識別數據批中的異常值 其實箱線圖判斷異常值的標準以四分位數和四分位距為基礎,四分位數具有一定的耐抗性,多達25%的數據可以變得任意遠而不會很大地擾動四分位數,所以異常值不會影響箱形圖的數據形狀,箱線圖識別異常值的結果比較客觀。由此可見,箱型圖在識別異常值方面有一定的優越性。

2.利用箱型圖判斷數據批的偏態和尾重 對於標準正態分布的樣本,只有極少值為異常值。異常值越多說明尾部越重,自由度越小(即自由變動的量的個數);而偏態表示偏離程度,異常值集中在較小值一側,則分布呈左偏態;異常值集中在較大值一側,則分布呈右偏態。

函數原型

seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)

導入數據

tips = pd.read_csv('tips.csv')tips.head()

繪製total_bill的箱型圖

sns.boxplot(x=tips["total_bill"])

以day為x軸,total_bill為y軸繪製箱型圖

sns.boxplot(x="day", y="total_bill", data=tips)

以day為x軸,total_bill為y軸,按照smoke區分類別,調色方案為Set3,繪製箱型圖

sns.boxplot(x="day", y="total_bill", hue="smoker", data=tips, palette="Set3")

以day為x軸,total_bill為y軸,按照time區分類別,描邊寬度為1.5,繪製箱型圖

sns.boxplot(x="day", y="total_bill", hue="time", data=tips, linewidth=1.5)

導入鳶尾花數據

iris = pd.read_csv('iris.csv')iris.head()

繪製鳶尾花數據箱型圖

sns.boxplot(data=iris, orient="h", palette="Set2")

區分數據類別繪製箱型圖

tips["weekend"] = tips["day"].isin(["Sat", "Sun"])ax = sns.boxplot(x="day", y="total_bill", hue="weekend", data=tips, dodge=False)

以上就是箱型圖的分享,下期我們將分享小提琴圖seborn.violinplot的繪製方法。

如果喜歡,請點讚和收藏,這對我非常重要,萬分感謝。

相關焦點

  • 用Seaborn繪製圖表
    使用seaborn和Pokemon(口袋妖怪)數據集的屬性,我們將創建一些非常有趣的可視化效果。我們首先要看的是散點圖。散點圖散點圖使用點來表示不同數值變量的值。每個點在水平軸和垂直軸上的位置表示單個數據點的值。它們用於觀察變量之間的關係。在seaborn中製作散點圖只需要使用「lmplot」函數。
  • 14個Seaborn數據可視化圖
    數據可視化在數據挖掘中起著非常重要的作用。各種數據科學家花費了他們的時間通過可視化來探索數據。為了加快這一進程,我們需要有合適的工具。沒有規劃的情況下,資源也無法轉化為有價值的商品。因此,我希望本文能夠為您提供關於所有可視化方法的架構。目錄簡介了解你的數據分布曲線a. 直方圖b. 聯合圖c. 配對圖d. Rug圖分布圖a. 條形圖b.
  • 技能分享|Python數據可視化利器:Seaborn使用方法(一)
    (數據連結:https://pan.baidu.com/s/19sdHiB5PRy-VSc3S0sYDnQ)04基礎的直方圖、曲線圖等我們就不再一一示範,本篇中,我們主要示範散點圖、箱線圖、小提琴圖、單變量密度估計圖、雙變量密度估計圖、熱力圖、矩陣散點圖的繪製。
  • 小白也能看懂的seaborn入門示例
    seaborn一共有5個大類21種圖,分別是:relplot() 關係類圖表的接口,其實是下面兩種圖的集成,通過指定kind參數可以畫出下面的兩種圖scatterplot() 散點圖lineplot() 折線圖stripplot() 分類散點圖swarmplot() 能夠顯示分布密度的分類散點圖boxplot()
  • Python可視化Seaborn庫詳解——繪圖方法
    01繪圖方法分類結合圖形的性質,將常規的可視化圖形分為了三類。import seaborn as snsimport pandas as pdimport numpy as npdata_raw=pd.read_csv("數據源/Titanic/train.csv")df=data_raw.copy()df.columns=[x.lower() for x in df.columns]relplotrelplot函數和待會要介紹的catplot
  • 韋編|五分鐘學會Seaborn常用圖表繪製
    Seaborn是基於matplotlib的Python數據可視化庫。它提供了一個高級界面,用於繪製引人入勝且內容豐富的統計圖形。使用Seaborn可以輕鬆查看多個變量之間的關係,分類顯示觀察結果或統計匯總信息,還可以隨意設置顏色,是數據分析的必備工具之一。Seaborn 根據數據特徵分為五種類型:關係圖、分類圖、分布圖、回歸圖、矩陣圖。五個類型共21種圖。
  • Python可視化23|seaborn.distplot單變量分布圖(直方圖|核密度圖)
    本文介紹seaborn.distplot繪製單變量分布圖(直方圖及核密度圖)。數據準備繪製直方圖hist修改直方圖hist中箱子數bins 直方圖成箱方式 繪製核密度曲線kernel density estimate (KDE)seaborn.kdeplot繪製窄寬度核密度曲線 bandwidth (bw),控制核密度曲線胖瘦核密度曲線結合直方圖fit參數seaborn.distplot
  • python可視化(三)seaborn單變量分析繪圖(直方圖、條形圖)
    在前面兩篇文章中,我們已經學習了seaborn繪圖的風格和顏色設置,從本篇文章開始,我們開始選一些有意思的數據集進行各種圖形繪製,在實踐中感受數據可視化的魅力。本篇文章主要講2個繪圖函數,那就是繪製直方圖的函數seaborn,distplot()和繪製條形圖的函數seaborn.barplot()(關於直方圖和條形圖的區別請查閱前面matplotlib系列中的相關文章)。處理繪圖數據今天我們用直方圖和條形圖展示下NBA2017-2018賽季各球員薪資情況。
  • python數據可視化(一)seaborn介紹及繪圖風格設置
    seaborn庫是對matplotlib庫更高級別的封裝,相當於提供了各種統計圖的模板,我們只需要將自己的數據傳入相應的方法即可,所以說,如果你學懂了前面matplotlib中的基礎繪圖方法的話,學習本主題內容將非常輕鬆(註:由於系統編輯器限制,所有代碼行有加粗的無序列表表示。)首先,我們還是來看一下seaborn庫主要學習的內容及篇幅安排。
  • Seaborn可視化-核密度分布圖 seaborn.kdeplot
    通過核密度估計圖可以比較直觀的看出數據樣本本身的分布特徵。具體用法如下。True, shade_lowest=False) 以上就是核密度分布圖的分享,下期我們將分享熱力圖seaborn.heatmap
  • 使用Seaborn和Pandas進行相關性分析和可視化
    r值公式讓我們通過一個簡單的數據集進行相關性的可視化它具有以下列,重量,年齡(以月為單位),乳牙數量和眼睛顏色。眼睛顏色列已分類為1 =藍色,2 =綠色和3 = 棕色。讓我們使用以上數據繪製3個散點圖。
  • python可視化
    這些包括 -bar或barh為條形hist為直方圖boxplot為盒型圖area為「面積」scatter為散點圖條形圖import pandas as pdimport numpy as npdf = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])df.plot.bar()要生成一個堆積條形圖,通過指定
  • Seaborn的6個簡單技巧
    我希望這些簡單的技巧能幫助你得到更好看的圖。基線圖本文中的腳本在Jupyter筆記本中的python3.8.3中進行了測試。讓我們使用Seaborn內置的penguins數據集作為樣本數據:# 導入包import matplotlib.pyplot as pltimport seaborn as sns# 導入數據df = sns.load_dataset('penguins').rename(columns={'sex': 'gender'})df我們將使用默認圖表設置構建標準散點圖
  • Python數據可視化:用Seaborn繪製高端玩家版散點圖
    散點圖是用於研究兩個變量之間關係的經典的和基本的圖表。如果數據中有多個組,則可能需要以不同顏色可視化每個組。  今天我們畫普通散點圖、邊際分布線性回歸散點圖、散點圖矩陣、帶線性回歸最佳擬合線的散點圖  本文示例多是來自官方文檔,這裡我只是做一下整理,讓大家知道散點圖的不同玩法,不要再繪製老掉牙的普通玩家版散點圖了。  普通玩家繪製的散點圖  在 matplotlib 中,可以使用 plt.scatterplot() 方便地執行此操作。
  • Matplotlib+Seaborn:一文掌握Python可視化庫的兩大王者
    它可以直接向用戶傳遞信息,無需太多額外工作(如下圖所示)。· plt.scatter()將輸入的散點圖上的數據作為初始參數,其中temp指x軸,cnt指y軸。· c指的是不同數據點的顏色。輸入一個字符串「季節」,它也表示數據幀中的一列,不同顏色對應不同季節。該方法用可視化方法對數據分組,十分簡單便捷。
  • python數據分析常用圖大集合
    以下默認所有的操作都先導入了numpy、pandas、matplotlib、seabornimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns一、折線圖折線圖可以用來表示數據隨著時間變化的趨勢x
  • 如何用pandas更快地進行數據可視化?
    ) - 1}, columns=['a', 'b', 'c'])下面,兩行代碼就能製作堆疊/不堆疊的直方圖df.plot.hist(stacked=True, bins=20)df.plot.hist(alpha=0.5)當然包括什麼箱線圖
  • matplotlib的Python數據可視化和探索——入門指南
    這是我們將使用matplotlib設計的可視化條狀圖餅形圖箱形圖直方圖折線圖和子圖散點圖了解數據集和問題陳述在介紹不同的可視化和圖表類型之前,我想花一些時間來理解數據。這是機器學習流程中的關鍵部分,我們應該充分注意它。我們將在此matplotlib教程中分析「 食品需求預測」項目。
  • 箱線圖boxplot的多種畫法
    箱線圖能夠顯示出可能為離群點(範圍±1.5*IQR以外的值,IQR表示四分位距,即上四分位數與下四分位數的差值)的觀測。從箱線圖中,可以大致推斷出數據的集中或離散趨勢。如果想要改變箱形圖類型,調整線條大小,調整參數varwidth,實現箱子的寬度與樣本量的平方根成比例,具體代碼參考以下:set.seed(2)op <- par(no.readonly
  • 掌握Seaborn的三分之一:使用relplot進行統計繪圖
    Seaborn將其所有API分為三類:繪製統計關係、可視化數據分布和分類數據繪圖。Seaborn提供了三個高級函數,它們包含了它的大部分特徵,其中之一是relplot()。relplot()可以可視化定量變量之間的任何統計關係。在本文中,我們將介紹這個函數的幾乎所有特性,包括如何創建子圖等等。