Python數據可視化:用Seaborn繪製高端玩家版散點圖

2021-01-15 網易

  

  散點圖是用於研究兩個變量之間關係的經典的和基本的圖表。如果數據中有多個組,則可能需要以不同顏色可視化每個組。

  今天我們畫普通散點圖、邊際分布線性回歸散點圖、散點圖矩陣、帶線性回歸最佳擬合線的散點圖

  本文示例多是來自官方文檔,這裡我只是做一下整理,讓大家知道散點圖的不同玩法,不要再繪製老掉牙的普通玩家版散點圖了。

  普通玩家繪製的散點圖

  在 matplotlib 中,可以使用 plt.scatterplot() 方便地執行此操作。

  import numpy as np
import matplotlib.pyplot as plt

  # Fixing random state for reproducibility
np.random.seed(19680801)

  N = 50
x = np.random.rand(N)
y = np.random.rand(N)
colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2 # 0 to 15 point radii

  plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()
matplotlib散點圖升級版

  散點的大小、形狀、顏色和透明度都是可以修改的,來看一個升級版。

  import matplotlib.pyplot as plt
import numpy as np

  N = 10
x = np.random.rand(N)
y = np.random.rand(N)
# 每個點隨機大小
s = (30*np.random.rand(N))**2
# 隨機顏色
c = np.random.rand(N)
plt.scatter(x, y, s=s, c=c, alpha=0.5)
plt.show()
Seaborn散點圖 + 分布圖#創建數據
rs = np.random.RandomState(2)
df = pd.DataFrame(rs.randn(200,2), columns = ['A','B'])

  sns.jointplot(x=df['A'], y=df['B'], #設置xy軸,顯示columns名稱
data = df, #設置數據
color = 'b', #設置顏色
s = 50, edgecolor = 'w', linewidth = 1,#設置散點大小、邊緣顏色及寬度(只針對scatter)
stat_func=sci.pearsonr,
kind = 'scatter',#設置類型:'scatter','reg','resid','kde','hex'
#stat_func=,
space = 0.1, #設置散點圖和布局圖的間距
size = 8, #圖表大小(自動調整為正方形))
ratio = 5, #散點圖與布局圖高度比,整型
marginal_kws = dict(bins=15, rug =True), #設置柱狀圖箱數,是否設置rug
)
帶線性回歸最佳擬合線的散點圖

  如果你想了解兩個變量如何相互改變,那麼最佳擬合線就是常用的方法。下圖顯示了數據中各組之間最佳擬合線的差異。要禁用分組並僅為整個數據集繪製一條最佳擬合線,請從下面的 sns.lmplot()調用中刪除 hue ='cyl'參數。

  import seaborn as sns
sns.set()

  tips = sns.load_dataset("tips")
g = sns.jointplot("total_bill", "tip", data=tips,
kind="reg", truncate=False,
xlim=(0, 60), ylim=(0, 12),
color="m", height=7)
矩陣散點圖

  矩陣散點圖 - pairplot()

  #設置風格
sns.set_style('white')
#讀取數據
iris = sns.load_dataset('iris')
print(iris.head())
sns.pairplot(iris,
kind = 'scatter', #散點圖/回歸分布圖{'scatter', 'reg'})
diag_kind = 'hist', #直方圖/密度圖{'hist', 'kde'}
hue = 'species', #按照某一欄位進行分類
palette = 'husl', #設置調色板
markers = ['o', 's', 'D'], #設置不同系列的點樣式(這裡根據參考分類個數)
size = 2 #圖標大小
)

  

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

  • 技能分享|Python數據可視化利器:Seaborn使用方法(一)
    (數據連結:https://pan.baidu.com/s/19sdHiB5PRy-VSc3S0sYDnQ)04基礎的直方圖、曲線圖等我們就不再一一示範,本篇中,我們主要示範散點圖、箱線圖、小提琴圖、單變量密度估計圖、雙變量密度估計圖、熱力圖、矩陣散點圖的繪製。
  • Python學習第90課-數據可視化之散點圖繪製
    【每天幾分鐘,從零入門python編程的世界!】今天我們學習散點圖,在統計學或者機器學習方面,或者在金融風險控制方面,金融風險控制經常要看異常交易、信貸風險,做這樣的分析就要用到一個圖--散點圖(scatter plot)。
  • 用Seaborn繪製圖表
    使用seaborn和Pokemon(口袋妖怪)數據集的屬性,我們將創建一些非常有趣的可視化效果。我們首先要看的是散點圖。散點圖散點圖使用點來表示不同數值變量的值。每個點在水平軸和垂直軸上的位置表示單個數據點的值。它們用於觀察變量之間的關係。在seaborn中製作散點圖只需要使用「lmplot」函數。
  • python可視化(三)seaborn單變量分析繪圖(直方圖、條形圖)
    在前面兩篇文章中,我們已經學習了seaborn繪圖的風格和顏色設置,從本篇文章開始,我們開始選一些有意思的數據集進行各種圖形繪製,在實踐中感受數據可視化的魅力。本篇文章主要講2個繪圖函數,那就是繪製直方圖的函數seaborn,distplot()和繪製條形圖的函數seaborn.barplot()(關於直方圖和條形圖的區別請查閱前面matplotlib系列中的相關文章)。處理繪圖數據今天我們用直方圖和條形圖展示下NBA2017-2018賽季各球員薪資情況。
  • Python可視化Seaborn庫詳解——繪圖方法
    其中,線性關系所涉及到的是折線圖和散點圖,這兩類圖形在日常運用中非常常見;分類關係主要是描述不同維度下數據的統計結果,如條形圖、箱圖等;組合關係就類似於高級程序語言,它是由不同的基礎圖形組合而來的。下面我們將一一介紹這些繪圖方法。
  • 14個Seaborn數據可視化圖
    配對圖d. Rug圖分布圖a. 條形圖b. 統計圖c. 箱型圖d. Violin圖高級繪製方法a. Strip圖b. Swarm圖矩陣圖a. Heat Mapb. Cluster Map網格a. Facet Grid回歸圖簡介Seaborn是一個基於matplotlib的Python數據可視化庫。它提供了一個高級界面,以繪製曲線和信息統計圖形。
  • python數據可視化(一)seaborn介紹及繪圖風格設置
    seaborn庫是對matplotlib庫更高級別的封裝,相當於提供了各種統計圖的模板,我們只需要將自己的數據傳入相應的方法即可,所以說,如果你學懂了前面matplotlib中的基礎繪圖方法的話,學習本主題內容將非常輕鬆(註:由於系統編輯器限制,所有代碼行有加粗的無序列表表示。)首先,我們還是來看一下seaborn庫主要學習的內容及篇幅安排。
  • 用Python演繹5種常見可視化視圖
    注意:想要更深層次的理解,需要自己動手跑代碼,體驗數據可視化過程如果你想要用Python進行數據分析,就需要在項目初期開始進行探索性的數據分析,這樣方便你對數據有一定的了解。其中最直觀的就是採用數據可視化技術,這樣,數據不僅一目了然,而且更容易被解讀。
  • Python數據可視化之高速繪圖神器PyQtGraph庫,強烈建議收藏
    但是這些繪圖庫也存在著不足,即在圖形繪製速度上有所欠缺,特別是對於科研算法方面的數據可視化,很多情況需要實時繪圖,要求能夠提供儘可能快的繪製刷新速度,那這些庫顯的有些力不從心了。而我們下面要介紹的繪圖庫-PyQtGraph庫,則在繪圖速度方面表現尤其突出,在不失繪圖美觀、功能強大的前提下,在繪圖速度方面作了極大的優化,特別適合於實時數據採集的動態圖形繪製場合。
  • 數據可視化最有價值的50個圖表 | 網際網路數據資訊網-199IT | 中文...
    在數據分析和可視化中最有用的 50 個 Matplotlib 圖表。 這些圖表列表允許您使用 python 的 matplotlib 和 seaborn 庫選擇要顯示的可視化對象。這些圖表根據可視化目標的7個不同情景進行分組。 例如,如果要想像兩個變量之間的關係,請查看「關聯」部分下的圖表。 或者,如果您想要顯示值如何隨時間變化,請查看「變化」部分,依此類推。
  • python可視化
    Boxplot可以繪製調用Series.box.plot()和DataFrame.box.plot()或DataFrame.boxplot()來可視化每列中值的分布。一幅數據圖基本上包括如下結構:Data: 數據區,包括數據點、描繪形狀Axis: 坐標軸,包括 X 軸、 Y 軸及其標籤、刻度尺及其標籤Title: 標題,數據圖的描述Legend: 圖例,區分圖中包含的多種曲線或不同分類的數據其他的還有圖形文本 (Text)、註解 (Annotate)等其他描述3.畫法下面以常規圖為例,詳細記錄作圖流程及技巧。
  • 超硬核的 Python 數據可視化教程!
    Python實現可視化的三個步驟:確定問題,選擇圖形 轉換數據,應用函數 參數設置,一目了然 1、首先,要知道我們用哪些庫來畫圖?matplotlibpython中最基本的作圖庫就是matplotlib,是一個最基礎的Python可視化庫,一般都是從matplotlib上手Python數據可視化,然後開始做縱向與橫向拓展。
  • 如何用pandas更快地進行數據可視化?
    作者:劉早起來源:早起Python(公眾號)如果你經常使用Python進行數據分析,那麼對於pandas一定不會陌生,但是Pandas除了在數據處理上大放異彩,隨著版本的不斷更新,Pandas的繪圖功能在某些情況下甚至要比matplotlib更加適用,本文就將介紹如何用
  • 數據可視化·圖表篇——散點圖
    大家好,上周介紹完餅圖之後,您有沒有親自動手嘗試一下呢?今天小數要帶大家熟悉的是散點圖,本文圖表生成所用工具仍然是大眾熟知的Excel。說到散點圖,它既能用來呈現數據點的分布,表現兩個元素的相關性,也能像折線圖一樣表示時間推移下的發展趨勢。可以說是最靈活多變的圖表類型。大數據時代,人們更關注數據之間的相關關係而非因果關係。
  • 5個可以幫助pandas進行數據預處理的可視化圖表
    第1步-我們將導入pandas、matplotlib、seaborn和NumPy包,我們將使用這些包進行分析。我們需要散點圖、自相關圖、滯後圖和平行圖。我們將使用「mpg」、「tips」和「attention」數據進行可視化。數據集是在seaborn中使用load_dataset方法加載的。
  • matplotlib的Python數據可視化和探索——入門指南
    Matplotlib提供了一種簡單而全面的可視化方法來介紹我們的發現。我們將在本教程中很快看到,有很多可視化可供選擇,以展示我們的結果。從直方圖到散點圖,matplotlib設置了一系列顏色,主題,調色板和其他選項以自定義和個性化我們的圖。無論您是在為機器學習項目執行數據探索,還是只是想創建令人眼花and亂的圖表,matplotlib都非常有用。
  • Python數據可視化實例之繪製圖表
    Python數據可視化實例之繪製圖表原創 蟲蟲安全 2018-09-05 17:41:57得利於語言的簡單明了、豐富的數據結構、豐富的類和模塊,Python如今成了數據科學中的香餑餑,成了matlab、R語言之外又一強大的數據分析工具。拋開其他方面的、今天蟲蟲帶大家一起來探索Python在數據可視化方面的應用。
  • Matplotlib+Seaborn:一文掌握Python可視化庫的兩大王者
    接下來看看如何使用matploblib生成散點圖。提示:當使用matplotlib時,文本輸出無法帶來視覺上的吸引力。為了解決這個問題,我們在執行代碼塊生成圖片時會在每一行代碼末端添加分號「;」。我們使用的資料庫是UCI機器學習庫中的共享單車數據集。Matplotlib: 散點圖散點圖是各種示意圖中影響力最廣、信息量最大、功能最多的一類圖。
  • 可視化工具不知道怎麼選?深度評測5大Python數據可視化工具
    作者 | 劉早起來源 | 早起Python(ID: zaoqi-python)相信很多讀者學習Python就是希望作出各種酷炫的可視化圖表,當然你一定會聽說過Matplotlib、Pyecharts、Seaborn、Plotly、Bokeh這五大工具,本文就將通過真實繪圖來深度評測這五個Python數據可視化的庫,看看到底這幾種工具各有什麼優缺點
  • Python可視化23|seaborn.distplot單變量分布圖(直方圖|核密度圖)
    本文介紹seaborn.distplot繪製單變量分布圖(直方圖及核密度圖)。本文內容概要 目錄 1、seaborn.distplot數據準備繪製直方圖hist修改直方圖hist中箱子數bins 直方圖成箱方式 繪製核密度曲線kernel