數據可視化·圖表篇——散點圖

2021-01-10 DataHunter

大家好,上周介紹完餅圖之後,您有沒有親自動手嘗試一下呢?

今天小數要帶大家熟悉的是散點圖,本文圖表生成所用工具仍然是大眾熟知的Excel。

說到散點圖,它既能用來呈現數據點的分布,表現兩個元素的相關性,也能像折線圖一樣表示時間推移下的發展趨勢。可以說是最靈活多變的圖表類型。

大數據時代,人們更關注數據之間的相關關係而非因果關係。那麼如何考量各變量之間的相關關係呢?散點圖就是一種最直觀簡單的形式。

散點圖的特點?

適用於展現兩個或三個變量之間的關係

數據量越大,散點圖發揮的作用越好

需要關注離群點(異常點)對整體的影響

普通散點圖與可視化

在實際應用中使用頻率最多的是二維散點圖和三維散點圖,而三維散點圖又與氣泡圖有密切關係,我們後面會提到。

二維散點圖的製作相對簡單,無需特殊設置。可視化方面其實也還是咱們的老套路,這裡再通過一個例子帶大家簡單過一遍。

小數收集了某餐館服務滿意度與排隊時間相關的15組數據,導入Excel ,直接生成散點圖如下:

可視化操作步驟:

背景顏色應用(還是以 DataHunter 的 logo 綠為主哦~)

字體顏色、數據點顏色調整

淡化坐標網格線

插入趨勢線。這是散點圖的特色,為了分析兩個變量之間的關係,我們通常會引入趨勢線,Excel中目前給我們提供了線性、指數、線性預測、雙周期移動平均等多種類型選擇。

現實操作中判斷兩個變量之間的關係類型,還需要引入回歸分析等方法,我在這裡只是作為可視化的一個簡單舉例,所以就直接插入了線性趨勢線。

優化後如下圖所示:

曲線圖

在Excel 的散點圖分類中,我們還可以看到一類變體的散點圖——曲線圖。它經常被用來表示某個變量隨時間變量變化的趨勢,與折線圖的功能類似。

我將自己最近30天的步行數作為數據源,然後生成曲線圖。

這裡不再贅述可視化過程,與普通散點圖基本相同(通過線條填充半透明處理、背景漸變填充、日期格式和坐標軸調整等)

氣泡圖

氣泡圖與散點圖最直觀的區別為:散點圖中的數據點長得都一樣,氣泡圖中的氣泡卻大小不同。因為氣泡圖在原先散點圖的基礎上引入了第三個值來控制氣泡的大小。

舉個例子,我將某校30名學生的期末成績與其對應的出勤率作為x值和y值,並引入「去圖書館的時間」作為z值,默認生成氣泡圖如下:

氣泡擠在一起了,怎麼辦呢?

調整坐標軸,將出勤率和分數的最小值和最大值進行修改,調整相應顏色,然後再插入趨勢線,就得到了下圖:

可以看出,除了出勤率與分數之間有簡單的正相關關係外,分數越高的同學,去圖書館的時間也相對較高(氣泡普遍更大)。

最後再強調一下:散點圖實際應用中更適合大範圍的數據,本篇文章中的舉例只是為了說明問題,所以數據量都不大。

小結

散點圖適用於研究大規模數據中兩個變量之間的相關關係

氣泡圖可用於研究展示三個變量之間的關係

曲線圖作為一種特殊的散點圖,適用於研究連續變量的變化趨勢。

題外話:其實看到這些散點圖,總讓小數想起一款大圓吃小圓的網頁遊戲,當初我也是沉溺其中,無法自拔,它的頁面如下圖,遊戲規則挺有意思的,感興趣的小夥伴可以去體驗一下~

最後,基礎圖表篇的可視化系列文章很快就要結束啦,下個系列大家想了解點啥呢?留言給小數,你想要的內容,統統給你!

相關焦點

  • 散點圖、箱線圖、核密度函數……數據分析必備的9種可視化圖表
    ,可視化技術可是數據科學家的必備技能之一。散點圖這是一種將兩個連續變量之間的關係可視化的完美圖表。通過散點圖來分析萼片長度和萼片寬度的關係。此外,還將subplots參數設置為True,因為在默認情況下,所有的列都會顯示在同一個圖表上。散點矩陣圖這是我最喜歡的數據分析的可視化技術之一,因為它可以對數據集中的所有數值及其相關性進行快速分析。
  • 數據可視化之旅(三):數據圖表的選擇(中)
    作者 | Destiny 來源 | 木東居士 0x00 前言數據圖表的選擇(上),分享了「時序數據」和「比例數據」的可視化圖表方案。不同的數據類型、不同的闡述目的,決定了數據可視化展現形式的差異。因此,今天這篇文章,主要是分享兩類不同的可視化目的及其可選擇的圖表形式。「對比型數據」:對比兩組或兩組以上數據的差異。
  • 數據可視化當中的圖表組合:比例面積圖
    編輯導讀:優秀的數據可視化依賴優異的設計,並非僅僅選擇正確的圖表模板那麼簡單,數據可視化可以幫助用戶更好地理解數據、運用數據。本文作者從自身經驗出發,結合具體案例分享了比例面積圖的不同組合形式,供大家一同參考學習。
  • Python數據可視化:用Seaborn繪製高端玩家版散點圖
    散點圖是用於研究兩個變量之間關係的經典的和基本的圖表。如果數據中有多個組,則可能需要以不同顏色可視化每個組。  今天我們畫普通散點圖、邊際分布線性回歸散點圖、散點圖矩陣、帶線性回歸最佳擬合線的散點圖  本文示例多是來自官方文檔,這裡我只是做一下整理,讓大家知道散點圖的不同玩法,不要再繪製老掉牙的普通玩家版散點圖了。  普通玩家繪製的散點圖  在 matplotlib 中,可以使用 plt.scatterplot() 方便地執行此操作。
  • B端互動設計——數據可視化圖表
    選定可視化圖表類型  圖表的作用,是幫助我們更好地看懂數據。選擇什麼圖表,需要回答的首要問題是『我有什麼數據,需要用圖表做什麼』,而不是 『圖表長成什麼樣』 ,根據數據選用合適的圖表展現來把數據的信息傳達給用戶;因此我們從數據出發、熟悉每種圖表的定義、適用場景、優缺點,從功能角度對圖表進行分類,這樣才能快速選擇合適的圖表。  1)比較類圖表
  • 數據可視化,職場數據分析都需要哪些常用的圖表?
    ,便於讓讀者更高效閱讀,而不單是自己使用,通過數據可視化突出數據背後的規律,以此突出數據中的重要因素,並且,數據可視化可以將數據變得更加直觀。  使用圖表數據可視化的作用  使用圖表來展示數據主要有三個作用:  表達形象化:使用圖表可以化冗長為簡潔,化抽象為具體,化深奧為形象,使讀者或聽眾更容易理解主題和觀點。  突出重點:通過對圖表中數據的顏色和字體等信息的特別設置,可以把問題的重點有效地傳遞給讀者或聽眾。
  • 數據可視化圖表工具有哪些圖表類型?
    每到月度、季度、年度總結的時候,用到最多的、最有說服力的就是數據了。讓數據說話,擺事實、講道理才能贏得上級的肯定。 大家都聽過「數據可視化」,也知道要用直觀的圖表讓受眾理解複雜多變的數據。
  • 精心整理4大類12個圖表類型,輕鬆搞定數據可視化
    今天,我會為大家分享4大類型共12種圖表,並解釋它們適合使用的場景以供大家參考。本篇適合收藏起來,需要的時候找出來看一遍。數據報表中常用圖表:柱形圖和條形圖;折線圖統計與分析常用圖表:直方圖;散點圖產品經理常用圖表:桑基圖;熱力圖;同期群圖經常被濫用的圖表:餅圖;雷達圖;面積圖;氣泡圖數據報表中常用圖表1、柱形圖和條形圖在呈現非連續性數據指標時,常常使用柱形圖和條形圖。
  • Python數據可視化實例之繪製圖表
    Python數據可視化實例之繪製圖表原創 蟲蟲安全 2018-09-05 17:41:57得利於語言的簡單明了、豐富的數據結構、豐富的類和模塊,Python如今成了數據科學中的香餑餑,成了matlab、R語言之外又一強大的數據分析工具。拋開其他方面的、今天蟲蟲帶大家一起來探索Python在數據可視化方面的應用。
  • 數據可視化圖表的使用方式及最佳做法,你用對了嗎?
    編輯導語:我們在工作中經常會用到數據,如今為了更加方便的數據圖表,一些企業採用數據可視化圖表,製作數據可視化大屏;本文作者介紹了數據可視化圖表的使用方式以及最佳做法,我們一起來學習一下。
  • 網際網路人要了解的數據可視化 —— 基礎篇
    所以這也促使我開啟了這個系列《網際網路人需要了解的數據可視化》,希望能夠給大家帶來一些不一樣的內容,為大家梳理一個完整的數據可視化框架。今天帶來的就是這個系列的第一篇,數據可視化的概念以及數據可視化設計的基本準則。最近一直在做國際外包,時間非常的零散,而寫邏輯性強的文章又非常耗費精力。所以從開題到現在,用了將近2個月的時間才將這篇文章徹底收尾。
  • 數據可視化最有價值的50個圖表 | 網際網路數據資訊網-199IT | 中文...
    在數據分析和可視化中最有用的 50 個 Matplotlib 圖表。 這些圖表列表允許您使用 python 的 matplotlib 和 seaborn 庫選擇要顯示的可視化對象。這些圖表根據可視化目標的7個不同情景進行分組。 例如,如果要想像兩個變量之間的關係,請查看「關聯」部分下的圖表。 或者,如果您想要顯示值如何隨時間變化,請查看「變化」部分,依此類推。
  • 數據可視化圖表怎麼做才好看?
    可視化技術仿佛有一種化平凡為非凡的魔力,冷冰冰的數據,經過可視化技術的加工,便酒麴入甕般幻化成視覺的盛宴,炫酷的、繽紛的、簡約的、繁複的……數據之美被展現的淋漓盡致。複雜的比如這種:簡單的比如而我們日常使用Excel或者PPT畫圖,一般是這種千篇一律的柱形圖和折線圖,還有那一成不變的配色如何做出高大上的圖表呢?
  • 圖表遠離「重做」有多難?學會散點圖,職場新手秒變效率大神
    今天職場君給大家介紹一種數據分析工具——散點圖。散點圖稱得上是商業工作中的數據分析神器。所以,大家趕快來了解一下——通過相關分析發現潛藏在數據中的關聯關係1.用散點圖來驗證數據的相關關係數據分析中經常使用的,與數據透視表並駕齊驅的是「散點圖」。
  • 數據分析,用對圖表很重要
    如何將冰冷的數據通過直觀的可視化圖表向上級進行匯報? 在產品設計的時候涉及到數據可視化統計的界面,如何選擇核心指標以及合適的可視化圖表? ........以上只是數據分析應用的其中一部分場景,實際上還有很多。
  • 這5種數據可視化方式是數據科學家標配!
    Matplotlib是一個流行的Python庫,可以用來很容易地創建數據可視化。但是,每次執行新項目時,設置數據、參數、圖形和繪圖都會變得非常繁瑣。在這篇博客文章中,我們將著眼於5個數據可視化,並使用Python的Matplotlib為他們編寫一些快速簡單的功能。與此同時,這裡有一個很棒的圖表,用於為工作選擇正確的可視化圖表!
  • 活用這幾種統計圖,你的數據可視化逆天了
    數據可視化,顧名思義就是將相對於隱晦的數據使用可視的、交互的圖表方式展示出來,進而形象的、直觀的將數據背後隱藏的信息和規律表示出來。步入大數據時代後,各行各業對數據越來越重視,隨之而來的就是對數據進行一系列的整合、挖掘、可視化分析,這為數據可視化注入了無限的活力,也就導致視覺的元素越來越多樣,從簡單的柱狀圖、線形圖、折線圖,擴展到了氣泡圖、男女圖、地圖、餅圖、散點圖、雷達圖等各種各樣的豐富的圖形。那麼活用了以下的幾種統計圖,你的數據可視化就逆天了。
  • 淺談數據可視化
    Anscombe 在1973年在他的一篇論文 "Graphs in Statistical Analysis"中分析散點圖和線性回歸的關係裡面提到圖像表示對數據分析的重要性。他用了下面這個例子,如下有四組數據:
  • Matplotlib繪製六種可視化圖表,值得收藏
    可視化圖表,有相當多種,但常見的也就下面幾種,其他比較複雜一點,大都也是基於如下幾種進行組合,變換出來的。對於初學者來說,很容易被這官網上眾多的圖表類型給嚇著了,由於種類太多,幾種圖表的繪製方法很有可能會混淆起來。
  • excel圖表應用技巧:不同類型圖表對數據表現的意義和作用
    Excel圖表類型非常多,並且各類型有相似之處。譬如折線圖和面積圖,都可以用來表達趨勢。那什麼時候更適合用面積圖,什麼時候更適合用折線圖呢?我來看看下面這篇文章吧!學習更多技巧,請收藏關注部落窩教育excel圖文教程。 今天不講技巧,講講每位Excel使用者都無法迴避的問題。