2015-11-19 大數據文摘
關於轉載授權
大數據文摘作品,歡迎個人轉發朋友圈,自媒體、媒體、機構轉載務必申請授權,後臺留言「機構名稱+轉載」,申請過授權的不必再次申請,只要按約定轉載即可,但文末需放置大數據文摘二維碼。
編譯|黃念
校對|丁一
引言
藝術之美根植於其所傳達的信息。有時候,現實並非我們所看到或感知到的。達文西(Da Vinci)和畢卡索(Picasso)等藝術家都通過其具有特定主題的非凡藝術品,試圖讓人們更加接近現實。
數據科學家並不遜色於藝術家。他們用數據可視化的方式繪畫,試圖展現數據內隱藏的模式或表達對數據的見解。更有趣的是,一旦接觸到任何可視化的內容、數據時,人類會有更強烈的知覺、認知和交流。
在數據科學中,有多種工具可以進行可視化。在本文中,我展示了使用Python來實現的各種可視化圖表。
怎樣才能在Python中實現可視化?
涉及到的東西並不多!Python已經讓你很容易就能實現可視化——只需藉助可視化的兩個專屬庫(libraries),俗稱matplotlib和seaborn。聽說過嗎?
Matplotlib:基於Python的繪圖庫為matplotlib提供了完整的2D和有限3D圖形支持。這對在跨平臺互動環境中發布高質量圖片很有用。它也可用於動畫。
Seaborn:Seaborn是一個Python中用於創建信息豐富和有吸引力的統計圖形庫。這個庫是基於matplotlib的。Seaborn提供多種功能,如內置主題、調色板、函數和工具,來實現單因素、雙因素、線性回歸、數據矩陣、統計時間序列等的可視化,以讓我們來進一步構建複雜的可視化。
我能做哪些不同的可視化?
剛出版不久的《A comprehensive guide on Data Visualization》中,介紹了最常用的可視化技術。在進一步深入學習前,如果你尚未閱讀此書,我們建議你參考此書。
以下是Python代碼與其輸出結果。我就是用下面的數據集來創建這些可視化的。
導入數據集
1.直方圖
2.箱線圖
3.小提琴圖
4.條形圖
5.折線圖
6.堆積柱形圖
7.散點圖
8.氣泡圖
9.餅圖
10.熱圖
、
你可以嘗試繪製基於兩個變量的熱圖,如X軸為性別,Y軸為BMI,數據點為銷售值。
結語
現在,你肯定已經意識到了數據可視化的美妙,為什麼不自己動手試試呢?在以後的文章中,我們還將探討用Python實現地圖可視化和詞雲。
大數據文摘也曾經發布過用R進行數據可視化的文章,《用R語言進行數據可視化的綜合指南(一)》和《用R語言進行數據可視化的綜合指南(二)》。大家可以參考一下,做個對比。
【限時乾貨下載】
2015/11/30前
2015年10月乾貨文件打包下載,請點擊大數據文摘底部菜單:下載等--10月下載
大數據文摘精彩文章:
回復【金融】 看【金融與商業】專欄歷史期刊文章
回復【可視化】感受技術與藝術的完美結合
回復【安全】 關於洩密、黑客、攻防的新鮮案例
回復【算法】 既漲知識又有趣的人和事
回復【谷歌】 看其在大數據領域的舉措
回復【院士】 看眾多院士如何講大數據
回復【隱私】 看看在大數據時代還有多少隱私
回復【醫療】 查看醫療領域文章6篇
回復【徵信】 大數據徵信專題四篇
回復【大國】 「大數據國家檔案」之美國等12國
回復【體育】 大數據在網球、NBA等應用案例
長按指紋,即可關注「大數據文摘」
專注大數據,每日有分享
覆蓋千萬讀者的WeMedia聯盟成員之一