Python在數據分析領域之所以牛,很大程度上是因為Pandas這個庫是在是太好用,廣泛應用於數據處理、數據分析等領域。
回想起自己剛畢業那會,要做很多處理,總是自己的讀取文件、篩選過濾、關聯文件、聚合統計、繪製圖表等等工作都是用Python原生語法實現,效率極其低下並且容易出錯,當我後來接觸到Pandas簡直喜愛的要哭。
在Python的庫中,Pandas是目前的最愛,將它的能力進行梳理:
1、直接按格式讀取超多數據源的數據,比如text、json、html、mysql等;
2、對數據清洗過濾、篩選、格式轉換;
3、方便的數據關聯、合併、分組統計;
4、強大的時間日期處理功能;
5、無縫對接matplot畫圖、也能很快的轉換到我喜歡的pyecharts畫圖;
6、快速的導出數據到mysql、excel、txt等等
7、與sklearn、tensorflow等機器學習深度學習庫的方便對接;
今天在網絡上發現了一張Pandas語法速記圖,來自官方文檔,地址在github:
https://github.com/pandas-dev/pandas/tree/master/doc
我也將其轉換成了一個大圖,分享給大家:
如果想要提升自己的Python水平,從基礎入門到高手熟練,Pandas必定是要掌握的一個庫。