天秀!一張圖就能徹底搞定Pandas

2020-12-22 CDA數據分析師

作者:劉早起

公眾號:早起Python

大家好,在三月初,我曾給大家分享過一份Matplotlib繪圖小抄,詳見收下這份來自GitHub的神器,一圖搞定Matplotlib!

昨天在面向GitHub編程時,無意發現了Pandas官方竟提供了同款小抄,項目地址如下

https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf

可以看到這份小抄提供了PPT和PDF兩個版本,雖然最新一條更新記錄為兩年前,但是並不影響我們拿來學習,下面我們來看看這份小抄(速查表)的強大!

這份速查表一共有兩頁,我已經將它轉換為圖片發在公眾號可能會被壓縮,你可以在文末下載高清大圖

經過一番研究,這兩張圖片一共覆蓋了12個常用的Pandas操作

1、數據創建

介紹了幾種常用的DataFrame創建語法

2、數據重塑

這部分主要是一些在數據清洗中常用的方法,比如數據連接、數據排序、數據刪除等,並且還對四個常用的操作給出了圖示,理解起來簡直不要太方便!

3、數據篩選

這一塊區域主要是分別用行/列來講解一些常用的數據查看、抽樣、切片等操作,包含了tailheadlociloc等非常重要的方法,並且同樣給出了部分動畫便於理解

4、數據探索

這一塊主要給出了一些在進行探索性分析時常用的方法,比如maxmincount等,不過官方將apply放在這裡,並沒有展開講解

5、數據修改

這兩個區域為缺失值處理和創建新的列,重點用動畫示例了assignqcut方法,缺失值處理部分僅給出了兩個方法,應該是偷懶了

6、數據分組

主要就是groupby和相關方法

7、數據連接

這裡介紹的還是非常詳細!用圖片例子來展示pd.merge中的各種參數變化的不同,一看就懂

以上就是我對這份小抄的基本概括,其實大家應該清楚,僅僅靠靠兩張圖片根本沒法把整個Pandas學明白,所以官方也有選擇性的對一些重要的方法給出了詳細的講解,而有些功能則一筆帶過,比如我之前花很大力氣介紹的pandas繪圖功能僅給出了區區一角

所以你應該這樣用這份小抄,把它當成速查表,「用於了解哪些操作可以用Pandas完成」在你不確定或者不明白如何處理數據時,通過這份速查表快速查到Pandas中的哪個方法可以完成,之後再進一步通過搜索學習對應的方法!

相關焦點

  • 如何用pandas更快地進行數據可視化?
    基本使用,學會製作套路首先我們使用pandas隨機生成示例數據import pandas as pddf= pd.DataFrame(np.random.rand(8, 4), columns=['A','B','C','D'])現在只要一行代碼,即可完成柱狀圖的繪製df.plot.bar()同樣是這個圖,如果使用Matplotlib
  • Pandas與Excel徹底拉開了距離.....
    4、專業的統計分析能力,Pandas提供了很多便捷的諸如相關性分析、時序分析、描述性統計等數據分析API。現在的就業形勢是:無論你是不是應聘數據相關的崗位,掌握pandas無疑都可以增加你的職場競爭力。心動嗎?想學嗎?
  • 一文搞定pandas的數據合併
    作者:來源於讀者投稿出品:Python數據之道一文搞定
  • Holder天秀刀妹驚豔全場,SMLZ打出翻身一戰,阿光徹底涼了?
    5分鐘,FPX三人強抓下,SMLZ率先被秒,但是RW上單刀妹趕到之後完成天秀,在RW崩盤的時候直接殺掉了FPX四人,成功扭轉了局勢。這一波大節奏過後RW感覺基本奠定了勝局了,而觀眾也是齊刷「阿光涼了」,不得不說這個新上單實在是有點秀。10分鐘,刀妹在上路又是秀氣了大蟲子,而且是殘血極限反殺,實在是太誇張了。
  • 「天秀」網友把迪士尼煙火表演拍成「火燒堡」,網友:青銅選手!
    導讀:「「天秀」網友把迪士尼煙火表演拍成「火燒堡」,網友:青銅選手!」可是有一位「天秀」網友,因為拍照功力有限,硬是將迪士尼的「煙火表演」給拍成了「火燒堡」,這還是我印象中的煙火表演嗎?這位網友還未自己喊冤,表示這是自己用大幾千塊錢拍出來的照片,為什麼會變成這樣。
  • 未明學院:7張思維導圖掌握數據分析關鍵庫pandas
    pandas與numpy一起構成了數據分析的基礎雙生庫。今天小明邀請了未明的王老師,給大家總結了pandas的核心知識,主要包括以下幾個方面。pandas核心知識01、首先我們來認識一下pandas的一些基本概念。
  • 當pandas遇上數據類型問題
    而在pandas中,一般情況下會根據我們導入的數據,自動分配最合適的數據類型。但是有時候pandas也會犯錯,這時候我們就需要diy自定義數據類型。本文主要將pandas的dtype,如何進行數據類型的操作。pands數據類型數據類型是程式語言的基礎性概念,ta會告訴電腦如何存儲數據、如何操作數據。
  • 國慶出遊必備的P圖app,出片率100%,手機就能搞定!
    以及小小p圖教程希望能幫到你們在票圈裡獲得更多點讚哦!黃油相機算是我平時用到最多的p圖軟體啦,基本上我的美妝產品圖和平時的日常它都能搞定。可以稱得上是plog之王,各種好看的中英文字體、貼紙、濾鏡、模板應有盡有。有時候抓拍到我家貓咪可愛的照片,也會用這個添加一些可愛的文字,讓圖片看起來更加生動有趣。
  • 一張圖搞定42種表情的英文表達!
    小編為大家準備了一張圖,搞定42種表情的英文說法!
  • 掌握pandas中的transform
    ❝本文示例代碼及文件已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes❞1 簡介開門見山,在pandas中,transform是一類非常實用的方法,通過它我們可以很方便地將某個或某些函數處理過程(非聚合)作用在傳入數據的每一列上,從而返回與輸入數據形狀一致的運算結果
  • 省內異地辦護照更方便了 一張身份證就能搞定
    原標題:省內異地辦護照更方便了 一張身份證就能搞定 泰安寧陽的梁先生日前去任城公安分局出入境服務大廳,僅憑一張身份證用時10分鐘就辦理了護照。此前,異地辦理護照需要提交一年以上社保繳費記錄或居住六個月以上的居住證明。
  • 使用pandas進行文件讀寫
    pandas是數據分析的利器,既然是處理數據,首先要做的當然是從文件中將數據讀取進來。
  • Pandas的crosstab函數
    但說到熱圖,課程的老師不知怎麼地引入了一個全新的pandas函數crosstab。然後,很快說:「crosstab是一個計算交叉表的有用函數…」我就在那裡不理解了。顯然,我的第一反應是查看函數的文檔。我剛開始覺得我可以處理Matplotlib的任何文檔,但是…我錯了。.
  • pandas指南:做更高效的數據科學家
    今天我要告訴你們的是:在數據科學中,有一個軟體包是你們絕對需要學習的,那就是pandas。而pandas真正有趣的地方是,很多其他的包也在裡面。pandas是一個核心包,因此它具有來自其他各種包的特性。
  • 再見Numpy,Pandas!又一個數據分析神器橫空出現!
    但是面對大數據的處理時,像是numpy和pandas的在加載數據時,會看到內存用量的飆升,而dask卻可以將這些大的數據進行並行計算。今天小編就帶領大家學習一個並行的計算庫——dask。dask可以幫助我們並行化處理pandas的DataFrame和numpy的計算,甚至是並行化處理機器學習算法。01.dask庫的使用介紹dask庫可以很好的兼容pandas的DataFrame數據和numpy的array數據,此外,像是Sklearn、XGBoost等機器學習庫,dask也能夠支持。
  • Pandas數據可視化原來也這麼厲害
    並且種類也比較豐富。比如這個圖,就非常厲害:畫圖神器pyecharts-旭日圖Pandas:而今天要講的是Pandas的可視化,Pandas主要作為數據分析的庫,雖然沒有上述三個庫那個強大,但是勝在方便,在數據分析的過程中,只要一行代碼就能實現。並且圖形也非常漂亮。
  • 一張圖搞不定介詞
    俗話說,一圖勝千言,圖片在某些領域的確比文字好使,但話也不能亂說,說什麼一張圖搞定介詞,這不是害人嗎。我為什麼這麼說?因為不少人為了騙點擊量,跑去當標題黨,並且在他(她)的內容裡「證明」了一張圖可以搞定介詞。我會在後續的課程中證明,他們都是錯的。英語學習亂象這麼多,為什麼單獨把介詞拎出來說事?因為亂象太多,不可能在一開始就全部展開來說。
  • 一張圖就能告訴你 什麼叫讓球!
    一張圖就能告訴你 什麼叫讓球!(本圖來源網絡,侵刪)讓球還分成主隊讓球和客隊讓球。如何判斷是主隊讓球還是客隊讓球呢?很簡單:看賠率!圖一是主隊實力更強,所以是主隊讓球。
  • 超全的pandas數據分析常用函數總結:下篇
    為了更好地學習數據分析,我對於數據分析中pandas這一模塊裡面常用的函數進行了總結。整篇總結,在詳盡且通俗易懂的基礎上,我力求使其有很強的條理性和邏輯性,所以製作了思維導圖,對於每一個值得深究的函數用法,我也會附上官方連結,方便大家繼續深入學習。
  • 利用Python中的pandas(date_range)庫生成時間序列(time series)
    在講pandas時間序列函數之前,我大概介紹下什麼是時間序列(time series)。時間序列(time series)簡單的說就是各時間點上形成的數值序列,時間序列(time series)分析就是通過觀察歷史數據預測未來的值。比如股票預測、房價預測分析等。本篇文章主要詳細講解生成時間索引的函數date_range及延伸函數。