數據透視表是將數據進行分類匯總,統計分析的強大工具。通過設置新的行標籤index和列標籤columns,指定需要被統計分析的數值values,指定採用的統計聚合函數aggfunc等,利用數據透視表可以對原始數據表進行多種視角的分析和不同方式的重塑,因而稱之為透視表。
在Python的Pandas中,可以用groupby方法或pivot_table函數完成分類匯總,實現數據透視表的功能。groupby是先分組,然後選擇聚合函數,生成透視表。pivot_table則是直接通過設置index,columns,values,aggfunc等參數生成透視表。
一,Excel中的數據透視表
Excel中的數據透視表可以設置行(index),列(columns),值(values),並通過值欄位設置選擇聚合函數。圖形界面操作相對簡單,但不夠靈活和強大。
二,pivot_table數據透視表
相比較Excel中的數據透視表,使用pandas的pivot_table函數來實現數據透視表,將十分靈活和強大。
構造dataframe數據
1,index參數
2,columns參數
3,values 參數
4,aggfunc 參數
5,pivot_table參數總覽
三,groupby數據分組功能
利用groupby方法分組功能配合聚合函數也能夠實現數據透視表效果,這也是數據分析中非常常用的方法。示範操作如下。
推薦閱讀
8,二維dataframe —— 類Series操作
9,二維dataframe —— 類array操作
10,二維dataframe —— 類excel操作
11,二維dataframe —— 類SQL操作