對索引進行排序
Series用sort_index()按索引排序,sort_values()按值排序;DataFrame也是用sort_index()和sort_values()。
按行排序
按值排序
Series:
DataFrame:
刪除指定軸上的項
即刪除Series的元素或DataFrame的某一行(列)的意思,我們可以通過對象的drop(labels, axis=0)方法實現此功能。刪除Series的一個元素:
刪除DataFrame的行或列:
需要注意的是drop()返回的是一個新對象,元對象不會被改變。
算術運算(+,-,*,/)
DataFrame中的算術運算是df中對應位置的元素的算術運算,如果沒有共同的元素,則用NaN代替。
此外,如果我們想設置默認的其他填充值,而非NaN的話,可以傳入填充值。
去重
duplicated()
DataFrame的duplicated方法返回一個布爾型Series,表示各行是否是重複行。具體用法如下:
drop_duplicates()
drop_duplicates()用於去除重複的行數,具體用法如下:
層次化索引
層次化索引(hierarchical indexing)是pandas的一項重要功能,它使我們能在一個軸上擁有多個(兩個以上)索引級別。請看以下例子:
索引方式
內層選取
數據重塑
將Series轉化成DataFrame: