今天介紹數據分析的第四課,教大家如何在python中用apply函數對數據框進行一些複雜一點的操作。
把字符型的數據處理成數值型
把數值型的數據分段處理
1 把字符型的數據處理成數值型
def replace_gender_to_num(val): if val=='男': return 1 else: return 0date_frame.gender.apply(replace_gender_to_num)至此,原gender列中「男」字符替換成1,「女」字符替換成0。
date_frame['new_gender'] = date_frame.gender.apply(replace_gender_to_num)可以發現性別為男,在new_gender中對應值為1,性別為女在new_gender中對應值為0。
2 把數值型的數據分段處理
在建模過程中,要把不同分段的值轉化成對應的woe,需要用到apply函數進行處理。類似的,在這個實例中假設要把身高高於1.8的同學當成第一類,身高高於1.65的當成第二類,其餘的同學當成第三類。def height_to_class(val): if val>=1.8: return 1 elif val>=1.65: return 2 else: return 3然後用apply函數調用該函數,並把得到的結果值保存到原數據框中去,具體語句如下:date_frame['heigth_class'] = date_frame.height.apply(height_to_class)
至此,在python中應用apply函數進行數據處理已介紹完畢,大家可以動手練習一下,思考一下apply函數還有沒有別的用途。
娛樂圈排行榜動態條形圖繪製
轉發與在看是更好的支持