1、利用字典生成DataFrame
① 第一種方式:列表組成的字典stu = { "name":["張三","李四","王燕"], "age":[18,20,22], "sex":["男","男","女"]
}
df = pd.DataFrame(stu)
display(df)
結果如下:
② 第二種方式:上述方式的一般形式person = { "name":"Tom", "age":20, "subject":["Python","Java","Excel"]
}
df = pd.DataFrame(person)
display(df)
結果如下:
x = [[1,2,3,4],[5,6,7,8],[9,10,11,12]]
df = pd.DataFrame(data)
display(df)
結果如下:
data = [
{"one":1,"two":2},
{"one":5,"two":10,"three":15}
]
df = pd.DataFrame(data)
display(df)
結果如下:
data = { "張三":{"Java":90, "Python":89, "Hive":78}, "李四":{"Java":82, "Python":95, "Hive":96}, "王五":{"Java":85, "Python":94}
}
df = pd.DataFrame(data)
display(df)
data = { "Java":{"張三":90,"李四":82,"王五":85}, "Python":{"張三":89,"李四":95,"王五":94}, "Hive":{"張三":78,"李四":96}
}
df = pd.DataFrame(data)
display(df)
結果如下:
data = { "Java":pd.Series(np.random.randint(70,100,5)), "Python":np.random.randint(80,100,5)
}
df = pd.DataFrame(data)
display(df)
結果如下:
column = ["Python","Java","Excel"]
dates = pd.date_range("20200202",periods=5)
df = pd.DataFrame(np.random.randint(low=70,high=100,size=(5,3)),
index=dates,columns=column)
display(df)
結果如下:
x = np.arange(1,21).reshape(4,5)
index = list("abcde")
df = pd.DataFrame(x,index=index)
display(df)
結果如下:
movie = ["戰狼2","哪吒之魔童降世","流浪地球","紅海行動"]
piapofang = [str(x)+"億" for x in [56.39,49.34,46.18,36.22]]
list_to_tuple = list(zip(movie,piaofang))
df = pd.DataFrame(list_to_tuple,columns=["movies","piaofang"])
display(df)
結果如下:
以後工作中都是利用已有的文件,進行數據分析。最好的方式就是將文件讀取成DataFrame方式,然後利用各種方式進行數據處理。由於文件格式眾多,這裡不細說,你需要讀取哪一種文件,就自行百度學習一下,即可。
———— The end ————
再會
為方便大家交流信息,我們建立了「數據幫Club」QQ群,我們後期將會在群裡隨時轉發推文信息。歡迎大數據、統計、人工智慧、數據科學愛好者加群交流學習。本文作者黃偉在CSDN的博客二維碼如下,更多精彩可掃描二維碼關注!歡迎投稿至:Datahelpclub@126.com