DataFrame(4):DataFrame的創建方式

2021-03-02 數據幫Club

1、利用字典生成DataFrame

① 第一種方式:列表組成的字典

stu = { "name":["張三","李四","王燕"], "age":[18,20,22], "sex":["男","男","女"]
}
df = pd.DataFrame(stu)
display(df)

結果如下:

② 第二種方式:上述方式的一般形式

person = { "name":"Tom", "age":20, "subject":["Python","Java","Excel"]
}
df = pd.DataFrame(person)
display(df)

結果如下:

③ 列表組成的列表

x = [[1,2,3,4],[5,6,7,8],[9,10,11,12]]
df = pd.DataFrame(data)
display(df)

結果如下:

④ 字典組成的列表

data = [
{"one":1,"two":2},
{"one":5,"two":10,"three":15}
]
df = pd.DataFrame(data)
display(df)

結果如下:

⑤ 字典組成的字典

data = { "張三":{"Java":90, "Python":89, "Hive":78}, "李四":{"Java":82, "Python":95, "Hive":96}, "王五":{"Java":85, "Python":94}
}
df = pd.DataFrame(data)
display(df)

data = { "Java":{"張三":90,"李四":82,"王五":85}, "Python":{"張三":89,"李四":95,"王五":94}, "Hive":{"張三":78,"李四":96}
}
df = pd.DataFrame(data)
display(df)

結果如下:

注意:對於上述兩個DataFrame,我們直接可以使用data.T進行DataFrame行、列之間的轉換。⑥ 由Series或ndarray組成的字典

data = { "Java":pd.Series(np.random.randint(70,100,5)), "Python":np.random.randint(80,100,5)
}
df = pd.DataFrame(data)
display(df)

結果如下:

2、自定義列、索引、數據生成DataFrame

column = ["Python","Java","Excel"]
dates = pd.date_range("20200202",periods=5)
df = pd.DataFrame(np.random.randint(low=70,high=100,size=(5,3)),
index=dates,columns=column)
display(df)

結果如下:

3、利用二維數組生成DataFrame(常用)

x = np.arange(1,21).reshape(4,5)
index = list("abcde")
df = pd.DataFrame(x,index=index)
display(df)

結果如下:

4、將不同的列錶轉化為tuple,生成DataFrame

movie = ["戰狼2","哪吒之魔童降世","流浪地球","紅海行動"]
piapofang = [str(x)+"億" for x in [56.39,49.34,46.18,36.22]]
list_to_tuple = list(zip(movie,piaofang))

df = pd.DataFrame(list_to_tuple,columns=["movies","piaofang"])
display(df)

結果如下:

5、通過讀取sql,csv,excel等文件生成DataFrame

  以後工作中都是利用已有的文件,進行數據分析。最好的方式就是將文件讀取成DataFrame方式,然後利用各種方式進行數據處理。由於文件格式眾多,這裡不細說,你需要讀取哪一種文件,就自行百度學習一下,即可。

————  The  end ————

再會

       為方便大家交流信息,我們建立了「數據幫Club」QQ群,我們後期將會在群裡隨時轉發推文信息。歡迎大數據、統計、人工智慧、數據科學愛好者加群交流學習。本文作者黃偉在CSDN的博客二維碼如下,更多精彩可掃描二維碼關注!歡迎投稿至:Datahelpclub@126.com


相關焦點

  • 什麼是Pandas的DataFrame?
    創建DataFrame最常用的一種是直接傳入一個由等長列表或NumPy數組組成的字典:In [33]: data={'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],'year':[2000,2001,2002,2001,2002],'pop':[1.5,1.7,3.6,2.4,2.9
  • Pandas-DataFrame基礎知識點總結
    DataFrame的創建有多種方式,不過最重要的還是根據dict進行創建,以及讀取csv或者txt文件來創建。這裡主要介紹這兩種方式。根據字典創建data = {    'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],    'year':[2000,2001,2002,2001,2002],    'pop':[1.5,1.7,3.6,2.4,2.9]}frame = pd.DataFrame(data)frame#輸出    pop state
  • DataFrame(3):DataFrame的創建方式
    (df)結果如下:② 第二種方式:上述方式的一般形式person = {          "name":"Tom",          "age":20,          "subject":["Python","Java","Excel"]
  • Python-Pandas安裝--Series結構和DataFrame結構
    A:一般會傳入等長的列表,或者利用NumPy的數組傳入 在這裡我們利用字典,等長列表的方式,創建一個DateFramefrom pandas import Series,DataFrameimport pandas as pddata={'city':['shanghai','beijing','tianjin
  • Pandas數據結構:DataFrame
    , 18],"city": ["BeiJing", "TianJin", "ShenZhen"]}print(data)print("")frame = pd.DataFrame(data) # 創建DataFrame
  • Pandas常用的兩種數據類型之「DataFrame」
    1.創建方式我可以使用如下的方式創建(初始化)DataFrame類型的對象(常用):•二維數組結構(列表,ndarray數組,DataFrame等)類型。•字典類型,key為列名,value為一維數組結構(列表,ndarray數組,Series等)。•如果沒有顯式指定行與列索引,則會自動生成以0開始的整數值索引。
  • R語言 | 數據框data.frame操作一網打盡
    創建數據框2. 行名列名等屬性3. 獲取元素(遍歷)4. 修改(增刪改、轉置、melt)5. 連接數據框、拆分數據框6. 數據框的計算,按某列求平均值 (數據透視表)數據框(data.frame)在R中使用的十分廣泛。只要你用read.table輸入數據,基本都是data.frame類別的數據。
  • 數據分析利器 pandas 系列教程(二):強大的 DataFrame
    創建 dataframe 的常見方式同 series 一樣,dataframe 也有 index,不同的是,series 除了 index,只有一列,而 dataframe 通常有很多列,比如上面的 dataframe 就有四列,而且都有名字:name、sex、course、grade,通過這些名字,可以索引到某一列,這些名字稱為列(索引),因此,在 dataframe
  • R語言基本功:vector,factor,list,matrix以及dataframe
    今天介紹R語言的幾個核心概念:vector,factor,list, matrix與dataframe。R語言中的vector主要包含三種類型,如數值型,字符型,邏輯型。5 6[3,] 7 8 9dataframe與excel的樣子看起來非常相似,是R語言統計分析中最常見的格式。
  • python數據分析專題 (12):DataFrame
    DataFrame既有行索引也有列索引,pandas中的DataFrame類似於R中的data.frame數據框,屬於二維數據。是數據分析中最為常用的數據類型。創建DataFrame可以使用pandas包中的DataFrame()函數生成DataFrame數據結構。有多種方式,可以直接從python的字典進行轉換,也可以從ndarry生成。
  • 【串講總結】array, list, tensor,Dataframe,Series之間互相轉換總結
    Dataframe創建的方式有很多種,這裡不贅述了。以下舉個例子,因為我們這裡要講的是和array等的轉換,這裡全都用數字型的元素。對於dataframe來說,我們列印出來,結構類似於一個二維矩陣格式,只是每一列和每一個行都有個index,這並且這些結構之間有很多方便的操作,在讀入結構化數據的時候尤為方便,所以平時做偏結構化數據的時候, 比如excel、pickle等等,pandas的使用是繞不開的。
  • 如何使用iloc和loc 對Pandas Dataframe進行索引和切片
    Pandas Dataframe在我們學習如何使用loc和iloc之前,我們最好先了解一下Pandas dataframe對象是如何工作的。對於本索引和切片教程的特定目的,我們最好知道dataframe中的每個行和列都有一個數字——一個索引。
  • pandas | 詳解DataFrame中的apply與applymap方法
    在上一篇文章當中,我們介紹了panads的一些計算方法,比如兩個dataframe的四則運算,以及dataframe填充Null的方法。今天這篇文章我們來聊聊dataframe中的廣播機制,以及apply函數的使用方法。
  • 數據集的「乾坤大挪移」:如何使pandas.Dataframe從行式到列式?
    本文將傳授給你數據集的「乾坤大挪移」大法,使用pd.melt()或melt方法使pandas. dataframe發生形變。一起來看看吧!行式vs寬式數據集如果我們將一個行式數據集與列式數據集進行比較,最容易理解行式數據集是什麼樣?
  • Pandas系列 - DataFrame操作
    列刪除 pop/del行選擇,添加和刪除行切片數據幀(DataFrame)是二維數據結構,即數據以行和列的表格方式排列數據幀(DataFrame)的功能特點:pandas.DataFrame創建DataFramePandas數據幀(DataFrame)可以使用各種輸入創建列表import pandas as pddata = [1,2,3,4,5]df = pd.DataFrame(data)print df
  • 將Python中的字典數據轉化為DataFrame
    創建字典把上面的表格,改寫為:data = {'Rank':[1, 2, 3, 4, 5], 'Language': ['Python', 'Java', 'Javascript', 'C#', 'PHP'], 'Share':[29.88, 19.05, 8.17, 7.3, 6.15],
  • Python數據分析 | 第五章 Pandas入門之Series和DataFrame
    「由於我們沒有為數據指定索引,於是會自動創建一個0到N-1(N為數據的長度)的整數型索引。 [2000, 2001, 2002, 2001, 2002, 2003],        'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}frame = pd.DataFrame(data)結果DataFrame會自動加上索引(跟Series一樣),且全部列會被有序排列:
  • 直接保存 DataFrame 表格到本地,這個「騷操作」你還不知道?
    方法介紹完成這個需求使用的是dataframe_image庫,因此在使用他之前,需要我們先安裝這個庫。pip install dataframe_imageip install dataframe_imageimport dataframe_image as dfi接著,調用dfi中的export()方法,就可以實現這個需求。但是關於這個知識點,你在百度上面其實看不到任何解答,那麼你應該怎麼學習呢?
  • paipai教你pandas(1) DataFrame的列維度操作
    今天paipai在使用pandas時,遇到了第一個問題,從一份Excel文件中讀取數據,構建為一個DataFrame對象,但是數據中的屬性欄位很多,需要對一些欄位進行取捨,paipai處理完數據之後呢,對Dataframe的列操作,整理了一下,在這裡分享給大家。      為了讓大家理解起來更直觀明了,paipai隱去複雜的列名和數值,用簡單的字母來代替。
  • 深拷貝和淺拷貝之list、dataframe
    python dataframe:深拷貝,pd.DataFrame.copy(user_info, deep=True),原值改變,複製的新值不會改變。淺拷貝,pd.DataFrame.copy(user_info, deep=False),原值改變,複製的新值也改變。