上一部分介紹Pandas庫Data Frame基礎知識,現在進入Pandas數據結構,介紹pandas的DataFrame對象和Series對象。無論是手動輸入數據還是創建小型測試示例,都需要了解如何在不從文件加載數據的情況下創建Data Frame。當遇到關於Stack Overflow錯誤的問題時,很有用的。
一.創建Series
在Pandas中,Series是一維容器,類似Python的內置的列表。這樣的數據類型表示Data Frame的每一列。
在Data Frame中,每一列的數據類型(dtype)必須相同。可以把Data Frame看作由Series對象組成的字典,其中每個鍵([『unit Price』])是列名,值([199])是Series,因而可以得出這樣的結論:Series和Python中的列表非常相似,但是它的每個元素的數據類型必須相同。我們在使用Numpy庫會發現這一點和ndarray表現出來的行為相同的。
創建Series最簡單方法就像上圖一樣傳入一個Python列表,如果傳入的是混合類型列表,將會使用最常見的類型,通常dtype為對象(object)
PS:在S中,左邊顯示的「行號」[0,1]實際上是Series的索引,類似在Data Frame基礎中所講過的Data Frame行名和行索引,這就意味著其實可以在Series中的值指定一個「名稱」,如S1.
二. 創建Data Frame
Data Frame看作由Series對象組成的字典。因此,字典是創建Data Frame最常用的方法,鍵代表列名,值是列的內容。
PS:結果的輸出順序並非固定不變。
Data Frame文檔指出可以使用columns參數指定列順序。如果想把Number列用作行索引,可以使用index參數
上面輸出的順序無法保障,因為Python字典本身沒有順序。如果想用有序字典,就需要使用collections模塊中的OrderedDict。在實際操作過程中,不能只使用OrderedDict函數包裝字典,因為創建字典將其傳遞到OrderedDict函數時,順序已經了。
PS:請注意OrderedDict後面跟著圓括號,圓括號裡面是由元組組成的列表,冒號變成逗號。
數據分析Pandas運用 | DataFrame基礎知識.(7-1)
數據分析Pandas運用 | DataFrame基礎知識.(7-2)
數據分析Pandas運用 | DataFrame基礎知識.(7-3)
數據分析Pandas運用 | DataFrame基礎知識.(7-4)
學習資料:
機器學習(1-5)
https://t.zsxq.com/yJ2VRb6
機器學習(6-10)
https://t.zsxq.com/imubM3N
Python神經網絡編程|中文版e-book|資料庫
https://t.zsxq.com/7i2zzvR
https://t.zsxq.com/3BU72vz