Python數據分析Pandas運用 | Pandas數據結構Series and Data Frame.(8)

2021-03-02 TCEEDGE

上一部分介紹Pandas庫Data Frame基礎知識,現在進入Pandas數據結構,介紹pandas的DataFrame對象和Series對象。無論是手動輸入數據還是創建小型測試示例,都需要了解如何在不從文件加載數據的情況下創建Data Frame。當遇到關於Stack Overflow錯誤的問題時,很有用的。

一.創建Series

在Pandas中,Series是一維容器,類似Python的內置的列表。這樣的數據類型表示Data Frame的每一列。

在Data Frame中,每一列的數據類型(dtype)必須相同。可以把Data Frame看作由Series對象組成的字典,其中每個鍵([『unit Price』])是列名,值([199])是Series,因而可以得出這樣的結論:Series和Python中的列表非常相似,但是它的每個元素的數據類型必須相同。我們在使用Numpy庫會發現這一點和ndarray表現出來的行為相同的。

創建Series最簡單方法就像上圖一樣傳入一個Python列表,如果傳入的是混合類型列表,將會使用最常見的類型,通常dtype為對象(object)

PS:在S中,左邊顯示的「行號」[0,1]實際上是Series的索引,類似在Data Frame基礎中所講過的Data Frame行名和行索引,這就意味著其實可以在Series中的值指定一個「名稱」,如S1.

二. 創建Data Frame

Data Frame看作由Series對象組成的字典。因此,字典是創建Data Frame最常用的方法,鍵代表列名,值是列的內容。

PS:結果的輸出順序並非固定不變。

Data Frame文檔指出可以使用columns參數指定列順序。如果想把Number列用作行索引,可以使用index參數

上面輸出的順序無法保障,因為Python字典本身沒有順序。如果想用有序字典,就需要使用collections模塊中的OrderedDict。在實際操作過程中,不能只使用OrderedDict函數包裝字典,因為創建字典將其傳遞到OrderedDict函數時,順序已經了。

PS:請注意OrderedDict後面跟著圓括號,圓括號裡面是由元組組成的列表,冒號變成逗號。

數據分析Pandas運用 |  DataFrame基礎知識.(7-1)

數據分析Pandas運用 | DataFrame基礎知識.(7-2)

數據分析Pandas運用 | DataFrame基礎知識.(7-3)

數據分析Pandas運用 | DataFrame基礎知識.(7-4)

學習資料:

機器學習(1-5)

https://t.zsxq.com/yJ2VRb6

機器學習(6-10)

https://t.zsxq.com/imubM3N

Python神經網絡編程|中文版e-book|資料庫

https://t.zsxq.com/7i2zzvR

https://t.zsxq.com/3BU72vz

相關焦點

  • Python-Pandas安裝--Series結構和DataFrame結構
    使用pandas庫相比NumPy庫有什麼好處,pandas庫比NumPy庫封裝了哪些特性 1. pandas會自動講數據按照自定義的方式進行對齊顯示,避免數據沒有對齊造成處理數據的時候出現失誤 2. pandas可以很靈活的處理缺失的數據,如果某個數據缺失,可以基於大部分數據的平均值進行填充,還可以填充想要的數值
  • Python數據分析 | 第五章 Pandas入門之Series和DataFrame
    5.1 pandas的數據結構介紹要使用pandas,你首先就得熟悉它的兩個主要數據結構:Series和DataFrame。雖然它們並不能解決所有問題,但它們為大多數應用提供了一種可靠的、易於使用的基礎。
  • python數據分析萬字乾貨!一個數據集全方位解讀pandas
    說到python與數據分析,那肯定少不了pandas的身影,本文希望通過分析經典的NBA數據集來系統的全方位講解pandas包,建議搭配IDE一遍敲一邊讀哦。話不多說,開始吧!目錄安裝與數據介紹pandas數據結構訪問series元素訪問dataframe元素查詢數據集分類和匯總數據
  • Pandas數據結構:DataFrame
    剛剛接觸pandas的朋友,想了解數據結構,就一定要認識DataFrame,接下來給大家詳細介紹!, 18],"city": ["BeiJing", "TianJin", "ShenZhen"]}print(data)print("")frame = pd.DataFrame(data) # 創建DataFrame
  • Pandas知識點-Series數據結構介紹
    一、Series數據結構介紹# coding=utf-8import pandas as pddf = pd.read_csv('600519.csv', encoding='gbk')data = df['收盤價']print(data)print(type(data))數據文件是600519.csv,將此文件放到代碼同級目錄下,從文件中讀取出數據,然後取其中的一列,數據如下圖。
  • Python學習120課 pandas簡介kaggle下載數據及pandas讀取外部數據
    【每天幾分鐘,從零入門python編程的世界!】numpy的基本的東西我們學習差不多了,後面具體應用中遇到問題具體分析,然後去深入了解遇到的新的知識點就行。現在我們開始學習pandas,pandas一般用的更多,pandas是基於numpy去寫的。pandas是一個專門做數據結構和數據分析的庫。
  • 數據科學 | pandas數據導入與導出
    當我們開始著手做一個數據分析項目時,選擇和導入數據集是第一個步驟,而導出數據雖然非必需,但有時候我們也需要保存處理或者分析後的結果,方便下次使用。在pandas中,它已經為我們提供了很多不同格式數據的導入和導出方法,下面這篇文章將具體介紹一些較為常用的方法,包括excel、csv文件以及資料庫的導入導出等。數據導入和導出是pandas中很基礎且重要的一個部分。
  • python數據分析專題 (12):DataFrame
    DataFrame是一個表格型的數據結構,它含有一組有序的列,每列可以是不同的值類型(數值、字符串、布爾值等)。
  • pandas:Series , Data Frame , Panel
    Data FrameData Frame是一個帶有行和列的二維標記數據結構。三個軸的名稱如下:條目items:axis 0軸0,每個條目對應於包含在其中的數據幀;長軸major_axis:axis 1軸1,它是每個數據幀的索引(行);短軸minor_axis:axis 2軸2,它是每個數據幀的列。Zipline只理解Panel格式的數據結構。
  • 快速介紹Python數據分析庫pandas的基礎知識和代碼示例
    本附註的結構:導入數據導出數據創建測試對象查看/檢查數據選擇查詢>數據清理篩選、排序和分組統計數據首先,我們需要導入pandas開始:import pandas as pd導入數據># Build data frame from inputted datadf = pd.DataFrame(data = {'Name': ['Bob', 'Sally', 'Scott', 'Katie'],'Physics': [68, 74, 77, 78], 'Chemistry':
  • Python:Pandas的DataFrame如何按指定list排序
    前言寫這篇文章的起由是有一天微信上一位朋友問到一個問題,問題大體意思概述如下:現在有一個pandas的Series和一個python的list,想讓Series按指定的list進行排序,如何實現?這個問題的需求用流程圖描述如下:我思考了一下,這個問題解決的核心是引入pandas的數據類型「category」,從而進行排序。在具體的分析過程中,先將pandas的Series轉換成為DataFrame,然後設置數據類型,再進行排序。思路用流程圖表示如下:
  • Pandas系列 - 基本數據結構
    二、pandas.DataFrame數據幀(DataFrame)是二維數據結構,即數據以行和列的表格方式排列數據幀(DataFrame)的功能特點:構造函數:pandas.DataFrame(data,
  • Pandas系列 - DataFrame操作
    列刪除 pop/del行選擇,添加和刪除行切片數據幀(DataFrame)是二維數據結構,即數據以行和列的表格方式排列數據幀(DataFrame)的功能特點:pandas.DataFrame構造函數:pandas.DataFrame(data, index, columns, dtype, copy)編號參數描述1data數據採取各種形式,如:ndarray,series,map,lists,dict,constant和另一個DataFrame。
  • 什麼是Pandas的DataFrame?
    什麼是DataFrameDataFrame是一個表格型的數據結構,它含有一組有序的列,每列可以是不同的值類型(數值、字符串、布爾值等)。DataFrame既有行索引也有列索引,它可以被看做由series組成的字典(共用同一個索引)2.
  • 數據集的「乾坤大挪移」:如何使pandas.Dataframe從行式到列式?
    圖源:unsplash如何將數據集從行式變為列式?有很多種方法可以做到這一點,但pandas的melt()方法是其中最靈活的一種,你只需要學好這種就足夠了。本文將傳授給你數據集的「乾坤大挪移」大法,使用pd.melt()或melt方法使pandas. dataframe發生形變。一起來看看吧!行式vs寬式數據集如果我們將一個行式數據集與列式數據集進行比較,最容易理解行式數據集是什麼樣?
  • pandas入門:Series、DataFrame、Index基本操作都有了!
    Series:基本數據結構,一維標籤數組,能夠保存任何數據類型DataFrame:基本數據結構,一般為二維數組,是一組有序的列Index:索引對象,負責管理軸標籤和其他元數據(比如軸名稱)groupby:分組對象,通過傳入需要分組的參數實現對數據分組
  • Python數據分析利器,Pandas入門介紹,幫你便捷高效處理複雜數據
    關於Python的數據分析,當我們遇到的數據量小、數據結構簡單時,可以通過字典、列表等Python常見的數據結構來處理。但是當我們面對的大量數據以及複雜數據的局面時,就需要用一些專門用於數據分析的擴展庫來處理數據了。今天給大家介紹一個Python裡專門用來做數據分析和處理的擴展庫。
  • python數據分析常用庫之pandas入門(2)
    索引、選擇和賦值昨天介紹了pandas的模塊引入、創建和讀取數據,今天主要看看怎麼從數據結構中獲得想要的值,也就是數據的索引查找、
  • Python數據分析入門日記Day6:數據分析庫Pandas:Series和Dataframe
    Python數據分析入門日記Day6——Pandas:Series和Dataframe從今天起,開始學習Python中另一個經常用到的庫——Pandas,Pandas作為數據分析庫在日常的數據分析工作中起到重要作用,是一個基於Numpy的、處理數據較為專業的庫。
  • Python自動化測試—使用Pandas來高效處理測試數據
    git clone git://github.com/pydata/pandas.gitcd pandaspython setup.py install  案例中的lemon_cases.xlsx文件內容如下所示:import pandas as pd# 讀excel文件# 返回一個DataFrame對象,多維數據結構