上一篇文章中我們詳細介紹了 NumPy 的功能及用途,本章節著重介紹 NumPy 一個神奇的對象 Ndarray 以及 NumPy 數據類型,包括兩者的用途,接下來就開啟神奇之旅吧。
標準安裝的 Python 中用列表 (list) 保存一組值,它可以用來當作數組使用,不過由於列表的元素可以是任何對象,因此列表中所保存的是對象的指針。這樣為了保存一個簡單的[1,2,3],需要有3個指針和三個整數對象。對於數值運算來說這種結構顯然比較浪費內存和CPU計算時間。
此外 Python 還提供了一個array模塊,array對象和列表不同,它直接保存數值,和C語言的一維數組比較類似。但是由於它不支持多維,也沒有各種運算函數,因此也不適合做數值運算。
NumPy 的誕生彌補了這些不足,NumPy提供了兩種基本的對象:ndarray(N-dimensional array object)和 ufunc(universal function object)。ndarray (下文統一稱之為數組)是存儲單一數據類型的多維數組,而 ufunc 則是能夠對數組進行處理的函數。
一、NumPy Ndarray 對象NumPy 最重要的一個特點是其 N 維數組對象 ndarray,Ndarray 從名字組成上看是 Nd-array,顧名思義就是 N 維數組的意思,它是一系列多維且同類型數據的集合,以 下標為 0 開始進行集合中元素的索引。ndarray 是內存存儲,換言之 ndarray 對象由計算機內存的連續一部分組成,並結合索引模式,將每個元素映射到內存塊中的一個位置,它比列表存儲節省空間
ndarray 對象是用於存放同類型元素的多維數組。ndarray 中的每個元素在內存中都有相同存儲大小的區域。1、ndarray 內部內容組成一個指向數據(內存或內存映射文件中的一塊數據)的指針。數據類型或 dtype,描述在數組中的固定大小值的格子。一個表示數組形狀(shape)的元組,表示各維度大小的元組。一個跨度元組(stride),其中的整數指的是為了前進到當前維度下一個元素需要"跨過"的字節數。2、ndarray 的內部結構ndarray 內部結構from numpy import *eye(4)Out[3]: array([[1., 0., 0., 0.], [0., 1., 0., 0.], [0., 0., 1., 0.], [0., 0., 0., 1.]])由以上實例可知,創建一個 ndarray 只需調用 NumPy 的 array 函數即可,如下:
numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)
3.1 參數說明名稱描述object數組或嵌套的數列dtype數組元素的數據類型,可選copy對象是否需要複製,可選order創建數組的樣式,C為行方向,F為列方向,A為任意方向(默認)subok默認返回一個與基類類型一致的數組ndmin指定生成數組的最小維度值得注意的是:ndmin 默認為數值為 0
3.2 運用實例創建一個簡單的 ndarray 對象,單維數組
import numpy as np a = np.array([1,2,3]) print (a)輸出結果如下:
創建一個大於 1 維的數組
import numpy as np a = np.array([[1, 2], [3, 4]]) print (a)輸出結果如下:
使用最小維度參數指定維度
以下實例指定數組維度為 2 維,ndmin 默認維度是 0
import numpy as np a = np.array([1, 2, 3,4,5], ndmin = 2) print (a)輸出結果為:
使用 dtype 參數指定數組元素的數據類型
import numpy as np a = np.array([1, 2, 3], dtype = complex) print (a)輸出結果:
二、NumPy 數據類型NumPy 支持的數據類型比 Python 內置的類型要更多,基本上可以和 C 語言的數據類型對應上,其中部分類型對應為 Python 內置的類型。
1、NumPy 常用數據類型下表列舉了 NumPy 常用基本數據類型,為了區別於 Python 原生的數據類型,bool、int、float、complex、str 等類型名稱末尾都加了 _。
名稱描述bool_布爾型數據類型(True 或者 False)int_默認的整數類型(類似於 C 語言中的 long,int32 或 int64)intc與 C 的 int 類型一樣,一般是 int32 或 int 64intp用於索引的整數類型(類似於 C 的 ssize_t,一般情況下仍然是 int32 或 int64)int8位元組(-128 to 127)int16整數(-32768 to 32767)int32整數(-2147483648 to 2147483647)int64整數(-9223372036854775808 to 9223372036854775807)uint8無符號整數(0 to 255)uint16無符號整數(0 to 65535)uint32無符號整數(0 to 4294967295)uint64無符號整數(0 to 18446744073709551615)float_float64 類型的簡寫float16半精度浮點數,包括:1 個符號位,5 個指數位,10 個尾數位float32單精度浮點數,包括:1 個符號位,8 個指數位,23 個尾數位float64雙精度浮點數,包括:1 個符號位,11 個指數位,52 個尾數位complex_complex128 類型的簡寫,即 128 位複數complex64複數,表示雙 32 位浮點數(實數部分和虛數部分)complex128複數,表示雙 64 位浮點數(實數部分和虛數部分)另外 numpy 的數值類型實際上是 dtype 對象的實例,並對應唯一的字符,包括 np.bool_,np.int32,np.float32,等等。
2、數據類型對象-dtype數據類型對象是用來描述與數組對應的內存區域如何使用,這依賴如下幾個方面:
數據的類型(整數,浮點數或者 Python 對象)在結構化類型的情況下,欄位的名稱、每個欄位的數據類型和每個欄位所取的內存塊的部分字節順序是通過對數據類型預先設定"<"或">"來決定的。"<"意味著小端法(最小值存儲在最小的地址,即低位組放在最前面)。">"意味著大端法(最重要的字節存儲在最小的地址,即高位組放在最前面)。
dtype 對象是使用以下語法構造的:
numpy.dtype(object, align, copy)align - 如果為 true,填充欄位使其類似 C 的結構體。copy - 複製 dtype 對象 ,如果為 false,則是對內置數據類型對象的引用實例操作:
實例 1
import numpy as np# 使用標量類型da = np.array([1, 2, 3])print(da.dtype)輸出結果為:
實例 2
import numpy as np# int8, int16, int32, int64 四種數據類型可以使用字符串 'i1', 'i2','i4','i8' 代替dt = np.dtype('i4')print(dt)輸出結果為:
3、結構化數據類型的運用結構化數據類型的使用,類型欄位和對應的實際類型將被創建
實例1:創建年齡數組並且應用於 ndarray 對象
1)創建一個結構化數據類型da = np.dtype(np.int64)print(da)
# 創建dt = np.dtype([('age',np.int8)])print(dt)輸出結果為:
2)將結構化數據類型應用於ndarray 對象dt = np.dtype([('age',np.int8)]) a = np.array([(10,),(20,),(30,)], dtype = dt) print(a)輸出結果為:
3) 類型欄位名可以用於存取實際的 age 列dt = np.dtype([('age',np.int8)]) a = np.array([(10,),(20,),(30,)], dtype = dt) print(a['age'])輸出結果為:
實例2:定義一個結構化數據類型 student,包含字符串欄位 name,整數欄位 age,及浮點欄位 marks,並將這個 dtype 應用到 ndarray 對象。
1) 創建數組student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')]) print(student)輸出結果:
[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')]2) 將數組應用與 ndarray 對象import numpy as npstudent = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')]) a = np.array([('abc', 21, 50),('xyz', 18, 75)], dtype = student) print(a)輸出結果為:
[(b'abc', 21, 50.) (b'xyz', 18, 75.)]3.1 內建類型的字符代碼如下:字符對應類型b布爾型i(有符號) 整型u無符號整型 integerf浮點型c複數浮點型mtimedelta(時間間隔)Mdatetime(日期時間)O(Python) 對象S, a(byte-)字符串UUnicodeV原始數據 (void)3.2 NumPy 數據類型轉換numpy 數據類型轉換需要調用方法 astype(),不能直接修改 dtype。調用 astype 返回數據類型修改後的數據,但是源數據的類型不會變,需要進一步對源數據的賦值操作才能改變。
實例:
da = np.array([1.2,1.1,1.0])# 輸出 da 的數據類型print(da.dtype)# 輸出 float64
# 轉換 da 的數據類型print(da.astype(np.int32))# 輸出 [1 1 1]
# 重新查看數據類型,發現數據類型還未改變print(da.dtype)# 輸出 float64
# 重新進行賦值操作da = da.astype(np.int32)print(da.dtype) # 輸出int32
print(da)# 輸出 [1 1 1]4、複數我們把形如 z=a+bi(a, b均為實數)的數稱為複數,其中 a 稱為實部,b 稱為虛部,i 稱為虛數單位。
當虛部 b=0 時,複數 z 是實數;
當虛部 b!=0 時,複數 z 是虛數;
當虛部 b!=0 ,且實部 a=0 時,複數 z 是純虛數。實例:
import numpy as np a = np.array([1, 2, 3], dtype = complex) print (a)輸出:
如上輸出結果就是複數形式的數據類型
總結本章節是對 NumPy Ndarray 對象及 NumPy 數據類型的用法作詳細介紹,本文介紹的是 Ndarray 基礎知識,等把 NumPy 所有知識點介紹完後會出一些項目實戰,更好的給運用 NumPy 相關知識點的工程師提供支撐。
參考https://www.runoob.com/numpy/numpy-ndarray-object.html https://www.runoob.com/numpy/numpy-dtype.html
文中示例代碼:python-100-days