矩陣與矩陣乘積簡介

2021-01-08 人工智慧遇見磐創

向量是存儲和操作數據的一種有用的方法，可以用箭頭或數字數組來表示它們。然而，創建更複雜的數據結構是有幫助的，這正是需要引入矩陣的地方。

介紹

矩陣是正方形或矩形數組，包含兩個維度：行和列，我們可以把它看作是一個電子表格。通常會在數學上下文中看到術語矩陣，在Numpy上下文中看到二維數組。

維度

在矩陣的上下文中，術語維度不同於向量表示的維數（空間維數）。當我們說矩陣是二維數組時，意味著數組中有兩個方向：行和列。

矩陣表示如下：

矩陣A有兩行兩列，如果矩陣有m行和n列，並且包含實值，可以用以下符號來刻畫它：A∈（m×n）。

我們可以使用不帶粗體的矩陣名稱引用矩陣中的元素，但是後面需要跟著行索引和列索引。例如，$ A_{2, 1}$表示第一行和第二列中的元素。

按照慣例，第一個索引用於行，第二個索引用於列。例如，上面提到的例子位於矩陣A的第二行和第一列，因此它被表示為$A_{2, 1}$。

矩陣分量可以寫如下：

圖1：矩陣是二維數組，行數通常用m表示，列數用n表示。

數組的形狀給出了每個維度中元素的數量，如圖1所示。由於此矩陣是二維的（行和列），因此需要兩個值來描述形狀（按此順序排列的行數和列數）。

我們先用這個方法np.array()創建一個2維numpy數組。

A = np.array([[2.1, 7.9, 8.4], [3.0, 4.5, 2.3], [12.2, 6.6, 8.9], [1.8, 1., 8.2]])注意，我們使用數組中的數組（[[]]）來創建二維數組。這與創建一維數組的不同之處在於所使用的方括號數。

與向量一樣，可以訪問Numpy數組的shape屬性：

A.shape可以看到該形狀包含兩個數字：它們分別對應於行數和列數。

要獲得矩陣元素，需要兩個索引：一個引用行索引，一個引用列索引。

使用Numpy，索引過程與向量的索引過程相同，只需要指定兩個索引。我們再來看下面的矩陣A：

A = np.array([[2.1, 7.9, 8.4], [3.0, 4.5, 2.3], [12.2, 6.6, 8.9], [1.8, 1.3, 8.2]])可以使用以下語法獲取特定元素：

A[1, 2][1，2]返回行索引為1、列索引為2（以零為基礎的索引）的元素。

要獲得完整的列，可以使用冒號：

A[:, 0]array([ 2.1, 3. , 12.2, 1.8])這將返回第一列（索引0），因為冒號表示我們需要從第一行到最後一行的元素。同樣，要獲取特定行，可以執行以下操作：

A[1, :]array([3. , 4.5, 2.3])能夠操縱包含數據的矩陣是數據科學家的一項基本技能。檢查數據的形狀對於確保數據的組織方式非常重要。了解使用Sklearn或Tensorflow等庫所需的數據形狀也很重要。

對於Numpy，如果數組是向量（1D Numpy數組），則shape是單個數字：

v = np.array([1, 2, 3])v.shape如果是矩陣，則形狀有兩個數字（行和列中的值的數目）。例如：

A = np.array([[2.1, 7.9, 8.4]])A.shape形狀的第一個數字是1。使用兩個方括號[[和]]，可以創建一個二維數組（矩陣）。

矩陣乘積

接下來我們將在數據科學基礎數學中學習乘積。矩陣的等價運算稱為矩陣乘積或矩陣乘法，它接受兩個矩陣並返回另一個矩陣。這是線性代數中的一個核心運算。

矩陣乘積的更簡單的情況是介於矩陣和向量之間（可以將其視為矩陣乘積，其中一個向量只有一列）。

上圖說明了矩陣和向量之間乘積的步驟。讓我們來看矩陣的第一行，在向量（值3和4）和行（值1和2）之間進行點積。第一行的第一個值的與第一列的第一個值(13)和第一行第二個值與第一列的第二個值(24)，它計算的矩陣的第一個元素是(13 + 24 = 11)。

你可以看到矩陣乘積與點積相關，就像把矩陣A分成三行並應用點積（如數據科學的基本數學）。

看看它是如何與numpy一起工作的。

A = np.array([ [1, 2], [5, 6], [7, 8]])v = np.array([3, 4]).reshape(-1, 1)A @ varray([[11], [39], [53]])請注意，我們使用了reshape函數將向量重塑為一個2乘1的矩陣（-11告訴Numpy猜測剩餘的數字）。如果沒有它，將以一維數組結束，而不是這裡的二維數組（只有一列的矩陣）。

還有另一種方法來考慮矩陣乘積，可以考慮向量包含了對矩陣的每一列加權的值。它清楚地表明，向量的長度需要等於應用向量的矩陣的列數。

下圖可能有助於將這個概念形象化。可以將向量值（3和4）視為應用於矩陣列的權重。前面看到的標量乘法規則會產生與以前相同的結果。

使用最後一個示例，可以編寫A和v之間的乘積，如下所示：

這一點很重要，因為正如你在數據科學基礎數學中看到的更多細節，它表明Av是A的列的線性組合，係數是v的值。

另外，你可以看到矩陣的形狀和向量的形狀必須匹配才能得到乘積。

矩陣乘積類似於矩陣向量積，但應用於第二個矩陣的每一列。

使用Numpy，可以精確地計算矩陣乘積：

A = np.array([ [1, 2], [5, 6], [7, 8],])B = np.array([ [3, 9], [4, 0]])A @ Barray([[11, 9], [39, 45], [53, 63]])與矩陣向量積一樣，第一個矩陣的列數必須與第二個矩陣的行數相匹配。

結果矩陣的行數與第一個矩陣的行數相同，列數與第二個矩陣的列數相同。

我們試試吧。

A = np.array([ [1, 4], [2, 5], [3, 6],])B = np.array([ [1, 4, 7], [2, 5, 2],])矩陣A和B有不同的形狀。讓我們計算他們的乘積：

A @ Barray([[ 9, 24, 15], [12, 33, 24], [15, 42, 33]])你可以看到AB的結果是一個3乘3的矩陣。這個形狀來自A（3）的行數和B（3）的列數。

可以使用矩陣與其轉置矩陣之間的乘積計算數據集的協方差矩陣，然後除以觀測值（或貝塞爾修正值減去1），但是需要事先確保變量的中心在零左右（這可以通過減去平均值來實現）。

讓我們模擬以下變量x、y和z：

x = np.random.normal(10, 2, 100)y = x * 1.5 + np.random.normal(25, 5, 100)z = x * 2 + np.random.normal(0, 1, 100)使用Numpy，協方差矩陣為：

np.cov([x, y, z])array([[ 4.0387007 , 4.7760502 , 8.03240398], [ 4.7760502 , 32.90550824, 9.14610037], [ 8.03240398, 9.14610037, 16.99386265]])現在，使用矩陣乘積，首先進行堆疊：

X = np.vstack([x, y, z]).TX.shape你可以看到變量X是一個100×3的矩陣：100行對應於觀察值，3列對應於特徵。然後，把這個矩陣減去均值：

X = X - X.mean(axis=0)最後，計算協方差矩陣：

(X.T @ X) / (X.shape[0] - 1)array([[ 4.0387007 , 4.7760502 , 8.03240398], [ 4.7760502 , 32.90550824, 9.14610037], [ 8.03240398, 9.14610037, 16.99386265]])你會得到一個協方差矩陣，與函數np.cov中得到的協方差矩陣相似，這一點很重要，要記住一個矩陣的轉置乘積對應於協方差矩陣。

兩個矩陣之間乘積的轉置定義如下：

例如，取以下矩陣A和B：

A = np.array([ [1, 4], [2, 5], [3, 6],])B = np.array([ [1, 4, 7], [2, 5, 2],])你可以檢查（AB）^T和B^T A^T的結果：

(A @ B).Tarray([[ 9, 12, 15], [24, 33, 42], [15, 24, 33]])B.T @ A.Tarray([[ 9, 12, 15], [24, 33, 42], [15, 24, 33]])兩個向量或矩陣在括號中的順序必須改變，以滿足等價性。如果改變向量和矩陣的順序，矩陣乘積的轉置等於轉置的乘積。

可以將此屬性應用於兩個以上的矩陣或向量，例如這樣。

矩陣與矩陣乘積簡介

相關焦點

線性代數入門——矩陣的轉置運算及對稱矩陣的概念

Excel函數公式大全之利用MMULT函數計算兩個數組矩陣的乘積

對角矩陣、單位矩陣、數量矩陣

線性代數入門——矩陣乘法的定義及其意義

No.3 矩陣乘法

2.4——矩陣的行列式與伴隨矩陣

線性代數基礎-矩陣

關聯矩陣、迴路矩陣和割集矩陣的關係

深度解析可逆矩陣與等價矩陣的區別與聯繫

正定矩陣與半正定矩陣

奇異值、奇異矩陣、SVD分解、正交矩陣

CFD理論掃盲|02 矩陣與張量

線性代數入門——矩陣乘積和乘冪在實際問題中的應用舉例

矩陣(二)

Python裡簡單的矩陣操作

線性代數入門——矩陣的按行、列分塊及其簡單應用

線性代數的第一堂課──矩陣乘法的定義

專題七:矩陣分解

求逆矩陣的三種方法

資料| 矩陣論簡明教程