這是《機器學習中的數學基礎》系列的第6篇。
今天我們來介紹基變換,簡單地說,基變換就是把向量用不同的基來表示。我們來舉個例子:
圖1
如上圖,在我們常見的標準坐標系中,有一個向量w=(2,2)。此時的基向量是i、j,我們可以用2i+2j來表示向量w。那能不能更換基向量來表示w呢?可以的,如下圖:
圖2
向量w並沒有變化,我們只是把原來的基向量都擴大了1倍,變成了新的基向量i』和j』。那w如何用新的基向量來表示呢?從圖上就可以看出,w=i』+j』。由於基變換了,我們的坐標系自然也跟著變換了。因此,在新的坐標系中,向量w就表示為(1,1)。
好,現在讓我們聚焦於圖2中新的坐標系。其中,向量w=(1,1),我們想知道在標準坐標系中的向量w該如何表示呢(忘掉圖1)?
在新坐標系中,w=1i』+1j』(1),而i』在標準坐標系中的坐標是(2,0),j』在標準坐標系中的坐標是(0,2),把它們代入到(1)式,可得:
這是啥?這不就是矩陣乘以向量的展開嗎?如下:
因此,我們就求得了w在標準坐標系中的坐標是(2,2)。
我們再來看下上面的式子,矩陣[2,0;0,2]表示了一種線性變換,它把新坐標系中的向量表示為了標準坐標系中的向量。那肯定又有人問了,如果給定一個標準坐標系的向量,如何求出它在新坐標系中的向量坐標呢?聰明的你肯定想到了,矩陣[2,0;0,2]的逆就表示了從標準坐標繫到新坐標系的轉換。因此,只需用矩陣[2,0;0,2]的逆乘以標準坐標系中的向量,就可以得到新坐標系中的向量表示了。
這就是今天的全部內容,你都get到了嗎?