數據科學中的數學基礎: 矩陣和向量空間

2021-02-24 遇見數學

首先通過一個簡單例子來感性認識一下標量(scalar)、向量(vector)和矩陣(matrix)這 3 個數學概念。

假設我們設計了一款網絡對戰遊戲,在遊戲中,玩家選擇自己的英雄與其他玩家對戰。每個英雄的能力由 3 種屬性描述:智力、敏捷和力量。為了方便表示,不妨用 i 表示智力、a 表示敏捷、s 表示力量。

對於英雄 A,它的設定是智力型英雄,智力被設定為 10,敏捷為 6 以及力量為 2,用數學式子表示為 i = 10, a = 6, s = 2。換句話說,我們用數字表表示各個屬性具體的值,這在數學上就叫作標量,標量其實就是數字。

將這 3 個屬性按照智力、敏捷和力量的順序寫在一起,就可以表示一個英雄的能力了。

比如用A = (10, 6, 2)表示英雄 A。在數學上A被稱為向量,正確地說應該是行向量。直觀上, 行向量是多個數字(標量)排成一行。與之類似的是列向量,即多個數字排成一列。

現在我們設計了另外 3 個英雄,分別為 B、C 和  D,向量表示為B = (3, 4, 10)、C = (5, 10, 4)和D = (6, 9, 5)。將這 4 個英雄的向量排列成矩形陣列,即每一行表示一個英雄,得到圖 3-1 所示的矩陣,而這個矩陣就可以表示所有 4 個英雄的屬性數據。

相關焦點

  • 在數據科學領域中,你需要多少數學知識?
    引言如果你有心學習數據科學,那麼你一定會在腦海中想過下面的問題:沒有或者只有很少的數學知識,我能做一個數據科學家嗎?數據科學必需的數學工具有哪些?有很多優秀的包可用於建立預測模型或者數據可視化。我的模型中有哪些超參數,如何對其進行微調以獲得性能最佳的模型?沒有良好的數學背景,你就無法解決上面提到的問題。最重要的是,在數據科學和機器學習中,數學技能與編程技能同等重要。因此,作為有志於數據科學的人,你必須花時間研究數據科學和機器學習的理論和數學基礎。 你構建可應用於實際問題的可靠而有效的模型的能力取決於您的數學基礎。
  • 2013考研數學衝刺複習:矩陣的特徵值與特徵向量講解
    矩陣的特徵值與特徵向量問題是考研數學中一常考點,然而在最後衝刺這一階段,同學們在做真題和模擬題《考研數學絕對考場最後八套題》時對這一考點還存在一些疑惑,對此,文都考研數學的輔導老師特撰此文講解矩陣的特徵值與特徵向量問題,助同學們考研成功。
  • 數據分析學習:入數據科學大坑,我需要什麼樣的數學水平?
    所以,本文作者闡釋了數據科學和機器學習為何離不開數學,並提供了統計學與概率論、多變量微積分、線性代數以及優化方法四個數學分支中需要熟悉的一些數學概念。本文的作者是物理學家、數據科學教育者和作家 Benjamin Obi Tayo 博士,他的研究興趣在於數據科學、機器學習、AI、Python 和 R 語言、預測分析、材料科學和生物物理學。
  • 矩陣的重要特性:特徵向量
    在主成分分析 (Principal Component Analysis) 中我們通過在拉伸最大的方向設置基,忽略一些小的量,可以極大地壓縮數據而減小失真。變換矩陣的所有特徵向量作為空間的基之所以重要,是因為在這些方向上變換矩陣可以拉伸向量而不必扭曲和旋轉它,使得計算大為簡單。所以特徵值固然重要,我們的終極目標卻是特徵向量。
  • 矩陣:特徵向量(Eigenvector)
    在主成分分析(Principal Component Analysis)中我們通過在拉伸最大的方向設置基,忽略一些小的量,可以極大地壓縮數據而減小失真。變換矩陣的所有特徵向量作為空間的基之所以重要,是因為在這些方向上變換矩陣可以拉伸向量而不必扭曲和旋轉它,使得計算大為簡單。所以特徵值固然重要,我們的終極目標卻是特徵向量。
  • 矩陣與矩陣乘積簡介
    向量是存儲和操作數據的一種有用的方法,可以用箭頭或數字數組來表示它們。然而,創建更複雜的數據結構是有幫助的,這正是需要引入矩陣的地方。介紹矩陣是正方形或矩形數組,包含兩個維度:行和列,我們可以把它看作是一個電子表格。通常會在數學上下文中看到術語矩陣,在Numpy上下文中看到二維數組。
  • 矩陣的瑰寶:深入挖掘特徵值和特徵向量,直觀地看抽象概念
    特徵值和特徵向量可能看起來是很抽象的概念,但它們在你周圍的世界中扮演著不可或缺的角色。因為一切都是由數據定義的,矩陣是處理數據的最佳工具,而它們又是矩陣中的瑰寶,可以揭示矩陣的性質。理解特徵值和特徵向量是什麼,如何推導它們,以及它們的應用,對于欣賞矩陣之美,以及更廣泛地理解數據和數學在世界中扮演的角色,都是不可或缺的。
  • 線性代數基礎-矩陣
    "矩陣"     矩陣應用在咱們生活中隨處可見, 比如經常使用的二維碼就是矩陣, 在計算機裡面顯示的圖片,存儲的方式就是矩陣
  • ,用幾何思維理解矩陣的「逆」和向量的「點積」
    這是《機器學習中的數學基礎》系列的第5篇。人的一生總是需要許多「Aha!」(啊哈!)時刻,也就是讓你頓悟的時刻。面對線性代數中複雜的概念和公式,如果我們從幾何的角度去審視它們,就好比我們擁有了上帝視角,可以從大局上掌控它們,也可以更深入的理解它們的內涵。逆先來看矩陣的逆。
  • 成為偉大的數據科學家需要掌握的基本數學
    數學是任何當代科學學科的基石。現代數據科學的幾乎所有技術,包括機器學習,都有深厚的數學基礎。毫無疑問,想要成為一個頂級的數據科學家,需要在各個方面都具有優勢如編程能力、一定的商業智慧、以及獨特的分析能力等。但了解「引擎蓋下的機械原理」總是有好處的。對算法背後的數學機制有一個深入的理解,將使你在同行中具有優勢。
  • 【特徵向量新解法】數學天才陶哲軒和三位物理學家的新發現
    沒錯,就是這個再普通不過的基礎數學求解公式。這也是教科書裡面求特徵值的方法!然而,三位物理學家PeterDenton、StephenParke、張西寧發現了一個全新的方法:知道特徵值,只需要列一個簡單的方程式,特徵向量便可迎刃而解。大神和三位物理學家一起發表了論文,闡述了這個公式的證明過程!
  • 機器學習第一步,從向量和矩陣開始!
    這就是運用向量的意義所在。向量與矩陣在機器學習算法中,有這樣幾個要素值得關注。雖然在不同語境下,向量的意義各不相同,但並不妨礙我們將其歸納為含有數量級與方向的量。這樣一來,向量便能搭載著數據的邏輯關係及權重,從而讓數據集被輸入編碼器,形成數組,隨之進入神經網絡模型運算。而這個龐大的數組,通常以矩陣的方式出現。
  • 新手想轉行大數據,需要哪些數學功底作為基礎?
    大數據是將結構化數據和非結構化數據形成的所有數據整合起來,用以分析發現數據背後相關關係的信息資產。除了這些,大數據中的數學基礎:向量、矩陣介紹;向量在遊戲引擎中的應用;矩陣奇異值分解及其應用;導數、梯度介紹;最優化方法及其應用……想從事數據科學相關崗位,這些數學基礎「必備」:函數、變量、方程、圖統計線性代數微積分離散數學遞歸關係和方程最優化、運籌學
  • 機器學習 線性代數基礎 | 1.4 矩陣乘向量的新視角:變換基底
    我們即將步入這一章的尾聲,在本章前面的三個小節中,我們學習了矩陣和向量的表示方法以及加法、乘法等基本運算的規則,並能夠熟練利用Python語言工具正確的對其進行描述和表示。但是顯然我們不能僅僅滿足於此,那麼在這一小節裡,我們一起回過頭來靜靜的思考這樣一個問題:矩陣A和列向量x的乘法運算Ax有沒有其他更深層次的幾何含義呢?
  • R語言筆記1:數據類型(向量、數組、矩陣、 列表和數據框)
    宏基因組按:科研中數據分析解讀佔用了我們太多時間,學習R語言是生物測序領域數據(reads count表)分析及可視化的首選。
  • 不學好數學也想當數據科學家?不存在的
    這些工具和技術包括了,模擬物理或信息過程從而探尋潛在動力學過程,嚴格地評價數據來源的質量,訓練人們從信息流中識別隱藏模式的識別能力,或者理解模型的局限性。這些內容都是科學過程中的標誌。你怎麼知道下一個數據點是否分布在3-sigma的範圍內?遇到這些問題,你該怎麼辦?或者,僅是隔壁計算機科學的研究生偶爾的打趣--計算機進行任何有意義的數學運算的數據表(即:矩陣)的運算負荷會隨矩陣大小(行或者列)的增加呈非線性增長,也會讓IT工程師感到困惑和惱火。
  • ML基礎:協方差矩陣!
    在翻譯sklearn文檔 2.無監督學習部分過程中,發現協方差矩陣幾乎貫穿整個章節,但sklearn指導手冊把協方差部分放在了這一章節偏後的部分,作為機器學習一個基礎概念,在這篇文章中,想把協方差矩陣的相關知識以及主要應用。統計學中常用平均值,方差,標準差等描述數據。
  • 數據科學中需要知道的5個關於奇異值分解(SVD)的應用
    我經常聽到我大學的熟人抱怨他們花了很多時間的代數方程在現實世界中基本沒用。好吧,但我可以向你保證,並不是這樣的。特別是如果你想開啟數據科學的職業生涯。線性代數彌合了理論與概念實際實施之間的差距。對線性代數的掌握理解打開了我們認為無法理解的機器學習算法的大門。線性代數的一種這樣的用途是奇異值分解(SVD)用於降維。你在數據科學中一定很多次遇到SVD。
  • 機器學習與數據分析常用術語-基礎篇(一)
    2.變量(variable)變量來源於數學,是計算機語言中能儲存計算結果或能表示值抽象概念。變量可以通過變量名訪問。可以理解為欄位。3.向量(Vector)在數學中,向量(也稱為歐幾裡得向量、幾何向量、矢量),指具有大小(magnitude)和方向的量。它可以形象化地表示為帶箭頭的線段。
  • Python求解特徵向量和拉普拉斯矩陣
    學過線性代數和深度學習先關的一定知道特徵向量和拉普拉斯矩陣,這兩者是很多模型的基礎,有著很重要的地位,那用python要怎麼實現呢?numpy和scipy兩個庫中模塊中都提供了線性代數的庫linalg,scipy更全面些。