理解高維的數學——一個4維以上歐幾裡德距離的直觀證明

2020-12-12 老胡說科學

數據科學家經常處理高維數據——根據上下文,數據科學家可以處理數百萬維的數據。在一個每一個新特性都是另一個維度的世界裡,很容易失去對更高維度的真正理解,以及它們是如何工作的,這對設計算法和數據分析很有幫助。

幾乎所有的機器學習算法都要求在多維空間中找到兩點之間的歐幾裡得距離——一條直線。在本文中,您將了解如何在4+維中計算歐式距離。

最初的勾股定理指出,在一個二維直角三角形中三條邊a,b,c滿足: a+ b= c。

通過添加另一個三角形,其長度與原始三角形的斜邊相同,我們可以通過替換來擴展勾股定理:

如果將藍色三角形「抬高」,使它的長邊仍然與綠色三角形的斜邊相連,並且d垂直於b:

紅色的線代表三維的線。它是由邊a、b和d決定的,因此,a+ b+ d= e。換句話說,三維距離是它三條邊的平方和的平方根。

將這個想法擴展到四個方面:

通過將附加的黃色三角形視為與e相連,並且將線段f垂直於d,我們可以說g^2等於其四個邊的平方之和,即a^2+b^2+d^2+f^2。a和b分別形成x和y軸;d形成z軸,附加三角形的短邊表示新尺寸的長度。

這個想法可以進一步概念化,把三角形堆疊想像成一張二維的紙,沿著c摺疊產生第三維,然後沿著e摺疊,使得f垂直於d以及其他軸,比如a和b。

添加新維度相當於在斜邊上疊加更多的三角形。

這依賴於所有維都互相正交的假設。這也是主成分分析等降維方法在多維空間中尋找正交向量的假設。PCA與多維空間中的歐幾裡得距離具有相同的基礎。

因此,給定一個n維地點集,

其中a表示第一個點在n維空間中的位置,其第m個元素表示第m維空間中該點的值(例如,如果a(1) = 10,則該點的x軸值為10,則n維空間中的距離由

或者,邊的平方和(由維度n a和b之間的距離給出)。

這也被稱為歐幾裡得範數。現在,你對運算法則如何在高維數據集中運作有了一些直覺,能夠在一個我們永遠無法完全理解的世界中畫出一條直線。

相關焦點

  • N維空間一——歐幾裡德空間
    在數學中,它是對歐幾裡德所研究的2維和3維空間的一般化。就是把長度和角度轉換成任意維數的坐標系。這是有限維、實內積空間的「標準」例子。 歐氏空間是一個特別的度量空間,內積空間是歐氏空間的一般化。約公元前300年,古希臘數學家歐幾裡德建立了角和空間距離之間聯繫的法則,現稱為歐幾裡德幾何。
  • 幽默、風趣而又執著的「幾何教父」——歐幾裡德的二、三趣事
    從公元前338年希臘諸邦被馬其頓控制,到公元前30年羅馬消滅最後一個希臘化國家託勒密王國的300餘年,史稱希臘數學的「黃金時代」,我們的「幾何教父」歐幾裡德就出生在這個年代,他的成就標誌了古希臘數學的巔峰。
  • 9個數據科學中常見距離度量總結以及優缺點概述
    這些度量,如歐幾裡得距離或餘弦相似度,經常可以在k-NN、UMAP、HDBSCAN等算法中找到。理解距離測量域比你可能意識到的更重要。以k-NN為例,這是一種經常用於監督學習的技術。作為默認值,它通常使用歐幾裡得距離。它本身就是一個很大的距離。
  • 產品數學課:如何理解個性化推薦裡的數學原理?
    2.4 三種推薦方式的區別理解完這三種推薦方式,我們來看看他們之間的區別。1)基於物品的協同過濾與基於內容的推薦內容和物品都是事物的一種,2者似乎都是在計算物品的相似性?看起來是相同的。三、相似度怎麼計算相似度常見的計算方式是餘弦相似度、歐幾裡德距離、Jaccard相關係數。下文則是對餘弦相似度及歐幾裡德距離的理解。數學課正式開始(敲黑板)。
  • 數據科學中常見的9種距離度量方法,內含歐氏距離、切比雪夫距離等
    這些度量,如歐幾裡得距離或者餘弦相似性,經常在 k-NN、 UMAP、HDBSCAN 等算法中使用。了解距離度量這個領域可能比你想的更重要,以 k-NN 為例,它常被用於監督學習中。但是,如果你的數據是高維的,歐幾裡德距離還能用嗎?又或者如果你的數據是由地理空間信息組成的,也許半正矢距離是很好的選擇。我們究竟如何選擇最適合的距離度量?
  • 收藏 | 機器學習最常見的 9 種距離度量方法,含歐氏距離、切比雪夫距離等
    這些度量,如歐幾裡得距離或者餘弦相似性,經常在 k-NN、 UMAP、HDBSCAN 等算法中使用。了解距離度量這個領域可能比你想的更重要,以 k-NN 為例,它常被用於監督學習中。但是,如果你的數據是高維的,歐幾裡德距離還能用嗎?又或者如果你的數據是由地理空間信息組成的,也許半正矢距離是很好的選擇。我們究竟如何選擇最適合的距離度量?
  • 本文帶你了解優化背後的數學知識
    背景知識在深入了解該論文之前,我們先要理解一些底層數學概念。理想情況下,這篇論文要求讀者對高斯幾何有基礎了解,即三維歐幾裡德空間中曲線和表面的幾何。此外,微分幾何的知識也很重要。不過,我會嘗試解釋這篇論文中某些術語的意義。每個平滑的 d 維流形 M 都局部微分同胚於 R^n。M 中每個點周圍都有一個平坦的(小型)鄰域。因此,它遵循 R^n 上的歐幾裡德度量。
  • 數據科學中常見的9種距離度量方法(內含歐氏距離、切比雪夫距離等)
    了解距離度量這個領域可能比你想的更重要,以 k-NN 為例,它常被用於監督學習中。但是,如果你的數據是高維的,歐幾裡德距離還能用嗎?又或者如果你的數據是由地理空間信息組成的,也許半正矢距離是很好的選擇。我們究竟如何選擇最適合的距離度量?數據科學家 Maarten Grootendorst 向讀者介紹了 9 種距離度量方法,並探討如何以及何時以最佳的方式使用它們。
  • 值得一看,25張動圖更直觀的理解初中數學
    同學對於初中數學各種公式定理掌握的如何呢?有不少同學對於這些很不擅長,林老師今天給大家分享25張動圖,能幫助同學們更有效的理解初中數學的知識點,一起來看看吧。橢圓的定義就是到兩個定點之間的距離和保持不變的點的軌跡。
  • 歷史上,有哪些被證明不成立的數學猜想?這些真的反人性的證明
    要證明一個數學猜想困難無比,推翻一個數學猜想卻只需一個反例!平行線第五公設的證明歐幾裡德幾何也就是我們大多數人所學的平面幾何,平面幾何的整個基石就是那五條公設,也就是我們數學中的公理,也即不用證明公認的定理.
  • 究竟什麼才是數學新課標中的「幾何直觀」
    幾何的發展首先是歐幾裡得的歐氏幾何,其次是19世紀上半葉,非歐幾何的誕生,再次是射影幾何的繁榮,最後是幾何學的統一。「直觀」是什麼?依據《辭海》中的解釋,直觀是不經過理智推理過程,而由感覺或精神直接體驗的一種認識作用。它是指通過對客觀事物的直接接觸而獲得感性認識的一種方式。
  • 機器學習基礎:相似度和距離度量究竟是什麼
    設 A 為用戶的電影評分 A 列表,B 為用戶的電影評分 B 列表,那麼它們之間的相似度可以這樣計算:從數學上看,餘弦相似度衡量的是投射到一個多維空間中的兩個向量之間的夾角的餘弦。當在多維空間中繪製餘弦相似度時,餘弦相似度體現的是每個向量的方向關係(角度),而非幅度。如果你想要幅度,則應計算歐幾裡德距離。
  • SVM教程:支持向量機的直觀理解
    下面是一個簡化版本的SVM:找到正確分類訓練數據的一組直線。在找到的所有直線中,選擇那條離最接近的數據點距離最遠的直線。距離最接近的數據點稱為支持向量(support vector)。支持向量定義的沿著分隔線的區域稱為間隔(margin)。下圖顯示了之前的第二條線,以及相應的支持向量(黑邊數據點)和間隔(陰影區域)。
  • 俄國數學天才稱平行線可以相交,遭嘲諷鬱鬱而終,12年後被證實!
    經過30年對非歐幾何學的努力,Lobachevsky的理論終於在1868年Bertrami公布的論文中被證實。Bertrami公布了一篇關於非歐幾何的解釋的學術論文,基本上是說非歐幾何可以存在於歐氏空間的曲面,註解了非歐氏幾何的真實性。每個人都認為是荒謬的非歐幾裡德幾何,終於翻過了身子。
  • 100 個最偉大的數學定理,你知多少?
    數學家並沒有免疫這些影響,在 1999 年 7 月的一個數學會議中,Paul 和 Jack Abad 提出了他們的「一百個最偉大的定理」名單。他們給出的排列是基於一下標準;「定理在文獻中的地位、證明的質量與結果的意外性」。這個排列當然同電影還有書排列的一樣的武斷,但是這裡的定理必定都是很有價值的結果。
  • 古希臘數學大家歐幾裡德的《幾何原本》,被稱為是千古奇書!
    歐幾裡德是位古希臘幾何學家,憑著一本《幾何原本》而流芳千古。雖然像拿破倉、亞歷山大和馬丁·路德這樣的人物,其有生之年的名氣要比歐幾裡德顯赫得多,但是,從歷史的視角來看,歐幾裡德應該比他們要流傳久遠。關於歐幾裡德的生平,我們幾乎一無所知。
  • 歐幾裡德數學競賽,你入圍全球前25%了嗎?
    2016年歐幾裡德數學競賽全球約16000名參賽學生,4月13日歐幾裡德數學競賽精彩回顧:北美最大規模數學競賽,西南優秀學子樹德同場競技歐幾裡德數學競賽由加拿大滑鐵盧大學主辦該校數學學院是全球最大的數學和計算機教育及研究中心該校是比爾·蓋茨兩度造訪、舉辦講座的加拿大唯一大學歐幾裡德是入圍滑鐵盧大學數學系獎學金評選資格的重要參考條件之一該競賽受到北美知名大學廣泛認可
  • 如何理解高維時空?試試看這部電影
    本文轉載自【微信公眾號:靜境,ID:FM18848】經微信公眾號授權轉載,如需轉載與原文作者聯繫今天再給大家推薦一部電影——《星際穿越》,幫助我們更好理解高維時空的概念。在高維時空的庫珀可以看到不同時間、不同空間的墨菲房間,而在三維空間中的墨菲則無法感知到在高維的庫珀。這是為什麼呢?
  • 維歐藝術留學:英國利茲大學怎麼樣?
    英國利茲大學好不好?乘火車2個小時左右即可到達倫敦,距離曼徹斯特也只有1小時左右的車程。 4、一流的教學設施 學校圖書館是全英國最大的大學圖書館之一,藏書種類豐富多樣。現有藏書2,600,000冊,期刊9,000多份,並配備網上查詢系統。