小樂數學科普:從歐氏距離並不是「歐拉距離」談起

2020-12-25 zzllrr小樂

最近幾年機器學習比較火,眾多程序猿大神們分享文章探討高維數據樣本相似度時,會經常提到「歐拉距離」這個詞。

「歐拉距離」是錯誤的叫法

首先,拋出結論:「歐拉距離」說法是錯誤的,應當是「歐幾裡得距離」,或者「歐氏距離」。當然,還有文獻提到「歐式距離」,更是大錯特錯,顯然不小心被不懂「數學」的輸入法(同音字,「歐式」比「歐氏」更高頻)帶到溝裡了。

歐氏距離

對數學史感興趣,並自認為對數學家歐拉Euler略知一二的小樂,一開始看到這個詞,比較納悶,還以為自己孤陋寡聞,居然不知道這個概念。於是一探究竟,發現這貨根本不是歐拉發明的一種數學概念,而應是歐幾裡得距離Euclidean distance,中文也叫歐氏距離,兩個數學家都姓「歐」(中譯),但此「歐」非彼「歐」,兩個人年齡相差約2000歲。出現這種以訛傳訛的現象,是時候值得糾正了,不然就像身邊人總是把「閾[yù]值」念成「閥[fá]值」,《漂洋過海來看你》誤把「情不自已[yǐ]」唱成「情不自己[jǐ]」(應為:我竟悲傷得不能自「已」[yǐ] [yǐ] [yǐ]),令強迫症難以接受。

小樂認為,第一個誤用「歐拉距離」的程序猿,應當是對數學家歐拉比較熟悉,甚至懷著激賞與崇敬之情的,但對數學知識概念的深入了解可能不夠,導致一聽到「歐氏」,立即大腦第一反應認為理所當然就是「歐拉」,畢竟我們見過太多歐拉發明或發現的數學知識理論了,歐拉函數,歐拉公式,歐拉方程,歐拉定理,歐拉角,歐拉線,歐拉常數,等等不一而足(當然這些冠以歐拉名字的玩意,都是後人冠名)。話說回來,我們不能奢望所有的程序猿都能精通數學理論和史實(除非他是高德納Donald Knuth),正如不能指望所有數學家都會編程,電腦玩得很溜一樣。

就在本文寫作之時,手上的編輯器還「智能」檢測出,提示小樂把「歐氏」改為「歐式」,讓人不禁唏噓,難道程序猿寫個錯別字的檢測程序,只考慮詞頻,都不考慮一下上下文嗎?

被誤判為錯別字

當然最後小樂還可以奢望一下,發起一個倡議,所有的現代文本編輯器(作業系統自帶的,基於瀏覽器web的或者App Native原生的),都能支持標準的數學公式編輯排版(例如:LaTeX語法之類),所有的瀏覽器都能支持數學公式的原生渲染(各瀏覽器大廠的產品經理和程序猿,聯合W3C之類的組織,來推動統一一下行業標準,例如統一支持用KaTeX之類渲染啊),就像小樂數學編輯器目前支持的各種數學公式一樣。這樣,小編們編輯微信公眾號文章,編輯百家號圖文,以及學生老師家長、科學家、數學家交流數學題時,就不要老用一大堆圖片,甚至粗暴手繪拍照,或者SVG複雜技術曲線救國了),畢竟圖片佔用的存儲資源和傳輸帶寬比文字大多了。

相關焦點

  • 機器學習裡的歐氏距離
    在詩句裡,距離可以很浪漫,「世界上最遙遠的距離,不是生與死的距離,不是天各一方,而是,我就站在你的面前,你卻不知道我愛你」。在機器學習裡,距離是嚴謹的,需要一個精確的公式來計算。許多機器學習的常見算法都需要用到距離函數,即用於計算兩個不同觀測(obs)之間的距離。
  • 歐氏距離、閔氏距離和馬氏距離(閔可夫斯基軼事外一則)
    距離的定義很多,在數學上只需滿足三個基本條件即可以稱為距離,即非負性、對稱性和三角不等式性質。     我們最熟悉的莫過於歐幾裡得(Euclid)距離(簡稱歐氏距離),但距離還有很多其他定義方式,在不同情形下有不同的應用。
  • 數據科學中常見的9種距離度量方法(內含歐氏距離、切比雪夫距離等)
    在數據挖掘中,我們經常需要計算樣本之間的相似度,通常的做法是計算樣本之間的距離。在本文中,數據科學家 Maarten Grootendorst 向我們介紹了 9 種距離度量方法,其中包括歐氏距離、餘弦相似度等。
  • 數據科學中常見的9種距離度量方法,內含歐氏距離、切比雪夫距離等
    在數據挖掘中,我們經常需要計算樣本之間的相似度,通常的做法是計算樣本之間的距離。在本文中,數據科學家 Maarten Grootendorst 向我們介紹了 9 種距離度量方法,其中包括歐氏距離、餘弦相似度等。許多算法,無論是監督學習還是無監督學習,都會使用距離度量。
  • 收藏 | 機器學習最常見的 9 種距離度量方法,含歐氏距離、切比雪夫距離等
    在數據挖掘中,我們經常需要計算樣本之間的相似度,通常的做法是計算樣本之間的距離。在本文中,數據科學家 Maarten Grootendorst 向我們介紹了 9 種距離度量方法,其中包括歐氏距離、餘弦相似度等。許多算法,無論是監督學習還是無監督學習,都會使用距離度量。
  • 計算距離知多少(一)
    點擊藍字 ·  關注我們,更多科普知識
  • 歐拉恆等式:完美的數學公式
    作為一個多產的數學家,歐拉貢獻不可估量,他提出了許多對現代數學不可或缺的概念。在歐拉的一生中,它出版了885份關於數學和其他學科的論文和書籍。即使是後來失明了,他仍然筆耕不輟。歐拉在失明之後還打趣地說:「現在我就更不會分心了。」 以勤奮著稱的歐拉,用他那驚人的記憶和心算能力彌補了視力的喪失。在歐拉一生豐碩的成果中,有一個以他名字命名的公式被譽為「上帝創造的公式」,那就是歐拉恆等式。
  • 唐人街2-曼哈頓距離是個啥
    2,聽起來非常之高大上的曼哈頓算法,今天就來一起腦補一下那些數學中常見的距離公式。,yn) 之間的距離為:       (1)二維平面上兩點a(x1,y1)與b(x2,y2)間的歐氏距離:        (2)三維空間兩點a(x1,y1,z1)與b(x2,y2,z2)間的歐氏距離:        (3)兩個n維向量a(x11,x12,…,x1n)與 b(x21,x22,…,x2n)間的歐氏距離:2、曼哈頓距離
  • 歐氏距離是否仍是跨模態/單模態Re-ID度量學習的最佳選擇?
    想法很自然:訓練階段最小化同類樣本之間的歐氏距離,推遠異類樣本之間的歐氏距離,檢索時也採用歐氏距離,這樣一來訓練目標和最終目標便達成了一致,符合直覺。另外值得注意的是,雖然訓練過程基於餘弦度量學習+softmax loss的方法,在測試階段檢索時卻只需用傳統歐氏度量求特徵距離即可,無需歸一化求餘弦距離。紅外-彩色跨模態Re-ID:
  • 小樂數學科普:一個可精確表徵形狀的數學框架:可見性圖
    zzllrr小樂導讀2021-2-5:本文由兩篇相關的英文翻譯構成,介紹了一種近期由馬克斯·普朗克分子植物生理研究所科學家研發的分析形狀的數學框架
  • 數學裡最美的恆等式——歐拉恆等式
    比較公認的觀點是著名的歐拉恆等式e^(iπ)+1=0,因為這個公式精簡卻無比美妙。e、i、π、1、0不正是數學中最常見、最重要的五個常數嗎?萊昂哈德·歐拉是18世紀最偉大的數學家之一,也是人類歷史上最傑出的數學家之一。作為一個多產的數學家,歐拉貢獻不可估量,他提出了許多對現代數學不可或缺的概念。在歐拉的一生中,它出版了885份關於關於數學和其他學科的論文和書籍。
  • 中考數學備戰032-不用歐拉定理,三個小題也可快求內外心距離
    下面這個題目是求三角形的內心和外心距離,如果你知道平面幾何歐拉定理((d^2)=(R^2)-2Rr,R表示外接圓半徑,r表示內切圓半徑,d表示內外心距離),那這個題目你可以秒出答案,不過即使你不知道也沒問題。我教你通過把下面這道題分解成三道非常非常簡單的題目,也可以很快求出三角形內心和外心的距離。
  • 機器學習中的分類距離
    這幾類物理幾何空間距離的應用非常多,尤其是歐氏距離。(圖中的c)就是A、B兩個樣本的歐氏距離。因此,歐氏距離就是兩個樣本值投影在其坐標空間上的兩點之間的直線距離。如何計算A與B之間的歐氏距離?,A、C兩個樣本的歐氏距離、曼哈頓距離和切比雪夫距離均小於A、B兩個樣本,因此,A與C的相似度較高。
  • 機器學習中的相似性度量:距離,原來還有這麼多類
    、信息熵1、歐氏距離(EuclideanDistance)歐氏距離是最易於理解的一種距離計算方法,源自歐氏空間中兩點間的距離公式。想像你在曼哈頓要從一個十字路口開車到另外一個十字路口,駕駛距離是兩點間的直線距離嗎?顯然不是,除非你能穿越大樓。實際駕駛距離就是這個「曼哈頓距離」。而這也是曼哈頓距離名稱的來源, 曼哈頓距離也稱為城市街區距離(CityBlock distance)。(1)二維平面兩點a(x1,y1)與b(x2,y2)間的曼哈頓距離
  • 數學名人 | 無處不在的歐拉,你真的了解什麼叫做數學大神嗎?
    該公式把兩個超越數:自然對數的底e,圓周率pi,兩個單位:虛數單位 i,和自然數的單位1,以及數學裡常見的0,五個重要而基本的數學元素全部包含在內。歐拉公式將指數函數的定義域擴展到複數域,建立三角函數和指數函數的關係,被譽為「數學中的天橋」。
  • 閔式距離詳解及其SPSS實現
    ②曼哈頓距離和切比雪夫距離的相互轉化。③閔式距離的SPSS實現一、閔可夫斯基距離閔可夫斯基距離(Minkowski Distance)又叫做閔氏距離,是一組距離的定義,其計算公式為如下圖。根據q取值的不同,閔氏距離可分為曼哈頓距離、歐氏距離和切比雪夫距離等。
  • 數學大師啟示錄——歐拉
    其實,歐拉不僅僅把它當作自己應盡的責任,他對它們確實懷有濃厚的興趣。你看,像柯尼斯堡七橋這類問題在數學上還沒有人處理過。它顯然不是我們所熟悉的代數問題,因為它不是研究數量的大小。它和平面幾何也不相同。平面幾何裡的圖形不是直線就是圓,是討論它們的角度大小和線段長短。
  • 論文推薦 | 基於歐氏距離的無人艇載毫米波雷達點跡凝聚方法
    試驗前對方法中涉及的各個閾值參數進行設定: 根據雷達性能說明書設置Rmin0=0, Rmax0=200, Amin0=-60, Amax0=60, Vmin0=-40, Vmax0=25, N0=3, 其中速度值的正負分別代表目標遠離和靠近; 考慮無人艇避碰安全距離等因素設置W0=3。RCS0設置過小會導致濾除效果較差, 過大容易造成漏檢, 因此對其進行合理設定最為關鍵。
  • 中等數學裡的歐拉定理(公式)知多少?
    以歐拉名字命名的科學成果有:歐拉角(剛體運動)、歐拉常數(無窮級數)、歐拉方程(流體動力學)、歐拉公式(複合變量)、歐拉數(無窮級數)、歐拉多角曲線(微分方程)、歐拉齊性函數定理摘微分方程)、歐拉變換(無窮級數)、伯努利—歐拉定律(彈性力學)、歐拉—傅立葉公式(三角函數)、歐拉—拉格朗日方程(變分學,力學)以及歐拉一馬克勞林公式(數字法)等等,不難想像,要完整地統計歐拉定理的個數,恐怕不是件容易的事
  • 常見距離度量方法優缺點對比!
    在本文中,我們將介紹不同的距離測量方法,並探索如何以及何時最好地使用它們。最重要的是,我會談談各自的缺點,這樣你就能知道何時該避開使用某些距離度量的措施。1. 歐式距離我們從最常見的距離測量開始,即歐氏距離。它是一種最好的距離測量方法,可以解釋為連接兩點的線段長度。