關於範數的知識整理

2020-12-06 wenxiaocheng

向量的範數:

向量範數是定義了向量的類似於長度的性質,滿足正定,齊次,三角不等式的關係就稱作範數。

向量的範數一般有L0, L1, L2與L_infinity範數,

L0範數:

定義為

即非0元素個數。

L0範數表示向量中非零元素的個數。如果我們使用L0來規則化參數向量w,就是希望w的元素大部分都為零。L0範數的這個屬性,使其非常適用於機器學習中的稀疏編碼。在特徵選擇中,通過最小化L0範數來尋找最少最優的稀疏特徵項。但是,L0範數的最小化問題是NP難問題。而L1範數是L0範數的最優凸近似,它比L0範數要更容易求解。因此,優化過程將會被轉換為更高維的範數(例如L1範數)問題。

L1範數:

L1範數是向量中各個元素絕對值之和,也被稱作「Lasso regularization」(稀疏規則算子)。

在機器學習特徵選擇中,稀疏規則化能夠實現特徵的自動選擇。一般來說,輸入向量X的大部分元素(也就是特徵)都是和最終的輸出Y沒有關係或者不提供任何信息的,在最小化目標函數的時候考慮這些額外的特徵,雖然可以獲得更小的訓練誤差,但在預測新的樣本時,這些沒用的信息反而會被考慮,從而幹擾了對正確Y的預測。稀疏規則化算子的引入就是為了完成特徵自動選擇,它會學習地去掉這些沒有信息的特徵,也就是把這些特徵對應的權重置為0。

L0範數與L1範數都可以實現稀疏,而L1範數比L0具有更好的優化求解特性而被廣泛使用。 L0範數本身是特徵選擇的最直接的方案,但因為之前說到的理由,其不可分,且很難優化,因此實際應用中我們使用L1來得到L0的最優凸近似。

總結一下上兩段的結論就是:L1範數和L0範數可以實現稀疏,L1因為擁有比L0更好的優化求解特性而被廣泛應用。這樣我們大概知道了可以實現稀疏,但是為什麼我們希望稀疏?讓參數稀疏有什麼好處呢?這裡有兩個理由:

1)特徵選擇(Feature Selection):

大家希望稀疏規則化的一個關鍵原因在於它能實現特徵的自動選擇。一般來說,X的大部分元素(也就是特徵)都是和最終的輸出沒有關係或者不提供任何信息的,在最小化目標函數的時候考慮這些額外的特徵,雖然可以獲得更小的訓練誤差,但在預測新的樣本時,這些沒用的信息反而會被考慮,從而幹擾了對正確的預測。稀疏規則化算子的引入就是為了完成特徵自動選擇的光榮使命,它會學習地去掉這些沒有信息的特徵,也就是把這些特徵對應的權重置為0。

2)可解釋性(Interpretability):

另一個青睞於稀疏的理由是,模型更容易解釋。例如患某種病的概率是y,然後我們收集到的數據x是1000維的,也就是我們需要尋找這1000種因素到底是怎麼影響患上這種病的概率的。假設這是個回歸模型:

當然了,為了讓y限定在的範圍,一般還得加個Logistic函數。 通過學習,如果最後學習到的就只有很少的非零元素,例如只有5個非零的,那麼我們就有理由相信,這些對應的特徵在患病分析上面提供的信息是巨大的,決策性的。也就是說,患不患這種病只和這5個因素有關,那醫生就好分析多了。但如果1000個都非0,醫生面對這1000種因素只能一臉懵逼不知如何是好。

L2範數

L2範數是最常用的範數了,我們用的最多的度量距離歐氏距離就是一種L2範數。在回歸裡面,有人把加了L2範數項的回歸c稱為「嶺回歸」(Ridge Regression),有人也叫它「權值衰減weight decay」。它被廣泛的應用在解決機器學習裡面的過擬問題合。

為什麼L2範數可以防止過擬合?回答這個問題之前,我們得先看看L2範數實際上是什麼。

L2範數是指向量各元素的平方和然後求平方根。我們讓L2範數的規則項最小,可以使得的每個元素都很小,都接近於0,但與L1範數不同,它不會讓它等於0,而是接近於0,這是有很大的區別的。而越小的參數說明模型越簡單,越簡單的模型則越不容易產生過擬合現象。為什麼越小的參數說明模型越簡單?因為當限制了參數很小,實際上就限制了多項式某些分量的影響很小(看上面線性回歸的模型的那個擬合的圖),這樣就相當於減少參數個數。

總結下:通過L2範數,我們可以實現了對模型空間的限制,從而在一定程度上避免了過擬合。

L2範數的好處是什麼呢?

1)學習理論的角度: 從學習理論的角度來說,L2範數可以防止過擬合,提升模型的泛化能力。

2)優化計算的角度: 從優化或者數值計算的角度來說,L2範數有助於處理 condition number不好的情況下矩陣求逆很困難的問題。關於condition number的知識參見這篇文章:https://blog.csdn.net/zouxy09/article/details/24972869

矩陣的範數:

矩陣範數是定義了矩陣的類似於長度的性質,與向量範數不同,他要滿足額外的性質:

矩陣範數一般有1-, 2-, infinity-, F-範數

列和範數,即所有矩陣列向量絕對值之和的最大值

譜範數,即ATA矩陣的最大特徵值的開平方。

行和範數,即所有矩陣行向量絕對值之和的最大值。以上這些都是誘導範數,由向量的Lp範數誘導而來。非誘導範數常見的為F-範數,即Frobenius範數以及核範數。

行和範數,即所有矩陣行向量絕對值之和的最大值,matlab調用函數norm(A, inf)。 以上這些都是誘導範數,由向量的範數誘導而來。

Frobenius範數,即矩陣元素絕對值的平方和再開平方

核範數英文稱呼叫Nuclear Norm。這個相對於上面火熱的L1和L2來說,可能大家就會陌生點。那它是幹嘛用的呢?約束Low-Rank(低秩)

秩可以度量相關性,而矩陣的相關性實際上有帶有了矩陣的結構信息。如果矩陣之間各行的相關性很強,那麼就表示這個矩陣實際可以投影到更低維的線性子空間,也就是用幾個向量就可以完全表達了,它就是低秩的。所以我們總結的一點就是:如果矩陣表達的是結構性信息,例如圖像、用戶-推薦表等等,那麼這個矩陣各行之間存在著一定的相關性,那這個矩陣一般就是低秩的。

如果A是一個m行n列的數值矩陣,rank(A)是X的秩,假如rank(A)遠小於m和n,則我們稱X是低秩矩陣。低秩矩陣每行或每列都可以用其他的行或列線性表出,可見它包含大量的冗餘信息。利用這種冗餘信息,可以對缺失數據進行恢復,也可以對數據進行特徵提取。

好了,低秩有了,那約束低秩只是約束rank(A)呀,和我們這節的核範數有什麼關係呢?他們的關係和L0與L1的關係一樣。因為rank()是非凸的函數,在優化問題裡面很難求解,那麼就需要尋找它的凸近似來近似它了。對,rank(A)的凸近似就是核範數。

相關焦點

  • 範數
    在線性代數、泛函分析及相關的數學領域,範數是一個函數,是矢量空間內的所有矢量賦予非零的正長度或大小。半範數可以為非零的矢量賦予零長度。定義範數的矢量空間是賦范矢量空間;同樣,定義半範數的矢量空間就是賦半範矢量空間。註:在二維的歐氏幾何空間 R中定義歐氏範數,在該矢量空間中,元素被畫成一個從原點出發的帶有箭頭的有向線段,每一個矢量的有向線段的長度即為該矢量的歐氏範數。
  • 向量範數詳解+代碼實現
    作者:張家豪 來源:人工智慧學習圈向量範數是什麼??兩個標量我們可以比較大小,比如1,2,我們知道2比1大。但是現在如果是兩個向量(1,2,1) (2,2,0),我們如何比較大小呢?此時我們把一個向量通過不同的方法,映射到一個標量,從而可以比較大小,這個標量學名就叫做「範數」。向量範數也可以分為0範數,1範數,2範數,p範數,∞範數等。向量範數為方便理解,在介紹向量範數之前,我們先定義一個簡單向量:0-範數向量0-範數表示向量非零元的個數。
  • 39.積分、泛函 + 歐拉-拉格朗日方程、實數、標量、變分法、極值、弧微分、範數(數學篇)
    換言之,只要在泛函中加入任何擾動,都會使泛函的值變大,所以擾動為0的時候,就是泛函關於擾動的一個極小值。所以當擾動的能量趨近於0,泛函關於擾動的導數也是0。關鍵是擾動如何表示。答案是擾動用一個很小的數e乘上一個連續函數。當e趨近於0,意味著擾動也趨近於0。所以當e為0的時候,泛函對a的導數也為0。這就非常巧妙的把對函數求導的問題轉化成了一個單因子變量求導的問題。這就是這個思想的偉大之處。
  • Geophysics:基於L1範數壓制有限差分累積誤差
    苗中正等-Geophysics:基於L1範數壓制有限差分累積誤差中科院地質與地球物理所地球與行星物理院重點實驗室博士生苗中正與導師張金海研究員,提出了一種基於L1範數優化有限差分常係數的新方法。首先,他們基於空間頻散關係利用L1範數構建目標函數;然後,將其離散並轉化為受限L1範數最小化問題;最後,使用交替方向乘子法求解該問題。
  • Geophysics:基於L1範數壓制有限差分累積誤差
    苗中正等-Geophysics:基於L1範數壓制有限差分累積誤差有限差分法算法簡單直觀,廣泛應用於地震波數值模擬,然而該方法在高頻率和粗網格情況下會產生較強的空間數值頻散假象。中科院地質與地球物理所地球與行星物理院重點實驗室博士生苗中正與導師張金海研究員,提出了一種基於L1範數優化有限差分常係數的新方法。首先,他們基於空間頻散關係利用L1範數構建目標函數;然後,將其離散並轉化為受限L1範數最小化問題;最後,使用交替方向乘子法求解該問題。以8階有限差分方法為例,圖1對比了各種方法的二維波數響應誤差,圖2進一步給出了特定角度下的誤差曲線。
  • 高中物理電磁學重點知識整理
    高中物理電磁學重點知識整理為了能更好更全面的對高中物理進行學習和複習,確保將所涉及的知識點能全部掌握,考點全面複習到位。下面是小編整理的高中物理電磁學重點知識整理,希望能對大家有所幫助。
  • 如何歸納整理所學知識
    中考網整理了關於如何歸納整理所學知識,希望對同學們有所幫助,僅供參考。   到了中學知識脈絡不再單一,如果還是一味的死記硬背,不僅使記憶效率降低,還容易記混記錯,而且等到真正用到某些知識的時候,容易形成「記憶堵塞」。   4、形不成體系   所謂的知識體系就是指知識經過學生輸入、加工、儲存過程而在頭腦中形成的有序的組織狀態。如果知識形不成體系,就像一盤散沙,無法找到各個知識點的聯繫,就無法串聯所學的知識。
  • 汽車英語知識學習:關於汽車英語單詞整理匯總
    但你知道英國與美國城市中,關於汽車的英文有很多種說法嗎?小編要在這篇文章中告訴你很多英國、美國對汽車的講法!1. 輪胎Tyre 輪胎 (英式)Tire 輪胎 (美式)2.以上就是關於汽車方面的英語知識,想必對汽車感興趣的小夥伴們一定看的很過癮吧。今天的英語知識乾貨就全部分享完了,大家有任何的英語學習問題,請點擊我的頭像,私信發消息給我,我看到將第一時間回復,也希望能幫到您,謝謝。
  • 騰訊AI Lab論文:用隨機象限性消極下降算法訓練L1範數約束模型
    騰訊技術工程官方號獨家編譯了論文《用隨機象限性消極下降算法訓練L1範數約束模型》(Training L1-Regularized Models with Orthant-Wise Passive Descent Algorithms),該論文被 AAAI 2018錄用為現場陳述論文(Oral Presentation),由騰訊 AI Lab獨立完成,作者為王倪劍橋。
  • CVPR 2019Oral論文解讀|百度提出關於網絡壓縮和加速的新剪枝算法
    雷鋒網(公眾號:雷鋒網) AI 科技評論按:百度關於網絡壓縮和加速的論文《 Filter Pruning via Geometric Median for Deep Convolutional Neural Networks Acceleration》被 CCF A 類學術會議 CVPR 2019 收錄為 Oral 論文,這篇論文提出了新的基於濾波器的幾何中心(geometric
  • Unity遊戲開發基礎知識整理
    Unity遊戲開發基礎知識整理 Unity3D是一個讓玩家輕鬆創建諸如三維視頻遊戲、建築可視化、實時三維動畫等類型互動內容的多平臺的綜合型遊戲開發工具
  • 關於地點的英文介詞最全整理!快收藏起來
    ,關於地點的介詞,英文如何搭配使用?相信這個問題應該是很多同學搞不清楚的,經常傻傻分不清,今天在這裡就給大家分享一下關於地點的英文介詞最全整理,希望能夠幫助到大家。. in3. by4. into/out of5. into6. in/at7. out of8. out of有關英語知識就分享到這裡
  • 2020年中考物理:常用常量及換算知識整理
    中考網整理了關於2020年中考物理:常用常量及換算知識整理,希望對同學們有所幫助,僅供參考。   1.空氣(15℃)中的聲速為:340m/s.   2. 大多數人的聽覺頻率範圍:20HZ~20000HZ.   3. 人耳區分回聲:≥0.1s   4.
  • 2020甘肅醫療衛生招聘考試公共基礎知識:關於地震的那些知識
    2020甘肅醫療衛生招聘考試公共基礎知識:關於地震的那些知識 2020甘肅事業單位醫療衛生崗招聘考試正在緊張備考中,甘肅事業單位E類考試主要考察醫學基礎知識和招聘崗位專業知識應用能力組成,部分事業單位還會考到
  • 關於知識的名言 關於知識有什麼句子
    那麼,關於知識的名言有哪些?我們一起看看吧。關於知識的名言:1、知識和世故不同,真有學問的人往往是很天真的。——羅曼·羅蘭2、知識是精神食糧。——柏拉圖3、如果一個人的知識缺乏條理,那他的知識越多,他就越感到困惑不解。——斯賓塞4、知識是為老年準備的最好的食糧。——亞里斯多德5、當我們步入晚年,知識將是我們舒適而必要的隱退的去處;如果我們年輕時不去栽種知識之樹,到老就沒有乘涼的地方了。
  • OK記:可多平臺摘錄的碎片化知識收集整理工具
    與此前相比,我們獲得的信息非常豐富,同時也非常雜亂無序,碎片化難以整理。如何從紛亂的碎片化信息中挑選和收集對自己長期有用的信息是很多人都在思考的問題。今天獵雲網(微信:ilieyun)要介紹的OK記就是要致力於解決碎片化知識閱讀帶來的問題。
  • 福建臨床醫學基礎知識:關於細胞、組織的適應總結
    福建臨床醫學基礎知識:關於細胞、組織的適應總結 【導讀】福建衛生人才網:提供2019福建醫療衛生閱讀資料,如需了解關於醫療衛生備考的醫學基礎知識、臨床、護理、面試等資料,請點擊上方連結了解更多詳情。
  • 2017醫學基礎知識:關於小腸液的分泌
    醫療衛生招聘考試資料:北京衛生人才網提供北京醫療衛生人才招聘考試複習資料,包括2017北京醫療衛生招聘考試資料、醫學基礎知識考點、解題技巧及醫生 護士招聘筆試面試輔導。2017醫學基礎知識:關於小腸液的分泌。更多醫療衛生招聘考試信息請點擊北京醫療衛生人才網。
  • 高中生物DNA知識點整理
    高中生物DNA知識點整理高中生物教材中許多知識都可以量化,涉及到一些計算,是生物科學深入發展的標誌之一。下面是小編整理的高中生物DNA知識點整理,具體內容如下。