加入極市專業CV交流群,與6000+來自騰訊,華為,百度,北大,清華,中科院等名企名校視覺開發者互動交流!更有機會與李開復老師等大牛群內互動!
同時提供每月大咖直播分享、真實項目需求對接、乾貨資訊匯總,行業技術交流。點擊文末「閱讀原文」立刻申請入群~
作者 |劉浪
原文 | https://zhuanlan.zhihu.com/p/61955391
動量(Momentum)算法帶動量的 SGD引入動量(Momentum)方法一方面是為了解決「峽谷」和「鞍點」問題;一方面也可以用於SGD 加速,特別是針對高曲率、小幅但是方向一致的梯度。
參數更新公式
為梯度
動量算法描述
如果動量算法總是觀測到梯度 g,那麼它會在 −g 方向上不斷加速,直到達到最終速度。
在實踐中, α 的一般取 0.5, 0.9, 0.99,分別對應最大2 倍、10 倍、100 倍的步長
和學習率一樣,α 也可以使用某種策略在訓練時進行自適應調整;一般初始值是一個較小的值,隨後會慢慢變大。自適應學習率的優化方法
AdaGrad 存在的問題
偏差修正
*延伸閱讀
點擊左下角「閱讀原文」,即可申請加入極市目標跟蹤、目標檢測、工業檢測、人臉方向、視覺競賽等技術交流群,更有每月大咖直播分享、真實項目需求對接、乾貨資訊匯總,行業技術交流,一起來讓思想之光照的更遠吧~
覺得有用麻煩給個在看啦~