計算機視覺知識點總結

2021-02-20 極市平臺

加入極市專業CV交流群,與6000+來自騰訊,華為,百度,北大,清華,中科院等名企名校視覺開發者互動交流!更有機會與李開復老師等大牛群內互動!

同時提供每月大咖直播分享、真實項目需求對接、乾貨資訊匯總,行業技術交流掃描文末二維碼立刻申請入群~

分享一篇計算機視覺知識點的相關博文匯總,非常系統全面,超多乾貨,也歡迎大家補充好的文章。本文涉及較多超連結,已經發布在極市開發者社區:

http://bbs.cvmart.net/articles/380(或直接閱讀原文),歡迎前往獲得更好的閱讀體驗。

作者 | JustDoIT

來源 | https://zhuanlan.zhihu.com/p/58776542

目錄
0 計算機視覺四大基本任務
1 經典卷積網絡
2 卷積、空洞卷積
3 正則化
4 全卷積網絡
5 1*1卷積核
6 感受野
7 常見損失
8 優化算法
9 concat 和 add的區別
10 注意力機制
11 CNN(卷積神經網絡)、RNN(循環神經網絡)、DNN(深度神經網絡)
12 邊框回歸
13 非極大值回歸(NMS, Soft NMS)
14 激活函數
15 評價指標
16 batch size的選擇
17 Graph Convolutional Network(GCN)0 計算機視覺四大基本任務計算機視覺四大基本任務(分類、定位、檢測、分割)1 經典卷積網絡

AlexNet

從AlexNet理解卷積神經網絡的一般結構

VGG

【深度學習】經典神經網絡 VGG 論文解讀深度學習之基礎模型-VGG

GoogleNet

深度學習卷積神經網絡——經典網絡GoogLeNet(Inception V3)網絡的搭建與實現

ResNet

ResNet解析ResNetV2:ResNet深度解析

DetNet

曠視科技提出物體檢測專用Backbone——DetNet2 卷積、空洞卷積變形卷積核、可分離卷積?卷積神經網絡中十大拍案叫絕的操作。

卷積

「看懂」卷積神經網(Visualizing and Understanding Convolutional Networks)CNN入門必讀經典:Visualizing and Understanding Convolutional Networks
3 正則化

L1、L2

機器學習中的範數規則化之(一)L0、L1與L2範數機器學習中正則化項L1和L2的直觀理解
4 全卷積網絡全卷積網絡 FCN 詳解5 1*1卷積核一文讀懂卷積神經網絡中的1x1卷積核如何理解卷積神經網絡中的1*1卷積6 感受野深度神經網絡中的感受野(Receptive Field)7 常見損失損失函數改進方法總覽

focal loss

何愷明大神的「Focal Loss」,如何更好地理解?

交叉熵

交叉熵損失函數

對比損失(Contrastive Loss)

Contrastive Loss (對比損失)

三元組損失(Triplet Loss)

Triplet Loss及其梯度

8 優化算法9 concat 和 add的區別10 注意力機制計算機視覺中的注意力機制計算機視覺中的注意力機制11 CNN(卷積神經網絡)、RNN(循環神經網絡)、DNN(深度神經網絡)12 邊框回歸邊框回歸(Bounding Box Regression)詳解13 非極大值回歸(NMS, Soft NMS)

NMS

NMS——非極大值抑制

Soft NMS

Soft NMS算法筆記14 激活函數深度學習中的激活函數導引15 評價指標

目標檢測mAP

rafaelpadilla/Object-Detection-Metrics

語義分割(PA、MPA、MIoU、FWIoU)

語義分割之評價指標

可參考下面論文第五章節

A Review on Deep Learning Techniques Applied to Semantic Segmentation16 batch size的選擇17 Graph Convolutional Network(GCN)

*推薦閱讀

掃描下方二維碼即可申請加入極市目標跟蹤、目標檢測、工業檢測、人臉方向、視覺競賽等技術交流群,更有每月大咖直播分享、真實項目需求對接、乾貨資訊匯總,行業技術交流,一起來讓思想之光照的更遠吧~

覺得有用麻煩給個好看啦~  

相關焦點

  • LABVIEW視覺模塊總結
    用LabVIEW這麼久,對於視覺模塊的應用也是不斷清晰,利用閒暇時總結一下。1、用LabVIEW做視覺開發需要哪些模塊?答:首先你得安裝LabVIEW的主框架,也就是你所要安裝的版本,然後根據相應的版本需要安裝DAQmx、VDM和VAS。
  • 如何入門計算機視覺,10條你不能不看的總結
    第三點,可能是大家都比較感興趣的,就是計算機視覺作為人工智慧的一個分支,它不可避免的要跟深度學習做結合,而深度學習也可以說是融合到了計算機視覺、圖像處理,包括我們說的自然語言處理,所以本文也會簡單介紹一下計算機視覺與深度學習的結合。第四點,身處計算機領域,我們不可避免的會去做開源的工作,所以本文會給大家介紹一些開源的軟體。
  • 計算機視覺新手指南
    海德堡國際機場 曼徹斯特大學 波恩大學 亞琛工業大學 阿姆斯特丹大學 慕尼黑工業大學 捷克技術大學 劍橋大學 格拉茨 IST奧地利 倫敦瑪麗皇后大學 蘇黎世大學 代爾夫特大學 利茲大學 伯爾尼大學 隆德大學 義大利特倫託大學 義大利佛羅倫斯大學 斯圖加特大學 薩爾大學 巴黎中央學校 巴黎理工學院 奧盧大學 卡爾斯魯厄理工學院如果你是計算機視覺領域的新手,可以在下面找到一系列初學者需要了解的基礎知識點
  • 結構光測量之三角測量原理及光學三角法知識點總結
    可以得到像素點一世界坐標點之間的對應關係為:光學三角法知識點總結  1)雙目立體視覺          雙目立體視覺屬於被動三維測量技術,優點在於其適應性強,可以在多種條件下靈活測量物體三維信息。但是被動三維測量技術需要大量相關匹配運算和較複雜的空間幾何參數的標定等,測量精度低,常用於對三維目標的識別、理解,以及用於位置、形態分析。尤其在無法採用結構光照明的時候優勢凸顯。
  • 計算機作業系統知識點總結
    作業系統是配置在計算機硬體上的第一層軟體,是控制計算機所有操作的軟體。4.1.2 作業系統的構成進程管理、內存管理、文件管理、輸入/輸出系統管理、二級存儲管理、聯網、保護系統、命令解釋程序4.2.1 作業系統的類別 經過多年的發展,作業系統多種多樣。為提高大型計算機系統的資源利用率,作業系統從批處理,多道程序發展為分時作業系統。為了滿足計算機處理實時事件的需要,就有實時作業系統。
  • 深度學習—計算機視覺學習路線【從學術到工作】
    甚至連生物醫學、機械自動化、土木建築等諸多專業的學生都開始研究其在各自領域的應用,一個視覺交流群裡三分之一以上都不是計算機相關專業的。當然,我也是其中一員。對於非計算機相關專業的同學而言,學習過程中往往缺少交流機會,不容易把握視覺知識的全貌。這裡僅根據個人經驗和網絡知識,談一談對於一名非計算機專業的學生而言,該不該入門計算機視覺?以及該如何學習計算機視覺?
  • 計算機視覺方向簡介 | 多視角立體視覺MVS
    推薦閱讀前段時間參加了個線下交流會(附SLAM入門視頻)計算機視覺方向簡介 | 從全景圖恢復三維結構計算機視覺方向簡介 | 陣列相機立體全景拼接計算機視覺方向簡介 |單目微運動生成深度圖計算機視覺方向簡介 | 深度相機室內實時稠密三維重建計算機視覺方向簡介 | 深度圖補全計算機視覺方向簡介 | 人體骨骼關鍵點檢測綜述計算機視覺方向簡介 | 人臉識別中的活體檢測算法綜述計算機視覺方向簡介 | 目標檢測最新進展總結與展望計算機視覺方向簡介 |
  • 吐血整理|3D視覺系統化學習路線
    2D視覺技術藉助強大的計算機視覺和深度學習算法取得了超越人類認知的成就,而3D視覺則因為算法建模和環境依賴等問題,一直處於正在研究的前沿。近年來,3D視覺技術快速發展,並開始結合深度學習算法,在智能製造、自動駕駛、AR/VR、SLAM、無人機、三維重建、人臉識別等領域取得了優異的效果。
  • 2018計算機視覺及機器學習重要會議匯總
    2017年初,我們總結了2017年計算機視覺,機器學習和人工智慧領域內的重要會議。
  • 什麼是計算機視覺?什麼是機器視覺?
    然而,小夥伴們知道視覺對於機器人是多麼難能可貴嗎?我們平時所說的計算機視覺和機器視覺又有什麼區別呢?今天小編就為大家講一講什麼是計算機視覺、什麼又是機器視覺。首先在很多文獻中,計算機視覺與機器視覺是不加區分的,但其實這兩個術語既有區別又有聯繫的。
  • 【計算機視覺】深度相機(一)--TOF總結
    這是一種二維(2D)視覺技術。3D 視覺是指除了捕捉目標的空間位置(x 軸和 y 軸)和顏色之外,還能捕捉目標的深度(又稱 Z 軸、範圍、距離)及其周圍環境。一個 3D 視覺系統同時輸出每個場景的地形視圖和色彩視圖。PrimeSense是一家無廠半導體公司。他們的技術賦予電視、機頂盒、客廳電腦等消費電子產品自然互動能力。他最得意的兩個字就是:深度。
  • 知識點總結 | 萬有引力定律章節知識點總結,很詳細!
    v減小(EK減小<Ep增加),所以E總增加;需克服引力做功越多,地面上需要的發射速度越大應該熟記常識:地球公轉周期1年,自轉周期1天=24小時=86400s,地球表面半徑6.4x103km 表面重力加速度g=9.8m/s2月球公轉周期30天推薦閱讀:高中地理必學的66個知識點
  • 計算機視覺中的Transformer
    點擊上方「計算機視覺Daily」,選擇加"星標"重磅乾貨,第一時間送達
  • 計算機視覺基本原理介紹—RANSAC
    RANSAC是計算機視覺中非常重要的算法,對於真實世界含有噪聲數據的模型擬合非常有效。CVPR2006曾經專門有一個RANSAC Workshop:25 Years of RANSAC(http://cmp.felk.cvut.cz/ransac-cvpr2006/)。說它是算法,但其實它更像一種思想,使用不同的模型假設能演變出不同的算法。
  • 計算機視覺方向簡介 | 人臉顏值打分
    最後我們做一個總結。人臉顏值打分算法,雖然是一個比較主觀的問題,但是也可以取得比較統一的結果。它可以是一個分類問題,也可以是一個回歸問題。基於深度學習的方法+更大更高質量的數據集的整理,可以非常完美地解決這個問題。在各大軟體當中目前用於娛樂,但顏值算法同樣在美容等行業有一定價值,還有待應用。參考文獻:[1] 環球網.
  • 探秘人工智慧 | 計算機視覺
    計算機視覺(Computational Vision)是由相機拍攝圖像,通過電腦對圖像中的目標進行識別和檢測,可以說是機器學習在視覺領域的應用,是人工智慧領域的一個重要部分。它的研究內容可以概括為:通過採集圖片或視頻,對圖片或視頻進行處理分析,從中獲取相對應的信息。換而言之就是運用照相機和計算機來獲取我們所需的信息。
  • 2020 Top10計算機視覺論文總結:論文,代碼,解讀,還有demo視頻!
    有作者總結了10篇他認為最優秀的論文,大家一起看看吧,不光有論文,還有代碼,解讀,demo視頻哦。作者:louisfb01 編譯:ronghuaiyang 來源:AI公園儘管今年世界上發生了這麼多事情,我們還是有機會看到很多驚人的研究成果。特別是在人工智慧更精確的說是計算機視覺領域。
  • 計算機二級選題題知識點總結(下)
    CPU 性能:主頻,也叫時鐘頻率,單位是MHz,用來表示CPU的運算速度;字長,CPU在同一時間內處理的一組二進位數稱為一個計算機的「字」,而這組二進位數的位數就是「字長」;運算速度,指CPU每秒所能執行的指令條數一般用MPIS來描述。
  • 計算機視覺的典型應用
    以下介紹了目前計算機視覺的大致應用領域。模式識別模式識別(Pattern Recognition)是通過計算機數位技術方法研究模式的自動處理和判別。客觀世界中的客體統稱為「模式」,隨著計算機技術及人工智慧的發展,有可能對客體作出識別,它主要是視覺和聽覺的識別,這就是模式識別的兩個重要方面。
  • Clarifai:通過CloudAPI、內部部署和SDK獲取計算機視覺AI
    計算機視覺 AI平臺作為人工智慧最流行的形式之一,去年,CVAI被譽為「AI最強大的表現形式」。Gartner最近的一項研究預測表明,到明年,企業捕獲的99%的視覺內容將由CV驅動的機器進行分析,到2023年,CV將成為「大規模破壞者」。那麼,你將如何運行系統/ AI?