圖解- 立體視覺BM算法原理

2020-12-16 Bing的天涯路

硬體準備

首先需要將兩個攝像頭固定起來就可以了。由於攝像頭自身有畸變，兩個攝像頭不是平行的，前後不一致之類的需要進行參數標定，這個太簡單就不說了。注意幾點：

BM和SGBM算法對參數敏感，一定要耐心調節參數攝像頭一定要標定這些立體算法對光照敏感BM算法實現原理

這種算法實現起來的優點就是快，缺點是深度圖的效果不是很好。BM算法只能對8為灰度圖像計算視差。大概是這種效果，我採集的是視頻，BM對視頻的每一幀進行處理。

BM算法原理是將兩個攝像頭的的幀分成很多的小方塊來機型匹配，通過移動小方塊來匹配另一個圖中的小方塊，通過發現不同小方塊在另一個圖像中的像素點位置在結合兩個攝像頭的關係數據（標定的參數中的translate 和rotation矩陣）來計算出物體的實際深度從而生成相應的深度圖。

算法概述

具體一點的解釋就是，BM算法會將當前的幀劃分為很多小塊，將每個小塊與另一個攝像頭採集的小塊進行比較，這個過程是將這個小塊進行移動比對得到的。移動的過程就是通過創建一個向量來模擬小塊從一個位置運行到另一個位置的運動。

然後在另一張圖中橫向查找顯示的像素塊

找到了之後我們就得到呢同一個塊在兩個圖中的像素距離，這個時候我們用類似三角測距的方式就可以獲取這個像素塊在真實世界中的距離。

那麼如何匹配像素塊呢？上述基本上是一個簡化版的BM算法概述，在上述的介紹中一直遺漏了一個問題，移動的過程中如何知道兩個塊是相似的呢？這是通過計算小方塊內計算像素點矩陣的 SAD（絕對差之和來實現的）

在計算視差圖之前，我們會見兩個圖轉化成灰度圖，這樣每個像素點我們只有一個值[0-255]，也就是單通道的，正常的數據是BRG數據也就是[0-255,0-255,0-255]這樣的。

為了計算SAD，我們需要對每個像素塊提取然後找到計算，通過相減當我們得到一個越小的SAD值就代表兩個像素塊約相似，相信看了下面這個圖就懂了：

BM算法參數的實際意義

BM算法使用OPENCV的實現的方法在網上有很多，這裡不再贅述。

本文作者熊冰，個人網站Bing的天涯路)，轉載請註明出處。

相關焦點

淺談立體視覺

淺談立體視覺 2020-10-23 16:41 來源：澎湃新聞·澎湃號·湃客
多視圖立體視覺:CVPR 2019 與 AAAI 2020 上的ACMH、ACMM及ACMP...

點擊上方「3D視覺工坊」，選擇「星標」乾貨第一時間送達多視圖立體視覺(MVS)一直是計算機視覺研究的一個熱點。它的目的是從多個已知相機姿態的圖像中建立密集的對應關係，從而產生稠密的三維點雲重建結果。在過去的幾年裡，人們在提高稠密三維重建的質量上付出了很大的努力，一些算法如PMVS、GIPUMA以及COLMAP等取得了令人印象深刻的效果。然而，在三維重建任務中，由於數據量大、弱紋理、遮擋、反射等問題，如何高效準確地實現多視圖立體視覺仍然是一個具有挑戰性的問題。
限位伸縮器原理圖解

限位伸縮器原理圖解
圖解剖析四柱液壓機工作原理

鑫臺銘給大家介紹四柱液壓機工作原理前，我們先來看一張液壓機的剖面圖（如下圖）：結合這張圖，我們來給大家介紹四柱液壓機的工作原理：圖解剖析四柱液壓機工作原理1．四柱液壓機主缸的運動(1)快速下行快速下行時，電磁鐵IYA通電，先導閥3和主缸換向閥
液壓機|四柱液壓機|單柱液壓機|小型液壓機工作原理圖解

液壓機工作原理圖解起升油缸設有三個油口，P1、P2和P3。液壓機工作原理圖解液壓系統包括主液壓系統和轉向液壓系統，兩個系統共用一液壓油箱。液壓機工作原理圖解液壓機的特點1、基於液壓傳動的原理，執行元件（缸及柱塞或活塞）結構簡單，結構上易於實現很大的工作壓力
一個超乾貨的3D視覺學習社區

……SLAM請問現在比較新且效果較好的Visual SLAM /Visual+Inertial SLAM 算法有哪些呢？如果能支持雙目RGB或RGB-D的更好！請問怎麼用單目普通相機的slam來做三維重建呢，對比sfm改做何區別比較好？您好，我想問下視覺慣性vio非線性優化這塊，原理不是很懂，想知道他到底做了什麼事？大佬好，最近又遇到難題了。
SLAM算法解析:抓住視覺SLAM難點,了解技術發展大趨勢

在無人駕駛方面，可以使用 SLAM 技術提供視覺裡程計功能，然後跟其他的定位方式融合。機器人定位導航方面，SLAM 可以用於生成環境的地圖。基於這個地圖，機器人執行路徑規劃、自主探索、導航等任務。SLAM 技術的發展距今已有 30 餘年的歷史，涉及的技術領域眾多。由於本身包含許多步驟，每一個步驟均可以使用不同算法實現，SLAM 技術也是機器人和計算機視覺領域的熱門研究方向。
排序算法之高效排序法

高效排序算法桶排序桶排序 (Bucket sort)或所謂的箱排序，是一個排序算法，工作的原理是將數組分到有限數量的桶子裡。每個桶子再個別排序（有可能再使用別的排序算法或是以遞歸方式繼續使用桶排序進行排序）。桶排序原理介紹桶排序是計數排序的升級版。它利用了函數的映射關係，高效與否的關鍵就在於這個映射函數的確定。
陳振傑:挖掘AI視覺算法長尾經濟

在此背景下，極視角聚焦圖像視覺，依賴算法平臺模式走出一條自己的商業之路。研究該模式背後，正是長尾經濟的一種典型應用案例。在AI應用碎片化需求大爆發的時間點，這是否將幫助極視角站穩腳跟？拭目以待。至少在深圳極視角科技有限公司（簡稱「極視角」；英文簡稱：Extreme Vision）成立至今的5年間，他們在國內首創的AI視覺算法平臺模式依然是支撐公司穩定發展的助推器。在基礎層—技術層—應用層（包括AI應用終端、AI應用行業解決方案）的AI產業鏈條中，成立於2015年6月的極視角，是專業的人工智慧與計算機視覺算法服務提供商，更偏向末端的應用層。
單相電機啟動和運行原理圖解

打開APP 單相電機啟動和運行原理圖解發表於 2019-10-21 09:55:42 單相電機的啟動，這種電容也叫啟動電容，
...聯合商湯提出視覺引導的聲源分離輔助立體聲重構方法 Sep-Stereo

作者 | Johann Zhou編輯 | 陳大鑫今天介紹的是一篇已被ECCV 2020接收的論文，這篇論文中提出了一種全新的通用框架，利用共享的主幹網絡，同時解決音頻-視覺學習的兩大主流問題：視覺信息引導的聲源分離和立體聲重構。
RSA算法原理(二)

有了這些知識，我們就可以看懂RSA算法。這是目前地球上最重要的加密算法。我們通過一個例子，來理解RSA算法。假設愛麗絲要與鮑勃進行加密通信，她該怎麼生成公鑰和私鑰呢？ex + φ(n)y = 1已知 e=17, φ(n)=3120，17x + 3120y = 1這個方程可以用"擴展歐幾裡得算法"求解，此處省略具體過程。總之，愛麗絲算出一組整數解為 (x,y)=(2753,-15)，即 d=2753。至此所有計算完成。
圖解汽車(9) 汽車差速器結構原理解析

閱讀提示：　　PCauto技術頻道圖解類文章都可以使用全新的高清圖解形式進行閱讀。大家可以通過點擊上面圖片連結跳轉到圖解模式。高清大圖面積提升3倍，看著更清晰更爽，趕緊來體驗吧！　　如果對於差速器的工作原理還不夠明白，可觀看下面這個講解差速器原理的視頻，非常經典有趣。（為了節省你的時間，可從3：30開始觀看）● 為何又要把差速器鎖死？
AlphaGo算法原理淺析

圍棋界公認AlphaGo的圍棋能力已經遠遠超過了人類職業圍棋的頂尖水平了，那麼AlphaGo為什麼這麼厲害，它的算法原理是什麼呢，下面結合在網際網路上看到的一些文章，整理思路進行淺析。雖然贏了人類，但沒有智能，因為整個算法完全就是按人工設計的一個算法，體現不出智能之處。計算機下圍棋，理論上也是可以暴力破解的，但是問題就在於圍棋的可走的步子太多了，以至於按目前的計算性能根本做不到暴力破解。而另外一種方式，是使用蒙特卡洛樹搜索的方法，蒙特卡洛算法通過某種「實驗」的方法，得到一個隨機變量的估計，從而得到一個問題的解。
資料|世界著名計算機教材精選:數據挖掘十大算法(中文版)

：數據挖掘十大算法》詳細介紹了在實際中用途最廣、影響最大的十種數據挖掘算法，這十種算法是數據挖掘領域的頂級專家進行投票篩選的，覆蓋了分類、聚類、統計學習、關聯分析和連結分析等重要的數據挖掘研究和發展主題。
計算機視覺入門大全:基礎概念、運行原理、應用案例詳解

選自 tryolabs機器之心編譯參與：魔王這是一篇計算機視覺入門指南，從概念、原理、用例等角度介紹了計算機視覺。「機器能夠模擬人類視覺系統」的幻想已經過時了。自 1960 年代第一批學術論文出現以來，計算機視覺已經走了很遠，現代系統已經出現，且它們可以集成到移動應用中。
常見 Hash 算法的原理

SHA-1 設計時基於和MD4同樣原理,而且模仿了該算法。哈希表不可避免衝突(collision)現象：對不同的keyword可能得到同一哈希地址即key1≠key2，而hash(key1)=hash(key2)。因此，在建造哈希表時不僅要設定一個好的哈希函數，並且要設定一種處理衝突的方法。
暢談自動駕駛|雷射雷達或優於視覺算法?

簡單來講，雷射雷達比普通視覺算法反應更快，能在極端惡劣天氣下運行自如，但成本也更為昂貴。誠然，雷射雷達相較於視覺算法有著許多天然優勢，但雷射雷達的價格也貴的離譜，僅僅64線束的雷射雷達就可以賣到53萬人民幣，而一個攝像頭只要幾千塊錢。雷射雷達難取所有人歡心哪怕強如雷射雷達，哪怕眾多車企趨之若鶩，依舊有一小部分人對之嗤之以鼻，首當其衝的就屬特斯拉CEO馬斯克。
綜述國內外三維視覺測量系統的發展現狀

80年代初，Marr從信息處理的角度綜合了圖像處理、心理物理學、神經生理學以及臨床病學的研究成果，提出了第一個較為完善的視覺系統框架，稱之為Marr視覺理論[3]。該理論從信息處理系統的角度出發，將系統的研究分為三個層次[3]：計算理論層次、表達與算法層次、硬體實現層次。
視覺直觀感受 7 種常用的排序算法

事實上，快速排序通常明顯比其他Ο(n log n) 算法更快，因為它的內部循環（inner loop）可以在大部分的架構上很有效率地被實現出來，且在大部分真實世界的數據，可以決定設計的選擇，減少所需時間的二次方項之可能性。

圖解- 立體視覺BM算法原理

相關焦點

淺談立體視覺

多視圖立體視覺:CVPR 2019 與 AAAI 2020 上的ACMH、ACMM及ACMP...

限位伸縮器原理圖解

圖解剖析四柱液壓機工作原理

液壓機|四柱液壓機|單柱液壓機|小型液壓機工作原理圖解

一個超乾貨的3D視覺學習社區

SLAM算法解析:抓住視覺SLAM難點,了解技術發展大趨勢

排序算法之高效排序法

陳振傑:挖掘AI視覺算法長尾經濟

單相電機啟動和運行原理圖解

...聯合商湯提出視覺引導的聲源分離輔助立體聲重構方法 Sep-Stereo

RSA算法原理(二)

圖解汽車(9) 汽車差速器結構原理解析

AlphaGo算法原理淺析

資料|世界著名計算機教材精選:數據挖掘十大算法(中文版)

計算機視覺入門大全:基礎概念、運行原理、應用案例詳解

常見 Hash 算法的原理

暢談自動駕駛|雷射雷達或優於視覺算法?

綜述國內外三維視覺測量系統的發展現狀

視覺直觀感受 7 種常用的排序算法