?雙目視覺定位是一種模仿人類雙眼視覺原理,通過兩個攝像頭(“雙目相機”)獲取物體的立體圖像,再利用三角測量原理計算物體三維坐標的技術,廣泛應用于機器人導航、工業檢測、自動駕駛、虛擬現實等領域。雙目視覺定位的過程可分為 4 個關鍵步驟,環環相扣確保定位精度:
?

1. 相機標定(消除誤差)
目的:獲取兩個攝像頭的內參(焦距、主點坐標、畸變系數)和外參(相對位置和姿態,如基線距離、旋轉角度),消除鏡頭畸變和安裝誤差對后續計算的影響。
方法:通過拍攝已知尺寸的標定板(如棋盤格),利用算法(如張氏標定法)計算內參和外參,生成校正參數。
2. 圖像校正(統一視角)
目的:將左右攝像頭拍攝的畸變圖像校正為 “平行對準” 的無畸變圖像,使左右圖像中對應點的掃描線在同一水平線上(“極線校正”),簡化后續匹配難度。
原理:利用相機標定得到的參數,通過透視變換將左右圖像投影到同一平面,確保物體在左右圖像中的對應點僅在水平方向存在視差,而非任意位置。
3. 立體匹配(尋找對應點)
目的:在左右校正后的圖像中,找到同一物體的對應像素點(“同名點”),計算視差 d。
挑戰:因光照變化、物體遮擋、紋理缺失(如純色表面)等,對應點匹配難度較大。
常用算法:
局部算法:基于像素鄰域信息(如塊匹配 BM、半全局匹配 SGM),速度快,適合實時場景;
全局算法:基于能量優化(如圖割 Graph-Cut),精度高但計算量大,適合靜態場景。
4. 三維重建(計算坐標)
目的:利用視差圖和相機參數,計算物體上每個點的三維坐標(X, Y, Z),完成定位。
原理:根據三角測量公式,結合校正后的圖像坐標、焦距、基線距離,將二維像素坐標轉換為三維世界坐標,最終輸出物體的位置信息(如距離相機的深度、平面坐標等)。