在計算機視覺領(lǐng)域,雙目測距技術(shù)通過模擬人類雙眼的視覺機制,實現(xiàn)了對三維空間中物體距離的精準(zhǔn)測量。其核心原理基于三角形幾何關(guān)系,通過計算左右攝像頭成像的視差來推導(dǎo)物體深度。本文將詳細闡述這一過程的底層邏輯,包括三角形模型的構(gòu)建、視差的產(chǎn)生機制、視差圖的遍歷計算以及深度信息的推導(dǎo)原理。
雙目測距的三角形模型構(gòu)建
人類雙眼之所以能感知物體遠近,是因為左右眼觀察同一物體時存在視角差異,這種差異被稱為視差。雙目測距系統(tǒng)正是利用這一原理,通過兩個平行放置的攝像頭(基線)模擬雙眼,形成一個以基線為底邊、以物體為頂點的三角形結(jié)構(gòu)。
設(shè)兩個攝像頭的光心分別為 O?和 O?,間距為基線長度 B(通常在系統(tǒng)標(biāo)定階段精確測量)。當(dāng)觀察空間中某點 P 時,P 在左攝像頭成像平面上的投影為 P?,在右攝像頭成像平面上的投影為 P?。此時,O?、O?和 P 構(gòu)成一個等腰三角形,其中 O?O?為基線 B,P 到基線所在平面的垂直距離即為目標(biāo)深度 Z。同時,P?和 P?在成像平面上與各自主點(光學(xué)中心在成像平面的投影)存在水平偏移,這兩個偏移量的差值便是視差的核心來源。
攝像頭的焦距 f(單位為像素)是連接二維成像與三維空間的關(guān)鍵參數(shù)。根據(jù)針孔成像模型,物體在成像平面上的投影尺寸與物距成反比,即 Z = f × 物高 / 像高。在雙目系統(tǒng)中,這一關(guān)系被擴展到左右視差的計算中,形成深度與視差的反比例關(guān)系。
視差的產(chǎn)生與數(shù)學(xué)表達
視差(Disparity)的本質(zhì)是同一物體在左右兩幅圖像中成像位置的水平偏差。在理想的平行雙目系統(tǒng)中(左右攝像頭光軸完全平行),視差僅體現(xiàn)為水平方向的位移,垂直方向的偏差可忽略不計(通過系統(tǒng)標(biāo)定消除)。
設(shè)左攝像頭成像平面上 P?的橫坐標(biāo)為 X?,右攝像頭成像平面上 P?的橫坐標(biāo)為 X?(以各自主點為原點),則視差 d 的定義為:
d = X? - X?
這一公式的物理意義是:物體距離越近,左右像點的水平偏差越大(視差越大);物體距離越遠,視差越小。當(dāng)物體位于無窮遠處時,視差趨近于 0。
從三角形相似原理出發(fā),可推導(dǎo)出視差與深度的定量關(guān)系。在 O?O?P 構(gòu)成的三角形中,O?P?和 O?P?均平行于深度方向 Z,因此形成兩個相似三角形:△PO?O?與△PP?P?。根據(jù)相似比關(guān)系:
B / Z = d /f
整理后可得深度計算公式:
Z = B × f /d
這一公式揭示了雙目測距的核心規(guī)律:深度 Z 與基線 B、焦距 f 成正比,與視差 d 成反比。這也是遍歷視差圖計算深度的理論基礎(chǔ)。