2016,VR元年,oculus、HTC、索尼等這樣的重量級廠商紛紛推出或宣布了自己的消費級硬件產品來搶占消費者市場,相信廣大VR愛好者們中的很多人都已經入手了一款虛擬現實設備。在這些硬件當中,Oculus Rift CV1(以下簡稱“CV1”)無疑是最受人矚目的硬件產品之一,畢竟它有2014年拿了Facebook20億美金這樣的大事件撐腰。
眾所周知,Oculus Rift采用的是主動式光學定位技術,那它到底是如何實現的呢?
?。╲ia:nukethefridge.com)
基本實現流程:
Oculus Rift設備上會隱藏著一些紅外燈(即為標記點),這些紅外燈可以向外發(fā)射紅外光,并用紅外攝像機實時拍攝。獲得紅外圖像后,將攝像機采集到的圖像傳輸到計算單元中,通過視覺算法過濾掉無用的信息,從而獲得紅外燈的所在方向,再利用PnP算法,即利用四個不共面的紅外燈在設備上的位置信息、四個點獲得的圖像信息即可最終將設備納入攝像頭坐標系,擬合出設備的三維模型,并以此來實時監(jiān)控玩家的頭部、手部運動。
注:具體可看如下圖,注意上面這些紅色的小點點。
接下來我將向大家介紹一下我的推理過程,以及算法的一些細節(jié)。
| 頭顯上的LED燈
前文中我提到我們需要利用四個不共面的紅外燈在設備上的位置信息來進行定位,而如果想要知道不同的紅外燈在設備上的位置信息,就必須能夠區(qū)分不同的紅外燈。
為什么這么說呢,如果不區(qū)分紅外燈,那么當DK2(注:特指頭顯)在空間中運動時,攝像機捕捉到光點后,要進行關聯(姿態(tài)最優(yōu)匹配的過程)的次數 會非常大,舉個列子:
1) 如果有N預測圖像點和M 《= N觀察圖像點,則有N!/(N-M)!可能的關聯
2) 對于N = 40和M = 20(對DK2 LED的數量),有3.3&TImes;1029的關聯,所以就算是計算機,也無法快速地得到結果。
很顯然,DK2一定是采用了某種先驗的方式區(qū)分光點。那么問題來了,DK2到底是如何區(qū)分的呢?
我曾看到有文章中猜測說DK2是通過LED燈的亮滅來區(qū)分的,實際上卻并非如此。因為雖然通過LED燈的亮滅來區(qū)分比較簡單,因為亮滅最容易區(qū)分出來,但是這種方法有個缺陷,就是無法區(qū)分是姿態(tài)改變導致的LED燈被遮擋,還是LED燈本身就熄滅了,所以,DK2沒有使用這個方法,而是采用LED燈光信息的強弱來實現的。我們來觀察用灰度攝像機拍攝的圖:
對比上面兩圖,可以發(fā)現亮斑的大小有變化??梢钥闯黾t色部分,在圖2時光斑更大,藍色則相反。接下里我們看詳細的做法。這里必須說一下,在推測具體的做法過程中,我曾誤以為DK2直接判斷光斑大小,然后根據多幀圖像的規(guī)律來判斷LED燈的ID,但實際上DK2是使用差分法來判斷光斑大小。我在這里簡單給大家介紹一下我的推理過程。
首先我用自己的攝像機拍攝了大量照片進行觀察后發(fā)現如果把攝像機用60HZ左右頻率拍攝,圖像每10張就會開始重復。
我先給光點編個號,如下圖:
比如,2號點的可以用肉眼識別的強弱順序:弱,弱,強,強,弱,強,弱,弱,弱,強。
那么是不是這樣呢?如何在DK2中表示這些強弱關系呢?
首先,已知SDK的windows的driver會發(fā)送一個開始信息,讓頭顯開始運作;
緊接著,這個driver就會不斷接收到下面信息:
X1 X2 X3 X4 是1個32位數,是圖像分析后得到的空間坐標(原理后面給大家解釋),DX則不知道干什么用,但是觀察上面的num,換算出來是40,index從1開始,不斷遞增到40,說明DK2在一個一個的識別LED燈,另外,這些信息每17ms左右發(fā)上來一次,和60HZ的拍攝頻率差不多,基本上可以認定是利用每10幀確定一個LED的方式。
為了完全確定這一點,還必須確定另一個問題:同步。
如果真的是LED通過10幀不同的變化來讓攝像機確定LED燈的ID,那么必須要同步。
這要求一個同步信號能同時傳給攝像機和頭顯,如果能了解同步的時機,就知道到底是不是60HZ的頻率了。
可是當我看了MT9V034的資料后發(fā)現居然拍攝的頻率是30HZ左右,不過細想一下,如果使用差分檢測發(fā),使用30HZ這個頻率也能拍攝出光強的變化。也就是說,DK2根本不是直接判斷光斑是大還是小,而是將當前幀的光斑與上一幀同一個光斑做對比,如果比之前大,則為大,反之則為小。那么當一個新的幀到達時,該算法首先提取幀的亮像素斑點,如下圖。忽略少于10個像素或不是圓盤狀的,最后確保所有的斑點來自前一幀中提取的大圓盤狀斑點,然后進行對比。
所以,DK2將當前幀的光斑與上一幀同一個光斑做對比,然后根據10幀不同的變化來讓攝像機確定LED燈的ID。
我在進一步查看這些點和位置信息的對應關系后,總結出DK2判斷強弱變化的依據是:
1) 如果當前幀的斑點比上一幀斑點大10%,就是0;
2) 如果當前幀的斑點比上一幀斑點小10%,就是1;
3) 否則忽略。
這樣的設計非常好,防止了LED燈受到隨機干擾。