解讀無人駕駛發(fā)展難點及現(xiàn)階段技術(shù)手段
一、自動駕駛還需要較長的路要走
ADAS、自動駕駛、無人駕駛、智能汽車等詞語風(fēng)靡科技圈,如果哪個智能硬件團隊或科技公司無法與這些關(guān)鍵詞建立關(guān)聯(lián),頗有被世界遺棄之感。但是,如果客觀的去分析,真正意義上的自動駕駛尚有較長的路要走。
1)不存在完美的傳感器件
無論是何種程度的智能駕駛,第一步都是感知,也就是感知車輛周邊的負(fù)責(zé)的路況環(huán)境。在這個基礎(chǔ)上才能做出相應(yīng)的路徑規(guī)劃和駕駛行為決策。感知所采用的各種傳感器包含:各種形式的雷達(dá)、單目攝像頭、雙目攝像頭等,或是由這些傳感器進行不同組合形成的感知系統(tǒng),而這些傳感器件各有利弊。
比如:激光雷達(dá)對雨霧的穿透能力受到限制、對黑顏色的汽車反射率有限;毫米波雷達(dá)對動物體反射不敏感;超聲波雷達(dá)的感知距離與頻率受限;攝像頭本身靠可見光成像,在雨霧天、黑夜的靈敏度有所下降。
2)從90分到100分要走的路才是最艱難的
如果人去開車,一年中發(fā)生些小的刮蹭、磕碰是再正常不過的事。但如果自動駕駛系統(tǒng)發(fā)生這些事故,就要成為關(guān)注的焦點甚至不被接受。其實,我們對機器智能的可靠性要求要遠(yuǎn)遠(yuǎn)超出人工智能的可靠性。每種機器智能設(shè)備的投入使用都是在其可靠性遠(yuǎn)超人工之后才被允許的。所以,自動駕駛的目標(biāo)不是“像人一樣的去開車”,而是“在安全性、舒適性、合理性完全超過常人的狀態(tài)去開車”。
3)復(fù)雜的路況問題是自動駕駛的壁壘
相對于歐、美、日本,中國的各種路況要復(fù)雜的多。僅僅紅綠燈的形態(tài)不下100種;各種交通標(biāo)識的形態(tài)沒有統(tǒng)一;車道線的寬窄、間隔參差不齊,甚至許多道路沒有車道線。所以,高速公路的自動駕駛、某段路線的自動駕駛與真正意義上的自動駕駛是兩個層面的問題,這些都是在實現(xiàn)完全自動駕駛之前需要我們解決的問題。
4)法律方面的壁壘
除了技術(shù)問題,還有我們社會的法律問題。這些技術(shù)要在法律層面得到認(rèn)可,就要說清楚一系列的技術(shù)問題,還要有大量繁雜的數(shù)據(jù)支持。法律上認(rèn)可的過程也一定會是漫長的一個過程。當(dāng)然,這些工作都在同時開展著。
綜上所述,自動駕駛需要一步一步的走,不會一下子跳躍過去。ADAS系統(tǒng)會是自動駕駛的第一個階段,當(dāng)我們實現(xiàn)了危險駕駛行為的準(zhǔn)確預(yù)警,積累了大量的經(jīng)驗和使用數(shù)據(jù)后,下一步的工作才有可能實現(xiàn)。
二、ADAS與行車記錄儀對成像系統(tǒng)的要求截然相反
可以確定的講,凡是在行車記錄儀成像系統(tǒng)的基礎(chǔ)上添加ADAS功能的,都是在炒作概念。目前車上用的智能硬件多是行車記錄儀、云鏡等產(chǎn)品,在這個上面開發(fā)ADAS功能,只是廠家賺取噱頭的方式。
其根本原因是ADAS與行車記錄儀對成像系統(tǒng)的要求是截然相反的。
行車記錄儀的目的是記錄車輛周邊的狀況,看的越清晰越好、越全面越好。這就需要成像系統(tǒng)具有超高的分辨率、超好的色彩還原性、超大的廣角鏡頭,視角增大意味著焦距的縮小。
而ADAS的要求如下:
一是看的越遠(yuǎn)越好,看的越遠(yuǎn)就能有更加充裕的時間做出判斷和反應(yīng),從而避免或者降低事故發(fā)生造成的損失。而焦距越長看的會越遠(yuǎn)。
二是只關(guān)注車輛行駛區(qū)域內(nèi)的障礙物,所以是窄視角,也就是長焦距。這樣能降低車輛兩側(cè)障礙物(如路基、欄桿等)對系統(tǒng)誤報的影響。
三是要求黑白圖像。彩色圖像在sensor表面進行了鍍膜或分光的帶通過濾光譜,雖然提升了人眼的感知體驗,但實際上降低了信噪比或者說信息量。這對真正意義的圖像計算不利。
綜上所述,在短焦距只關(guān)注周邊景物的行車記錄儀成像系統(tǒng)的基礎(chǔ)上,進行ADAS的研發(fā)是不切實際的。
三、自動駕駛的傳感器主要有三大類
1)雷達(dá)
雷達(dá)又分為激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)等類型。激光雷達(dá)又可以分為單線雷達(dá)、雙線雷達(dá)、多線雷達(dá)等。
如果想要解決后裝的問題,或者說準(zhǔn)前裝的問題,雷達(dá)首先是被排除的對象。原因如下:第一,成本下不來。不管單線的、雙線的、還是64線的,最便宜的在 1000元左右,有的甚至高達(dá)數(shù)十萬,比車還貴。第二,雷達(dá)的安裝和標(biāo)定是個非常繁瑣的工作。不同的車型,安裝的方式會各不相同,都需要進行各自的精確標(biāo)定和調(diào)整,這個周期短則數(shù)天,長則數(shù)月。
當(dāng)然,雷達(dá)的優(yōu)勢在于測算的精度非常高,探測距離遠(yuǎn)。
2)單目攝像頭
單目攝像頭的大致原理如下。先通過圖像匹配進行識別(車型、行人等),再通過大小去估算距離。也就是在估算距離之前要知道這是個什么目標(biāo),是汽車還是行人,是貨車、SUV還是小轎車等。而做到這一點,需要建立并不斷更新一個龐大的樣本特征數(shù)據(jù)庫,然后對實時拍到的圖像視頻進行識別。這會導(dǎo)致系統(tǒng)無法對非標(biāo)準(zhǔn)的車型、物體、障礙物進行識別,從而無法進行預(yù)警。只有在識別成功完成后,才能根據(jù)大小、面積、尺寸、或其它特征進行距離的估算。
單目的優(yōu)勢在于成本較低,對計算資源的要求較低,系統(tǒng)結(jié)構(gòu)相對簡單。其缺點在于要保證較好的識別率,必須不斷更新和維護好樣本數(shù)據(jù)庫;無法對非標(biāo)準(zhǔn)障礙物進行判斷;距離并非真正意義上的測量,準(zhǔn)確度較低。
3)雙目攝像頭
雙目和單目有一個共同的特點,就是拍攝的圖象是二維的,而雷達(dá)是單線或多線的。
雙目的原理與人眼相似。人眼能夠感知物體的遠(yuǎn)近,是由于兩只眼睛對同一個物體呈現(xiàn)的圖像存在差異,或稱“視差”。目標(biāo)距離越遠(yuǎn),視差越小;反之,視差越大。視差的大小對應(yīng)著目標(biāo)物體的遠(yuǎn)近。這也是3D電影能夠使人有立體層次感知的原因。所以說雙目系統(tǒng)對目標(biāo)物體距離感知是一種絕對的測量,而非估算。
雙目系統(tǒng)的優(yōu)勢如下:一是成本比較低,但是比單目系統(tǒng)要高;二是沒有識別率的限制,因為從原理上無需先進行識別再進行測算,而是對所有障礙物直接進行測量;三是精度比單目高,直接利用視差計算距離;四是無需維護樣本數(shù)據(jù)庫,因為對于雙目沒有樣本的概念。[!--empirenews.page--]
雙目系統(tǒng)的缺點在于:計算量非常大,對計算單元的性能要求非常高,這使得產(chǎn)品化、小型化的難度較大。所以在芯片或FPGA上解決雙目的計算問題難度比較大。
國際上使用雙目的研究機構(gòu)或廠商,絕大多數(shù)是使用服務(wù)器來進行圖像處理與計算的;也有部分將算法進行簡化后,使用FPGA進行處理,但雙目配準(zhǔn)的效果又收到較大程度影響,存在很多噪點與空洞,這對后續(xù)的計算不利,存在安全風(fēng)險。
目前,中科慧眼技術(shù)團隊實現(xiàn)了在芯片中對雙目的高速計算,算法一方面要保證無噪點、空洞的干擾,另一方面要反映出細(xì)小障礙物的存在,在這個前提下將芯片計算效率提升至15fps。
上圖為實際場景與計算得到的距離的對應(yīng)關(guān)系(不同飽和度顏色代表不同距離,從暖色調(diào)至冷色調(diào)為距離由近及遠(yuǎn))。從右圖可以看出,距離計算的二維圖像中,噪點與空洞被很好的抑制。色調(diào)(距離)的過渡是平滑過渡,沒有跳變。
中科慧眼的雙目方案和國際上其他方案對相同高速公路實測對比結(jié)果如下圖所示:
雙目攝像頭的計算原理:
上圖中的人和椰子樹,人在前,椰子樹在后,最下方是雙目相機中的成像??梢钥闯鲇覀?cè)相機成像中人在樹的左側(cè),左側(cè)相機成像中人在樹的右側(cè),這是因為雙目的角度不一樣。再通過對比兩幅圖像就可以知道樹的視差小而人的視差大,因為樹的距離遠(yuǎn),人的距離近。這就是雙目三角測距的原理。
離攝像頭遠(yuǎn)的物體在雙目圖像中的disparity小,離攝像頭遠(yuǎn)近的物體disparity大。如果距離無限遠(yuǎn),雙目幾乎是沒有差別的。所以國際上大多數(shù)雙目系統(tǒng)的基線距離是十幾厘米,和人眼的距離是相近的。雙目系統(tǒng)可以實時把拍攝到的內(nèi)容轉(zhuǎn)化成距離。ADAS一個很重要的作用是碰撞預(yù)警。碰撞預(yù)警需要關(guān)注距離的變化,需要估計即將碰撞的時間。有了距離測量,才會有距離變化,有距離變化才會有碰撞時間的估計,最后才會有預(yù)警。
算法這里只講概念,國際上有兩種主流算法。一個叫ELAS,一個叫SGBM。這兩個算法是公開的。
我們的雙目方案相比傳統(tǒng)的算法具有如下優(yōu)勢:
一是效率,在芯片上的效率達(dá)到15fps,在FPGA+ARM架構(gòu)上的效率可以達(dá)到40fps。
二是效果,就是對于小障礙物的識別。既要做到?jīng)]有雜點和空洞,又要表現(xiàn)細(xì)節(jié)。否則小的障礙物,比如一條橫著的欄桿就無法識別,增加駕駛的風(fēng)險。下面的圖表現(xiàn)的是小物體和行人的探測上中科慧眼雙目方案與國際上其他算法的對比。
(Our為中科慧眼算法效果、其它為國際流行傳統(tǒng)方法的處理效果)
四、大規(guī)模產(chǎn)品化自動駕駛路還很長
國際上有Google,豐田等公司研制的無人駕駛汽車進行了大量的路測,在國際上具有較大的影響力。他們使用的是“全副武裝”的雷達(dá)陣列+攝像頭的模式,是一種側(cè)重于技術(shù)積累、品牌傳播、前瞻性研究的方式。計算核心使用的是位于車輛后備箱中的計算機陣列或服務(wù)器。僅僅車頂上方的velodyne多線激光雷達(dá)就高達(dá)數(shù)十萬元。而這種方式去實現(xiàn)無人駕駛無論從成本、體積、便捷性等方面考量,都尚不具備大規(guī)模普及與推廣的條件。國內(nèi)也有很多十余家團隊目前在做本地化的自動駕駛系統(tǒng)研發(fā),像中科慧眼的雙目產(chǎn)品樣機已經(jīng)完成,正在進行大規(guī)模路測。從產(chǎn)品理論技術(shù)原型走到真正被用戶接受的產(chǎn)品,恐怕要有很長的路要走。