Waymo挑戰(zhàn)賽兩個第一,地平線與零跑秀中國肌肉
6月20日,CVPR 2021自動駕駛研討會(Workshop on Autonomous driving)揭曉了本年度谷歌無人駕駛公司W(wǎng)aymo開放數(shù)據(jù)集挑戰(zhàn)賽的最終結(jié)果,地平線感知算法團(tuán)隊(duì)?wèi){借AFDetV2模型獲得了實(shí)時3D挑戰(zhàn)項(xiàng)目的第一名,另一個模型則榮獲Most Efficient Model(最高效模式)頭銜。這是繼2020年榮獲5項(xiàng)挑戰(zhàn)中4項(xiàng)全球第一后,地平線再次摘得桂冠。
在實(shí)時2D挑戰(zhàn)項(xiàng)目中,中國的零跑汽車團(tuán)隊(duì)在2D實(shí)時檢測挑戰(zhàn)賽中斬獲了第一名。
每項(xiàng)挑戰(zhàn)的得獎團(tuán)隊(duì)獲得1.5萬美元現(xiàn)金獎勵,第二名團(tuán)隊(duì)獲得5000美元,第三名團(tuán)隊(duì)獲得2000美元。

地平線再次奪冠
研討會精彩紛呈
CVPR 2021自動駕駛研討會旨在聚集學(xué)術(shù)界和工業(yè)界的研究人員和工程師,討論自動駕駛感知的最新進(jìn)展。為期一天的研討會包括論文發(fā)布、特邀演講和技術(shù)基準(zhǔn)挑戰(zhàn),以展示當(dāng)前的技術(shù)水平以及計(jì)算機(jī)視覺在自動駕駛中的局限性和未來方向,以及計(jì)算機(jī)視覺和人工智能(AI)最有前途的應(yīng)用。

演講者
論文的主題包括:自主導(dǎo)航與探測;基于視覺的高級駕駛輔助系統(tǒng)、駕駛員監(jiān)控和高級接口;無人機(jī)和水下機(jī)器人視覺系統(tǒng);車輛技術(shù)中的深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和圖像分析技術(shù);車輛應(yīng)用性能評估;采集系統(tǒng)(如相機(jī)、雷達(dá)、激光雷達(dá))的車載校準(zhǔn);三維重建與理解;基于視覺的定位(例如,位置識別、視覺里程計(jì)、SLAM)等。
群雄逐鹿,方顯英雄本色
自動駕駛(AD)將對人們的日常生活產(chǎn)生了重大影響,開發(fā)自動化車輛已成為工業(yè)界和學(xué)術(shù)界的核心興趣所在。隨著人們在這一領(lǐng)域的發(fā)力,與AD相關(guān)的所有技術(shù)都取得了長足進(jìn)步。
那么,怎樣要證明一家公司在自動駕駛領(lǐng)域的實(shí)力呢?答案是:來Waymo開放數(shù)據(jù)集挑戰(zhàn)賽一決高下!
作為全球自動駕駛公司王者,2020年3月,Waymo首次在CVPR自動駕駛研討會期間舉辦Waymo開放數(shù)據(jù)集挑戰(zhàn)賽,宗旨是以模型導(dǎo)向,以算法為王。Waymo首席科學(xué)家兼項(xiàng)目負(fù)責(zé)人Drago Anguelov表示:“我們的數(shù)據(jù)集是有史以來規(guī)模最大、場景最豐富、最多樣化的自動駕駛數(shù)據(jù)集之一?!?

大規(guī)模數(shù)據(jù)收集
作為自動駕駛領(lǐng)域中算法研發(fā)方面最著名的國際性大賽,本屆Waymo開放數(shù)據(jù)集挑戰(zhàn)賽旨在鼓勵對感知與行為預(yù)測進(jìn)行新的研究。為此,Waymo開放了其自動駕駛車輛在25個城市收集的超過1000萬英里、570個小時的自動駕駛道路數(shù)據(jù),超10萬個城市真實(shí)場景。大賽吸引了包括清華、滴滴、賽靈思、伯克利、德克薩斯大學(xué)、南洋理工大學(xué)等在內(nèi)的30余支學(xué)術(shù)界和產(chǎn)業(yè)界頂尖自動駕駛研發(fā)團(tuán)隊(duì)的參與。
為了解計(jì)算機(jī)視覺算法在解決自主駕駛環(huán)境感知問題方面的現(xiàn)狀,主辦方提出了兩個挑戰(zhàn),準(zhǔn)備了由Waymo和Argo-AI收集和注釋的大規(guī)模數(shù)據(jù)集。基于這些數(shù)據(jù)集定義了許多現(xiàn)實(shí)問題,鼓勵業(yè)界為自動駕駛發(fā)明新的算法。Waymo開放數(shù)據(jù)集挑戰(zhàn)賽共設(shè)四個現(xiàn)場項(xiàng)目,包括動態(tài)預(yù)測、關(guān)聯(lián)預(yù)測、實(shí)時2D檢測及實(shí)時3D檢測。
-
運(yùn)動預(yù)測挑戰(zhàn):給定實(shí)體(agent)對應(yīng)地圖上過去1秒的軌跡,在未來的8秒鐘內(nèi)預(yù)測最多8個實(shí)體的位置。
-
交互預(yù)測挑戰(zhàn):給定實(shí)體在對應(yīng)地圖上過去1秒的軌跡,預(yù)測2個交互實(shí)體在未來8秒內(nèi)的共同未來位置。
-
實(shí)時3D檢測:給定三幅激光雷達(dá)測距圖像和相關(guān)攝像頭圖像,為場景中的對象生成一組3D直立框。
-
實(shí)時2D檢測:給定一組攝像頭圖像,為場景中的對象生成一組2D框,有延遲要求。
力壓賽靈思奪得頭籌
地平線連續(xù)兩年參加Waymo自動駕駛算法挑戰(zhàn)賽,連續(xù)兩年斬獲殊榮。相比上屆,本屆Waymo比賽實(shí)時3D檢測難度更高,實(shí)時性要求更接近實(shí)際場景。結(jié)果,地平線力壓賽靈思、德克薩斯大學(xué)等公司和高校團(tuán)隊(duì),其AFDetV2模型奪得實(shí)時3D檢測第一名。該項(xiàng)目要求實(shí)時性,在小于70毫秒時間內(nèi)精度最高者為第一名。地平線提交的另一模型AFDetV2-Base摘得Most Efficient Model稱號,是速度最快的模型,同時模型精度大于70APH。

CVPR 2021公布獲獎頁面
值得一提的是,地平線連續(xù)兩年參加3D物體檢測項(xiàng)目,去年的模型至今為止仍是Waymo競賽榜單(LeaderBoard)上檢測精度最高的模型;而今年的模型在實(shí)時性檢測的榜單上又名列第一。同時擁有3D物體檢測精度最高和實(shí)時性最高的3D物體檢測模型,充分體現(xiàn)了地平線世界領(lǐng)先的算法實(shí)力。
感知能力是自動駕駛的起點(diǎn)和基石。地平線通過“算法+芯片”軟硬結(jié)合,面向智能駕駛場景,聚焦視覺感知,提供智能駕駛核心解決方案。地平線團(tuán)隊(duì)此次在實(shí)時3D檢測項(xiàng)目的表現(xiàn)展現(xiàn)了其高水準(zhǔn)的智能感知能力。一系列關(guān)鍵技術(shù)實(shí)現(xiàn)不僅是地平線團(tuán)隊(duì)對先進(jìn)算法的創(chuàng)新性運(yùn)用,也體現(xiàn)了其強(qiáng)大的工程能力,能夠在貼合實(shí)際應(yīng)用場景的前提下,實(shí)現(xiàn)高精度、低延遲,不斷提升感知的準(zhǔn)確性。
攻克模型運(yùn)用關(guān)鍵技術(shù)難點(diǎn)
實(shí)時3D對檢測精度和速度都有極高的要求。如何能夠最有效利用計(jì)算資源是此次競賽的核心問題。
憑借對3D物體檢測的多年技術(shù)積累,在模型設(shè)計(jì)上,地平線團(tuán)隊(duì)選擇了無錨單階段(Anchor-free Single-stage)目標(biāo)檢測方向,這與去年提出的核心算法AFDet的思路一致。在修改算法的基礎(chǔ)上又做了一系列提升,包括:加入基于交并比預(yù)測(IoU-prediction)的重打分(rescoring),以解決分類熱圖(classification heatmap)與定位圖(localization map)的不重合(mis-alignment)問題;在RPN(風(fēng)險順序數(shù))環(huán)節(jié)中加入自校準(zhǔn)卷積(self-calibrated convolution),提升網(wǎng)絡(luò)的感受野(receptive field),更好地處理語義信息;在訓(xùn)練的監(jiān)督中加入特征點(diǎn)(keypoints)的輔助分支;同時在模型訓(xùn)練的最后階段利用隨機(jī)加權(quán)平均(stochastic weight averaging)進(jìn)一步提升模型的泛化性。這些技術(shù)大幅提升了原有模型的檢測精度,且所增加的計(jì)算量基本上可以忽略。
據(jù)介紹,為了滿足實(shí)時性要求,地平線分析了模型中每個部分的耗時,發(fā)現(xiàn)模型的前處理部分和特征提取部分是實(shí)時性瓶頸。對此,團(tuán)隊(duì)做了算法和工程方面的改進(jìn):首先調(diào)整了特征提取網(wǎng)絡(luò)結(jié)構(gòu),憑借經(jīng)驗(yàn)在原有網(wǎng)絡(luò)基礎(chǔ)上做了網(wǎng)絡(luò)結(jié)構(gòu)搜索(network architecture search),最終選擇了“減少前端殘差網(wǎng)絡(luò)(residual block)數(shù)量,且減少Z方向上采樣卷積數(shù)量”的網(wǎng)絡(luò)結(jié)構(gòu),在精度和速度上做了平衡;接著,對前處理部分的體素化(voxelization)做了并行處理優(yōu)化,釋放了原有算法中對每個體素中點(diǎn)數(shù)的限制,極大地提升了(速度提升17毫秒)處理效率;最后,把模型中的批量標(biāo)準(zhǔn)化(batch norm)參數(shù)融合進(jìn)卷積參數(shù),進(jìn)一步提升了模型速度。
這些關(guān)鍵技術(shù)的實(shí)現(xiàn)是該團(tuán)隊(duì)對先進(jìn)算法的創(chuàng)新性運(yùn)用,也是其強(qiáng)大工程能力的體現(xiàn)。
造車新勢力也有斬獲
在Waymo挑戰(zhàn)賽上,零跑汽車獲得自動駕駛算法挑戰(zhàn)賽2D實(shí)時檢測第一名。得益于視覺識別技術(shù)的沉淀與經(jīng)驗(yàn)積累,零跑團(tuán)隊(duì)取得了不錯的成績。2D實(shí)時檢測賽道主要考驗(yàn)選手兩個方向,一是算法模型對障礙物檢測分類的準(zhǔn)確性;二是算法模型在設(shè)備上跑的速度能否達(dá)到實(shí)時性。

零跑汽車獲得2D第一名
此前,還真沒有聽說過零跑汽車,現(xiàn)在才知道這是一家擁有IT基因,屬于“IT人造車”的汽車公司。其自詡為創(chuàng)新型智能電動汽車企業(yè),是擁有智能電動車完整自主研發(fā)能力的整車廠家。
零跑汽車由浙江大華技術(shù)股份有限公司及其主要創(chuàng)始人共同投資成立,始終堅(jiān)持核心技術(shù)的自主研發(fā),致力于打造高品質(zhì)、國際化、具有核心技術(shù)能力的全球主流智能電動車品牌。

自研芯片的零跑汽車
去年,零跑汽車發(fā)布了首款完全自主知識產(chǎn)權(quán)的智能駕駛芯片——凌芯01。該芯片由零跑汽車攜手國內(nèi)芯片企業(yè)耗時3年聯(lián)合開發(fā),據(jù)稱處理性能接近市場頂尖的Mobileye芯片。
據(jù)介紹,凌芯01整體開放性更強(qiáng),既能支撐通用運(yùn)算,又有特定的AI運(yùn)算邏輯,具有能耗比更低、安全可靠性更高的優(yōu)勢。凌芯01的核心CPU處理器采用了阿里旗下平頭哥半導(dǎo)體公司提供的“玄鐵C860”處理器,集成高性能的AI神經(jīng)元處理器,全面提升芯片核心處理速度與效率。
此外,凌芯01可通過PCIE級聯(lián)技術(shù),實(shí)現(xiàn)多片組合形成計(jì)算平臺,提供更強(qiáng)大的AI算力。凌芯01支持接入12路攝像頭來實(shí)現(xiàn)2.5D的360°環(huán)視,并可支持自動泊車、ADAS智能駕駛輔助域控制,以及接近L3級別的自動駕駛算力,充分滿足用戶對于車輛智能駕駛與主被動智能安全的行車需求。
作為零跑汽車首款高端純電動SUV車型,零跑C11將率先搭載凌芯01,采用整套完全自主知識產(chǎn)權(quán)的智能駕駛解決方案,從芯片級打通整個智能駕駛系統(tǒng)。C11出自零跑自主開發(fā)的純電模塊化C架構(gòu),配備海格力斯三合一電驅(qū)系統(tǒng),搭載最新一代高通驍龍8155平臺的三聯(lián)屏智能車機(jī),搭載Leap Cloud系統(tǒng)。此外,C11還配備有藍(lán)牙鑰匙、人臉識別、適配個性化調(diào)節(jié)、智能空氣凈化系統(tǒng),為消費(fèi)者帶來極致的智能化體驗(yàn)。
零跑自品牌創(chuàng)立以來,始終堅(jiān)持核心技術(shù)的自主研發(fā)。在技術(shù)儲備方面,零跑是國內(nèi)極少數(shù)擁有智能電動汽車完整自主研發(fā)能力并掌握核心技術(shù)的廠家。
芯片是自動駕駛的基石
新一輪科技革命和產(chǎn)業(yè)變革將推動自動駕駛產(chǎn)業(yè)再上新臺階。早在2010年,地平線創(chuàng)始人兼CEO余凱博士便帶領(lǐng)團(tuán)隊(duì)斬獲了首屆ImageNet圖像識別評測第一名,被譽(yù)為“最懂算法的AI芯片公司”,如今在Waymo挑戰(zhàn)賽再次蟬聯(lián)第一,而中國的造車新勢力也已躋身其中,這不能不說是中國汽車芯片及算法領(lǐng)域的一件幸事。
可以說,這兩家公司不只是學(xué)霸,而是實(shí)績有目共睹。搭載地平線征程芯片的已有長安、奇瑞螞蟻、智己汽車、廣汽AION Y、嵐圖FREE、江淮汽車思皓QX、廣汽傳祺GS4 Plus、上汽大通MAXUS MIFA、2021款理想ONE等車型。而凌芯01是自研自用,上車也不是問題。
我們期待,未來這樣的芯片廠商和車企從底層芯片賦能,加快開發(fā)自主智能駕駛算法,加速智能駕駛的落地進(jìn)程。