增強(qiáng)現(xiàn)實(shí)技術(shù)的發(fā)展及應(yīng)用
掃描二維碼
隨時(shí)隨地手機(jī)看文章
人工智能論壇如今浩如煙海,有硬貨、有干貨的講座卻百里挑一。由中國科學(xué)院大學(xué)主辦,中國科學(xué)院大學(xué)學(xué)生會(huì)承辦,讀芯術(shù)作為指定合作自媒體的“AI未來說·青年學(xué)術(shù)論壇”第三期“計(jì)算機(jī)視覺”專場已于2019年3月24日下午在中科院舉行。百度李穎超老師為大家?guī)韴?bào)告《百度增強(qiáng)現(xiàn)實(shí)技術(shù)及應(yīng)用》。
李穎超,百度增強(qiáng)現(xiàn)實(shí)技術(shù)部高級(jí)經(jīng)、DuMixAR平臺(tái)負(fù)責(zé)人。2009年獲北京理工大學(xué)博士學(xué)位,多年從事增強(qiáng)現(xiàn)實(shí)、計(jì)算機(jī)視覺領(lǐng)域的研發(fā)工作。組織團(tuán)隊(duì)所研發(fā)的DumixAR平臺(tái)致力于面向業(yè)界提供領(lǐng)先的AR技術(shù)和解決方案,持續(xù)推動(dòng)AR技術(shù)和產(chǎn)品化進(jìn)展,推動(dòng)AR技術(shù)在行業(yè)廣泛落地應(yīng)用。
報(bào)告內(nèi)容:介紹百度在增強(qiáng)現(xiàn)實(shí)方向的技術(shù)進(jìn)展,包括三維感知跟蹤、人機(jī)交互、內(nèi)容生產(chǎn)等,同時(shí)介紹增強(qiáng)現(xiàn)實(shí)技術(shù)的技術(shù)開放情況和落地應(yīng)用。
百度增強(qiáng)現(xiàn)實(shí)技術(shù)及應(yīng)用
李博士帶來了題為《百度增強(qiáng)現(xiàn)實(shí)技術(shù)及應(yīng)?》的分享。
李博士主要介紹了支撐增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)的核心CV(ComputerVision,計(jì)算機(jī)視覺)能力,展示了百度DuMix AR平臺(tái)構(gòu)建及AR技術(shù)在各領(lǐng)域的應(yīng)用落地,這為開發(fā)者和用戶帶來了更多的價(jià)值。
由“基礎(chǔ)層”、“感知層”、“認(rèn)知層”和“平臺(tái)應(yīng)用層”四層架構(gòu)組成的百度大腦中,AR/VR與圖像、視頻能力組合成為感知層中的視覺部分;從細(xì)分技術(shù)方向上看,包含了圖像、視頻、重要垂類(人臉識(shí)別、OCR)、邊緣計(jì)算以及AR五大特色技術(shù)能力。
從 PC 時(shí)代使用鍵盤鼠標(biāo)交互,到移動(dòng)時(shí)代通過指尖交互,再到智能化時(shí)代可以通過各種傳感器交互,在交互手段不斷升級(jí)的趨勢下,AR通過將現(xiàn)實(shí)世界、虛擬信息和人連接起來為人們提供了嶄新的智能化交互方式?,F(xiàn)場,李博士展示了百度DuMixAR平臺(tái)在場景探索上幾個(gè)非常有意思的實(shí)例,讓同學(xué)們對AR技術(shù)在消費(fèi)層面的應(yīng)用有了更直觀的理解。
典型的AR技術(shù)工作原理是將Camera、GPS、IMU等傳感器采集的真實(shí)世界數(shù)據(jù),通過感知系統(tǒng)處理獲得關(guān)于世界的結(jié)構(gòu)、語義等信息,與后端虛擬信息實(shí)時(shí)融合,經(jīng)由顯示系統(tǒng)和人機(jī)交互能力為用戶帶來虛實(shí)結(jié)合的沉浸體驗(yàn)。
AR 系統(tǒng)的構(gòu)建包含了感知跟蹤、虛實(shí)融合、人機(jī)互動(dòng)和內(nèi)容生產(chǎn)這四部分關(guān)鍵能力,其中感知跟蹤與CV技術(shù)結(jié)合最為密切。在識(shí)別典型物體進(jìn)行感知跟蹤場景下,系統(tǒng)設(shè)計(jì)核心在于能夠支持多模態(tài)數(shù)據(jù)的靈活性和實(shí)時(shí)性。為此,百度設(shè)計(jì)了統(tǒng)一的注冊系統(tǒng)和數(shù)據(jù)中心,通過實(shí)時(shí)構(gòu)建局部地圖有效提升穩(wěn)定性;對于3D 物體,基于輪廓特征識(shí)別和紋理特征識(shí)別兩套方案有效兼容更多應(yīng)用場景。在空間感知定位方面,在即時(shí)定位與建圖(SLAM)的技術(shù)框架下,VO方案僅基于視覺信息,可以兼容更多中低端機(jī)型,融合IMU的VIO方案則為用戶帶來更好的AR體驗(yàn)。此外,李博士還介紹了在人機(jī)互動(dòng)、內(nèi)容生產(chǎn)和虛實(shí)融合方向的關(guān)鍵技術(shù)、重大挑戰(zhàn)與流行趨勢。
百度DuMix AR平臺(tái)不僅將這些底層技術(shù)打包全面開放,為開發(fā)者提供了滿足不同需求的SDK集成方案;還創(chuàng)建了友好的內(nèi)容開放平臺(tái),幫助沒有開發(fā)能力的設(shè)計(jì)師搭建AR內(nèi)容和場景。李博士認(rèn)為,隨著未來硬件和網(wǎng)絡(luò)的升級(jí),以及算法和數(shù)據(jù)的積累,真正成熟的AR 應(yīng)用會(huì)很快到來。