先進(jìn)汽車 GPU 的高速和高效開發(fā)將加速智能駕駛的更廣泛普及
中國汽車工業(yè)在繼續(xù)保持全球產(chǎn)量第一的同時(shí),也在加速電氣化進(jìn)程,智能化也在不斷推進(jìn)。圖形處理器(GPU)已經(jīng)成為智能駕駛和新一代座艙中,被用以實(shí)現(xiàn)先進(jìn)駕駛輔助(ADAS)或者自動(dòng)駕駛(AD),或者處理更多的屏顯、實(shí)現(xiàn)人機(jī)互動(dòng)和汽車與環(huán)境互動(dòng)的核心處理器件之一,基于 GPU 開發(fā)的智駕芯片和智能座艙芯片具有廣闊的前景。
作為世界第四大芯片 IP 公司,Imagination 在全球汽車 GPU IP 市場一直處于領(lǐng)先地位,并專為汽車市場開發(fā)了 XS 系列 GPU,該系列最新的 DXS 是一款可擴(kuò)展、靈活的 GPU IP,專為處理駕駛艙、信息娛樂和高級駕駛輔助系統(tǒng)中的圖形和計(jì)算工作負(fù)載而打造。
該處理器僅以單核 1.5TFLOPS 的處理能力在計(jì)算性能方面引領(lǐng)行業(yè)同儕,而且還引入多項(xiàng)創(chuàng)新實(shí)現(xiàn)了分布式安全性,消除了芯片設(shè)計(jì)公司以往為實(shí)現(xiàn) ASIL-B 等級功能安全而產(chǎn)生的額外開銷。目前,采用這種創(chuàng)新的、低成本的分布式安全機(jī)制 DXS GPU 已通過了 ASIL-B 汽車功能安全性認(rèn)證。
除了算力和分布式安全等硬件方面的創(chuàng)新,Imagination 還為 DXS 系列 GPU 配置了全面的計(jì)算庫和工具鏈,期望在提升開發(fā)效率和充分釋放 DXS GPU 的性能方面,進(jìn)一步加速智能駕駛芯片的設(shè)計(jì)和普及。
Imagination 提供的一系列底層計(jì)算庫都經(jīng)過深度軟件調(diào)優(yōu)。全新計(jì)算庫和人工智能工具包,可幫助軟件開發(fā)人員實(shí)現(xiàn)高達(dá) 80% 的 GPU 利用率。這也將加速常見計(jì)算工作負(fù)載的處理,如計(jì)算機(jī)視覺和 ADAS 系統(tǒng)感知數(shù)據(jù)的預(yù)處理和后處理。傅里葉變換加速庫(imgFFT)在智能駕駛領(lǐng)域是處理傳感器數(shù)據(jù)的得力助手。智能汽車搭載的雷達(dá)、攝像頭等傳感器會(huì)生成海量數(shù)據(jù),imgFFT 能快速將時(shí)域數(shù)據(jù)轉(zhuǎn)換到頻域。例如,毫米波雷達(dá)不斷發(fā)射和接收電磁波,產(chǎn)生的時(shí)域信號經(jīng) imgFFT 處理后,車輛可清晰分辨出周邊物體的速度、距離等信息。在圖像識別方面,攝像頭拍攝的圖像數(shù)據(jù),通過 imgFFT 頻域數(shù)據(jù)分析提取,可突出圖像中的邊緣、紋理等關(guān)鍵特征,使圖像識別算法能更精準(zhǔn)地識別道路標(biāo)志、車道線以及其他車輛,幫助車輛提前做出反應(yīng),極大地提升了自動(dòng)駕駛系統(tǒng)的環(huán)境感知能力和安全性。
線性代數(shù)庫(imgBLAS)為智能駕駛中的復(fù)雜運(yùn)算提供了高效支持。在路徑規(guī)劃算法里,imgBLAS 的矩陣運(yùn)算能力發(fā)揮著關(guān)鍵作用。當(dāng)車輛規(guī)劃行駛路線時(shí),要綜合考慮地圖數(shù)據(jù)、實(shí)時(shí)路況、自身位置等信息,這些都以矩陣形式呈現(xiàn)。借助 imgBLAS 的矩陣乘法、加法等優(yōu)化函數(shù),車輛能快速計(jì)算出不同路徑的成本和可行性,找到最優(yōu)行駛路徑。在機(jī)器學(xué)習(xí)模型訓(xùn)練中,imgBLAS 同樣不可或缺。像訓(xùn)練用于預(yù)測交通流量的模型時(shí),涉及大量數(shù)據(jù)的矩陣運(yùn)算,imgBLAS 能大幅提升運(yùn)算速度,縮短模型訓(xùn)練時(shí)間,使模型更快適應(yīng)路況變化,為自動(dòng)駕駛決策提供更準(zhǔn)確的依據(jù)。
神經(jīng)網(wǎng)絡(luò)庫(imgNN)是推動(dòng)自動(dòng)駕駛技術(shù)智能化的核心力量。在自動(dòng)駕駛系統(tǒng)的深度學(xué)習(xí)模型中,imgNN 為模型的訓(xùn)練和推理提供了有力支持。在訓(xùn)練階段,imgNN 優(yōu)化了模型參數(shù)更新的計(jì)算過程,加速了模型的收斂速度,使模型能夠更快地學(xué)習(xí)到圖像中各類物體的特征。在實(shí)際駕駛中,模型進(jìn)入推理階段,imgNN 能夠高效處理攝像頭傳來的圖像數(shù)據(jù),迅速識別出車輛、行人、障礙物等目標(biāo),并準(zhǔn)確判斷其位置和運(yùn)動(dòng)狀態(tài),幫助車輛及時(shí)做出制動(dòng)、避讓等決策,使得自動(dòng)駕駛系統(tǒng)的反應(yīng)更加靈敏、決策更加精確,有力地推動(dòng)了自動(dòng)駕駛技術(shù)從理論走向?qū)嶋H應(yīng)用。
Imagination 還將其開發(fā)庫與 oneAPI Toolkit、TensorGraph Reference Kit 進(jìn)行對接和優(yōu)化,無論開發(fā)者在何種架構(gòu)、平臺上開發(fā),或是使用開源框架,都能無縫使用這些庫,極大地提升了開發(fā)環(huán)境選擇的靈活性。
Imagination 致力于解決 GPU 開發(fā)的局限性問題,為開發(fā)者們提供了一套全面且極具創(chuàng)新性的解決方案。這一方案不僅打破了硬件廠商的壁壘,還極大地提升了開發(fā)效率,讓開發(fā)者能夠?qū)W⒂谒惴▋?yōu)化和應(yīng)用創(chuàng)新,從而在激烈的技術(shù)競爭中占據(jù)優(yōu)勢。
UXL 基金會(huì),即 Unified Acceleration Foundation,是在當(dāng)前全球 GPU 開發(fā)格局下應(yīng)運(yùn)而生的重要組織,其愿景是打破少數(shù)廠商利用其軟件平臺與 GPU 硬件構(gòu)建的封閉生態(tài)系統(tǒng)帶來的限制,使全球開發(fā)者可以不依賴某一特定軟件平臺進(jìn)行 AI 和其他應(yīng)用程序開發(fā),從而解決其他硬件廠商的 GPU 在軟件開發(fā)后適配上面臨的諸多困難。UXL 基金會(huì)的目標(biāo)是構(gòu)建一個(gè)開源項(xiàng)目,打造一套能驅(qū)動(dòng)多種 GPU 等加速器芯片的軟件和工具,使開發(fā)者的代碼能在任何機(jī)器上運(yùn)行,而無需考慮具體使用何種芯片和硬件,以此推動(dòng)建立開放標(biāo)準(zhǔn)的生態(tài)系統(tǒng),打破硬件與軟件之間的壁壘,統(tǒng)一異構(gòu)計(jì)算生態(tài)。它基于 oneAPI 來提供跨平臺編程接口和工具,如 oneDPL、oneDNN 等,以促進(jìn)軟件快速移植和開發(fā)效率。
目前,Imagination 及其客戶和合作伙伴通過 oneAPI,攜手解決了軟件開發(fā)移植過程中遇到的許多問題,不僅有效地支持了開發(fā)者提升開發(fā)效率,還可加速軟件移植和實(shí)現(xiàn)無形資產(chǎn)的全面復(fù)用。
Imagination 的 PVRTune 工具為開發(fā)者提供了精確的性能分析支持。該工具專門針對包括新推出的 DXS GPU 在內(nèi)的 PowerVR 器件進(jìn)行硬件級別的性能深度剖析。利用 PVRTune,開發(fā)者能夠?qū)崟r(shí)監(jiān)控 GPU 負(fù)載、內(nèi)存帶寬等關(guān)鍵性能指標(biāo)。在識別問題后,能夠迅速定位性能瓶頸,優(yōu)化代碼結(jié)構(gòu),從而顯著提升應(yīng)用的運(yùn)行效率。PVRTune 還支持多線程調(diào)試,協(xié)助開發(fā)者均衡各線程負(fù)載,預(yù)防資源沖突。通過其直觀的可視化界面,開發(fā)者可以清晰地查看性能數(shù)據(jù),并精確調(diào)整參數(shù),進(jìn)一步優(yōu)化應(yīng)用性能,確保即便在復(fù)雜場景中也能保持高效運(yùn)行。
該參考計(jì)算和 AI 工具包已在客戶和合作伙伴的項(xiàng)目開發(fā)中實(shí)現(xiàn)了許多成功范例。例如,澎峰科技基于 Imagination 的計(jì)算庫構(gòu)建 AI 解決方案,借助參考工具包,在 Imagination GPU 上運(yùn)行各類人工智能應(yīng)用,其中大語言推理引擎 PerfXLM 相較于 CPU 方案,性能提升高達(dá) 100%,且移植耗時(shí)極短。
目前,已有領(lǐng)先汽車芯片企業(yè)購買了 Imagination 的 DXS 系列汽車 GPU IP 的授權(quán),預(yù)計(jì)在不久的將來,業(yè)界將看到采用 DXS GPU IP 開發(fā)的高算力、具有功能安全性的智駕芯片。這些智駕芯片除了充分發(fā)揮 Imagination 獨(dú)特的 PowerVR GPU 架構(gòu)、在行業(yè)內(nèi)領(lǐng)先的 HyperLane 硬件隔離技術(shù)等創(chuàng)新,也為最終應(yīng)用的開發(fā)者提供了從生態(tài)系統(tǒng)、底層庫、性能分析工具到參考工具包的全方位支持,有效解決了傳統(tǒng)開發(fā)環(huán)境的局限性問題。從而推動(dòng)開發(fā)者發(fā)揮 GPU 技術(shù)在更靈活、更通用和生命周期更長等方面的優(yōu)勢,助力智駕芯片開發(fā)者快速實(shí)現(xiàn)高質(zhì)量創(chuàng)新。