分布式安全機(jī)制實現(xiàn)更高效的ASIL-B級功能安全構(gòu)建,Imagination發(fā)布最新汽車級GPU IP——IMG DXS GPU
掃描二維碼
隨時隨地手機(jī)看文章
近年來,隨著汽車智能化和電動化的快速發(fā)展,汽車半導(dǎo)體市場展現(xiàn)出了前所未有的增長潛力。根據(jù)S&P Global Mobility的預(yù)測,到2029年,全球汽車半導(dǎo)體市場的收入預(yù)計將大幅增長,超過1300億美元。2022年該市場的收入為680億美元,意味著未來幾年將實現(xiàn)一倍的增長。這一增長主要得益于先進(jìn)駕駛輔助系統(tǒng)(ADAS)、電動化以及信息娛樂系統(tǒng)的普及,尤其是在電動汽車領(lǐng)域,半導(dǎo)體內(nèi)容的增加更為顯著。未來十年,隨著這些技術(shù)的廣泛應(yīng)用,汽車半導(dǎo)體市場將迎來爆發(fā)式的增長。
高性能計算需求上升正在推動著包括車規(guī)級GPU在內(nèi),發(fā)揮出更為關(guān)鍵的作用尤。隨著ADAS(高級駕駛輔助系統(tǒng))和自動駕駛對高性能計算需求的增加,車規(guī)級GPU不僅是圖像處理的核心,更在駕駛輔助、自動駕駛決策和傳感器數(shù)據(jù)融合等方面發(fā)揮著重要作用。車規(guī)級GPU正在推動汽車從輔助駕駛逐步邁向完全自動駕駛的未來。
作為深耕GPU領(lǐng)域近40年的專家,Imagination的半導(dǎo)體解決方案在各類市場中已經(jīng)出貨超過13億臺設(shè)備,其中3.95億設(shè)備是應(yīng)用在汽車領(lǐng)域的。尤其是在座艙和信息娛樂系統(tǒng)GPU IP供應(yīng)上,是當(dāng)之無愧的的全球領(lǐng)先者。通過統(tǒng)一的PowerVR GPU架構(gòu),Imagination在汽車領(lǐng)域內(nèi)提供了高效、安全且可擴(kuò)展的圖形和計算處理能力,滿足了現(xiàn)代汽車對計算性能日益增長的需求。
近日Imagination發(fā)布了其最新的汽車級GPU IP——IMG DXS GPU,相比上一代汽車GPU IP,DXS GPU的峰值性能提升了50%,并結(jié)合了最新的D系列架構(gòu)效率和圖形功能,使其成為強(qiáng)大的圖形處理器。新推出的分布式安全機(jī)制(Distributed Safety Mechanisms)在不影響性能的前提下,簡化了實現(xiàn)ASIL-B(汽車功能安全等級)的成本。通過軟硬件的協(xié)同優(yōu)化,DXS GPU的計算性能提升高達(dá)10倍,極大增強(qiáng)了GPU在自動駕駛等高計算需求場景下的表現(xiàn)。
最新的PowerVR架構(gòu),突破GPU計算能力新高度
最新的IMG DXS GPU在圖形處理和計算性能上的強(qiáng)大表現(xiàn)。首先,相比上一代產(chǎn)品,DXS GPU的每核心性能提升了50%,顯著提高了圖形和計算任務(wù)的處理能力。此外,DXS GPU具有極強(qiáng)的可擴(kuò)展性,支持?jǐn)U展至四個核心,最大化系統(tǒng)的處理能力。在1GHz時,DXS MC1能夠達(dá)到1.5 TFLOPS的浮點性能,并在INT8計算中實現(xiàn)6 TOPS(每秒萬億次操作),圖形像素填充率達(dá)到48 GPixels/s。而當(dāng)頻率提升至1.5GHz,DXS MC4的整體性能能夠達(dá)到9 TFLOPS的浮點性能、36 TOPS的INT8性能以及288 GPixels/s的像素填充率。通過這些優(yōu)化,DXS GPU在計算性能、圖形處理能力和可擴(kuò)展性方面都達(dá)到了一個新的高度。
IMG DXS GPU的強(qiáng)大性能表現(xiàn)來自其最新一代PowerVR GPU架構(gòu)。通過采用2D雙速率紋理處理、數(shù)據(jù)主線、固件處理器、片段著色率以及ASTC HDR等先進(jìn)技術(shù),該架構(gòu)實現(xiàn)了性能密度提升20%。這種提升不僅增強(qiáng)了乘客的游戲體驗,還改善了車載用戶界面的響應(yīng)速度,提供了更順暢的操作體驗。同時,PowerVR GPU顯著增強(qiáng)了環(huán)視系統(tǒng)的圖像渲染能力,提升了駕駛安全性,并為車內(nèi)座艙提供了更個性化的體驗,使每輛車的座艙設(shè)計更加差異化、與眾不同。
據(jù)悉,IMG DXS GPU在多種工作負(fù)載下相較于競爭對手的顯著性能優(yōu)勢。首先,在峰值性能方面,IMG DXS的表現(xiàn)達(dá)到了競爭對手的四倍,這意味著在處理高強(qiáng)度任務(wù)時,它能夠提供極為強(qiáng)大的處理能力。此外,在填充率為中心的圖形工作負(fù)載中,其性能可以達(dá)到競爭對手的兩倍。而對于計算密集型圖形任務(wù),IMG DXS GPU的性能提升高達(dá)28%。特別是在安全關(guān)鍵的工作負(fù)載中,IMG DXS的性能還能進(jìn)一步提升,最高可達(dá)兩倍。這些表現(xiàn)凸顯了IMG DXS GPU在處理復(fù)雜圖形和計算任務(wù)時的出色能力,尤其在對安全性和性能有高要求的應(yīng)用場景中,優(yōu)勢更加明顯。
“首先DXS完美地匹配了今天汽車對于中央計算的要求,迎合了整車架構(gòu)正在從分布式轉(zhuǎn)向中央計算的趨勢。第二個是完美匹配今天高性能的中央計算的要求,它提供了遠(yuǎn)高于CPU的計算性能,同時提供了遠(yuǎn)遠(yuǎn)高于NPU以及這類加速器SoC的編程靈活性?!盜magination車載GPU產(chǎn)品線產(chǎn)品總監(jiān)章政分享到,“而且除了性能之外,最重要的是我們推出了全新的功能安全解決方案:分布式安全機(jī)制——幾乎完全消除了以前的其他功能安全方案實現(xiàn)機(jī)制帶來的性能以及片芯面積損失。”
創(chuàng)新的專利——分布式安全機(jī)制,讓ASIL-B的實現(xiàn)更為高效
正如章總強(qiáng)調(diào)的,此次IMG DXS GPU的一大創(chuàng)新就是采用了Imagination最新的專利技術(shù)——分布式安全機(jī)制,所以能夠在幾乎不增加核心面積的情況下,實現(xiàn)更高的安全性和性能效率,助力客戶構(gòu)建ASIL-B級別的汽車級GPU。
要實現(xiàn)ASIL-B級功能安全,傳統(tǒng)的方式有雙核鎖步(Dual-Core Lock Step)和工作負(fù)載重復(fù)(Workload Repetition)兩種。其中雙核鎖步是通過增加核心面積(面積增加至兩倍),來實現(xiàn)更高的安全性。然而,雖然面積顯著增加,性能卻沒有顯著提升。這意味著為了滿足安全要求,系統(tǒng)的成本會大幅上升。工作負(fù)載重復(fù)這一方法通過在相同面積上重復(fù)工作負(fù)載,來提高安全性,但結(jié)果是性能僅為標(biāo)準(zhǔn)核心的一半。這種方法雖然占用的額外資源較少,但性能損失明顯。
IMG DXS GPU則能夠在標(biāo)準(zhǔn)核心的基礎(chǔ)上,以最小的面積增加的前提下,提供與標(biāo)準(zhǔn)核心相同的性能,同時實現(xiàn)ASIL-B的安全標(biāo)準(zhǔn)。這使得它比雙核鎖步和工作負(fù)載重復(fù)更為高效,既保證了安全性,又避免了面積和性能的重大損失。
這種創(chuàng)新的技術(shù)叫做Safety Pairs,這是一種分布式功能安全機(jī)制,是Imagination的最新專利技術(shù),它通過利用現(xiàn)代處理器中的并行性和自然空閑時間來實現(xiàn)故障檢測,且無需對工作負(fù)載或硬件進(jìn)行重復(fù)處理,從而減少了開銷。
如下圖展示了處理器在不同時間段的運行狀態(tài),其中每個條形代表了處理器的任務(wù)執(zhí)行情況和空閑狀態(tài)。黃色部分標(biāo)記為“IDLE”(空閑),表示處理器的自然空閑時間,而紫色和紅色部分表示不同的任務(wù)執(zhí)行時間。通過在這些空閑時間運行測試向量來檢測潛在故障,Safety Pairs能夠在不增加硅片或工作負(fù)載的前提下,實現(xiàn)故障檢測功能。
這個技術(shù)的優(yōu)點在于它避免了傳統(tǒng)方法中需要通過重復(fù)執(zhí)行工作負(fù)載或增加處理單元來實現(xiàn)安全檢測的做法,從而提高了系統(tǒng)的效率和資源利用率。簡言之,Safety Pairs使得IMG DXS GPU能夠以更少的硬件和資源開銷,確保系統(tǒng)的安全性和可靠性,滿足汽車行業(yè)的功能安全要求(如ASIL-B標(biāo)準(zhǔn))。
“為什么功能安全在車這一塊很難推廣起來?主要是因為成本,因為芯片面積增加一倍或者是性能降低為二分之一,對于廠商來說它的成本也就增加了一倍。這個增加一倍的成本,最后都要轉(zhuǎn)化到消費者頭上去,那這個價格就要增加一倍。過去沒有太多客戶愿意為這個東西買單,所以一直推不起來?!闭抡忉尩?,“Imagination作為一個傳統(tǒng)的GPU玩家,我們對GPU非常了解,我們對GPU怎么運行是非常清楚的。所以我們利用了GPU的一些特性來非常靈活地實現(xiàn)了功能安全機(jī)制?!?
整體而言,DSM(Distributed Safety Mechanism-分布式安全機(jī)制)是一種分布式架構(gòu),通過持續(xù)發(fā)送微小的測試向量來確保各子組件的正確性與穩(wěn)定性。該機(jī)制不僅適用于車載電子系統(tǒng),還能夠滿足航空、醫(yī)療、工業(yè)等多個具備功能安全要求的領(lǐng)域的需求。Imagination將持續(xù)優(yōu)化和發(fā)展這一機(jī)制,提升其效率,并擴(kuò)大其應(yīng)用范圍。目前,DSM已能夠輕松滿足ASIL-B的安全等級要求。未來還有望將進(jìn)一步提升其安全等級,并在更低的資源和成本消耗下,確保更高的安全標(biāo)準(zhǔn)的實現(xiàn)。
雙速率FP16+SPU增加+軟件優(yōu)化,AI能力提升近十倍
AI的能力和圖形處理的能力是相通的,而高階自動駕駛的實現(xiàn)又必須依賴AI能力,因此DXS GPU在AI能力上的創(chuàng)新和優(yōu)化,也是其重要的一部分。透過軟件優(yōu)化和架構(gòu)創(chuàng)新,DXS GPU也進(jìn)一步幫助開發(fā)者更快速和高效地將AI的能力部署到汽車中。
盡管圖形處理是GPU的核心強(qiáng)項,隨著計算任務(wù)對并行處理要求的增加,圖形處理和計算的需求變得高度一致,許多GPU廠商開始將圖形處理硬件用于加速計算任務(wù)。這一趨勢也推動了AI的發(fā)展,因為AI的巨大算力需求最初就是通過GPU實現(xiàn)的,而CPU無法提供足夠的計算能力來支持AI的工作。
然而,盡管現(xiàn)代AI算法需要更高的性能,當(dāng)前的半導(dǎo)體技術(shù)仍然面臨帶寬和工藝節(jié)點的瓶頸,尤其是在5納米甚至更小的技術(shù)節(jié)點上,成本會極具上升。因此,DXS在架構(gòu)上進(jìn)行了創(chuàng)新,通過支持FP16精度的計算來滿足大部分AI工作負(fù)載的需求,減少了對高帶寬的依賴。FP16比FP32帶寬需求更低,通過增加雙速率的FP16單元和SPU,DXS能夠在FP16工作負(fù)載下提供三倍的算力,顯著提升了性能。
此外,為了進(jìn)一步降低帶寬需求,DXS盡可能將所有計算控制在GPU內(nèi)部,減少數(shù)據(jù)在GPU和其他模塊之間的流動,從而大幅降低系統(tǒng)的帶寬要求。DXS在1GHz主頻下,能夠在FP16半精度浮點計算中提供12 TFLOPS的性能,在int8計算中則可達(dá)到24 TOPS的性能,且在主頻進(jìn)一步提高到1.2GHz甚至1.5GHz時,性能會進(jìn)一步提升。
另外值得關(guān)注的一點在于,相比于其他專門用于AI加速的NPU,GPU的最大優(yōu)勢在于其成熟的生態(tài)系統(tǒng),這主要得益于基于開放標(biāo)準(zhǔn)的編程環(huán)境,如OpenCL、Vulkan和oneAPI。強(qiáng)大的生態(tài)系統(tǒng)不僅降低了研發(fā)成本,還使得客戶能夠方便地將任務(wù)從競爭平臺移植到DXS上,推動了產(chǎn)品的市場推廣和盈利能力。經(jīng)過多年的發(fā)展,Imagination的GPU生態(tài)系統(tǒng)已經(jīng)非常成熟,為客戶的產(chǎn)品優(yōu)化提供了極大的便利。
“整個NPU生態(tài)系統(tǒng)是四分五裂的,開發(fā)成本非常高。根據(jù)行業(yè)內(nèi)一些反饋——一個 NPU 的硬件工程師大概要搭配 10 到 20 個軟件工程師去把這個 NPU 的硬件給運行起來,這個軟件的成本是非常昂貴的。而且NPU它是固化的一個東西(因為要追求效率,編程性就非常差),但是我們看一看今天 AI 才剛剛開始新的算法,每一天都在出現(xiàn)新的架構(gòu)。沒法去預(yù)測明天會有哪個新的架構(gòu)出現(xiàn),所以今天固化的NPU架構(gòu)也無法去適配未來新的算法架構(gòu)。特別是當(dāng)NPU都追求高制程,高制程的制造成本又非常高昂。如果固化架構(gòu)的這一NPU的生命周期很短,那這筆投資基本上就是有去無回的。”章政特別解釋到,”我們看到的這個將來的趨勢是什么?將來的趨勢是在 AI 沒有完全固化之前,編程性是很重要的??删幊绦裕粋€開發(fā)的生態(tài)系統(tǒng)有眾多的參與者,能更好的適配新的這個方法是用新的 framework 讓這個產(chǎn)品的生命周期增長,能有更多的銷量,攤薄你研發(fā)的成本,那你這個公司的最后這個產(chǎn)品才有機(jī)會去盈利。“
因此,DXS GPU有著天然的開發(fā)生態(tài)優(yōu)勢,而Imagination也進(jìn)一步在硬件架構(gòu)優(yōu)化創(chuàng)新的基礎(chǔ)上,提供了最新的計算庫(compute library)和工具包(Toolkit),來幫助開發(fā)者加速關(guān)鍵的汽車應(yīng)用——特別是ADAS(高級駕駛輔助系統(tǒng))和計算機(jī)視覺相關(guān)的任務(wù)。
據(jù)悉,在一些典型的工作負(fù)載中,DXS的AI性能相比上一代產(chǎn)品提升了近十倍。前面提到雖然硬件性能僅提升約50%,但這次顯著的性能增長主要歸因于軟件的支持與優(yōu)化。特別是在計算庫方面,性能提升了2至4倍。優(yōu)化的計算庫不僅在帶寬使用上實現(xiàn)了顯著的節(jié)省,同時也對片上內(nèi)存進(jìn)行了有效的管理與優(yōu)化。通過盡可能將所有計算保持在片上運行,避免了數(shù)據(jù)在不同計算單元之間的頻繁傳輸,從而降低了帶寬消耗。這一優(yōu)化措施不僅提升了系統(tǒng)效率,也顯著降低了能耗,因為數(shù)據(jù)傳輸通常是能耗的主要來源之一。
未來,隨著計算庫的不斷增強(qiáng),DXS GPU的硬件利用率將持續(xù)提升,使得更多的高級駕駛輔助系統(tǒng)(ADAS)功能能夠在GPU上實現(xiàn)。這樣DXS GPU就能夠為ADAS提供更多更靈活的算法支持,從而幫助客戶的產(chǎn)品在未來具備更高的可持續(xù)性。利用強(qiáng)大的可編程性和計算能力,客戶在面對新的自動駕駛算法或功能需求時,也能夠通過開放API快速地在DXS平臺上實現(xiàn)這些新功能,從而滿足市場多樣化需求。
靈活可拓展方案保證客戶成本效益,應(yīng)對未來增長需求
最后,DXS GPU**延續(xù)了Imagination在GPU產(chǎn)品上的拓展性優(yōu)勢,這保證了客戶的長期靈活性和成本效益,尤其是在應(yīng)對未來可能增長的智能座艙和人機(jī)交互(HMI)需求時。
“雖然現(xiàn)在的需求可能不需要使用最高級別的GPU,但DXS GPU架構(gòu)設(shè)計了多種可擴(kuò)展的方案,以滿足未來可能出現(xiàn)的更高計算需求。例如,在未來5到10年內(nèi),如果智能座艙的屏幕數(shù)量增加,或者對HMI的要求提升,用戶可以從不同級別的DSX GPU中選擇,比如從8核心到256核心,或者選擇更高級別的MC2、MC4型號。簡單來說,即便當(dāng)前你選擇的是低規(guī)格的GPU,未來仍然可以根據(jù)需求逐步升級和擴(kuò)展,保持靈活性和成本效益?!?a href="/tags/Imagination" target="_blank">Imagination 資深產(chǎn)品總監(jiān)Stephen Spain表示,“簡單來說,即便當(dāng)前你選擇的是低規(guī)格的GPU,未來仍然可以根據(jù)需求逐步升級和擴(kuò)展,保持靈活性和成本效益?!?