面向自動駕駛車輛高強(qiáng)度工作,Arm發(fā)布三款芯片
未來智能汽車的變革、數(shù)據(jù)的處理效率、汽車的安全保障,以及新的電子架構(gòu)和自動駕駛的技術(shù)等等都離不開芯片。而最近Arm發(fā)布了三款芯片,面向自動駕駛車輛的高強(qiáng)度工作負(fù)載。
Arm近日發(fā)布了幾款全新的IP,旨在讓智能汽車開發(fā)商更容易將他們的設(shè)計(jì)方案推向量產(chǎn)市場。據(jù)該公司介紹,三種新處理器IP將集成到一個系統(tǒng)芯片上——Arm Cortex-A78AE處理器、Mali-G78AE圖形處理器和Mali-C71AE圖像信號處理器。
Arm表示,Cortex-A78AE、Mali-G78AE和Mali-C71AE是現(xiàn)有的Cortex-A78、Mali-G78和Mali-C71的高階版本,面向自動駕駛車輛的高強(qiáng)度工作負(fù)載。
在軟件開發(fā)支持方面,Arm提供了Arm Fast Models,可用于構(gòu)建功能精確的虛擬平臺,使軟件開發(fā)和驗(yàn)證先于硬件可用性。還有Arm Development Studio,其中包括由德國TUV SUD認(rèn)證的Arm編譯器。
這些新產(chǎn)品方案的推出,目的是為了提供更高效和安全的數(shù)據(jù)處理,以實(shí)現(xiàn)自主決策的效率、安全和潛力。
盡管,完全自動駕駛車輛或無人駕駛汽車可能還需要數(shù)年時間才能投入商用,但先進(jìn)的駕駛輔助系統(tǒng)(ADAS)已經(jīng)可以幫助減少多達(dá)40%的事故。
Arm汽車和物聯(lián)網(wǎng)副總裁Chet Babla表示,新技術(shù)將安全放在首位,但也提供了能效和性能提升。
一、提高性能功耗比
Cortex-A78AE是Cortex-A76AE的后續(xù)產(chǎn)品,其微架構(gòu)已經(jīng)在多個方面進(jìn)行了改進(jìn)。它的特點(diǎn)是額外的帶寬,改進(jìn)的分支檢測,以及比上一代帶寬高50%的內(nèi)存子系統(tǒng)。
但是Cortex-A78AE最突出的特性可能是宏操作緩存,這種結(jié)構(gòu)設(shè)計(jì)用于保存解碼指令,解耦獲取引擎和執(zhí)行,以支持動態(tài)代碼序列優(yōu)化。
Arm表示,這些創(chuàng)新使得整型和浮點(diǎn)計(jì)算的性能比Spec2006綜合基準(zhǔn)套件提高了30%以上。此外,它們還有助于提高Cortex-A78AE的功率效率。
在7納米器件上,Cortex-A78AE以低60%的功率實(shí)現(xiàn)了目標(biāo)性能,在相同的功率(耗電量)下性能提高了25%。
此次,Arm將Cortex-A78AE的安全特性作為主要進(jìn)步進(jìn)行重點(diǎn)“宣傳”。
當(dāng)Cortex-A76AE引入Split-Lock架構(gòu)時,它被視為安全計(jì)算新時代的誕生。及時檢測邏輯中的故障對解決行業(yè)標(biāo)準(zhǔn)(如ISO 26262/IEC 61508)規(guī)定的功能性安全問題大有幫助。
但是新的架構(gòu)帶來了新的挑戰(zhàn)——可用性、ASIL B支持和全系統(tǒng)功能安全性。Cortex-A78AE通過一系列的安全功能直面這些挑戰(zhàn)。
首先,Arm通過增加時間多樣性來增強(qiáng)原來的鎖步能力,以防止常見原因的故障,這是一個很小但非常重要的增加。
除了拆分模式操作之外,還增強(qiáng)了混合模式——這是一種進(jìn)步,允許共享的DSU-AE邏輯在鎖模式下繼續(xù)運(yùn)行,而cpu保持獨(dú)立(拆分)。
這樣做的好處有兩方面:
1、在FMEDA中,DSU-AE計(jì)數(shù)對診斷覆蓋率的額外覆蓋;2、cpu可以單獨(dú)離線進(jìn)行測試,而集群本身仍可用于計(jì)算,盡管計(jì)算能力有所降低。
此外,標(biāo)準(zhǔn)的安全措施,如緩存保護(hù)邏輯在Cortex-A78AE中仍然是強(qiáng)制性的,可用性進(jìn)一步增強(qiáng),增加了線鎖定支持,以避免觸及緩存結(jié)構(gòu)中的錯誤位置。
最后,Cortex-A78AE帶有AMBA奇偶性保護(hù)功能,它的架構(gòu)與AE IP組合套件一起工作。這是一種簡單且有效的方式,可以在SoC的其余部分?jǐn)U展功能安全保護(hù)傘,從而實(shí)現(xiàn)端到端(E2E)保護(hù)能力的目標(biāo)。
此外,Cortex-A78AE可以在處理器集群中擴(kuò)展到最多4個核,并且可以在L1、L2和L3中使用不同大小的緩存。
盡管Cortex-A78AE的性能令人印象深刻,但汽車及工業(yè)領(lǐng)域的計(jì)算平臺需要混合功率效率、算法強(qiáng)度和直接計(jì)算吞吐量。
正確大小的計(jì)算是當(dāng)今的口號。簡單地說,沒有一個微體系結(jié)構(gòu)能夠滿足這些細(xì)分市場的應(yīng)用程序需求。
例如,一個自動駕駛平臺需要在使用車輛控制之前感知數(shù)據(jù)、感知障礙物并決定正確的路徑矢量。只有中間的兩個任務(wù),需要大量不同的算法來執(zhí)行。
為此,除了內(nèi)存接口和類型之外,CPU還支持以各種緩存大小(L1、L2和L3)進(jìn)行配置。比如,Cortex-A78AE可以與Cortex-A65AE在異質(zhì)計(jì)算集群中配對,并且可以通過加速器相干端口與加速器耦合。
這種新的混合模式允許分割鎖功能,其中處理器成對運(yùn)行,在不影響性能的情況下滿足較低級別的安全要求,而SoC計(jì)算體系結(jié)構(gòu)也可以部署到不同的域控制器上。
二、硬件分離
與Cortex-A78AE互補(bǔ)的是最新推出的Mali-G78AE,這是一個全新的圖形組件,可以解決自動駕駛系統(tǒng)中的異構(gòu)計(jì)算需求。
G78AE GPU提供了一種新的資源分配方法,它具有一種稱為靈活分區(qū)的特性,這使得圖形資源可以專用于不同的工作負(fù)載,同時保持彼此獨(dú)立。
基本上,Mali-G78AE可以被分割成一個系統(tǒng)中的多個GPU,有多達(dá)4個用于工作負(fù)載分離的專用分區(qū),這些分區(qū)可以使用用于事務(wù)的單獨(dú)內(nèi)存接口分別上機(jī)、關(guān)機(jī)和復(fù)位。
Mali-G78AE可以從1個shader core擴(kuò)展到24個,在新的架構(gòu)中,這意味著可以按照8個slices配置,每個slices有三個shader core。
每個slices有獨(dú)立的內(nèi)存接口、工作控制和L2緩存,以確保分離的功能安全和信息安全,slices也可以組合在一起,在多達(dá)四個分區(qū)可配置軟件。
Mali-G78AE還包括專用的硬件虛擬化,這意味著GPU作為一個整體(即每個單獨(dú)的分區(qū))可以在多個虛擬機(jī)之間進(jìn)行虛擬化。
除此之外,它還具有安全特性,包括鎖步、內(nèi)置自測試、接口奇偶校驗(yàn)、隔離檢查和只讀內(nèi)存保護(hù)。
新Mali-G78AE GPU為獨(dú)立的安全工作負(fù)載提供了多達(dá)4個獨(dú)立分區(qū)的靈活分區(qū)。例如,汽車上的信息娛樂系統(tǒng)、具有安全要求的儀表和駕駛員監(jiān)控系統(tǒng)現(xiàn)在都可以通過硬件分離同時獨(dú)立運(yùn)行。
三、視覺感知,仍是大難題
Mali-C71AE,利用硬件安全機(jī)制和診斷軟件來預(yù)防和檢測故障,并確保“每一個像素的可靠性”。
Arm表示,事實(shí)上,Mali-C71AE是Mali相機(jī)系列ISPs中首款內(nèi)置安全功能的產(chǎn)品。同時,支持ASIL B/SIL 2安全能力,提供1.2千兆像素/秒的吞吐量。
Mali-C71AE支持最多4個實(shí)時攝像頭輸入或者16個來自內(nèi)存的攝像頭數(shù)據(jù)流。相機(jī)輸入可以用多種方法進(jìn)行處理,包括按接收順序、按編程順序或按各種其他軟件定義的模式。
先進(jìn)的空間降噪、每次曝光噪聲分析和色差校正為計(jì)算機(jī)視覺應(yīng)用提供了優(yōu)化的數(shù)據(jù),為ADAS和人機(jī)界面應(yīng)用提供了實(shí)時安全功能,使系統(tǒng)級功能安全符合400多個專用故障檢測電路和內(nèi)置自檢。
此外,Mali-C71AE具有超寬動態(tài)范圍的24位處理,提供了獨(dú)立的動態(tài)范圍管理、感興趣的區(qū)域操作和用于進(jìn)一步分析的平面直方圖。