從麒麟980的性能看對(duì)2019年手機(jī)的影響
消息,距離Arm今年6月首次公布新的Cortex A76 CPU微體系結(jié)構(gòu)還不是太久,久。Cortex A76發(fā)布時(shí)Arm在新核心的性能和效率改進(jìn)方面做出了重大承諾,如今我們已經(jīng)看到采用該架構(gòu)芯片的手機(jī)已經(jīng)上市。Cortex A76的表現(xiàn)是否如預(yù)期?A76對(duì)2019年的智能手機(jī)而言又意味著什么?
在《麒麟980性能表現(xiàn)大起底:既有情理之中,又有意料之外》一文主要介紹了麒麟980的表現(xiàn),但對(duì)于那些沒有購(gòu)買華為Mate 20和Mate 20 Pro的人興趣或許沒那么大。本文將更多關(guān)注麒麟980內(nèi)部新的Cortex A76架構(gòu),探討新架構(gòu)將在新一代SoC競(jìng)爭(zhēng)中發(fā)揮的作用以及將對(duì)2019年新款手機(jī)產(chǎn)生的影響。
是否達(dá)到Arm的性能預(yù)測(cè)?
Arm此前表示Cortex A76時(shí)鐘頻率高達(dá)3GHz,相應(yīng)地性能預(yù)測(cè)都是在這個(gè)頻率上。正如Anandtech作者在5月份所寫的那樣,3GHz的頻率是一個(gè)過于樂觀的目標(biāo),2.5GHz更加現(xiàn)實(shí)。最終麒麟980的時(shí)鐘頻率為2.6GHz,這更符合本文作者的預(yù)期。
3GHz的Cortex A76的性能表現(xiàn)預(yù)計(jì)會(huì)比2.4GHz的Cortex A73(高通驍龍835的配置)整數(shù)和浮點(diǎn)計(jì)算分別提升1.9和2.5倍。如果是2.6Ghz的時(shí)鐘頻率,預(yù)計(jì)會(huì)有1.65和約2.15倍的性能提升。
實(shí)際情況是,麒麟980整數(shù)計(jì)算跑分提升1.77倍,浮點(diǎn)計(jì)算跑分超預(yù)期達(dá)到2.21倍的增長(zhǎng)。之所以跑分超預(yù)期,可能是Arm模擬運(yùn)行時(shí)是采用2MB L3,而麒麟980的芯片配置是4MB L3。
再看SPEC2006,因?yàn)橛幸幌盗懈鼜?fù)雜,更強(qiáng)大的工作負(fù)載,可以更好地代表用戶期望的更廣泛的應(yīng)用程序。
Arm對(duì)此項(xiàng)性能預(yù)測(cè)更加樂觀,因?yàn)橐呀?jīng)進(jìn)行了IPC比較以及絕對(duì)分?jǐn)?shù)比較。 Arm聲稱,在3GHz的絕對(duì)改進(jìn)中,3.3GHz時(shí)有2.1倍的提升且“無(wú)熱約束”,在5W TDP內(nèi)有1.9倍的提升。后一項(xiàng)的數(shù)字非常令人困惑,因?yàn)锳rm的營(yíng)銷這對(duì)于這到底意味著什么是矛盾的。長(zhǎng)期以來作者一直質(zhì)疑CPU是否會(huì)以某種方式達(dá)到單線程SPEC工作負(fù)載的熱限制,結(jié)果會(huì)很糟糕。
IPC比較更直接,與Cortex A73相比將在整數(shù)和浮點(diǎn)中分別看到1.58倍和1.79倍的提升。
在實(shí)際測(cè)試中,麒麟980和Cortex A76提供了更多,我們看到整數(shù)和浮點(diǎn)分?jǐn)?shù)提高了1.89倍和2.04倍。 在IPC方面,基于Cortex A73的麒麟970和驍龍835的增幅更為顯著,提升分別為1.78倍和1.92倍。實(shí)際上,因?yàn)轺梓?80的性能比預(yù)期的要好,所以它實(shí)際上達(dá)到了預(yù)計(jì)的3GHz Cortex A76的預(yù)計(jì)成績(jī)(基于Arm的數(shù)字),而實(shí)際只是采用2.6GHz的時(shí)鐘頻率。
內(nèi)存子系統(tǒng)非常重要
CPU中的內(nèi)存子系統(tǒng)似乎一直被誤解,CPU的帶寬可以非常寬,且具有任何數(shù)量的執(zhí)行資源,但是無(wú)論微架構(gòu)有多大,如果內(nèi)存子系統(tǒng)(高速緩存,內(nèi)存控制器)無(wú)法使設(shè)備正確地提供數(shù)據(jù),那么它就不重要了。過去幾年的在移動(dòng)領(lǐng)域可以看到與過去幾十年中在桌面設(shè)備上看到的相同的工作負(fù)載的增加,而且速度正在加快。移動(dòng)應(yīng)用程序變得更大、更復(fù)雜,并且它們處理的數(shù)據(jù)也顯著增長(zhǎng)。
這種變化的問題在于,如果它們無(wú)法準(zhǔn)確地再現(xiàn)如今日常應(yīng)用程序的微架構(gòu)工作負(fù)載特征,那么我們通常使用的基準(zhǔn)測(cè)試的工具可能會(huì)過時(shí)。隨著麒麟980的推出,基于GeekBench 4,我看到一些人得到了錯(cuò)誤的想法,并在芯片組的實(shí)際性能方面得出了錯(cuò)誤的結(jié)論。
為了解釋這一點(diǎn),需要展示最新一代SoC的演變,所有這些都與固定的起始數(shù)字有關(guān)。這里選擇驍龍 835,因?yàn)樗砹艘粋€(gè)平衡且受歡迎的手機(jī)SoC。
在SPECint2006中,分?jǐn)?shù)似乎與GeekBench4的分?jǐn)?shù)差別不大,這對(duì)大多數(shù)SoC都有效。唯一的重大差別來自蘋果的A11和A12芯片,這兩款芯片展現(xiàn)出比GB4更大的SPEC工作負(fù)荷性能。
再看SPECfp2006,除了基準(zhǔn)測(cè)試在他們的程序中使用更多浮點(diǎn)數(shù)據(jù)類型的明顯事實(shí),也看到更大比例的工作負(fù)載,其特點(diǎn)是對(duì)內(nèi)存子系統(tǒng)提出了更多的需求,我們發(fā)現(xiàn)不同SoC之間存在更多差異。蘋果A12能夠展示出在SPECfp中比GB4 FP工作負(fù)載更大的升級(jí)改進(jìn) ,需要指出,蘋果新一代處理器進(jìn)行了大量?jī)?nèi)存子系統(tǒng)性能的改進(jìn)。 Exynos 9810則相反,它在SPEC中的性能遠(yuǎn)遠(yuǎn)低于在GeekBench4中的表現(xiàn),再次顯現(xiàn)出了芯片組的致命弱點(diǎn),因?yàn)檫@款CPU的內(nèi)存和緩存子系統(tǒng)在很大程度上落后于競(jìng)爭(zhēng)對(duì)手 。
在這里要說的是,絕大多數(shù)實(shí)際使用的應(yīng)用程序表現(xiàn)得比SPEC更像GeekBench4,最值得一提的是蘋果的新A12以及三星的Exynos 9810在兩個(gè)極端情況下對(duì)比如上所示。在更具代表性的基準(zhǔn)測(cè)試中,例如瀏覽器JS框架性能測(cè)試(Speedometer 2.0),或者在Android端的PCMark 2.0,我們看到比SPEC更大的指令和數(shù)據(jù)壓力,乘以SPECfp體現(xiàn)的差異。
還有一些基準(zhǔn)測(cè)試與工作負(fù)載表征相反,Dhrystone或Coremark的內(nèi)存占用量非常小。在這里,大多數(shù)基準(zhǔn)測(cè)試將完全適合CPU的較低緩存層次結(jié)構(gòu),而不會(huì)對(duì)較大的緩存甚至DRAM施加壓力。這些仍然是他們自己基準(zhǔn),但不應(yīng)被視為現(xiàn)代應(yīng)用中整體性能的代表。安兔兔的CPU測(cè)試屬于這個(gè)范疇,因?yàn)樗加每臻g很小,并且不會(huì)測(cè)試執(zhí)行引擎和第一級(jí)緩存層次結(jié)構(gòu)之外的任何部分。
海思的麒麟980以及Arm的Cortex A76在這方面似乎取得了很大的平衡,SPEC和GeekBench4之間的性能并沒有太大差異。
頂級(jí)能效,絕對(duì)性能仍然落后于蘋果
在功率和能源效率方面,Arm提出,在相同的功率使用情況下,Cortex A76的性能比Cortex A75高40%,相同的性能下,Cortex A76只使用Cortex A75 50%的功率。當(dāng)然,這兩個(gè)數(shù)字的意義不是特別大,因?yàn)橹瞥坦?jié)點(diǎn)在發(fā)展。
看SPEC的結(jié)果它們似乎不僅僅證實(shí)了Arm的說法。正如之前提到的,根據(jù)Arm在5月份的數(shù)據(jù)進(jìn)行了性能和功率預(yù)測(cè),實(shí)際結(jié)果超過了預(yù)期。由于Cortex A76超越了IPC預(yù)測(cè),它能夠在比3GHz估計(jì)更高效的頻率點(diǎn)上實(shí)現(xiàn)目標(biāo)性能點(diǎn)。
結(jié)果非常出色,麒麟980的性能比驍龍845高45-48%,但完成相同的工作能量消耗少25-30%。如果要降低麒麟980的時(shí)鐘頻率或?qū)嶋H測(cè)量的1.9GHz A76能量效率以匹配驍龍845的性能點(diǎn),可以很容易地看到麒麟980使用不到一半的能量。
對(duì)于Arm而言并不完全出乎意料的一個(gè)指標(biāo)是在相同的功率下Cortex A76的性能提高40%。Arm選擇了一個(gè)750mW的任意點(diǎn)進(jìn)行比較,這可能會(huì)使聲明準(zhǔn)確,我們不知道這個(gè)交叉點(diǎn)在哪里,并且需要更精確地測(cè)量?jī)蓚€(gè)芯片組的頻率。事實(shí)上,Cortex A76是一款耗電量更大的CPU,單核有源平臺(tái)的功耗上升了14-21%。
這里可以與蘋果最新產(chǎn)品進(jìn)行比較,麒麟980的能源效率略高于A12,這意味著兩個(gè)SoC的每瓦性能幾乎完全相同。最大區(qū)別在于,蘋果能夠?qū)崿F(xiàn)61-74%的性能優(yōu)勢(shì),線性成本增加60-70%的功耗。
對(duì)于下一代驍龍和Exynos 9820意味著什么?
麒麟980的出色表現(xiàn)對(duì)即將發(fā)布的驍龍旗艦處理器是個(gè)好事,但我們期待高通在核心時(shí)鐘頻率方面更加積極,比麒麟980的2.6GHz高一點(diǎn)。功率和效率的實(shí)際表現(xiàn)還有待觀察,但理論上性能也應(yīng)該很好。
高通確實(shí)有一個(gè)方面可以變得復(fù)雜,那就是SoC的系統(tǒng)緩存。顯然,高通試圖在進(jìn)入DRAM之前模仿蘋果進(jìn)一步擁有系統(tǒng)范圍的緩存層次結(jié)構(gòu)。對(duì)驍龍845而言,這是一把雙刃劍,因?yàn)閮?nèi)存延遲比驍龍835降低了,但這種降級(jí)似乎導(dǎo)致驍龍845中的Cortex A75可能無(wú)法實(shí)現(xiàn)其全部潛力。希望新一代SoC在這方面的影響較小,可以期待良好的性能數(shù)據(jù)。
三星上周正式發(fā)布了Exynos 9820,但情況不太樂觀。Exynos 9810在基準(zhǔn)測(cè)試中表現(xiàn)不佳 ,不僅因?yàn)檎{(diào)度程序問題,還因?yàn)槲Ⅲw系結(jié)構(gòu)似乎并不平衡。麒麟980能夠超過Exynos 9810的峰值性能,同時(shí)消耗不到一半的能量。在更合理的2.3GHz頻率點(diǎn),性能差距擴(kuò)大到23-30%,仍然表現(xiàn)出比麒麟980約42%-47%的能效劣勢(shì)。
三星稱,Exynos 9820的性能提升20%或功耗提高40%,這里的關(guān)鍵字是“或”。 以2.7GHz作為基準(zhǔn)比較,20%的性能提升可能會(huì)與Cortex A76競(jìng)爭(zhēng),但芯片的糟糕能效仍將保持不變。同樣,將更高效的2.3GHz結(jié)果作為基準(zhǔn)性能,效率提高40%將與麒麟980的效率相匹配,但性能不足。
三星的市場(chǎng)數(shù)據(jù)不夠好,從表現(xiàn)看,如果結(jié)果如此平衡那么Exynos 9820的競(jìng)爭(zhēng)力讓人懷疑。 唯一的希望是,就像蘋果對(duì)外宣傳的A12的性能低于實(shí)際表現(xiàn),S.LSI正在低估Exynos 9820的改進(jìn)。唯一可以看到的方案是聲稱性能跳躍僅代表GeekBench4分?jǐn)?shù),SPEC的實(shí)際改進(jìn)和更實(shí)際的工作負(fù)載看到了更大的提升,縮小了上面討論過的兩個(gè)基準(zhǔn)之間的比率差距,希望是后一種情況。
Cortex A76是一款非常強(qiáng)勁的CPU
隨著Deimos和Hercules的曝光,Arm承諾下一代CPU性能提升15-20%。Arm的優(yōu)勢(shì)在于在強(qiáng)大的功率范圍內(nèi)提供一整套卓越的性能。雖然PPA指標(biāo)不是消費(fèi)者本身應(yīng)該關(guān)心的東西,但Arm也能夠使CPU保持極小。
我們剛看到Arm新的服務(wù)器核心--Ares應(yīng)該是Enyo / A76的基礎(chǔ)設(shè)施,也是最近宣布的Neoverse系列CPU內(nèi)核的一部分。在單個(gè)芯片上設(shè)置這種機(jī)芯的32或64個(gè)核心并不難。 總體而言,我們期待未來幾個(gè)月更多令人興奮的產(chǎn)品,無(wú)論是在移動(dòng)和基礎(chǔ)設(shè)施領(lǐng)域。
編譯,via anandtech
相關(guān)文章:
麒麟980性能表現(xiàn)大起底:既有情理之中,又有意料之外
Cortex A76沒出生就已被它干掉——三星Exynos M3架構(gòu)詳解
三星終于發(fā)布AI處理器Exynos9820迎戰(zhàn)蘋果、華為,但用的是8nm工藝
原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。