22年后再戰(zhàn)高性能顯卡市場 Intel Xe GPU架構(gòu)詳解:王之野望
作為CPU界的王者,Intel對高性能GPU市場一直沒有死心,1998年就推出了i740獨顯,12年后又推出Larrabee,22年后的今天又重燃戰(zhàn)鼓,推出了Xe GPU架構(gòu)。
Intel重新殺入高性能GPU市場的傳聞已久,并挖來了AMD RTG部門前主管、首席架構(gòu)師Raja Koduri坐鎮(zhèn)GPU業(yè)務(wù),這次是否會不一樣呢?
今天的2020年架構(gòu)日上,Intel終于詳細地解開了Xe GPU的面紗,這里我們就來管中窺豹一探Intel歷時多年重新打造的GPU架構(gòu)。
對于Xe架構(gòu),我們之前的報道已經(jīng)多次提到Intel對它的期望是希望用一種架構(gòu)去滿足多種使用場景,從筆記本到游戲卡再到高性能超算,都是Xe架構(gòu),推動GPU算力從萬億次(TFLOPS)向千萬億次(PFLOPS)邁進。
Intel Xe架構(gòu)總覽:一種架構(gòu)通殺四方、適應(yīng)AI、云時代
對于Xe GPU架構(gòu),官方的定義是“并行矢量矩陣架構(gòu)”,已經(jīng)突出了這個架構(gòu)的特點,那就是高度并行,適合擴展多種場景。
Xe GPU架構(gòu)有三大重點—;—;軟件第一、并行第二,同時適應(yīng)全新的工作負載,比如AI、視覺云計算等等,這也是Intel作為GPU后來的一個優(yōu)勢,研發(fā)GPU架構(gòu)的時候可以不用照顧太多之前的積累,直接面向未來潛力巨大的場景,比如AI、云計算等等。
Xe GPU希望用一個架構(gòu)統(tǒng)一所有應(yīng)用場景,不過實際情況還是很復(fù)雜的,不同場景對性能、功耗的要求不同,可以細分為集成+低能耗、中端、發(fā)燒級、數(shù)據(jù)中心/AI、HPC百億億次計算等等。
在這些細分場景中,Intel打造了三種不同的架構(gòu)—;—;Xe LP低功耗、Xe HP高性能、Xe HPC,不過實際上已經(jīng)擴展到了四種,后面會再詳細說。
雖然有三四種不同的架構(gòu),不過Intel現(xiàn)在做的主要是兩種—;—;適用于HPC的Xe HPC及低功耗的Xe LP,后者適合核顯、筆記本及低端獨顯,包括之前曝光最多的DG1顯卡。
Intel Xe GPU架構(gòu)詳解:EU、存儲、AI、顯示、視頻單元全都改了
目前進度最好的還是Xe LP低功耗版,Xe GPU的結(jié)構(gòu)介紹都是基于Xe LP的,具體如下:
Xe LP架構(gòu)簡單來說就是在提升FLOPS浮點性能的同時,還要考慮功耗,所以能效很重要,性能及能效兼顧。
提升性能就要提升計算規(guī)模,Xe架構(gòu)在Gen11基礎(chǔ)上全面提升了執(zhí)行單元的規(guī)模,EU單元從Ice Lake處理器上的Gen11核顯最多64個提升到了96個,每周期Texel紋理、Pixel像素渲染能力也從32、16提升到48、24,總體性能1.5倍于目前Gen11顯卡水平。
考慮到Gen11的規(guī)模實際上已經(jīng)是目前Gen9.5的2倍多,理論上Tiger Lake上的Gen12核顯性能是現(xiàn)有核顯的至少3倍。
能效方面,在同樣的電壓下,Xe LP GPU的頻率大幅提升,從之前1.1GHz左右提升到了1.7GHz,還有其他手段一起降低了功耗,能效也全面改進了。
下面就是Gen11與Xe架構(gòu)EU單元的具體對比了。
存儲單元方面,Xe LP GPU的改變也不小,L1新增了數(shù)據(jù)緩存,并支持端對端壓縮,L3緩存從Gen11的3MB大幅提升到16MB,同時GTI(Graphics Technology Interface 圖形技術(shù)接口)帶寬翻倍。
在AI上,Xe架構(gòu)之前的GPU主要是支持FP32、FP16及Int16浮點,而Xe GPU開始支持INT8指令,AI性能是FP32的4倍。
多媒體引擎上,Xe GPU架構(gòu)的解碼、編碼帶寬翻倍,支持AV1加速,同時支持4K/8K60播放,還有HDR、杜比音效等等。
顯示輸出方面,Xe GPU支持4屏擴展,支持雙eDP,接口支持DP 1.4、HDMI 2.0、TBT4及USB4,并支持8K UHD輸出,還有360Hz高刷、自適應(yīng)Sync,全面達到頂級水平。
為何說軟件第一?Intel Xe GPU驅(qū)動及軟件優(yōu)化
前面提到Xe GPU架構(gòu)的時候,Intel第一個強調(diào)的是軟件,很多人可能并不理解,實際上Intel這次是抓到重點了,軟件支持是GPU最容易翻車的地方,Intel的核顯GPU多年來理論性能不弱,但是游戲表現(xiàn)一言難盡,就是驅(qū)動和優(yōu)化是最大的鍋。
這次Intel對軟件及驅(qū)動的重視終于提上來了,這也跟Raja Koduri本人的風(fēng)格有一定關(guān)系,2013年他回到AMD的時候,當年AMD第一個改革的就是催化劑驅(qū)動,全面放棄之前的界面及設(shè)計,變成了現(xiàn)在的腎上腺素Adrenalin驅(qū)動。
在圖形軟件方面,不同場景下的GPU面對的挑戰(zhàn)也是不同的,3D渲染、計算、多媒體、性能、穩(wěn)定性等等都很重要。
在驅(qū)動及編譯器效率上,Xe GPU改變了調(diào)度設(shè)計,支持AI優(yōu)化指令,降低了DX11中的驅(qū)動開銷(overhead),減少了API延遲等等。
針對GPU優(yōu)化,Xe GPU可以自適應(yīng)優(yōu)化,在后臺就最大化GPU性能。
Xe GPU還支持了VRS可變幀率渲染,根據(jù)渲染場景的不同來選擇降低或者提升渲染內(nèi)容,之前在Ice Lkae的Gen11上首先應(yīng)用了。
還有就是IGCC控制面板,這里面提供了不少游戲輔助弓箭手,包括截屏、銳化、直播等等,如果大家用過NVIDIA的GFE及AMD的RIS,就知道Intel這是在一比一的致敬兩位對手了,這對游戲玩家來說也是好事。
最后就是游戲支持,這個才是考驗GPU廠商的關(guān)鍵,目前已經(jīng)得到英雄薩姆4、GRID、Gear Tactics、Ring of Elysium、Chvalry II等游戲支持的,這個只能慢慢來了。
Intel Xe GPU產(chǎn)品線:Xe LP首發(fā)三款、One More Thing驚喜亮相
在尾聲階段,來看看Intel Xe GPU最終的產(chǎn)品線,目前主要是Xe LP及Xe HPC兩個架構(gòu)有結(jié)果,其中LP架構(gòu)會有三款產(chǎn)品。
最快見到的Tiger Lake處理器上的Gen12核顯,然后就是DG1,這個是針對移動內(nèi)容創(chuàng)造者的,還有就是針對服務(wù)器的SG1,后兩者規(guī)格應(yīng)該差不多。
然后就是One More Thing了,前面說到了Xe GPU有LP、HP及HPC三種,現(xiàn)在Intel又增加了一個選擇—;—;Xe HPG,專門為發(fā)燒級游戲玩家設(shè)計的。
Xe HPG最大的特點就是支持RT光線追蹤,硬件光追這個未來游戲的最大賣點也追上來了,至此AMD、NVIDIA及Intel三家都明確了支持光追了。
現(xiàn)在Xe GPU的架構(gòu)就變成了Xe LP、Xe HPG、Xe HP及Xe HPC四大金剛了,未來會覆蓋核顯到HPC超算在內(nèi)的多個場景。
最最后就是四款GPU架構(gòu)的工藝及封裝了,Xe LP會使用Intel的10nm SuperFin工藝,Xe HPG及Xe HP則是增強版10nm SuperFin工藝,其中Xe HP還會使用EMIB 2.5D封裝技術(shù)。
在往上,Xe HPC的計算卡之前原定是7nm工藝首發(fā),現(xiàn)在隨著7nm延期,也退回到了10nm SuperFin工藝了,不過封裝技術(shù)是最先進的Foveros及Co-EMIB。
總之,今天公布的Xe架構(gòu)可以讓大家過過癮,然而這些東西依然是紙面上的,停留在架構(gòu)上的,有關(guān)DG1顯卡、HPG光追卡的最終規(guī)格、性能、價格、上市時間等信息還得等等,最快也要年底左右了