Intel Xe獨立顯卡:一個架構(gòu)通吃、最多1000個單元
Intel今天正式公布了正在研發(fā)中的通用型GPU Ponte Vecchio,7nm工藝制造,F(xiàn)overos 3D、EMIB封裝,Xe全新架構(gòu),支持HBM顯存、CXL高速互連等技術(shù),面向HPC高性能計算、AI人工智能等領(lǐng)域。
事實上,Intel Xe GPU架構(gòu)是一個非常靈活、擴展性極強的統(tǒng)一架構(gòu),并針對性地劃分成多個微架構(gòu),從而可用于幾乎所有計算、圖形領(lǐng)域,包括百億億次高性能計算、深度學(xué)習(xí)與訓(xùn)練、云服務(wù)、多媒體編輯、工作站、游戲、輕薄筆記本、便攜設(shè)備等等。
Intel還將Xe GPU劃分成了三個檔次:
1、Xe LP(低功耗):用于集成核顯、入門級獨顯,典型功耗5-20W,最高可擴展到50W。
2、Xe HP(高性能):用于主流和發(fā)燒消費市場、數(shù)據(jù)中心和AI領(lǐng)域,典型功耗75-250W。
3、Xe HPC(高性能計算):用于超級計算機等,功耗暫無具體數(shù)值但基本不會有什么限制。
Intel首席架構(gòu)師Raja Koduri透露,Xe GPU最初只設(shè)計了LP、HP兩個微架構(gòu),后來發(fā)現(xiàn)HPC領(lǐng)域也有很大的機遇,就增加了一個,也是這次介紹的重點,可以打造百億億次超算平臺,比如美國能源部旗下的“極光”(Aurora)就用了它和未來的10nm可擴展至強。
Raja還聲稱,Xe HPC可以擴展到多達1000個EU執(zhí)行單元,而且每個單元都是全新設(shè)計的,F(xiàn)P64雙精度浮點計算能力是現(xiàn)在的40倍。
Xe HPC架構(gòu)中,EU單元對外通過XEMF(Xe Memory Fabric)總線連接HBM高帶寬顯存,同時集成大容量的一致性緩存“Rambo”,CPU和GPU均可訪問,并借此將多個GPU連接在一起,提供極致的顯存帶寬和FP64浮點性能,且支持顯存/緩存ECC糾錯、至強級RAS。
封裝方面,EMIB用于連接GPU與HBM,F(xiàn)overos則用于互連Rambo緩存,由多個GPU在同一中介層上共享。二者都會大大提升帶寬效率和密度。
Xe HPC將采用Intel 7nm工藝制造,官方稱新工藝會加入EUV極紫外光刻技術(shù),相比于10nm晶體管密度翻番,同時設(shè)計規(guī)則復(fù)雜度只有四分之一,而且規(guī)劃了跨節(jié)點工藝優(yōu)化,也就是會有更好的7nm+、7nm++。
當然,Intel早就說了第一款Xe顯卡會是10nm工藝,只是這次沒有給出更具體的消息,估計會在明年先推出10nm工藝、面向主流和發(fā)燒游戲市場的產(chǎn)品,后年再拿出7nm工藝、面向數(shù)據(jù)中心和高性能計算的版本。