英偉達(dá)Tegra K1深度解讀:技術(shù)很牛
1月10日消息,在今年的CES展上,Nvidia為我們帶來了Tegra系列移動(dòng)芯片當(dāng)中的最新成員——Tegra K1。這款芯片將會(huì)把Nvidia苦苦掙扎的移動(dòng)處理器業(yè)務(wù)和更為成功的桌面顯卡部門聯(lián)合在一起。
根據(jù)Nvidia的說法,Tegra K1將會(huì)為移動(dòng)設(shè)備帶來“下一代家用機(jī)的游戲圖形性能”,但功耗僅有2W。Nvidia是如何辦到這一切的呢?科技網(wǎng)站Android Authority日前就撰文對(duì)Tegra K1進(jìn)行了深度介紹。文章內(nèi)容如下:
大量的CUDA核心
Tegra K1總共擁有192個(gè)顯卡處理核心(Tegra 4為72個(gè)),這無疑是這款芯片的一大亮點(diǎn)。顯卡的“血統(tǒng)”要比核心數(shù)量更為重要,而在這一點(diǎn)上,Tegra K1也沒有讓我們失望。不同于Tegra 4,Nvidia直接把Kepler架構(gòu)用在了Tegra K1身上,讓后者和GTX 680,Titan和780Ti這些桌面顯卡站在了同一水平線上。
雖然Nvidia并沒有對(duì)Tegra K1的Kepler架構(gòu)進(jìn)行多少改動(dòng),但把它和上面這些頂級(jí)桌面顯卡放在一起比較的確有點(diǎn)不公平。Tegra K1只有單獨(dú)一個(gè)Nvidia SMX單元,其中包含了192個(gè)CUDA核心,8個(gè)紋理單元,4個(gè)光柵處理單元,這和Nvidia的頂級(jí)顯卡系列相比明顯少了很多。就拿GTX 680為例,這款顯卡擁有1536個(gè)CUDA核心,128個(gè)紋理單元,32個(gè)光柵處理單元。
Nvidia并未提及Tegra K1核心的時(shí)鐘頻率或者是帶寬,但在CES的展示當(dāng)中,他們的確給出了Tegra K1的著色器性能峰值:365 GFLOPS。目前還很難去測算這款芯片的實(shí)際性能,但我們還是可以進(jìn)行一些比較。比如說,定位低端的OEM版本GT630擁有192個(gè)CUDA核心,其著色器性能峰值為336 GFLOPS。
比較應(yīng)該已經(jīng)足夠了,那么Nvidia是如何把這一切放進(jìn)一枚功耗僅有2W的芯片當(dāng)中的呢?
從彼此獨(dú)立的芯片轉(zhuǎn)向單獨(dú)一枚SoC會(huì)帶來節(jié)能性上的明顯提升,而大幅縮減核心和光柵處理單元的數(shù)量也得以讓Tegra K1的功耗能夠低于Nvidia的Kepler筆記本芯片系列(已經(jīng)在20W以下了)。更大的128KB L2緩存也降低了消耗在片外存儲(chǔ)器訪問上的能源。
對(duì)于效率管理能耗的低級(jí)別優(yōu)化也應(yīng)該被給予特別的關(guān)注。門控電源和門控時(shí)鐘會(huì)快速識(shí)別出閑置的GPU核心,并降低時(shí)鐘頻率或者是徹底封閉這些區(qū)塊,以此達(dá)到降低功耗的目的。對(duì)于ASTC紋理壓縮的支持也會(huì)幫助降低UI和3D渲染的工作量。
無論是從圖形性能還是節(jié)能性上面,Tegra K1都是巨大的進(jìn)步。但并非所有的提升都來自于硬件部分。
下一代API
要說在移動(dòng)設(shè)備上提供下一代游戲體驗(yàn)這方面,Tegra K1最顯著的新功能就是全面的圖形API支持了。也許你還記得,Tegra 4并不支持OpenGL、CUDA和DirectX 11這些常見的API,只是對(duì)部分游戲進(jìn)行了優(yōu)化,這還要取決于開發(fā)者。Tegra K1在這方面得到了改善,帶來了對(duì)于OpenGL 4.4,微軟DirectX 11.2,OpenGL ES 3.0和Nvidia自家CUDA 6的全面支持。
新的API自然也帶來了圖形性能上的新提升,比如對(duì)于FXAA和TXAA抗鋸齒和Nvidia PhysX物理加速引擎的支持,還有Compute Shaders所帶來的一整套高級(jí)特效(比如環(huán)境光遮蔽)。Tegra K1同時(shí)也是市面上首款支持硬件曲面細(xì)分的移動(dòng)顯卡,不過高通正在開發(fā)的Adreno 420同樣也會(huì)具備該功能。
這所帶來的好消息就是,PC和家用機(jī)游戲的開發(fā)者現(xiàn)在可以把自己的作品進(jìn)行壓縮,然后放到移動(dòng)設(shè)備上讓Tegra K1運(yùn)行。考慮到這款芯片的性能據(jù)稱是要強(qiáng)過PlayStation 3和Xbox 360,所以跨平臺(tái)移植也不是沒有可能。Nvidia在展會(huì)現(xiàn)場已經(jīng)展示了Unreal Engine 4、《英雄薩姆3》和《三位一體2》的移植版,Tegra K1運(yùn)行起來毫無問題。
兩種CPU設(shè)計(jì)
Tegra K1共有兩種CPU版本,針腳設(shè)計(jì)完全兼容,這也就意味著廠商可以輕松在兩者之間進(jìn)行互換。第一種是我們所熟悉的四核+Cortex A15排布,架構(gòu)和Tegra 4幾乎完全相同。而第二種加入了Nvidia自己的雙核ARM CPU。
和Tegra 4一樣,Tegra K1的CPU共有4個(gè)滿速A15核心,用于處理繁重任務(wù),額外的一個(gè)低性能A15“附屬核心”就負(fù)責(zé)一些簡單任務(wù)。每一個(gè)核心還可以被封閉以降低能耗,只有在需要時(shí),額外的核心才會(huì)開啟。但K1和Tegra 4之間有一個(gè)細(xì)微的差別,那就是前者的CPU是基于新的第三版ARM Cortex A15核心設(shè)計(jì)。
第三版Cortex A15主要對(duì)門控時(shí)鐘進(jìn)行了封閉,從而達(dá)到了提升節(jié)能性的目的。轉(zhuǎn)換到28nm HPM制程工藝也進(jìn)一步降低了能耗,Nvidia也將時(shí)鐘速度提升了20%,從1.9GHz提高到了2.3GHz。
Tegra K1的A15處理器也要比Tegra 4的稍快一些,但提升程度并沒有Kepler顯卡那樣大。但是,這種久經(jīng)考驗(yàn)的四核設(shè)計(jì)意味著Nvidia可以很快開始Tegra K1的生產(chǎn),OEM廠商預(yù)計(jì)會(huì)在本季度收到供貨。
而代號(hào)為“Denver”的第二種CPU設(shè)計(jì)就完全不同了。Nvidia徹底放棄了附屬核心這種設(shè)計(jì),而選擇了更加傳統(tǒng)的雙核配置。這兩個(gè)核心基于新的ARMv8架構(gòu),同時(shí)支持64位和32位。Denver的最高時(shí)鐘頻率鎖定在2.5GHz,同時(shí)具備更大的128KB L1指令緩存和64KB L1數(shù)據(jù)緩存。不過遺憾的是,目前有關(guān)Denver的信息還非常有限,不過Nvidia放棄流行的四核設(shè)計(jì)而選擇雙核的舉動(dòng)值得玩味。
豐富的多媒體功能
Nvidia同時(shí)賦予了Tegra K1許多額外的功能。這款芯片的圖像信號(hào)處理器(簡稱ISP,負(fù)責(zé)多種圖像任務(wù))得到了升級(jí),數(shù)量也增加到了兩個(gè)。
每一個(gè)ISP都具備14位輸入下6億像素/秒的處理能力(Tegra 4為10位下4億像素/秒),降噪能力得到了提升,同時(shí)還能支持1億像素圖像感光元件。雙ISP的加入也讓雙攝像頭操作成為可能,我們也已經(jīng)在其他設(shè)備上看過了類似功能。和Tegra 4一樣,K1同樣支持通過HDMI輸出4K視頻內(nèi)容,但它的GPU能否處理4K 3D游戲讓人懷疑。
結(jié)語
Tegra K1終于體現(xiàn)出了Nvidia的真正實(shí)力,但從這一點(diǎn)上看,它就是一款讓人非常興奮的產(chǎn)品。K1也很有可能被加入到下一代Nvidia Shield當(dāng)中。
對(duì)于Nvidia來說,擺在面前的最大障礙依然是找到足夠大的消費(fèi)者基礎(chǔ)。在移動(dòng)設(shè)備上獲得家用機(jī)的游戲質(zhì)量還不是普羅大眾所追求的。再過幾年后,像Steam OS這樣的項(xiàng)目可能會(huì)推動(dòng)游戲在Linux平臺(tái)的發(fā)展,到那時(shí),Android平臺(tái)的一款強(qiáng)大游戲芯片可能會(huì)更加誘人。
從技術(shù)角度看,Tegra K1很強(qiáng)大,但在休閑游戲所主導(dǎo)的移動(dòng)市場,它可能并沒有看上去那么開創(chuàng)性。我們還需等待開發(fā)者們能夠利用Kepler給我們帶來些什么,以及Denver有沒有什么新內(nèi)容。