NVIDIA正式公布Turing架構(gòu):新增RT Core
掃描二維碼
隨時(shí)隨地手機(jī)看文章
雖然NVIDIA正式公布新一代的GeForce游戲卡應(yīng)該要等到下周科隆游戲展前的“GeForce Gaming Celebration”活動(dòng),但是在昨天正式開幕的SIGGRAPH 2018,這場圖形界頂級大會(huì)上,NVIDIA是不可能空手到來的,而事實(shí)上他們昨晚確實(shí)有很多重量級的公布,包括全新的Turing架構(gòu)(注意,官博現(xiàn)在還沒有使用任何中文命名),包括第一張專用于光線追蹤的GPU:Quadro RTX,但是我們還是應(yīng)該從它的根基:新的Turing架構(gòu)開始說起。
NVIDIA的官方直播大概是早上的8:45結(jié)束的,現(xiàn)在還有很多細(xì)節(jié)沒有公布出來,所以我們先來看看官方的Newsroom,首先關(guān)于Turing架構(gòu),NVIDIA對其非常有自信,稱其為自從2006年通過統(tǒng)一渲染架構(gòu)帶來CUDA后最偉大的飛躍,所以你可想而知NVIDIA對其的期望,或者說野心。新的Turing架構(gòu)很重要的一點(diǎn)就是混合渲染(Hybrid Rendering)來實(shí)現(xiàn)光線追蹤,具體來說包括引入全新的RT Core來加速光線追蹤,還有我們已經(jīng)在Volta架構(gòu)看到的Tensor Core來加速AI處理,當(dāng)然還有光柵化,畢竟現(xiàn)在我們還沒有厲害到能夠拋棄光柵化的程度,所以新的Turing架構(gòu)是包含多種力量的,而這種包含多方力量來實(shí)現(xiàn)光線追蹤的混合渲染,應(yīng)該會(huì)成為日后的關(guān)鍵詞。
每次有新架構(gòu)到來,我們最關(guān)心的就是微架構(gòu)級別的變化:有哪些新增的特性,有哪些精簡的部分,如果說Volta架構(gòu)我們開始看到Tensor Unit,那么新的Turing架構(gòu)當(dāng)中最重要的就是新引入的RT Core。既然是“RT”,顧名思義就是沖著光線追蹤(Ray Tracing)來的,它的作用是用來加速處理光線在三維環(huán)境中的傳播,處理光線的速度是目前Pascal架構(gòu)的25倍,同時(shí)讓GPU作為節(jié)點(diǎn)處理最末幀(Final Frame)的效果渲染要比將CPU作為節(jié)點(diǎn)的速度快30倍。
同時(shí)讓人興奮的是,自從Volta架構(gòu)開始引入的Tensor Core,我們都知道它能提供遠(yuǎn)遠(yuǎn)高于傳統(tǒng)GPU的人工智能、深度學(xué)習(xí)性能,這部分性能能夠賦予我們的GPU去做很多以往沒有的工作,比如說在Turing架構(gòu)當(dāng)中的Tensor Core,能夠在每秒處理500萬億的張量運(yùn)算,通過這部分性能,我們能實(shí)現(xiàn)以往無法奢望的功能,比如說新的基于深度學(xué)習(xí)的抗鋸齒技術(shù):DLAA(Deel Learning Anti-Aliasing,萬物基于深度計(jì)算)。
最后在傳統(tǒng)的架構(gòu)方面,Turing在我們熟悉的SM單元當(dāng)中新增整數(shù)處理(Integer Unit)單元,以及新的統(tǒng)一緩存架構(gòu),能夠帶來目前架構(gòu)兩倍的帶寬。規(guī)格方面,Turing架構(gòu)能夠搭載最多4608 CUDA,并且能夠帶來最高16 TFlops浮點(diǎn)性能。