在今年4月初開幕的圖形處理器技術大會上,NVIDIA展示了針對VR虛擬現(xiàn)實和深度學習應用的最新技術和產品。NVIDIA聯(lián)合創(chuàng)始人兼CEO黃仁勛在反復重申“一個全新的計算模型”這樣的字眼。他指出,“消費市場需要的計算機可再也不是那種馬馬虎虎就能打發(fā)的一般產品。大家都愿意享受超級計算速率帶來的快感,特別是基于GPU加速帶來的計算體驗”。
當然,超級計算時代的到來并非只是想想就能實現(xiàn)的,基于這樣的目標,NVIDIA在今年的GTC大會上推出了包括GPU芯片Tesla P100(基于全新Pascal平臺架構上打造)、DRIVE PX2(用于自動駕駛汽車的開發(fā)平臺)和用于深度學習研究的超級計算機DGX-1(使用Tesla P100芯片建造,運算速度可達170萬億次)在內的一系列新技術和新產品。
基于NVIDIA全新計算平臺Pascal打造的Tesla P100 GPU芯片集成了NV Link總線,16GB HBM2顯存,內建3584個CUDA,224個紋理單元,16GB HBM2顯存,帶寬可達到720GB/s,擁有基于16nm FinFET工藝打造的最大GPU核心。
△NVIDIA Tesla P100圖形處理器芯片
此外,Tesla P100芯片也是繼2014年發(fā)布,基于Kepler架構平臺打造的Tesla K80之后,Tesla系列GPU產品的首次重大升級。
不過既然這是一款針對深度學習打造的GPU芯片,那么這里還必須要提一下Tesla P100芯片使用的NVIDIA旗艦GP100核心。GP100的性能一公布,給車云菌的感覺就是NVIDIA這次回歸了GK110大核心時代注重雙精度運算的設計,而且比之前更加變態(tài)。它每組SM單元中有64個FP32單元,但有32個FP64單元,F(xiàn)P64與FP32比例是1:2。這樣的設計意味著GP100的FP32 CUDA核心可以同時執(zhí)行2個FP16半精度運算,因此FP16浮點性能高達21.6TFLOPS。
△NVIDIA GP100核心架構示意圖
GPU并行運算的特性很適合深度學習。據(jù)車云菌了解,NVIDIA在Tesla P100之外還推出了基于GP100核心的DGX-1深度學習超級計算機,由8顆GP100核心及2顆16核Xeon E5處理器組成,深度計算性能達到了170TFLOPS,號稱比250臺X86服務器還要強大。
△NVIDIA 超級計算機DGX-1 售價高達$129000,真心不便宜
在過去的兩年里,每次GTC大會的主題演講環(huán)節(jié),黃仁勛都會將話題的重點放在深度學習和神經網絡研究上,并適時推出相關的新技術和新產品,而這些為NVIDIA之后進行人工智能的研究奠定了基礎。今年也不例外。除了基于Pascal全新架構平臺打造的Tesla P100芯片外,NVIDIA還發(fā)布了兩款Maxwell計算平臺下的全新GPU芯片—Tesla M40/M4,是為深度學習應用而特別打造的。