如果李佳琦跨界帶貨GPU,那鐵定不如黃仁勛。但現(xiàn)場的感覺又如同李佳琦的直播一般,一句 “The more you buy ,the more you save”像極了“OMG”,你能忍住不心動?
偌大的演講大廳烏央央一片,塞下幾千人,一眼望不見頭,舞臺角落放著兩瓶礦泉水,一場大型年度“帶貨”大會即將開始。
NVIDIA GTC 2019大會今年參加人數(shù)多達6100人,幾年來翻番的漲,大家?guī)е鴮VIDIA(英偉達)崇拜之情從各個城市趕來,匯聚一堂,當然也有不少和筆者一樣,對本屆GTC大會主角黃仁勛(英偉達CEO)更感興趣。去年一句“快來買吧,超便宜的!”深深刻在腦海,今年一句 “The more you buy ,the more you save?!秉c嗨全場。
我猜所有人都在盤算,今年又要瘋狂“推銷”哪些產(chǎn)品?
燈光、音響……各單位注意,黃教主登場,Action!

一
蘇州一夜之間陡降10℃,考驗黃教主皮衣耐寒程度的時候到了。
二話不說,先秀成績?!皟H在去年,我們就發(fā)布了500多個SDK和庫,其中既有全新內(nèi)容,也有更新版本。為了提高GPU性能,深度學習訓練在3年內(nèi)提高4倍,深度學習推理在1年內(nèi)提高2倍?!?

黃教主一面告訴我們摩爾定律快到頭了,一面又表現(xiàn)自己硬件性能還在反規(guī)律提升。并表示,出色的芯片只是起點,因為軟件優(yōu)化成了大力丸,而NVIDIA的CUDA平臺具有豐富的庫、工具和應用程序。
此外,在會議介紹后的媒體采訪中,黃教主表示:“制程雖然很重要,但不是最重要的。RTX芯片和光線追蹤技術在12nm制程情況下,達到AMD 7nm制程GPU水平?!彼惴?、軟件、架構等全棧優(yōu)化的組合拳果然威力驚人。
如今英偉達已經(jīng)售出15億塊GPU。
英偉達專注于加速計算領域,致力于解決普通計算機無法解決的問題,在垂直市場中將GPU、深度專業(yè)知識、計算堆棧、算法和生態(tài)系統(tǒng)專業(yè)知識集于一體。立足一個架構,從游戲到汽車再到醫(yī)療健康。
二
上個月,英偉達公布2020財年 Q3財報,收入高達30.1億美元,其中游戲業(yè)務就占到16.6億美元。游戲撐起來了英偉達的半壁江山,GTC 2019的“帶貨”現(xiàn)場也是從游戲開始。
現(xiàn)場,黃仁勛宣布6款支持RTX的游戲,為《暗影火炬》《project X》《無限法則》《軒轅劍柒》《鈴蘭計劃》《邊境》,表明RTX技術的開發(fā)者數(shù)量飆升。

所謂光線追蹤技術其實就是將光源產(chǎn)生的光線所產(chǎn)生的折射,反射等光線變化和對陰影產(chǎn)生的反應通過計算準確的反映到畫面之中,為人們帶來百分之百的光影效果。
此前,英偉達和微軟還共同宣布《我的世界》將支持RTX。黃仁勛稱,《我的世界》是由用戶創(chuàng)造的世界,因此無法預烘焙GI(全局光照)和一般反射之類的燈光效果,而RTX可以實時妥善完成這些操作。

總結起來一個字,真,兩個字,逼真。玩家在游戲里創(chuàng)造了“我的世界”,英偉達撒下一片光明。
當你還在沉浸在唯美畫面的視頻中時,黃仁勛端出一臺筆記本——采用MAX-Q的超薄筆記本。今年年初的CES上,聯(lián)想就秀了一把英偉達RTX 2080 Max-Q顯卡的拯救者Y9000K。教主現(xiàn)場表示,Max-Q設計將超高GPU能效和總體系統(tǒng)優(yōu)化集于一身,使功能強大的GPU用于輕薄的筆記本。

“中國游戲筆記本電腦發(fā)貨量超過500萬臺,在5年內(nèi)增加了4倍。GeForce RTX Max-Q筆記本電腦是增長速度最快的游戲平臺?!焙闷诖藭r黃仁勛會說一句“OMG”,那樣全球的游戲玩家就如同拜倒在李佳琦“OMG”聲中的女粉們,欲罷不能。
此外,今天騰訊游戲和英偉達宣布了一項將電腦游戲帶入云端的合作。資料顯示,英偉達的GPU技術為騰訊游戲的START云游戲服務賦力,該服務已從今年初開始進入測試階段。START使游戲玩家可以隨時隨地,即使是在配置不足的設備上也能玩AAA游戲。騰訊游戲計劃將擴展其云游戲產(chǎn)品,為數(shù)百萬玩家提供與本地游戲設備一致的游戲體驗。

英偉達和騰訊游戲還宣布成立一個游戲聯(lián)合創(chuàng)新實驗室。雙方將共同探索AI在游戲、游戲引擎優(yōu)化和新光照技術(包括光線追蹤和光線烘焙)中的新應用。
讓游戲逼真顯然是不夠的。
會上,黃仁勛宣布,瑞云云渲染平臺將配備NVIDIA RTX GPU,首批5000片RTX GPU將在2020年上線。其中超過85%的中國電影工作室都是瑞云的客戶,《戰(zhàn)狼2》、《哪吒》和《流浪地球》就是出自其手,堪稱全亞洲最大的云渲染平臺。
黃仁勛還發(fā)布了面向建筑行業(yè)(AEC)的Omniverse開放式3D設計協(xié)作平臺,本地和云端均支持在AEC工作流中增加實時協(xié)作功能,將支持Autodest REVIT、Trimble SketchUP和McNeel Rhino等主流AEC應用。

現(xiàn)場一則實例中,“原本花費485小時的渲染場景,現(xiàn)在只需不到40小時就渲染完成?!贝颂帒撚钟小癘MG”。
其中,NVIDIA Omniverse是一個面向3D制作流程的協(xié)作平臺,基于Pixar公司的Universal Scene Description技術,并由NVIDIA RTX提供支持。
三
我相信李佳琦看了黃教主意氣風發(fā)的“帶貨”現(xiàn)場都要自愧不如,居然帶的還都是剛出爐的新貨。
比如,英偉達今天宣布發(fā)布NVIDIA Parabricks基因組分析工具包。其中Parabricks是一個CUDA加速的基因組處理工具包可與用于發(fā)現(xiàn)變異并能產(chǎn)生與行業(yè)標準GATK最佳實踐流程一致的結果。并能夠?qū)崿F(xiàn)30-50倍的加速,Parabricks可以提供DeepVariant工具,利用深度學習技術進行基因變異檢測。
此外,據(jù)現(xiàn)場透露,華大基因已采用Parabricks,借助若干GPU服務器,華大基因可以按其測序儀生成的數(shù)據(jù)的速率來處理基因組。而且,今年英偉達為CUDA增加了兩個新的主流應用5G vRAN和基因組處理。
再比如,現(xiàn)場發(fā)布推理軟件TensorRT 7,這是英偉達第七代推理軟件開發(fā)套件,打開了智能AI人機交互的新世界,實現(xiàn)與語音代理、聊天機器人和推薦引擎等應用進行實時互動。
據(jù)介紹,TensorRT 7內(nèi)置新型深度學習編譯器。該編譯器能夠自動優(yōu)化和加速遞歸神經(jīng)網(wǎng)絡與基于轉換器的神經(jīng)網(wǎng)絡。這些日益復雜的神經(jīng)網(wǎng)絡是AI語音應用所必需的。與在CPU上運行時相比,會話式AI組件速度提高了10倍以上,從而將延遲降低到實時交互所需的300毫秒閾值以下。

“我們已進入了一個機器可以實時理解人類語言的AI新時代。”黃仁勛一句話總結。
再再比如,黃仁勛發(fā)布用于自動駕駛和機器人的高度先進的軟件定義平臺——NVIDIA DRIVE AGX Orin。

該平臺內(nèi)置全新Orin系統(tǒng)級芯片。該芯片由170億個晶體管組成,凝聚著NVIDIA團隊為期四年的努力。Orin系統(tǒng)級芯片集成了NVIDIA新一代GPU架構和Arm Hercules CPU內(nèi)核以及全新深度學習和計算機視覺加速器,每秒可運行200萬億次計算,幾乎是NVIDIA上一代Xavier系統(tǒng)級芯片性能的7倍。此外,Orin可處理在自動駕駛汽車和機器人中同時運行的大量應用和深度神經(jīng)網(wǎng)絡,并且達到了ISO 26262 ASIL-D等系統(tǒng)安全標準。
在汽車領域,黃仁勛還宣布,英偉達將在 NVIDIA GPU Cloud (NGC) 容器注冊上,向交通運輸行業(yè)開源 NVIDIA DRIVE自動駕駛汽車開發(fā)深度神經(jīng)網(wǎng)絡。如今,NVIDIA 向自動駕駛汽車開發(fā)者開源其預訓練 AI 模型和訓練代碼。通過一套 NVIDIA AI 工具,NVIDIA 生態(tài)系統(tǒng)內(nèi)的開發(fā)者們可以自由擴展和自定義模型,從而提高其自動駕駛系統(tǒng)的穩(wěn)健性與能力。

此外,現(xiàn)場英偉達還宣布和滴滴合作,滴滴將在數(shù)據(jù)中心使用NVIDIA GPU訓練機器學習算法,并采用NVIDIA DRIVE為其L4級自動駕駛汽車提供推理能力。為了訓練這些深度神經(jīng)網(wǎng)絡,滴滴將采用NVIDIA GPU數(shù)據(jù)中心服務器。在云計算方面,滴滴還將構建領先的AI基礎架構,并推出計算型、渲染型和游戲型vGPU云服務器。

滴滴云將采用新的vGPU許可證模式,旨在為用戶提供體驗更佳、應用場景更豐富、效率更高、更具創(chuàng)新性和靈活的GPU計算云服務。目前,滴滴云已與NVIDIA等行業(yè)合作伙伴攜手服務交通出行、AI、圖形渲染、電子游戲及教育培訓等多個領域。
再再再比如,NVIDIA發(fā)布全新版本Isaac軟件開發(fā)套件(SDK),為機器人提供更新的AI感知和仿真功能。
Isaac SDK 包括 Isaac Robotics Engine(提供應用程序框架),Isaac GEM(預先構建的深度神經(jīng)網(wǎng)絡模型、算法、庫、驅(qū)動程序和API),用于室內(nèi)物流的參考應用程序以及Isaac Sim的第一個版本(提供導航功能)。
而全新Isaac SDK可以大大加快研究人員、開發(fā)人員、初創(chuàng)企業(yè)和制造商開發(fā)和測試機器人的速度。它使機器人能夠通過仿真獲得由人工智能技術驅(qū)動的感知和訓練功能,可以在各種環(huán)境和情況下對機器人進行測試和驗證。
四
黃仁勛在現(xiàn)場用一張PPT上顯示了2019年天貓全球狂歡節(jié)的交易成績單,他不明白為什么這一天會有這么多人同時進行交易,但這不影響他宣布阿里巴巴推薦系統(tǒng)采用NVIDIA AI,并表示CPU速度太慢了,只有3QPS,但英偉達的GPU可以提升至780QPS。

說完略帶停頓,全場響起掌聲,欽佩于780比3,但也可能是停頓處就該自然鼓掌。
此外還宣布了百度推薦系統(tǒng)也采用了NVIDIA AI,有100多個推薦模型被使用在百度的眾多應用中。其中百度龐大的用戶潛在興趣數(shù)據(jù)包含了千億維稀疏離散特征和10TB embedding詞表。
同樣,訓練此模型在CPU上成本高昂且速度慢,據(jù)悉,GPU訓練成本只有CPU的1/10。
雖然黃仁勛沒有提過一句具體成本情況,但經(jīng)常說“The more you buy ,the more you save”。暴力增加性能后,總會在高階、大數(shù)據(jù)量的應用情況下,節(jié)約出成本。而人工智能時代,又需要這種暴力。
