在 PyTorch 上將 AI 算法的實時推理速度提升 10 倍,有可能嗎?
前段時間的CES上,AMD正式發(fā)布Ryzen 7000的3D緩存版,對于游戲玩家來說,Ryzen 7000 3D緩存版算是今年最期待的CPU。上一代的Ryzen7 5800X3D憑借超強的游戲性能和性價比,在德國最大的PC硬件零售商的統(tǒng)計中,甚至成為2022年最暢銷的高性能處理器。有著Ryzen 5000 3D緩存版的珠玉在前,AMD也是對這個系列的迭代產(chǎn)品寄予了厚望,特別是在Ryzen 7000系列銷量并不樂觀的當下,3D緩存版幾乎可以說是AMD唯一翻盤的希望。那么Ryzen 7000 3D緩存版的表現(xiàn)到底如何?又是否值得游戲玩家購買呢?年度游戲神U預定?
Ryzen 7000 3D緩存版?zhèn)涫芷诖皇菦]有原因的,以上一代的Ryzen7 5800X3D為例,雖然這款處理器并非AMD的旗艦型號,價格也僅為449美元(國行價格3099元),但是其游戲性能卻可以媲美英特爾的特挑版旗艦處理器i9-12900KS,而且后者的售價高達739美元(國行為5699元)。
以接近一半的價格提供相同的游戲性能,Ryzen7 5800X3D自然也就得到了許多游戲玩家的追捧。同時,很多玩家也在期待Ryzen 7000 3D緩存版可以延續(xù)Ryzen 5800X3D的“神話”,以50%的價格在游戲性能上擊敗i9-13900K。
先來看看Ryzen 7000 3D緩存版的規(guī)格,AMD此次發(fā)布的3D緩存版處理器一共三款,分別是Ryzen9 7950X3D、Ryzen9 7900X3D和Ryzen7 7800X3D,對比上一代新增了兩個型號,規(guī)格如下:
Ryzen9 7950X3D:16核心32線程,16MB二級緩存、64MB三級緩存、64MB 3D緩存,基準頻率4.2GHz,加速頻率5.7GHz,TDP120W。
Ryzen9 7900X3D:12核心24線程,12MB二級緩存、64MB三級緩存、64MB 3D緩存,基準頻率4.4GHz,加速頻率5.6GHz,TDP120W。
Ryzen7 7800X3D:8核心16線程,8MB二級緩存、32MB二級緩存、64MB三級緩存,基準頻率未知(官方標注為4.xGHz,或許是還未最終確定出廠基準頻率),加速頻率則是5.0GHz,TDP依然為120W。去年英特爾發(fā)布13代酷睿處理器,帶來多款帶K型號的旗艦處理器。而最近,英特爾在旗艦之上實現(xiàn)突破,推出i9-13900KS,主頻高達6Ghz。
作為i9-13900K的升級款,KS后綴的處理器是英特爾特挑體質(zhì)處理器,相比普通的i9-13900K默認主頻更高,超頻潛力也更大。i9-13900KS在沒有超頻的情況下就能穩(wěn)定6GHz。在規(guī)格方面,i9-13900KS采用8顆性能核加上16顆能效核的24核32線程,相比i9-13900K,基礎頻率從3.0GHz增加到了3.2GHz,擁有UHD770集顯。同時i9-13900KS擁有更高的默認TDP,相較i9-13900K提升25W,達到150W。
值得注意的是,i9-13900KS還支持極限性能模式,在開啟這個模式之后,LP1和LP2將會增加到320W。此外i9-13900KS支持最高DDR5?5600MT/s和DDR4?3200MT/s的內(nèi)存,兼容Z790和Z690主板。
在之前英特爾放出的視頻中,英特爾技術營銷工程師行了演示,搭配華碩Z790商用主板,以及海盜船一體式水冷。在全核心負載下,性能核的頻率為5.6GHz,能效核的頻率為4.3GHz。在沒有經(jīng)過任何改動的情況下,兩個性能核最高可以達到6GHz,但頻率并沒有始終保持在這個水平。英特爾方面解釋說,頻率將取決于許多因素,例如功耗計算、熱量或軟件本身。
但盡管如此,i9-13900KS的性能依舊令人驚艷。同時官方表示,憑借現(xiàn)有的英特爾600或全新英特爾700芯片組主板,發(fā)燒友用戶可以暢享第13代英特爾酷睿處理器帶來的出眾性能。產(chǎn)品支持最新的DDR5和既有的DDR4內(nèi)存,用戶在享受第?13?代酷睿所帶來的性能優(yōu)勢的同時,也可以根據(jù)自己的功能需求和預算組裝機器。
2023年初,英特爾醞釀已久的新一代數(shù)據(jù)中心芯片走至臺前。
1月11日,英特爾正式推出第四代英特爾至強可擴展處理器(代號“Sapphire Rapids”)、英特爾至強CPU Max系列(代號“Sapphire Rapids HBM”)以及英特爾數(shù)據(jù)中心GPU Max系列(代號“Ponte Vecchio”)。
一方面,在英特爾的轉(zhuǎn)型中,數(shù)據(jù)中心一直是核心業(yè)務。根據(jù)英特爾公布的數(shù)據(jù),過去四代所有的至強處理器已經(jīng)銷售了約8500萬顆,其中第三代產(chǎn)品在兩年內(nèi)銷售了1500萬顆。同時,在算力的新需求下,其數(shù)據(jù)中心產(chǎn)品也已經(jīng)從CPU拓展至GPU等,芯片巨頭們都在建立新的生態(tài)體系。
另一方面,在疫情和外部環(huán)境變換之下,半導體產(chǎn)業(yè)整體承壓,尤其是終端需求下滑的情況下,數(shù)據(jù)中心成為半導體行業(yè)的重要增長點,這也成為眾多芯片企業(yè)瞄準的方向,競爭隨之更加猛烈。
根據(jù)Dell’Oro Group此前發(fā)布的報告,由于運營商、云計算廠商運算需求持續(xù)提升,到2026年,全球數(shù)據(jù)中心的資本支出預計將達到3770億美元。在數(shù)字化的趨勢下,算力產(chǎn)業(yè)格局也在重塑中。
在中國數(shù)據(jù)中心市場上,機構指出2023年有望回暖。IDC中國研究經(jīng)理索引向21世紀經(jīng)濟報道記者表示:“抗疫政策的轉(zhuǎn)變對中國2023年經(jīng)濟復蘇帶來了正面影響,2023年我們預計中國整體服務器市場需求也將出現(xiàn)反彈,出貨量和廠商銷售額分別增長5.5%和7.2%。”
企業(yè)數(shù)字化來勢洶洶,建設數(shù)字化所需的計算力、數(shù)據(jù)等智能技術的基礎設施常被忽略。
然而,當降本增效成為企業(yè)發(fā)展的指導方針之一,數(shù)字化項目落地所涉及的方方面面也已經(jīng)不容小覷。驅(qū)動算法與模型的數(shù)據(jù)與算力,也成為實現(xiàn) " 降本增效 " 的重要手段。
例如,假設一個供應給終端硬件的視覺算法的交付時長是六個月,算法訓練與調(diào)優(yōu)原為 2 個月,企業(yè)調(diào)配 2 個算法工程師,一個算法工程師的年薪為 100 萬,如果算法的訓練速度可以提升 10 倍,那么對企業(yè)所產(chǎn)生的直接影響就是四個字:真金白銀!
當然,這是計算服務商一直在努力的目標。但,在 PyTorch 上將 AI 算法的實時推理速度提升 10 倍,有可能嗎?
英特爾做到了。
在 1 月 11 日舉辦的第四代英特爾 ® 至強 ® 可擴展處理器新品發(fā)布會上,英特爾正式推出第四代英特爾 ® 至強 ® 可擴展處理器、英特爾 ® 至強 ® CPU Max 系列以及英特爾 ® 數(shù)據(jù)中心 GPU Max 系列。
第四代至強不僅實現(xiàn)了 AI 推理的加速,還推動了數(shù)據(jù)中心的性能、能效和安全性的大幅躍升,為為 AI、云、網(wǎng)絡、邊緣和全球領先的超級計算機帶來全新功能。