在AI算力需求指數(shù)級增長的背景下,NVIDIA BlueField-3 DPU憑借其512個NPU核心和400Gbps線速轉(zhuǎn)發(fā)能力,為機器學(xué)習(xí)推理提供了革命性的硬件卸載方案。通過將PyTorch模型量化至INT8精度并結(jié)合DPU的硬件加速引擎,某頭部云服務(wù)商在BlueField-3上實現(xiàn)了ResNet50推理延遲從12ms壓縮至2ms的行業(yè)突破,同時保持Top-1準確率達75.8%。
在AI訓(xùn)練集群和超算中心場景中,傳統(tǒng)CPU處理網(wǎng)絡(luò)協(xié)議棧導(dǎo)致的20μs級延遲和30%的CPU資源占用已成為性能瓶頸。NVIDIA BlueField-3 DPU通過硬件卸載TCP/IP處理,結(jié)合內(nèi)核旁路(Kernel Bypass)和RDMA增強技術(shù),在100Gbps網(wǎng)絡(luò)下實現(xiàn)6.8μs端到端延遲和3倍吞吐量提升。本文通過實測數(shù)據(jù)對比、關(guān)鍵優(yōu)化技術(shù)解析、內(nèi)核模塊開發(fā)示例,深度揭示DPU加速網(wǎng)絡(luò)處理的實現(xiàn)原理。
在當(dāng)今數(shù)據(jù)爆炸的時代,數(shù)據(jù)中心面臨著前所未有的網(wǎng)絡(luò)性能挑戰(zhàn)。傳統(tǒng)的網(wǎng)絡(luò)處理方式主要依賴CPU,但隨著網(wǎng)絡(luò)流量的急劇增長,CPU在網(wǎng)絡(luò)協(xié)議棧處理上的開銷日益增大,導(dǎo)致系統(tǒng)整體性能下降、延遲增加。數(shù)據(jù)處理單元(DPU)的出現(xiàn)為解決這一問題提供了新的思路。DPU能夠?qū)⒕W(wǎng)絡(luò)協(xié)議棧的處理任務(wù)從CPU卸載到專門的硬件上,從而釋放CPU資源,降低網(wǎng)絡(luò)延遲,提高系統(tǒng)整體性能。NVIDIA BlueField-3 DPU作為一款先進的DPU產(chǎn)品,具備強大的網(wǎng)絡(luò)處理能力,本文將深入探討如何將TCP/IP協(xié)議棧卸載到BlueField-3,并對其延遲優(yōu)化效果進行實測。
2024年9月19日,安謀科技(中國)有限公司(以下簡稱“安謀科技”)正式推出本土自研的首款“玲瓏”D8/D6/D2顯示處理器,以及新一代的“玲瓏”V510/V710視頻處理器。聚焦國內(nèi)前沿技術(shù)趨勢,安謀科技自研業(yè)務(wù)產(chǎn)品矩陣持續(xù)擴容,全新亮相的處理器新品能夠滿足多樣化智能應(yīng)用場景的性能功耗配置需求,助力國產(chǎn)芯片廠商在多媒體技術(shù)領(lǐng)域?qū)崿F(xiàn)創(chuàng)新躍進。
“隨著時間來講,我們可以看到很明顯現(xiàn)在RISC-V對于ARM這邊的替換在市場上已經(jīng)在不斷的發(fā)生,同時也發(fā)生在我們這邊(DPU和FTTR)?!币嫠夹究萍迹ㄉ虾#┯邢薰窘鉀Q方案副總裁唐杰在第四屆滴水湖RISC-V產(chǎn)業(yè)論壇中說到。
AMD Zen4架構(gòu)和CCD計算內(nèi)核設(shè)計已經(jīng)沒什么秘密了,但是做輔助的IOD輸入輸出內(nèi)核一直比較神秘。
經(jīng)過前幾天的預(yù)熱,撼迅正式發(fā)布了最頂級的RX 7900 XTX Liquid Devil,這也是華擎AUAQ水神之后,第二款水冷版RX 7900系列顯卡。
據(jù)報道,AMD已經(jīng)占據(jù)了中央處理器單元近三分之一的市場份額,而英國芯片技術(shù)公司 Arm Ltd 在 PC 市場的增長在 2022 年第四季度有所放緩。
消費市場下滑,這已經(jīng)是不爭的事實,而相比老對手Intel來說,AMD剛剛交出的業(yè)績是超預(yù)期的,所以股價接連大漲,市值也是輕松超越前者。
上周Intel公司發(fā)布了22年Q4季度財報,現(xiàn)在輪到AMD的Q4財報了,他們的表現(xiàn)要比友商好得多,營收56億美元,同比增長了16%,表現(xiàn)超過了預(yù)期。
一場始于云計算的軟硬件變革,已經(jīng)蔓延到了芯片行業(yè)甚至整個IT產(chǎn)業(yè)。沒人能否認,新的大幕正徐徐拉開。自研DPU(Data Processing Unit),成為云廠商擺在臺面上的要緊事。
在Intel發(fā)布不太好看的Q3季度財報之后沒幾天,AMD的Q3財報也出爐了,收為55.65億美元,與上年同期的43.13億美元相比增長29%,在當(dāng)前的環(huán)境下還能逆勢增長。
2021年10月至今,中科院計算所面向全行業(yè)先后發(fā)布了《專用數(shù)據(jù)處理器(DPU)技術(shù)白皮書》和《專用數(shù)據(jù)處理器(DPU)性能基準評測方法與實現(xiàn)》,兩份白皮書較為全面地解釋了,DPU為何被定義為數(shù)據(jù)中心發(fā)展的顛覆性技術(shù)。
AMD的芯片產(chǎn)品一直被譽為業(yè)界良心,這一次AMD又做了一件讓用戶感覺到AMD Yes的好事,該公司宣布將旗下的賽靈思7系列器件的壽命延長到了2035年,總計提供長達25年的支持,這些產(chǎn)品最早發(fā)布于10多年前。
AMD剛剛官方宣布,將于美國東部時間8月29日19點(北京時間8月30日7點)舉辦發(fā)布會,正式推出下一代銳龍7000系列處理器,主題是“together we advance_PCs”(同超越,共成就PC)。
在DPU概念誕生之初,人們爭論它“應(yīng)如何定義”,但后來發(fā)現(xiàn),只有定義,還遠不能說明 DPU能做什么、有什么作用、如何與現(xiàn)有系統(tǒng)更好地協(xié)同。本文將討論DPU發(fā)展中的四個關(guān)鍵問題:DPU是什么?DPU可以標準化嗎?DPU產(chǎn)業(yè)化面臨哪些挑戰(zhàn)?以及是否有“中國方案”?一些問題目前還很難給出確切的答案,但拋磚引玉,希望引起大家的關(guān)注。
前幾天AMD發(fā)布了Q2季度財報,營收大漲70%,旗下的EPYC霄龍及Ryzen銳龍?zhí)幚砥鞴Σ豢蓻],其中EPYC這一波漲勢喜人,而且跟PC下滑不同,接下來EPYC業(yè)務(wù)還會繼續(xù)增長。
Intel公司前幾天發(fā)布了Q2季度財報,營收及盈利表現(xiàn)不佳,現(xiàn)在輪到AMD發(fā)布Q2季度財報,表現(xiàn)卻是完全不一樣的,AMD實現(xiàn)連續(xù)8個季度的增長,季度營收首次突破60億美元,利潤更是翻倍。
這大概是AMD歷史上最突然、最神秘、最折騰的一塊卡了。
前不久,@AMD中國 官微發(fā)布了一條“與蔚來達成合作,旗下EPYC系列處理器賦能蔚來汽車HPC平臺”的視頻,引起關(guān)注,6月8日,蔚來汽車企業(yè)傳播高級總監(jiān)馬麟回應(yīng)表示,蔚來與AMD沒有合作,更沒有授權(quán)AMD開展此傳播。