攜手競(jìng)爭(zhēng)對(duì)手,NVIDIA攜手Intel和Arm發(fā)布FP8標(biāo)準(zhǔn),提升AI運(yùn)算速度和效率
掃描二維碼
隨時(shí)隨地手機(jī)看文章
為了加速 AI 訓(xùn)練、推理的發(fā)展,英偉達(dá)(NVIDIA)、英特爾(Intel)以及 Arm 近日攜手發(fā)布了“FP8 Formats for Deep Learning”白皮書,希望能通過 8 位浮點(diǎn)運(yùn)算的格式來改善運(yùn)算性能,并將其作為 AI 通用的交換格式,提升深度學(xué)習(xí)訓(xùn)練與推理速度。目前該白皮書也已提交給了電氣與電子工程師協(xié)會(huì)(Institute of Electrical and Electronics Engineers, IEEE)。
FP8 格式之所以重要的原因有很多,其中最重要的是,到目前為止,AI 推理之間存在一種分裂,以整數(shù)格式(通常為 INT8,但有時(shí)為 INT4)以低精度完成,與 AI 訓(xùn)練以 FP16、FP32 或 FP64 精度完成,HPC 以 FP32 或 FP64 精度完成。NVIDIA和 Intel 都認(rèn)為 FP8 不僅可以用于推理,在某些情況下還可以用于 AI 訓(xùn)練,從而從根本上提高其加速器的有效吞吐量。
AI芯片企業(yè)Graphcore 也正在推動(dòng) IEEE 采用供應(yīng)商為 AI 設(shè)計(jì)的 FP8 格式作為其他所有人都可以使用的標(biāo)準(zhǔn)。此外,AMD 和高通也支持將FP8格式作為標(biāo)準(zhǔn)格式,以幫助降低云和邊緣的訓(xùn)練和推理成本。”
NVIDIA官方再度公布的最新消息顯示,美國(guó)政府對(duì)NVIDIA繼續(xù)開發(fā)H100集成電路的出口、再出口和國(guó)內(nèi)轉(zhuǎn)讓的許可進(jìn)行了授權(quán)。這也意味著NVIDIA無需將某些業(yè)務(wù)轉(zhuǎn)移到中國(guó)境外。另外該授權(quán)還允許NVIDIA在2023年3月1日前為A100 GPU的美國(guó)客戶提供必要的出口支持(這里應(yīng)該指的是在大陸的美國(guó)客戶);同時(shí),授權(quán)A100和H100在2023年9月1日之前通過NVIDIA的香港公司履行訂單和物流。
雖然,NVIDIA A100/H100系列產(chǎn)品在美國(guó)給出的“緩沖期”之內(nèi)仍然可以通過其香港公司對(duì)中國(guó)大陸的出口,但是“緩沖期”過后,則必須有美國(guó)政府的許可才能出口。因此,一些大陸客戶為了保障供應(yīng),趕在“緩沖期”內(nèi)加大了A100/H100的采購(gòu)量,也并不奇怪。
需要指出的是,從美國(guó)的禁令來看,只要性能小于A100的產(chǎn)品的都是能夠正常對(duì)國(guó)內(nèi)出貨的。那么鑒于國(guó)內(nèi)市場(chǎng)的龐大需求,NVIDIA完全是有能力、也有動(dòng)機(jī)來專門為中國(guó)市場(chǎng)推出一款性能略低于A100的產(chǎn)品,比如搞個(gè)A90來規(guī)避美國(guó)的出口許可機(jī)制,同時(shí)又能滿足國(guó)內(nèi)的需求。預(yù)計(jì)“緩沖期”過后,NVIDIA有可能會(huì)推出相應(yīng)的產(chǎn)品。
盡管NVIDIA的游戲業(yè)務(wù)收入在2022年二季度出現(xiàn)嚴(yán)重下滑,但是在獨(dú)立GPU市場(chǎng)(包括AIB 合作伙伴顯卡), NVIDIA仍保持著79%的份額,穩(wěn)居第一。根據(jù)市場(chǎng)研究機(jī)構(gòu)Jon Peddie Research的最新數(shù)據(jù)顯示,2022年二季度,全球獨(dú)立GPU市場(chǎng)出貨量較去年同期增長(zhǎng) 2.4% 至 1040 萬臺(tái),但是較一季度環(huán)比則下滑了22.6%。NVIDIA在獨(dú)立GPU的顯卡市場(chǎng)出貨量雖然同比增長(zhǎng)了近3%,但是環(huán)比卻下滑了19.1%。而這主要是由于PC出貨量及虛擬幣挖礦需求下滑所引起的。
NVIDIA公司(納斯達(dá)克代碼:NVDA)是全球可編程圖形處理技術(shù)領(lǐng)袖。與ATI(后被AMD收購(gòu))齊名,專注于打造能夠增強(qiáng)個(gè)人和專業(yè)計(jì)算平臺(tái)的人機(jī)交互體驗(yàn)的產(chǎn)品。公司的圖形和通信處理器擁有廣泛的市場(chǎng),已被多種多樣的計(jì)算平臺(tái)采用,包括個(gè)人數(shù)字媒體PC、商用PC、專業(yè)工作站、數(shù)字內(nèi)容創(chuàng)建系統(tǒng)、筆記本電腦、軍用導(dǎo)航系統(tǒng)和視頻游戲控制臺(tái)等。NVIDIA全球雇員數(shù)量超過4000人。全球各地眾多OEM廠商、顯卡制造商、系統(tǒng)制造商、消費(fèi)類電子產(chǎn)品公司都選擇NVIDIA的處理器作為其娛樂和商用解決方案的核心組件。在PC應(yīng)用領(lǐng)域(例如制造、科研、電子商務(wù)、娛樂和教育等),NVIDIA公司獲獎(jiǎng)不斷的圖形處理器可以提供出色的性能和鮮銳的視覺效果。其媒體和通信處理器能夠執(zhí)行寬帶連接和通信應(yīng)用中要求十分苛刻的多媒體處理任務(wù),并在音頻應(yīng)用能力方面取得突破。NVIDIA產(chǎn)品和技術(shù)的基礎(chǔ)是NVIDIA ForceWare,這是一種綜合性軟件套件,能夠?qū)崿F(xiàn)業(yè)內(nèi)領(lǐng)先的圖形、音頻、視頻、通信、存儲(chǔ)和安全功能。NVIDIA ForceWare可以提高采用NVIDIA GeForce圖形芯片和NVIDIA nForce平臺(tái)解決方案的各類臺(tái)式和移動(dòng)PC的工作效率、穩(wěn)定性和功能。