華為AI昇騰910登場(chǎng), 讓摩爾定律起死回生
眾所周知,驅(qū)動(dòng)AI發(fā)展的動(dòng)力有三個(gè)要素:算法、數(shù)據(jù)、算力。其中,算法是否有創(chuàng)新發(fā)展難以量化跟蹤,數(shù)據(jù)的巨大體量也難以計(jì)算,唯有算力可以量化。
9月18日,在2019年全連接大會(huì)上,基于前不久推出的昇騰910 AI處理器,華為推出了AI訓(xùn)練卡Atlas 300、訓(xùn)練AI服務(wù)器的Atlas 800,以及由上千顆昇騰910 AI處理器組成的Atlas 900 AI訓(xùn)練集群。尤其是Atlas 900 AI訓(xùn)練集群,算力驚人。官方數(shù)據(jù)顯示,該集群的總算力相當(dāng)于50萬(wàn)臺(tái)PC。
ResNet-50模型訓(xùn)練被視為全球衡量AI計(jì)算能力的主要標(biāo)準(zhǔn)。華為輪值董事長(zhǎng)胡厚崑告訴《中國(guó)經(jīng)營(yíng)報(bào)》記者,在最典型的ResNet v1.5訓(xùn)練模型中,Atlas 900用59.8秒完成了訓(xùn)練,排名世界第一,讓原來(lái)的世界紀(jì)錄提升了10秒。
“ImageNet-1K數(shù)據(jù)集”包含128萬(wàn)張圖片、精度為75.9%,在同等精度下其他兩家業(yè)界主流廠商的測(cè)試成績(jī)?yōu)?0.2秒和76.8秒,Atlas 900 AI訓(xùn)練集群的成績(jī)比第二名快了15%。
在2018年全連接大會(huì)上,華為首次對(duì)外發(fā)布AI戰(zhàn)略,當(dāng)時(shí)只交付了可用于推理計(jì)算的昇騰310處理器和ModelArts應(yīng)用平臺(tái)。一年之后,華為先是于2019年8月23日推出當(dāng)前全球算力最強(qiáng)的AI處理器昇騰910,接著又在9月18日推出Atlas 900 AI訓(xùn)練集群,從芯片硬核上搭建起了全棧全場(chǎng)景的AI計(jì)算能力。
發(fā)力AI計(jì)算產(chǎn)業(yè)的原因在于,華為預(yù)計(jì),5年之后AI計(jì)算所消耗的算力將占到全社會(huì)算力消耗總量的80%以上,全球計(jì)算產(chǎn)業(yè)將進(jìn)入新的智能時(shí)代。而Gartner的預(yù)測(cè)顯示,到2023年,全球計(jì)算產(chǎn)業(yè)的規(guī)模將超過(guò)2萬(wàn)億美元。
算力稀缺的挑戰(zhàn)
業(yè)界甚至有言論認(rèn)為,AI讓摩爾定律起死回生,就是因?yàn)樗懔Φ膹?qiáng)大作用??梢哉f(shuō),算力是AI發(fā)展的重要基石,因?yàn)橹匾腁I技術(shù)突破依然必須在足夠的算力基礎(chǔ)上才能實(shí)現(xiàn)。
而隨著大數(shù)據(jù)、人工智能等新技術(shù)的應(yīng)用,企業(yè)對(duì)于算力的需求不斷飆升,傳統(tǒng)計(jì)算產(chǎn)業(yè)亟待轉(zhuǎn)型升級(jí)。統(tǒng)計(jì)數(shù)據(jù)顯示,目前全球每年新增數(shù)據(jù)20ZB,AI算力需求每3.5個(gè)月就會(huì)翻一倍;該速度已遠(yuǎn)超摩爾定律關(guān)于性能翻倍的周期。按照摩爾定律,集成電路上可容納的元器件數(shù)目大約每隔18~24個(gè)月便會(huì)增加一倍,性能也將提升一倍。也就是說(shuō),摩爾定律驅(qū)動(dòng)的傳統(tǒng)計(jì)算產(chǎn)業(yè),已不適應(yīng)大數(shù)據(jù)、人工智能的發(fā)展需求。另外,5G、物聯(lián)網(wǎng)、邊緣計(jì)算等新技術(shù)的崛起,也讓算力面臨更加多樣化的現(xiàn)實(shí)需求。
正因?yàn)榇?,盡管如今算法效率不斷提高、芯片技術(shù)高度發(fā)達(dá),但依然面臨著算力稀缺的挑戰(zhàn)。OpenAI近期發(fā)布的研究報(bào)告顯示,2012年至2018年,人們對(duì)于算力的需求平均每年增長(zhǎng)10倍。尤其是進(jìn)入5G時(shí)代,數(shù)據(jù)量將以爆炸式的情形增長(zhǎng),因?yàn)锳I行業(yè)需要對(duì)數(shù)據(jù)進(jìn)行更大規(guī)模的清洗、標(biāo)注、訓(xùn)練。這意味著行業(yè)需要更長(zhǎng)的時(shí)間進(jìn)行運(yùn)算,而算力不夠?qū)?huì)導(dǎo)致AI發(fā)展速度的降低。
這也正是8月23日昇騰910發(fā)布時(shí),華為另一位輪值董事長(zhǎng)徐直軍直言“AI研究遇到的最大困難就是缺少算力——AI本質(zhì)就是暴力計(jì)算”的原因所在。
很多巨頭公司和創(chuàng)業(yè)公司都看上了AI 芯片領(lǐng)域廣闊的市場(chǎng)前景。因?yàn)楦鶕?jù)Gartner的研究,AI芯片在2017年的全球市場(chǎng)規(guī)模為48億美元,2020年預(yù)計(jì)將達(dá)到146億美元,其中云端AI有望占到105億美元。但問(wèn)題在于,就產(chǎn)品而言,目前真正有市場(chǎng)優(yōu)勢(shì)的廠商鳳毛麟角。
強(qiáng)悍的昇騰910
放眼全球AI芯片市場(chǎng),當(dāng)前華為昇騰910的優(yōu)勢(shì)較為明顯,這主要體現(xiàn)在以下幾個(gè)方面:
首先是生產(chǎn)工藝,昇騰910是一顆采用7nm+ EUV工藝技術(shù)的芯片,在工藝制造上屬于當(dāng)前全球最高水平。其次是芯片架構(gòu),昇騰910采用華為“Da Vinci(達(dá)芬奇)”架構(gòu)。這屬于華為自研架構(gòu),也是亮點(diǎn)之一。
再次是開(kāi)源架構(gòu),昇騰910采用MindSpore架構(gòu),按照華為的說(shuō)法,該架構(gòu)將于2020年第一季度開(kāi)源。MindSpore架構(gòu)對(duì)標(biāo)當(dāng)前全球主流AI 框架Tensorflow 、Caffe、Pytorch等,華為并開(kāi)源這一架構(gòu)有助于業(yè)界開(kāi)發(fā)更好的AI應(yīng)用,并促進(jìn)AI生態(tài)的發(fā)展。
最重要的一點(diǎn)在于,昇騰910是當(dāng)前更強(qiáng)的AI芯片。其AI算力水平相當(dāng)50個(gè)當(dāng)前最新最強(qiáng)的CPU。其訓(xùn)練速度也提升了50%~100%。實(shí)測(cè)結(jié)果表明,在算力方面,昇騰910完全達(dá)到其設(shè)計(jì)規(guī)格——即半精度(FP16)算力達(dá)到256Tera-FLOPS,整數(shù)精度(INT8)算力達(dá)到512Tera-OPS。更為重要的是,達(dá)到規(guī)格算力所需功耗僅310W,明顯低于設(shè)計(jì)規(guī)格的350W。
正是基于上述性能指標(biāo),徐直軍才敢在發(fā)布會(huì)上表示:昇騰910的總體技術(shù)表現(xiàn)超出預(yù)期,作為算力最強(qiáng)AI處理器當(dāng)之無(wú)愧。
昇騰910的橫空出世更像是一個(gè)里程碑,作為全球已發(fā)布的單片算力最強(qiáng)的AI處理器,昇騰910恰恰是為AI應(yīng)用而生。而基于昇騰芯片,華為面向人工智能應(yīng)用和智能駕駛也分別推出了Atlas和MDC兩個(gè)系列的產(chǎn)品,以推動(dòng)普惠AI的目標(biāo)落地。
其中,基于昇騰910和去年華為全連接大會(huì)推出的昇騰310,華為已搭建了全棧全場(chǎng)景的產(chǎn)品能力。華為智能計(jì)算業(yè)務(wù)部總裁馬海旭告訴記者,基于昇騰芯片的Atlas 200系列可以?xún)?nèi)嵌在智能機(jī)器人等產(chǎn)品;Atlas 300系列真要用于AI訓(xùn)練;Atlas 500系列用于邊緣計(jì)算的小站;Atlas 800系列是針對(duì)AI服務(wù)器的;Atlas 900系列也是針對(duì)AI訓(xùn)練的。而在搭建超強(qiáng)算力核心競(jìng)爭(zhēng)力的布局中,華為不僅僅有昇騰芯片針對(duì)AI計(jì)算,還有鯤鵬芯片針對(duì)通用計(jì)算,“昇騰+鯤鵬”在底層硬核方面構(gòu)成了華為在整個(gè)計(jì)算產(chǎn)業(yè)的核心能力。
相比較昇騰系列主打AI計(jì)算不同,華為鯤鵬920芯片主打通用計(jì)算,基于鯤鵬處理器打造的TaiShan服務(wù)器,其優(yōu)勢(shì)主要體現(xiàn)在高性能、低功耗上。這樣一來(lái)就可以幫助企業(yè)更好進(jìn)行大數(shù)據(jù)的即時(shí)處理和計(jì)算,從而為未來(lái)走向智能時(shí)代奠定基礎(chǔ)。
基于外界對(duì)華為推進(jìn)AI全棧全場(chǎng)景戰(zhàn)略的預(yù)測(cè),“服務(wù)器操作系統(tǒng)”何時(shí)推出也頗讓人期待。在2019年全連接大會(huì)上,華為宣布將于今年底開(kāi)源服務(wù)器操作系統(tǒng)EulerOS以及單機(jī)版的GaussDB數(shù)據(jù)庫(kù),以“硬件開(kāi)放+軟件開(kāi)源”姿態(tài)為計(jì)算產(chǎn)業(yè)向前發(fā)展注入新的活力。
差異化的市場(chǎng)路徑
徐直軍在介紹昇騰芯片商業(yè)模式時(shí)曾經(jīng)指出,“我們不直接向第三方提供芯片,而是提供基于芯片的硬件和云服務(wù),我們和純芯片廠商沒(méi)有直接競(jìng)爭(zhēng)。”
那么,消費(fèi)者和企業(yè)如何才能用上華為的AI算力?事實(shí)上,全球市場(chǎng)中的各類(lèi)AI芯片,基本上都是以板卡、服務(wù)器或云服務(wù)的方式提供給客戶(hù)和合作伙伴的。華為也是如此。
華為公司智能計(jì)算產(chǎn)品線相關(guān)負(fù)責(zé)人介紹說(shuō):華為昇騰系列AI處理器將搭載于Atlas系列AI產(chǎn)品和云服務(wù)上,并隨之推向市場(chǎng)。
前述Atlas 200、300、500、800、900系列產(chǎn)品都是基于昇騰AI處理器的系列人工智能計(jì)算產(chǎn)品,產(chǎn)品形態(tài)包括AI模塊、加速板卡、邊緣設(shè)備、服務(wù)器等,可分別應(yīng)用于終端、邊緣計(jì)算、云,覆蓋全場(chǎng)景AI需求,讓智能計(jì)算無(wú)所不及。目前,已有大量國(guó)內(nèi)外企業(yè)搭載了華為Atlas系列模塊和板卡,進(jìn)行AI產(chǎn)品的開(kāi)發(fā)。
據(jù)了解,Atlas人工智能計(jì)算平臺(tái)支持業(yè)界主流AI計(jì)算框架,如谷歌的TensorFlow、Facebook的PyTorch/Caffe等,也支持華為最新的AI計(jì)算框架MindSpore。其中,MindSpore框架的特點(diǎn)是可以實(shí)現(xiàn)算法即代碼,大幅降低AI開(kāi)發(fā)門(mén)檻,同時(shí)也具備全場(chǎng)景應(yīng)用優(yōu)勢(shì),其與昇騰910的深度協(xié)同將全面發(fā)揮處理器的算力潛能。
目前全球范圍內(nèi)與昇騰910芯片相近的產(chǎn)品,主要由兩家企業(yè)提供,一家是谷歌,另一家是英偉達(dá)。其中,谷歌只對(duì)外提供云服務(wù),不提供板卡等。
與同樣同時(shí)擁有AI芯片及云服務(wù)的谷歌相比,華為昇騰910的商業(yè)模式也存在差異化優(yōu)勢(shì)。因?yàn)?ldquo;昇騰系列產(chǎn)品包括AI芯片和AI IP,其中Nano、TINY、Lite系列都是IP,既能嵌入華為自身芯片,也能嵌入其他所有需要AI能力的產(chǎn)品”。
基于華為昇騰系列AI芯片,通過(guò)模塊、板卡、小站、一體機(jī)等豐富的產(chǎn)品形態(tài),華為打造了面向“端、邊、云”的全場(chǎng)景AI基礎(chǔ)設(shè)施,可廣泛用于智慧城市、運(yùn)營(yíng)商、金融、互聯(lián)網(wǎng)、電力等領(lǐng)域。
華為發(fā)布的《全球產(chǎn)業(yè)展望GIV 2025》預(yù)測(cè),到2025年,大企業(yè)AI普及率將達(dá)到86%。因此,華為開(kāi)始在計(jì)算領(lǐng)域全面發(fā)力,并致力用芯片、AI和架構(gòu)創(chuàng)新等技術(shù),為客戶(hù)提供強(qiáng)勁算力、云邊協(xié)同、全場(chǎng)景覆蓋、一體化的計(jì)算解決方案。
與純芯片廠商英偉達(dá)相比,華為不獨(dú)立出售芯片,而是出售搭載了自研AI芯片的Atlas系列產(chǎn)品,與之形成差異化競(jìng)爭(zhēng)?;谧匝蠥I芯片,華為不斷擴(kuò)大自己在AI計(jì)算領(lǐng)域的競(jìng)爭(zhēng)優(yōu)勢(shì)。