Google借助計(jì)算引擎A2 VMs在云中推出了首批NVIDIA Ampere A100 GPU
Google宣布基于NVIDIA Ampere A100 Tensor Core GPU在Google Compute Engine上引入了Accelerator-Optimized VM(A2)系列。A2在單個(gè)VM中最多可提供16個(gè)GPU,并且是公共云中第一個(gè)基于A100的產(chǎn)品。
Google設(shè)計(jì)了A2虛擬機(jī)系列,以提高其客戶的培訓(xùn)和推理計(jì)算性能。A2具有基于新NVIDIA Ampere架構(gòu)的NVIDIA A-100 Tensor Core圖形處理單元。根據(jù)博客文章,A-100的計(jì)算性能是上一代GPU的20倍,并配備40 GB的高性能HBM2 GPU內(nèi)存。此外,A2 VM配備多達(dá)96個(gè)Intel Cascade Lake vCPU,可選的本地SSD,用于需要更快地將數(shù)據(jù)饋送到GPU和高達(dá)100 Gbps網(wǎng)絡(luò)的工作負(fù)載。
當(dāng)客戶的工作負(fù)載要求更高時(shí),A2提供帶有16個(gè)A100 GPU的a2-megagpu-16g實(shí)例,其中包括總共640 GB的GPU內(nèi)存,1.3 TB的系統(tǒng)內(nèi)存以及通過(guò)NVSwitch連接的所有組件,最高可提供聚合帶寬為9.6TB / s。
請(qǐng)注意,A2還提供了較小的配置,使客戶可以滿足他們對(duì)GPU計(jì)算能力的需求??蛻艨梢赃x擇五種配置,從一到16個(gè)GPU,具有兩種不同的CPU和網(wǎng)絡(luò)對(duì)GPU的比率-由于Ampere的多實(shí)例組(MIG)功能,每個(gè)GPU最多可劃分為七個(gè)GPU實(shí)例。。
NVIDIA加速計(jì)算部門(mén)總經(jīng)理兼副總裁Ian Buck在最近的公司博客中寫(xiě)道,A-100在GCP上的可用性:
在云數(shù)據(jù)中心中,A100可以支持廣泛的計(jì)算密集型應(yīng)用程序,包括AI培訓(xùn)和推理,數(shù)據(jù)分析,科學(xué)計(jì)算,基因組學(xué),邊緣視頻分析,5G服務(wù)等。
借助A2系列,虛擬機(jī)Google進(jìn)一步擴(kuò)展了預(yù)定義和自定義虛擬機(jī)的產(chǎn)品范圍,從計(jì)算到加速器優(yōu)化的機(jī)器。此外,該公司將繼續(xù)與其他云競(jìng)爭(zhēng)廠商如微軟,該公司最近發(fā)布了新的通用和各種內(nèi)存優(yōu)化VM家庭英特爾芯片組(AVX-512) -和AWS,它最近發(fā)布了基于其EC2 INF1實(shí)例Inferentia籌碼。這些新的VM類(lèi)型中有許多是針對(duì)具有AI和機(jī)器學(xué)習(xí)工作負(fù)載的客戶的。
Constellation Research Inc.首席分析師兼副總裁說(shuō):
云領(lǐng)導(dǎo)力之戰(zhàn)主要是在AI之戰(zhàn)中進(jìn)行的,而這就是使企業(yè)的AI負(fù)載吸引到每個(gè)供應(yīng)商的云中。中間是諸如NVidia之類(lèi)的平臺(tái)供應(yīng)商,它們提供跨云平臺(tái)和內(nèi)部部署選項(xiàng)。因此,隨著Google將最新的Nvidia平臺(tái)引入其Google Cloud,它使CxO可以更輕松地將AI工作負(fù)載跨內(nèi)部和(Google)云遷移。
他還說(shuō):
隨著Google成為排名第三的供應(yīng)商,它必須在吸引負(fù)載方面更加開(kāi)放和更具創(chuàng)造力-這是Google戰(zhàn)略的另一個(gè)例子。相比之下,更大的AWS和Azure戰(zhàn)略仍將轉(zhuǎn)向AI負(fù)載的云專(zhuān)有計(jì)算架構(gòu)。CxO必須意識(shí)到鎖定對(duì)于大多數(shù)技術(shù)供應(yīng)商而言仍然是理想的結(jié)果,并且需要權(quán)衡便利性,速度和鎖定之間的風(fēng)險(xiǎn)。
目前,A2 VM系列處于Alpha狀態(tài),客戶可以通過(guò)注冊(cè)來(lái)請(qǐng)求訪問(wèn)權(quán)限。此外,谷歌表示,公眾可獲得性和價(jià)格信息將在今年晚些時(shí)候發(fā)布。最后,該公司還宣布即將為Nvidia A100提供對(duì)Google Kubernetes Engine,Cloud AI Platform和其他服務(wù)的支持。