美國想憑Summit奪回超級計(jì)算機(jī)霸主地位
美國謀求重新奪回超級計(jì)算機(jī)霸主地位;
IBM終于開始出貨其獨(dú)具風(fēng)格的Power9處理器;
英偉達(dá)的Volta GPU將成為Summit和Sierra的主力計(jì)算單元。
美國欲憑借Summit超級計(jì)算機(jī)重回世界之巔
計(jì)算機(jī)領(lǐng)域的軍備競賽對國際關(guān)系和地緣政治的影響和其它任何常規(guī)軍備競賽一樣重要。這是一場關(guān)于打造出全球最快的超級計(jì)算機(jī)的競賽。擁有最快的超級計(jì)算機(jī)不僅僅關(guān)乎民族自豪感,它還具備貨真價實(shí)的經(jīng)濟(jì)、政治和軍事利益。超級計(jì)算機(jī)有諸多用武之地,不僅可以用于大范圍地區(qū)的天氣預(yù)報,還可以用于核武器的建模和設(shè)計(jì)。
目前,世界上最快的超級計(jì)算機(jī)是中國的神威·太湖之光,其運(yùn)算能力能夠達(dá)到驚人的93 PetaFLOPS,即每秒執(zhí)行93×10 ^ 15次浮點(diǎn)運(yùn)算。 2018年,美國計(jì)劃在田納西州的橡樹嶺國家實(shí)驗(yàn)室(ORNL)打造出超過神威·太湖之光的超級計(jì)算機(jī)。這臺名為Summit的超級計(jì)算機(jī)的運(yùn)算能力將達(dá)到200 PetaFLOPS,同時,加利福尼亞州的勞倫斯利弗莫爾國家實(shí)驗(yàn)室也正在建造一個設(shè)計(jì)上與Summit類似的姊妹計(jì)算機(jī)Sierra。
Summit由大約4600個“節(jié)點(diǎn)”組成,這些節(jié)點(diǎn)基本上都是機(jī)架式服務(wù)器。雖然Summit的計(jì)算能力將比其前任強(qiáng)大5-10倍,但它的節(jié)點(diǎn)只有前任的1/4,而且耗電量也大大降低。
這臺超級計(jì)算機(jī)這么強(qiáng)悍,靠的是這些節(jié)點(diǎn)的特殊內(nèi)在。每個節(jié)點(diǎn)都包含一個由IBM設(shè)計(jì)的專用HPC(高性能計(jì)算)服務(wù)器。 該節(jié)點(diǎn)包含兩個IBM Power9處理器、六個英偉達(dá)的Tesla V100 SXM2 GPU加速器,而且整個盒子采用水冷設(shè)計(jì),如文章頂部的硬件照片所示。該硬件最近曾在全球超算大會SC17上展出過。
IBM系統(tǒng)的獨(dú)特之處在于,每個Power9處理器都通過英偉達(dá)專有的高速NVLink數(shù)字接口直接與英偉達(dá)的GPU通信。 這種內(nèi)置功能是Power9獨(dú)有的,可通過NVLink 2.0實(shí)現(xiàn)100 GB/秒的吞吐能力。
在實(shí)際工作中,由這些Power9處理器協(xié)調(diào)每個節(jié)點(diǎn)的計(jì)算流程,Tesla V100則負(fù)責(zé)繁重的計(jì)算工作。IBM將NVLink 2接口集成到芯片上這個設(shè)計(jì)決策表明它深諳高性能計(jì)算的發(fā)展方向。IBM并沒有抗拒越來越流行使用GPU進(jìn)行計(jì)算的趨勢,而是明智地選擇了它。
IBM終于開始出貨其獨(dú)具一格的Power9處理器
每顆Power9處理器本身就是一臺功能強(qiáng)大的計(jì)算機(jī),最多可包含24個處理器內(nèi)核,每個內(nèi)核可以并行執(zhí)行四個線程,Power9支持96個線程的并行計(jì)算。此外,每顆Power9還支持48路PCIE 4.0通道和8個內(nèi)存通道。
IBM的Power處理器系列基于PowerPC RISC架構(gòu),曾經(jīng)用在蘋果的Mac電腦上,當(dāng)蘋果公司改用英特爾的x86處理器后,IBM將重點(diǎn)放在了服務(wù)器市場上。
客戶早就對Power9望眼欲穿,IBM去年發(fā)布了這顆芯片,人們普遍預(yù)計(jì)IBM將在2017年年底出貨這顆芯片。根據(jù)目前得到的消息,Power9已經(jīng)應(yīng)用在Sierra和Summit上,但是IBM并沒有公布Power9全面供貨的信息,現(xiàn)在業(yè)界認(rèn)為該芯片可能于2018年初上市銷售。
Power9是一個龐大無比的芯片,這可能是它遲遲沒有面世的原因。 Power9現(xiàn)在采用格羅方德的14納米制程制造。它可能是格羅方德試圖在其14納米節(jié)點(diǎn)工藝上制造的最大的芯片,所以,如果產(chǎn)能和良率達(dá)不到IBM的預(yù)期,我一點(diǎn)都不會感到驚訝。同樣影響產(chǎn)能和良率的一個因素是,Power9是一顆龐大而且復(fù)雜的高性能芯片。
英偉達(dá)Volta GPU將成為Summit和Sierra的主力計(jì)算單元
Summit和Sierra都將使用相似的搭載雙Power9處理器的IBM HPC計(jì)算機(jī),它們兩個的主要區(qū)別在于Sierra每個節(jié)點(diǎn)只有四個Tesla V100 GPU,而Summit每個節(jié)點(diǎn)包含六個Tesla V100 SXM2 GPU。雖然GPU數(shù)量更少,但是這種設(shè)計(jì)方式可以實(shí)現(xiàn)CPU和GPU之間150 GB/秒的NVLink 2通信速度,從而提高吞吐能力。
Tesla V100中的每個GV100 GPU都比Power9更加龐大,正是因?yàn)槊總€V100都需要消耗300瓦的功率,才使用了昂貴的水冷解決方案。據(jù)預(yù)計(jì),整個Summit的的功耗為13兆瓦,而擁有4000-5000個節(jié)點(diǎn)的Sierra的功耗為11兆瓦。就所有實(shí)際應(yīng)用而言,Summit和Sierra的計(jì)算能力大小主要取決于Tesla V100 GPU的能力限制。
從美國這兩款超級計(jì)算機(jī)可以一窺英偉達(dá)V100 GPU的市場機(jī)會。這兩個系統(tǒng)將使用超過45,000個V100 GPU,美國能源部的一位客戶表示,每顆V100 GPU的價格在8000美元左右,這兩臺超級計(jì)算機(jī)為Tesla V100貢獻(xiàn)的銷售額就超過了3.6億美元。
IBM和英偉達(dá)很可能會成為全球超級計(jì)算領(lǐng)域的強(qiáng)勢存在,并持續(xù)受益于永無休止的打造更快超級計(jì)算機(jī)的軍備競賽。