巴塞隆納超級運算中心(Barcelona Supercomputing Center;BSC)近年來致力于研發(fā)超級計算機的替代型架構,也以傳統(tǒng)上應用于智能型手機等客戶端裝置的ARM服務器芯片,開發(fā)出原型系統(tǒng)架構。
據The Platform報導,低階CPU-GPU混合式系統(tǒng),可望讓ARM架構取代傳統(tǒng)高效能運算(HPC)的x86架構,甚至導入比x86-GPU效能更為強大的ARM-GPU系統(tǒng)。BSC認為,結合眾多低階CPU與GPU的系統(tǒng),很可能跟運算效能更強的CPU或CPU-GPU混合系統(tǒng)一樣,能處理特定的大型平行運算數據。
BSC旗下白朗峰計劃(Mont-Blanc)可望帶動新一波計算機運算趨勢,廠商可選擇較弱的系統(tǒng)節(jié)點,而不選擇功能性強大的節(jié)點。而這些會視平行運算應用而定,也會受到每節(jié)點的單線程運算效能(single-threaded performance)、內存帶寬(memory bandwidth)、以及網絡帶寬(network bandwidth)影響。
歐洲高速計算聯(lián)盟(Partnership for Advanced Computing in Europe;PRACE)自2011年開始補助相關研究,提供1,450萬歐元的3年計劃補助,接著又追加1,130萬歐元,補助延展至2016年。歐盟執(zhí)委會(European Commission;EC)也提供其中1,610萬歐元補助原型系統(tǒng)開發(fā)項目。
白朗峰計劃于2011年以NVIDIA的Fermi GPU跟Tegra3的ARM處理器做為基礎,推出首個原型,而最終的白朗峰原型,搭載2層BullX B505刀鋒服務器、三星電子(Samsung Electronics)Exynos 5 ARM芯片、4核心Mali-T604 GPU。
白朗峰計劃希望建立一套原型系統(tǒng),在每7MW(百萬瓦)功率電路(power envelope)下可達每秒50千兆次浮點運算(petaflops),而最終目標是于2017年打造出一套可在10MW功率電路下達每秒200千兆次浮點運算效能的ARM-GPU運算節(jié)點系統(tǒng)。
目前,白朗峰最終原型系統(tǒng)將用于測試BSC研發(fā)的OmpSs混合運算環(huán)境。白朗峰計劃與協(xié)力伙伴預計將導入11項應用至原型系統(tǒng),包括電子結構、粒子物理學、蛋白質折迭(protein folding)、波之傳播(wave propagation)等等。
如果價格、效能與散熱表現(xiàn)合理,針對服務器設計的ARM 64-bit處理器可望實現(xiàn)白朗峰目標。不過,目前無人知道PRACE或歐執(zhí)委屆時是否會繼續(xù)投資該計劃,后續(xù)發(fā)展仍待持續(xù)追蹤。