云平臺(tái)而生 英特爾至強(qiáng)E5處理器解析
按照著名的Tick-Tock戰(zhàn)略,英特爾在3月初發(fā)布了至強(qiáng)E5-2600/1600系列處理器。一代的至強(qiáng)E5-2600系列還是沿用了之前單路至強(qiáng)E3所采用的SandyBridge架構(gòu),但是因?yàn)镋5是面向雙路應(yīng)用的產(chǎn)品,所以在命名上叫做“SandyBridge-EP”。作為英特爾的主力產(chǎn)品,至強(qiáng)E5-2600/1600系列處理器的主要方向就是提供更好的云服務(wù)及高性能計(jì)算環(huán)境。下面,我們就從技術(shù)及應(yīng)用的角度介紹一下至強(qiáng)E5處理器作為云計(jì)算平臺(tái)計(jì)算的基礎(chǔ)所具備的種種優(yōu)勢(shì)特性。
四大技術(shù)革新助力云計(jì)算基礎(chǔ)架構(gòu)
對(duì)于云計(jì)算應(yīng)用來(lái)說(shuō),強(qiáng)大的性能是保證有效應(yīng)用的關(guān)鍵。本次英特爾至強(qiáng)E5系列處理器的推出正是大幅度提升了處理器計(jì)算能力,從而實(shí)現(xiàn)了更快的運(yùn)行速度和更大的處理能力。具體說(shuō)來(lái),至強(qiáng)E5系列處理器相比上一代的至強(qiáng)5600系列來(lái)說(shuō)主要有以下4方面的改進(jìn)。
至強(qiáng)E5-2600處理器架構(gòu)介紹
圖中為我們傳達(dá)了4個(gè)重要的信息8核心、QPI 8.0GT/S通道、DDR3高頻內(nèi)存的支持、PCI-E 3.0互聯(lián)互通。下面我們就一一來(lái)解釋這4個(gè)要素。
8核心處理器在上一代的Westmere-EP處理器中,某些高端的型號(hào)采用的是6核心架構(gòu),這也是英特爾在雙路處理器中提供的頂級(jí)核心數(shù)量。當(dāng)然借助于超線程的支持,這個(gè)核心數(shù)量的數(shù)字可以翻一番,但是從物理的角度來(lái)說(shuō)英特爾在E5-2600之前一直是以6核心的產(chǎn)品擔(dān)當(dāng)重任。
如今發(fā)展到了E5-2600系列,處理器的核心增加到了8個(gè)。這個(gè)不僅僅是簡(jiǎn)單的數(shù)量提升,要知道在同樣適用SandyBridge架構(gòu)的E3處理器中,核心數(shù)量只有4個(gè)。更多的物理核心可以提供更好的計(jì)算性能,當(dāng)然對(duì)于時(shí)下流行的虛擬化來(lái)說(shuō),多核心的優(yōu)勢(shì)更為明顯。
第二條QPI通道同樣對(duì)比上一代的Westmere-EP處理器,英特爾自從在Nehalem-EP中增加了QPI 這個(gè)概念之后,對(duì)于性能提升有了極大的飛躍。而這次在E5-2600中,通道的數(shù)量增加到了2條,而且?guī)捯蔡嵘搅?GT/s,之前是6.4GT/s。換句話說(shuō),同樣是基于SandyBridge架構(gòu),雙路的產(chǎn)品比單路產(chǎn)品增加了更多的處理器互通功能,這會(huì)使得兩個(gè)或多個(gè)處理器之前的協(xié)調(diào)更為順暢,言外之意就是性能也會(huì)隨之提升。
DDR3高頻內(nèi)存的支持從Nehalem-EP開(kāi)始,英特爾支持三通道的DDR3內(nèi)存,那時(shí)候的頻率還是 1066MHz。到了Westmere-EP這代,三通道的內(nèi)存支持沒(méi)有變,但是頻率提升到了1333MHz。如今,至強(qiáng)E5-2600這代產(chǎn)品出現(xiàn)了變化。首先是對(duì)于內(nèi)存頻率的支持達(dá)到了1600MHz,這還不是最重要的至強(qiáng)E5-2600系列支持4通道內(nèi)存,最大內(nèi)存插槽數(shù)量也從原來(lái)的18條增加到了24條。從數(shù)量來(lái)說(shuō),3*6和4*6的看起來(lái)是多了不少,但是能夠?qū)崿F(xiàn)的通道組數(shù)量是相同的。當(dāng)然,在這一代的內(nèi)存上也有了明顯的變化,這一點(diǎn)我們隨后會(huì)提到。
PCI-E 3.0互聯(lián)英特爾在至強(qiáng)E5處理器中增加了對(duì)于PCI-E 3.0規(guī)范的支持,但是這一代的主板還僅能提供PCI-E 2.0的接口。在可以預(yù)見(jiàn)的下一代IvyBridge處理器中,英特爾將全面支持PCI-E 3.0規(guī)格。這部分我們?cè)诤竺鏁?huì)有詳細(xì)的解釋?zhuān)@里先給大家留下一個(gè)印象。
剛剛我們看過(guò)了至強(qiáng)E5-2600系列處理器的新改進(jìn),這還遠(yuǎn)遠(yuǎn)不夠。我們需要了解的是E5-2600處理器是如何運(yùn)行的,具體來(lái)說(shuō)就是如何與其他的設(shè)備相溝通。這部分我們來(lái)看看下面的一張圖。
至強(qiáng)E5-2600處理器是如何運(yùn)行的
首先來(lái)解釋一個(gè)名詞Romley。Romley是本次至強(qiáng)E5處理器的平臺(tái)名稱(chēng),是圍繞著至強(qiáng)E5處理器而開(kāi)發(fā)的芯片組、主板以及相關(guān)技術(shù)組成的解決方案平臺(tái)。因此,這里我們就可以看到這個(gè)平臺(tái)在運(yùn)行中的一些特性。
基本上處理器部分包括了我們剛剛介紹的內(nèi)容,我們可以從圖示中清楚的看到處理器所提供的40條PCI-E 3.0通道之外,在第二顆處理器上還有1條PCI-E 2.0的通道(黃色部分),第一顆處理器有粉色部分都與芯片組相連。
另外我們看到了兩個(gè)英特爾一直力推的內(nèi)容,Node Manager節(jié)點(diǎn)管理器和Data Center Manager數(shù)據(jù)中心管理軟件。對(duì)于云應(yīng)用來(lái)說(shuō),在數(shù)據(jù)中心中管理成千上萬(wàn)臺(tái)服務(wù)器可不是那么容易的事情。這兩款軟件可以幫助系統(tǒng)維護(hù)人員盡可能降低維護(hù)難度,節(jié)省維護(hù)成本和時(shí)間。
剛剛我們看到的還是以處理器為主,包括如何與外部互通的內(nèi)容。那么處理器內(nèi)部是如何通信的呢?這里我們就不得不提及它的核內(nèi)與核外架構(gòu)。
至強(qiáng)E5-2600處理器核內(nèi)與核外架構(gòu)
這里我們又看到了“圓環(huán)套圓環(huán)”的設(shè)計(jì),也就是從SandyBridge開(kāi)始的環(huán)形總線。與至強(qiáng)E3所提供的類(lèi)似,這次的環(huán)形總線還是分為內(nèi)外兩條,在核心數(shù)量上增加到了8個(gè)。圖中剪刀的部分就是至強(qiáng)E5相比E3來(lái)說(shuō)增加的4個(gè)核心。
和E3處理器類(lèi)似,Ring Bus環(huán)形總線更能夠較好的展示出Sandy Bridge的真實(shí)性能。通過(guò)上圖大家可以看到,Ring Bus環(huán)形總線連接各個(gè)CPU核心、LLC緩存(L3緩存)、融合進(jìn)去的GPU以及System Agent(系統(tǒng)北橋)等部分。[!--empirenews.page--]
Ring Bus環(huán)形總線由四條獨(dú)立的環(huán)組成,分別是數(shù)據(jù)環(huán)Data Ring、請(qǐng)求環(huán)Request Ring、響應(yīng)環(huán)Acknowledge Ring和偵聽(tīng)環(huán)Snoop Ring。借助于環(huán)形總線,CPU與GPU可以共享LLC緩存,將大幅度提升GPU性能。
在這個(gè)環(huán)形總線上,分布著多個(gè)Ring Stop,也就是俗稱(chēng)的“站臺(tái)”。這個(gè)“站臺(tái)”在每個(gè)CPU/LLC塊上具有兩個(gè)連接點(diǎn)。環(huán)形總線的存在,可以大大減少核心訪問(wèn)三級(jí)緩存的周期。在以往的產(chǎn)品中,多個(gè)核心共享一個(gè)三級(jí)緩存,需要訪問(wèn)的話必須先經(jīng)過(guò)流水線發(fā)送請(qǐng)求,在進(jìn)行優(yōu)先級(jí)排序之后才能進(jìn)行。新的環(huán)形總線將三級(jí)緩存分割成了若干部分,借助于每個(gè)站臺(tái),核心可以快速的訪問(wèn)LLC。
在至強(qiáng)E5中,還沿用了SandyBridge架構(gòu)的256位指令集。這部分其實(shí)在單路至強(qiáng)E3中就已經(jīng)談過(guò),相比原來(lái)的128位指令集來(lái)說(shuō),256位指令集在性能上更為出色。有關(guān)這部分的內(nèi)容我們可以看看E3處理器中是如何介紹的。
256bit指令集,讓好事變得更好
Sandy Bridge的AVX將向量化寬度擴(kuò)展到了256位,原有的16個(gè)128位XMM寄存器擴(kuò)充為256位的YMM寄存器,可以同時(shí)處理8個(gè)單精度浮點(diǎn)數(shù)和4 個(gè)雙精度浮點(diǎn)數(shù)。換句話說(shuō),Sandy Bridge的浮點(diǎn)吞吐能力可以達(dá)到前代的兩倍。不過(guò)現(xiàn)在,AVX的256位向量還僅僅能夠支持浮點(diǎn)運(yùn)算。不過(guò)AVX的特別之處在于,它可以應(yīng)用128位的SIMD整數(shù)和SIMD浮點(diǎn)路徑。
AVX指令集是和Sandy Bridge微架構(gòu)緊密結(jié)合的,因此,微架構(gòu)的浮點(diǎn)寄存器也要從128位擴(kuò)展到256位,此外,Load單元也要適應(yīng)一次載入256位的能力,Sandy Bridge沒(méi)有直接擴(kuò)展原有Load單元的位寬,而是通過(guò)增加了一個(gè)Load單元來(lái)達(dá)到256bit Load的能力。
在進(jìn)行新性能擴(kuò)展的同時(shí),AVX指令集的出現(xiàn)對(duì)于原有的X86指令集也進(jìn)行了優(yōu)化與重新組合這主要源于AVX指令集新的操作碼編碼方式。AVX指令集的編碼方式叫做VEX(Vector Extension),其主要用途是縮短指令長(zhǎng)度,降低無(wú)謂的代碼冗余,并且也降低了對(duì)解碼器的壓力,實(shí)現(xiàn)的方式也很特別壓縮各式各樣的Prefix 前綴,集中到一個(gè)比較固定的字段中,從而達(dá)到了精簡(jiǎn)指令集的目的。
剛剛我們?cè)诮榻BE5-2600的時(shí)候,曾經(jīng)提到過(guò)它的2個(gè)重大改進(jìn),就是雙QPI通道和PCI-E 3.0支持。下面,我們就來(lái)詳細(xì)介紹一下這兩部分內(nèi)容是怎么回事兒。
雙QPI通道示意圖
這里我們看到的是兩個(gè)QPI管理模塊。通過(guò)這兩個(gè)模塊,我們可以看到數(shù)據(jù)實(shí)現(xiàn)了同時(shí)互通,QPI具備了20條通道,同時(shí)可以動(dòng)態(tài)分配10條通道。QPI通過(guò)環(huán)形總線與外界互通,達(dá)到了傳輸指令和數(shù)據(jù)的目的。
PCI-E 3.0示意圖
我們可以看到,處理器的核外結(jié)構(gòu)部分提供了PCI-E 3.0的功能,而相比上一代的PCI-E 2.0來(lái)說(shuō),它可以實(shí)現(xiàn)帶寬數(shù)量的雙倍提升,從4GT/s提升到8GT/s。更重要的是,這些通道之間可以隨意組合,我們看到在PCI-E 3.0提供的40個(gè)通道中,每16個(gè)通道可以實(shí)現(xiàn)2個(gè)X8或者4個(gè)X4功能,這樣對(duì)于有效分配帶寬非常有幫助,因?yàn)椴⒎撬械脑O(shè)備都需要X16通道才能支持。
由此看來(lái),PCI-E 3.0提供了一種靈活的模式,大大增加了帶寬的利用率。這就使得所有的PCI-E設(shè)備都可以實(shí)現(xiàn)高速互聯(lián),同時(shí)也讓之前難以普及的PCI-E外界設(shè)備得到了更大的發(fā)展空間(比如PCI-E SSD固態(tài)硬盤(pán))。我們?cè)谶@里也看到了PCI-E 2.0的身影,作為低速通道,它更大的作用是實(shí)現(xiàn)一種補(bǔ)充,而且也只有X4一種規(guī)格。
俗話說(shuō)好馬配好鞍,剛剛我們介紹了許多處理器相關(guān)的內(nèi)容,現(xiàn)在我們將視角轉(zhuǎn)移到芯片組上來(lái),看看SandyBridge-EP的芯片組有哪些變化。這次至強(qiáng)E5-2600搭載的芯片組名稱(chēng)為C600。
英特爾C600芯片組示意圖
我們來(lái)看看C600芯片組的支持設(shè)備圖。首先我們發(fā)現(xiàn),它通過(guò)PCI-E 2.0與處理器相連,其次就是我們看到了PCI-E 2.0的字樣,同樣這也是作為PCI-E 3.0的補(bǔ)充而存在的。
除了上面介紹的2內(nèi)容之外,還有一個(gè)內(nèi)容也是要注意的。在磁盤(pán)方面,C600芯片組提供了SATA接口下3Gbps和6Gbps兩種磁盤(pán)的支持,但是板載的SAS接口卻只能支持到最大8個(gè)3Gbps接口。如今許多SAS磁盤(pán)都是基于6Gbps接口的,也就是說(shuō)用戶(hù)需要使用額外的陣列卡才行。
雖然沒(méi)有提供SAS 6Gbps的支持,但是本次發(fā)布的E5-2600系列在I/O方面也有獨(dú)到之處。它有一個(gè)名為Data Direct I/O的特色技術(shù)(以下簡(jiǎn)稱(chēng)為DDIO),這項(xiàng)技術(shù)可以幫助處理器更快速、更智能的選擇最短路線來(lái)讀寫(xiě)數(shù)據(jù),從而提升I/O性能。[!--empirenews.page--]
通過(guò)進(jìn)出兩個(gè)方向的對(duì)比,我們驚奇的發(fā)現(xiàn)如今數(shù)據(jù)的讀寫(xiě)已經(jīng)不需要像以前那樣經(jīng)過(guò)內(nèi)存才能完成。從LLC可以直接傳輸?shù)胶诵闹?,這樣就節(jié)省了繁瑣的操作步驟,提供了更短的相應(yīng)時(shí)間。之前需要4-5步的操作如今可以簡(jiǎn)化到3步完成,流水線少了一環(huán),自然也更加快捷。
如今節(jié)能是大家都在談?wù)摰脑掝},而且數(shù)據(jù)中心應(yīng)用的能耗是巨大的,因此在這一代的至強(qiáng)E5-2600系列中特別談到了如何節(jié)能的問(wèn)題。我們先來(lái)看看英特爾有什么兼顧性能和節(jié)能的解決辦法。
動(dòng)態(tài)調(diào)整性能
在E5-2600系列中,英特爾提出了一個(gè)觀點(diǎn),就是如何使得兼顧性能的同時(shí)保證節(jié)能。這里有一個(gè)動(dòng)態(tài)開(kāi)關(guān)的概念。我們看到圖中的3條線,綠色代表了最佳性能、藍(lán)色代表了均衡性能(提供動(dòng)態(tài)開(kāi)關(guān)),而黃色代表了均衡性能(不提供動(dòng)態(tài)開(kāi)關(guān))。
在開(kāi)啟了動(dòng)態(tài)開(kāi)關(guān)之后,我們會(huì)發(fā)現(xiàn)之前處于下風(fēng)的均衡性能會(huì)有一個(gè)明顯的提升,其吞吐量最終與最佳性能重合了。也就是說(shuō)動(dòng)態(tài)開(kāi)關(guān)可以保證服務(wù)器即便在非最高性能運(yùn)行的情況下,還可以實(shí)現(xiàn)高可用性,這在之前是沒(méi)有的,也是一個(gè)新的突破。
LR內(nèi)存運(yùn)行示意圖
另外一個(gè)是又第三方內(nèi)存廠商提供的。如今在強(qiáng)調(diào)虛擬化的同時(shí),用戶(hù)也在不斷增加內(nèi)存,這勢(shì)必對(duì)服務(wù)器來(lái)說(shuō)也是不小的能耗負(fù)擔(dān)。LR內(nèi)存的出現(xiàn)就是為了解決這一問(wèn)題,它本身是低能耗的內(nèi)存,而且相比傳統(tǒng)的R-ECC內(nèi)存來(lái)說(shuō)我們可以明顯的看到它通過(guò)一個(gè)緩存芯片實(shí)現(xiàn)了更快速的數(shù)據(jù)讀寫(xiě)方式,這也是它性能提升的原因所在。
結(jié)合高速計(jì)算與更低能耗,至強(qiáng)E5-2600/1600系列處理器提供了硬件與軟件多方面的改進(jìn)。硬件上更快速的 SandyBridge核心幫助服務(wù)器實(shí)現(xiàn)更大的性能,而動(dòng)態(tài)開(kāi)關(guān)和低功耗內(nèi)存的支持幫助服務(wù)器可以實(shí)現(xiàn)更低的功耗。而在數(shù)據(jù)中心層面,英特爾節(jié)點(diǎn)管理器和數(shù)據(jù)中心管理器都可以幫助云應(yīng)用實(shí)現(xiàn)更高效和更節(jié)能??偨Y(jié)我們談到的至強(qiáng)E5系列處理器諸多特點(diǎn),我們發(fā)現(xiàn)它實(shí)現(xiàn)了更高的性能和更低的功耗,作為新一代的產(chǎn)品來(lái)說(shuō)實(shí)現(xiàn)了真正實(shí)現(xiàn)了對(duì)于上一代的替代,為當(dāng)今數(shù)據(jù)中心及云應(yīng)用環(huán)境提供了平臺(tái)基礎(chǔ)。