為何如此能超頻?解讀推土機(jī)CPU背后設(shè)計(jì)實(shí)力
在2011年10月中旬,AMD發(fā)布了旗艦級(jí)CPU產(chǎn)品推土機(jī)(Bulldozer)FX系列處理器,除了用戶(hù)關(guān)心的絕對(duì)性能之外,推土機(jī)FX系列處理器強(qiáng)大的超頻能力一直是業(yè)界關(guān)注的焦點(diǎn)。推土機(jī)CPU為什么擁有如此強(qiáng)大的超頻能力?為什么AMD需要讓這款產(chǎn)品成為新一代的超頻明星?在CPU超頻世界紀(jì)錄頻頻被推土機(jī)CPU打破之時(shí),我們也開(kāi)始尋找一些隱藏在這顆CPU設(shè)計(jì)過(guò)程中的蛛絲馬跡。
推土機(jī)FX處理器將采用"Bulldozer"微架構(gòu),全系列包含8核、6核以及4核處理器,其超強(qiáng)的可超頻能力,全系列處理器均不鎖頻和豐富的指令集支持。推土機(jī)系列人氣最高的莫過(guò)于FX-8150處理器,其8核處理器將成為目前業(yè)界唯一的面向臺(tái)式機(jī)的8核心處理器。
推土機(jī)FX處理器擁有強(qiáng)勁的超頻能力
推土機(jī)(Bulldozer)是AMD全新微處理器架構(gòu)。"推土機(jī)"將采用32nm SOI工藝,采用了"模塊化(Module)"的設(shè)計(jì),每個(gè)"模塊"包含兩個(gè)處理器核心。每個(gè)Bulldozer Module將會(huì)集成2M L2緩存, 8MB的L3緩存,核心面積為30.9平方毫米。
推土機(jī)FX系列處理器的超頻能力讓每一個(gè)AMD用戶(hù)非常自豪,早在2011年AMD就已經(jīng)對(duì)外宣稱(chēng)其推土機(jī)FX系列處理器產(chǎn)品在制冷足夠的情況下將"有著令人驚喜甚至不可思議的表現(xiàn)"。事實(shí)也證明了這一點(diǎn),熟悉或者關(guān)注DIY超頻領(lǐng)域的用戶(hù)應(yīng)該,早在兩年之前CPU主頻的世界紀(jì)錄就突破了8GHz的大關(guān),去年這個(gè)世界紀(jì)錄的具體數(shù)字是8.308GHz,而現(xiàn)在,AMD的FX-8150已經(jīng)將記錄再一次改寫(xiě)并得到了吉尼斯世界紀(jì)錄組織的認(rèn)證,近期的CPU主頻世界紀(jì)錄是由AMD的FX-8150在2011年8月31日創(chuàng)造的8.429GHz。
推土機(jī)FX處理器正在創(chuàng)造更多超頻奇跡
就在去年底,這一超頻紀(jì)錄再次被推土機(jī)系列CPU自己刷新。上圖為臺(tái)灣著名超頻玩家Andre Yang現(xiàn)在又取得了8461.51MHz的更好成績(jī)。和AMD官方的做法類(lèi)似,Andre Yang也使用了頂級(jí)型號(hào)FX-8150,同樣屏蔽成了單模塊雙核心。根據(jù)CPU-Z認(rèn)證頁(yè)面的信息,這顆處理器的外頻超到了272.95MHz,倍頻為31x,核心電壓已經(jīng)加至1.992V,幾乎突破了2V,而主板是推土機(jī)御用的華碩玩家國(guó)度Crosshair V Formula,內(nèi)存使用海盜船的一條2GB DDR3,頻率909.8MHz,時(shí)序9-9-9-24。
更長(zhǎng)流水線帶來(lái)更大頻率潛能
從架構(gòu)來(lái)看,推土機(jī)是一款使用了全新架構(gòu)的CPU,同時(shí)AMD歷經(jīng)長(zhǎng)時(shí)間大規(guī)模重新開(kāi)發(fā)讓推土機(jī)和以前的所有CPU有極大的區(qū)別--推土機(jī)每一個(gè)整數(shù)單元有兩個(gè)浮點(diǎn)單元包圍,我們可以理解它是一顆自然的超線程處理器。作為AMD耗盡心血研發(fā)的新一代CPU,Bulldozer堪稱(chēng)K8之后的最大革新(K10架構(gòu)只能算K8的增強(qiáng)版,架構(gòu)變化并不多),它改變了傳統(tǒng)CPU的設(shè)計(jì)思路,將CPU模塊化,每個(gè)模塊又可細(xì)分為兩個(gè)微內(nèi)核,這兩個(gè)微內(nèi)核相互獨(dú)立而又高度共享浮點(diǎn)單元、L2緩存等功能單元。
推土機(jī)架構(gòu)CPU每個(gè)內(nèi)核自帶雙整數(shù)單元
得益于對(duì)CPU內(nèi)核的徹底重新設(shè)計(jì),AMD開(kāi)始大手筆改變推土機(jī)CPU的流水線,AMD從K8架構(gòu)也就是Athlon 64處理器開(kāi)始將流水線提升到12級(jí),這在當(dāng)時(shí)是一個(gè)較為平衡的設(shè)計(jì),它遠(yuǎn)低于Intel為了沖擊頻率高峰而達(dá)到的32級(jí);其后Phenom II X4處理器為了提升頻率將流水線提升到14級(jí),而到了推土機(jī)Bulldozer FX系列處理器,流水線通過(guò)添加堆棧、寄存器等訪問(wèn)過(guò)程達(dá)到了18級(jí)。
CPU的流水線可以被比喻為"樓梯",不管采用幾級(jí)流水線,一個(gè)周期內(nèi)所達(dá)到的高度都是一個(gè)樓層的高度。也就是說(shuō)樓梯采用的階數(shù)越多,坡度越小,同時(shí)路程也越長(zhǎng);這樣對(duì)于構(gòu)架一定的情況下,樓梯的階數(shù)必然有一個(gè)最佳值,流水線太長(zhǎng)會(huì)導(dǎo)致分支預(yù)測(cè)失敗后流水線重新載入代價(jià)太大,但是流水線太短又會(huì)導(dǎo)致CPU難以提升到理想運(yùn)行頻率。
流水線對(duì)于頻率提升至關(guān)重要
眾所周知,Pentium 4正是在流水管線上的加長(zhǎng)設(shè)計(jì),使之能夠達(dá)到如此之高的主頻,雖說(shuō)流水管線的加長(zhǎng)會(huì)導(dǎo)致數(shù)據(jù)在管線逗留的時(shí)間增長(zhǎng),導(dǎo)致數(shù)據(jù)出錯(cuò)的可能增加,一旦一個(gè)數(shù)據(jù)出錯(cuò),其結(jié)果就在于整個(gè)運(yùn)算步驟都將重新來(lái)過(guò),這樣就會(huì)造成處理器處理性能的降低。但依靠高效的分支預(yù)測(cè)體系和Cache機(jī)制就可以改善這一點(diǎn)。AMD經(jīng)過(guò)多年探索,認(rèn)為在多核心之路上仍然不能放棄單核性能,更不能因?yàn)樘嵘l率而放棄效率,所以最終將推土機(jī)Bulldozer FX系列CPU流水線確定在18級(jí),保證了頻率和效率的平衡。
[!--empirenews.page--]
所有推土機(jī)FX系列處理器都支持Turbo Core自動(dòng)超頻技術(shù)
所以最終產(chǎn)品推土機(jī)CPU的頻率也是非常值得欣喜的,我們可以看到推土機(jī)CPU依靠較長(zhǎng)的流水線工位推升了運(yùn)行頻率達(dá)到穩(wěn)定運(yùn)行3-5GHz。AMD首批發(fā)布的四款CPU型號(hào)分別為FX-4100、FX-6100、FX-8150和FX-8120,全部都采用了不鎖倍頻設(shè)計(jì)。
推土機(jī)CPU在頻率方面的努力還遠(yuǎn)不止默認(rèn)頻率的提升,通過(guò)Turbo Core技術(shù),用戶(hù)能夠在日常工作中獲得更高的CPU核心運(yùn)行頻率。我們用簡(jiǎn)單的總結(jié)可以將Turbo Core技術(shù)的原理闡述清楚:利用P-State電源管理狀態(tài)切換。我們可以通過(guò)FX系列處理器的規(guī)格表格來(lái)了解一下全系列推土機(jī)FX處理器的Turbo Core情況。
32nm工藝助力提升極限頻率
與Intel相比,AMD在32nm方面的技術(shù)同樣是非常完美的。AMD全球晶圓代工廠Global Foundries在90nm時(shí)代就和IBM展開(kāi)了深入的合作。在今年初,GlobalFoundries與IBM再次達(dá)成了協(xié)議,利用現(xiàn)有資源和工廠共同生產(chǎn)32nm處理器。面對(duì)來(lái)勢(shì)洶洶的Intel,IBM和GlobalFoundries終于攜起手來(lái),從技術(shù)和產(chǎn)能兩個(gè)方面為AMD的APU和推土機(jī)處理器提供全方位支持。
GlobalFoundries生產(chǎn)的AMD 32nm工藝晶圓
制造工藝的改進(jìn)理論上可以帶來(lái)功耗的降低,使得產(chǎn)品的默認(rèn)時(shí)鐘頻率可以更高,直接提升性能。相對(duì)于45nm工藝,AMD所使用的32nm工藝的NMOS和PMOS晶體管漏電量大幅度很多,如果芯片晶體管數(shù)量相同,32nm工藝同比封裝尺寸僅是45nm工藝產(chǎn)品的70%。由于上述改進(jìn),電路的尺寸和性能均可得到顯著優(yōu)化。這種晶體管可以承受最高的驅(qū)動(dòng)電流,并可以提升極限開(kāi)關(guān)速度,配合應(yīng)變硅SOI技術(shù)有效降低發(fā)熱。
新的推土機(jī)FX系列處理器采用的是最新的32納米制造工藝,在此之前的Llano APU其實(shí)也同樣采用了相同的工藝技術(shù)。讓我們換位思考一下,如果不采用32納米技術(shù),那么我們將看到極高的功耗和無(wú)法控制的芯片面積,所以32納米就成為必然。
推土機(jī)使用了先進(jìn)的32nm工藝
推土機(jī)采用GlobalFoundries的32nm新工藝(之前還一直維持在45nm), 除了SOI(Silicon On Insulator,絕緣硅)技術(shù)外,HKMG(高K金屬門(mén))工藝也被首次采用。使用HKMG工藝的好處是可以減少柵極的漏電量,降低柵極電容,這也是繼續(xù)提高制程的關(guān)鍵技術(shù)之一。除此之外,11個(gè)銅金屬層和低K電介質(zhì)、基于硅鍺的拉伸硅、第二代沉浸式光刻等技術(shù)也悉數(shù)在列,目的就是為了進(jìn)而使得晶體管的尺寸進(jìn)一步縮小,減小核心面積,降低整體功耗,提升頻率潛力。
不鎖倍頻享受更輕松超頻過(guò)程
傳統(tǒng)的CPU為了限制用戶(hù)自主超頻,在倍頻方面幾乎是無(wú)法調(diào)整的,即便擁有調(diào)整余地也只能向下設(shè)置以獲得更低功耗。AMD自從Athlon X2黑盒時(shí)代打破這一格局,推出了可以向上調(diào)節(jié)倍頻的CPU,以便為用戶(hù)提供更強(qiáng)的超頻潛力,同時(shí)更小幅度影響到周邊硬件設(shè)備,在工藝成熟的背景下提供這種增值服務(wù),也讓我們看到了AMD對(duì)自家CPU產(chǎn)品的質(zhì)量信心十足。
超頻玩家通過(guò)液氮助力推土機(jī)達(dá)到8.335GHz高頻
我們知道CPU總頻率=外頻X倍頻,由于CPU的外頻調(diào)節(jié)經(jīng)常伴隨著內(nèi)存頻率、北橋總線、PCI-E頻率等一系列頻率發(fā)生變化,所以大部分被鎖定倍頻的CPU在超頻過(guò)程中會(huì)影響到內(nèi)存、顯卡、硬盤(pán)等硬件的穩(wěn)定工作,超頻幅度被限制。下圖中我們看到的是某款990FX系列主板BIOS設(shè)置界面,第一項(xiàng)CPU Clock Ratio就是倍頻調(diào)節(jié)選項(xiàng),直接在這里設(shè)置比率,就可以在外頻不變的情況下獲取更高的核心頻率。
推土機(jī)搭配990FX主板擁有豐富的超頻選項(xiàng)
由于取消了倍頻調(diào)整的限制,推土機(jī)CPU超頻更加輕松,在超頻過(guò)程中對(duì)內(nèi)存、PCI-E頻率的影響更小。推土機(jī)FX-8150的超頻選項(xiàng)和以往的羿龍II沒(méi)有什么區(qū)別,在990FX主板上能夠調(diào)節(jié)的選項(xiàng)主要有倍頻、外頻、CPB倍頻、內(nèi)存頻率等,相對(duì)基本上沒(méi)有什么改變,用戶(hù)可以通過(guò)修改倍頻為主要方式進(jìn)行超頻。
風(fēng)冷超頻到4.5GHz的推土機(jī)FX-8150
電壓選項(xiàng)方面,目前市面上的高端990FX主板提供CPU PLL電壓、內(nèi)存電壓、CPU NB電壓和CPU電壓等多種選項(xiàng),調(diào)節(jié)步進(jìn)精細(xì),調(diào)節(jié)范圍也比較足,我們通過(guò)提升PLL電壓和CPU電壓來(lái)配合超頻。上圖中我們看到推土機(jī)FX-8150最終在1.31V電壓下穩(wěn)定超頻到4.5G的水平,超頻幅度達(dá)25%,可以通過(guò)AIDA64的3分鐘穩(wěn)定性測(cè)試,此時(shí)國(guó)際象棋成績(jī)?yōu)?3759,相比默認(rèn)頻率成績(jī)提升約17.3%。[!--empirenews.page--]
在32nm工藝的全方位配合下,通過(guò)改變CPU邏輯架構(gòu),加上完全不鎖倍頻的設(shè)計(jì),AMD為高端DIY玩家?guī)?lái)了一款超頻潛能極強(qiáng)的CPU。從目前的媒體與用戶(hù)測(cè)試情況來(lái)看,推土機(jī)CPU的體制不同,極限頻率也不同,推土機(jī)架構(gòu)普遍超頻能力比較強(qiáng),風(fēng)冷可以穩(wěn)定達(dá)到4.5GHz左右,而配合AMD官方水冷可以穩(wěn)定達(dá)到4.9GHz以上。按照關(guān)節(jié)能、調(diào)外頻、倍頻、升CPU電壓、主板相關(guān)供電設(shè)置的順序調(diào)節(jié)可以很輕松的實(shí)現(xiàn)超頻。