最近拜AMD“準(zhǔn)時”推出Zen 微架構(gòu)的Ryzen 桌上型處理器,與重返服務(wù)器戰(zhàn)場的EPYC 產(chǎn)品線所賜,自從因AMD Bulldozer 微架構(gòu)被Intel Sandy Bridge 打爆、至今一路死氣沉沉的x86 處理器市場,終于再度人聲鼎沸,熱鬧滾滾。
但AMD 在x86 處理器的前景真的有值得樂觀的理由嗎?這就得好好回顧一下過去10 年發(fā)生的點點滴滴了。要了解這歷史全貌,不需高深的電腦結(jié)構(gòu)知識,更不需要攜帶水球、大鎖和鏈條進(jìn)入立法院,只要帶著常識正常運轉(zhuǎn)的大腦。
自K8 重大勝利后就青黃不接的AMD x86 微架構(gòu)
20 多年來,從“產(chǎn)品單價極高,小廠只要有一點點占有率,即可把自己養(yǎng)得很滋潤”,演變到今日實質(zhì)只容得下兩間x86 處理器供應(yīng)商,對AMD 以及歷史上諸多消失于市場洪流的x86 處理器廠商來說,要在Intel 的陰影下求生存,追求足以支撐營運的出貨量及利潤,需要達(dá)成的戰(zhàn)略目標(biāo),依序如下:
·進(jìn)入品牌電腦大廠的個人電腦供應(yīng)鏈。
·進(jìn)入品牌電腦大廠的商用個人電腦及工作站供應(yīng)鏈。
·進(jìn)入品牌電腦大廠的筆記型電腦供應(yīng)鏈。
·進(jìn)入品牌電腦大廠的商用筆記型電腦供應(yīng)鏈。
·進(jìn)入服務(wù)器市場。
·進(jìn)入云端資料中心業(yè)者的機(jī)房。
其余應(yīng)用,如手機(jī)、平板、游戲機(jī)、機(jī)上盒、嵌入式系統(tǒng)等,都是比較次要的事。
簡而言之,長期重點還是在服務(wù)器與云端資料中心。
AMD 近代超純量x86 處理器的發(fā)展(所以就不包含486 體系的Am5x86),大致可簡述如下,技術(shù)細(xì)節(jié)就不談了。
K5:大師手筆,卻聽說讓Compaq 癡癡等不到
由“x86 指令集毫無道理可尋”留名于世的K5 總工程師Mike Johnson(他同時也是AMD 的Am29000 RISC 處理器總工程師,K5 有部分執(zhí)行單元是直接“拷貝”自Am29000),其領(lǐng)軍操刀的產(chǎn)品一再延宕,江湖傳言搞到原本不打算采用Intel Pentium 硬要癡等K5 的Compaq(后來被HP 并購,成為HP x86 服務(wù)器與個人電腦的基石)也hold 不住,最后沒有得到品牌電腦大廠的青睞,只能打零售街頭游擊戰(zhàn),僅在Windows 95 引爆個人電腦市場急速成長的美好年代,留下“價格實惠”與“較好超頻”的殘憶。
K6:購并而來,但打不過枝繁葉茂的Intel P6 家族
AMD K6 并非自家設(shè)計,而是透過購并NexGen 而來,為了相容于Intel Pentium 家族腳位,而移除L2 快取記憶體專用匯流排(類似Pentium Pro)的產(chǎn)物。
總之,產(chǎn)品推出時程還是太晚,還是以卵擊石地一頭撞上Intel P6 微架構(gòu)的桌上型處理器家族,一直玩想掩蓋時脈較低弱點的PR(Performance Rating,意指整數(shù)邏輯運算效能相當(dāng)于同時期Intel 處理器的時脈)話術(shù),套句當(dāng)年P(guān)C Magazine Inside Track 專欄的毒舌評論:PR 只是讓自己的產(chǎn)品看起來比較差,而不是比較好。既然競爭力比較差,售價當(dāng)然不得不“經(jīng)濟(jì)實惠”,有沒有那么好超頻就見仁見智了。
有如二戰(zhàn)后期德國和日本的主力戰(zhàn)機(jī)家族,K6 家族的諸多衍生產(chǎn)品也是一路挨打,不敵Intel 的Pentium III,更遑論遙不可及的x86 服務(wù)器市場了,那時正是Intel 創(chuàng)建Xeon 品牌,開始跟著Windows NT 與Linux 體系服務(wù)器作業(yè)系統(tǒng),四處攻城掠地、掃蕩日暮西山的搭載RISC 處理器Unix 服務(wù)器家族的關(guān)鍵時刻,但AMD 卻看得到吃不到。
K7:曙光乍現(xiàn),x86 世界的Alpha 21264
真正讓AMD 看到逆轉(zhuǎn)戰(zhàn)局曙光的,是曾擔(dān)任DEC Alpha 21064 / 21264 架構(gòu)師的Dirk Meyer 領(lǐng)導(dǎo)的K7──“x86 世界的Alpha 21264,還沿用相同的EV6 匯流排”──AMD 歷史上首次在微架構(gòu)復(fù)雜性與帳面上的制程技術(shù)超越同期Intel 產(chǎn)品,也是AMD 首款原生支援雙處理器的微架構(gòu)(搭配AMD 760MP 芯片組),更讓AMD 創(chuàng)下單季營收10 億美元的紀(jì)錄。
比較不會有人注意的是,AMD 一反過去在K6 過度投資分支預(yù)測,即使指令管線變深,AMD 還是不太愿意在K7 的動態(tài)分支預(yù)測(以及后繼的K8)上投資太多心力,扯遠(yuǎn)了。
不過,K7 后期也是被Intel NetBurst 微架構(gòu)的Pentium 4 窮追猛打,因種種技術(shù)限制和商業(yè)因素,AMD 也未能實現(xiàn)成功進(jìn)入服務(wù)器市場的悲愿。
直到AMD 的雷神之錘K8──也許可視為x86 世界的Alpha 21364(等同于整合記憶體控制器與新型匯流排的Alpha 21264)──直接往Intel 頭頂狠狠尻下去為止。
K8:空前大勝,神也寫不出來的劇本
綜觀整個電腦工業(yè)歷史,論處理器市場的競爭,除了IBM 賭上身家“人類歷史上除了太空梭以外投資最大的產(chǎn)品開發(fā)案”S/360,與相容IBM 全體RISC 指令集、歷史上首款原生雙核心處理器Power4,還真的找不到如此成功、剛好兼顧天時地利人和的巨大戰(zhàn)略勝利(如果有請告訴我),讓AMD 過了好幾年爽日子,爽到一直生不出K8 的正統(tǒng)后繼者,也就是真正的“K10”原始開發(fā)案,兼具深管線、高時脈、同時多執(zhí)行緒與愿意在動態(tài)分支預(yù)測大力投資的先進(jìn)微架構(gòu),也就是我們現(xiàn)在看到的Zen,又扯遠(yuǎn)了。
天時:Intel當(dāng)時內(nèi)部正陷于“64位元指令集”內(nèi)亂,如果真的推出64位元的x86指令集Yamhill,那正統(tǒng)的IA-64(Itanium)該怎么辦?這讓AMD有了靠64位元x64指令集的回溯相容性,可為了當(dāng)時容量水漲船高的記憶體容量,提供高性能平面定址的優(yōu)勢,橫掃千軍萬馬直取上將首級、奪取服務(wù)器市占率。
至于攸關(guān)營運成本的電力效率,AMD K8 的Opteron 表現(xiàn)更遠(yuǎn)勝Intel NetBurst 的Xeon,在高密度服務(wù)器如刀鋒與磚塊看似即將流行的21 世紀(jì)前幾年,更突顯AMD 這方面的優(yōu)勢。
但AMD x86-64 在擴(kuò)張指令格式上并非良好的設(shè)計(如果跟后來Intel AVX 相比,或者有充分理由相信AVX 的VEX 本來就源自Yamhill 原案),這在后面讓整個x86 處理器產(chǎn)業(yè)都付出了代價。
地利:K8并非砍掉重練的全新微架構(gòu),而是以為K7的基礎(chǔ)的衍生設(shè)計,主要新增64位元指令集(當(dāng)然,指令管線、執(zhí)行單元和記憶體管理單元也需要相對應(yīng)的調(diào)整)、讓K8可以原生支援8處理器環(huán)境的HyperTransport匯流排與整合性記憶體控制器,而對多處理器/多核心平臺事關(guān)重大的快取記憶體一致性協(xié)定,也早在K7時期就導(dǎo)入可大幅減輕頻寬負(fù)載的MOESI,意謂AMD可以更快完成產(chǎn)品的設(shè)計與驗證,盡快讓Opterton進(jìn)入市場跟Xeon一決雌雄。
人和:當(dāng)時微軟姿態(tài)擺得很明,相較于萬丈高樓平地起還要先打地基的IA-64,64位元x86指令集比較便于他們建立軟體生態(tài)圈,也不愿意同時支援兩套不同的64位元x86指令集,這也是逼迫Intel不得不在Prescott加入x86-64(還不是原本Intel自己的Yamhill)最后一根稻草。
陽光般的貴人
但AMD 過去沒真正經(jīng)營過服務(wù)器市場,因產(chǎn)品需更可靠,軟硬體環(huán)境更加復(fù)雜,服務(wù)器的產(chǎn)品驗證遠(yuǎn)比個人電腦嚴(yán)謹(jǐn),那AMD 如何彌補缺乏經(jīng)驗的弱點?
無獨有偶,因Ultra SPARC 逐漸失去競爭力,被迫進(jìn)入x86 服務(wù)器市場且在市場開發(fā)階段不斷掙扎的Sun,也許因Opteron 系統(tǒng)架構(gòu)近似于后來取消的幾個UltraSPARC 處理器專案,優(yōu)先選擇AMD 為x86 服務(wù)器處理器供應(yīng)商,Sun 也是最早推出Opteron 服務(wù)器的一線大廠。Sun 身為客戶的反饋,補強了AMD 過去一直缺乏經(jīng)驗的服務(wù)器環(huán)境驗證,這影響遠(yuǎn)遠(yuǎn)超出很多人的想像。
Sun 的選擇,同時增強了其他服務(wù)器市場競爭對手與企業(yè)客戶對AMD 服務(wù)器產(chǎn)品線的信心,AMD 開始懂得如何做好過去一直被系統(tǒng)客戶罵翻的產(chǎn)品品質(zhì)和嚴(yán)苛驗證,而且隨著越來越多客戶選擇Opteron,進(jìn)入良性循環(huán),直到開始有越來越多企業(yè)用戶相信“Opteron 優(yōu)于Xeon”,包括臺灣以前某個“有名大站”等。
除了從天上掉下來砸到AMD 的幸運,已經(jīng)沒有其他可以解釋的理由了。
AMD 從此不再是企業(yè)市場的陌生人
也許一般個人電腦玩家無法體會這種感覺,但當(dāng)看到最普及的商用Unix 作業(yè)系統(tǒng)Solaris,跑在搭載AMD Opteron、由Sun 天字第一號員工親自設(shè)計如同藝術(shù)品的Galaxy 系列x86 服務(wù)器上,這對當(dāng)時無法把AMD 跟企業(yè)應(yīng)用聯(lián)想在一起的企業(yè)客戶是何等巨大的震撼。
別說支援原生雙處理器了,你看過8 顆Opteron 處理器的服務(wù)器嗎?而且上面掛的品牌還是Sun HP 這些大廠(HP 雖貴為Intel 在Itanium 最重要甚至可說是實際上唯一的伙伴,但后來HP 賣Opteron 服務(wù)器卻是賣最兇的,Intel 應(yīng)該不少人內(nèi)心五味雜陳)。
這也是Hector Ruiz 擔(dān)任AMD 執(zhí)行長的最大貢獻(xiàn),讓AMD 成功進(jìn)入企業(yè)市場,不只服務(wù)器,后來商用電腦與筆電也雨露均沾,AMD 慢慢占有一席之地,在職場隨處可見AMD Inside 的系統(tǒng)。即使近年AMD 比較弱勢,多數(shù)人也不會覺得公司配發(fā)給你的生產(chǎn)力工具里面裝著來自AMD 的心臟,是很奇怪的事情。
AMD Opteron 的成功,也許可以直接從產(chǎn)品牌價略見一斑:2003 年的Opteron 846 / 848,曾高達(dá)3,199 美元,直到最近的EPYC 7500,才再度看到這種等級的價格標(biāo)簽,整整相隔了近14年。
得來不易的優(yōu)勢最終仍慘遭Intel 鐘擺巨輪輾碎
但AMD 的攻勢也就到了盡頭,接著就是Intel 在2006 年重整旗鼓開始帝國大反擊,也是關(guān)心過去10 年處理器市場的讀者所熟悉的“鐘擺(Tick-Tock)戰(zhàn)略”,小步快跑,急起直追,展現(xiàn)了驚人的執(zhí)行力,以服務(wù)器市場為主,Intel 追擊的軌跡可簡述為:
2006年:由以色列海法主導(dǎo)、原本和NetBurst高低檔搭配的Pentium M體系Merom微架構(gòu),完全取代NetBurst,一統(tǒng)服務(wù)器、桌機(jī)、筆電。這時Intel靠著Woodcrest奪回單一核心的效能優(yōu)勢,也再度確定Intel高效能x86微架構(gòu)的發(fā)展基礎(chǔ),回到起源于1995年P(guān)entium Pro的P6,直到非循序指令執(zhí)行引擎替換成NetBurst系的Sandy Bridge,才替問世于1995年的P6劃下輝煌的句點。
沒有原生4 核沒關(guān)系,采用多芯片封裝一次包兩顆湊4 核也可以。當(dāng)時應(yīng)該也少人預(yù)期到,隔沒幾年,就換AMD 被迫如法炮制昔日嘲諷的“雙餡水餃”,在Socket G34 塞兩顆核心二打一,勉強對抗占有優(yōu)勢的Intel。
2009年:由Hillsboro主導(dǎo)、在Pentium 4初期曾目標(biāo)“時脈上看10GHz”的Nehalem,重回以P6體系為基礎(chǔ)后,原生4核加上了同時多執(zhí)行緒、QPI匯流排、整合式記憶體控制器與相對應(yīng)的MESIF快取記憶體一致性協(xié)定,基本上已經(jīng)可以視為“Intel世界的K8”,但青出于藍(lán)勝于藍(lán),AMD K8的多處理器系統(tǒng)架構(gòu)優(yōu)勢,此時已蕩然無存(除了Intel多出很燙手有點難散熱的IOH),支撐AMD不墜的,只有K8重大戰(zhàn)略勝利的剩余動量與現(xiàn)有客戶的信心度。
對Intel,開始移植源自Itanium 的系統(tǒng)可靠性技術(shù)至8 處理器Nehalem-EX 最重大的意義是:確立Itanium 邊緣化的命運。2006 年啟動鐘擺戰(zhàn)略時,將64 位元x86 指令集從心不甘情不愿的IA-32e 和EM64T 正名為Intel 64,就初露端倪。這重大的戰(zhàn)略決定,也和當(dāng)時Intel 部分高層離職潮有直接或間接關(guān)系,包括因P6 奇跡而擁有完美“服務(wù)器夏天”感到驕傲的某任Cadence 執(zhí)行長,與18 歲就進(jìn)Intel 上班,后來確定搶不到執(zhí)行長而跳槽VMware 時還放話“Itanium 業(yè)務(wù)其實有賺錢”的那位。
當(dāng)然,AMD 也沒有閑著坐等Intel 咬上來,但以K8 為基礎(chǔ)的原生4 核K10(Barcelona,Shanghai)與原生6 核K10(Istanbul),相較于Intel 的鐘擺頻率,進(jìn)步幅度都太小了,而Barcelona 的TLB 臭蟲事件,更傷害了企業(yè)對Opteron 的信心,以Nehalem 微架構(gòu)與Tylersburg 平臺為死亡交叉點,即使AMD 再如何對外宣稱“執(zhí)行力到位”,如2006 年底在德州展示原生4 核,2009 年準(zhǔn)時推出Istanbul 等,頹勢已無法挽回。
2011~2012年:AMD一拖再拖、由IBM Power4總架構(gòu)師Chuck Moore操刀的Bulldozer,與Intel同樣一再延宕的Sandy Bridge在服務(wù)器市場頂上決戰(zhàn),從內(nèi)到外每個環(huán)節(jié)幾乎都輸人的AMD,就如同在衛(wèi)城作戰(zhàn)失敗后的德軍,從此一蹶不振,連續(xù)4個世代叢集多執(zhí)行緒微架構(gòu)都被Intel“后P6時代”鐘擺壓垮,低耗電微架構(gòu)Jaguar與ARM Cortex-A57的Opteron,對大局完全無足輕重,直到2017年Zen微架構(gòu)的EPYC問世前,沒有一絲一毫翻身的可能性。
對了,為何AMD 沒有K9?因為K9 的英文發(fā)音是“犬類”,AMD 不想當(dāng)敗家之犬,只可惜本名K8L 的K10 也沒有成功阻止AMD 退潮。
走音出錘的推土機(jī)工地秀
Intel 有鐘擺,AMD 當(dāng)然也有,只是跟Intel 相比,AMD 連續(xù)4 個世代的叢集多執(zhí)行緒微架構(gòu),完全是小巫見大巫,而AMD 為了異質(zhì)多核心大計預(yù)先鋪設(shè)的暗樁,也被Intel的鐘擺巨輪輾成碎片。
2011年:推土機(jī)(Bulldozer),32nm制程,出師不利的先鋒,因為推土機(jī)設(shè)定集里面的預(yù)定對手不是Sandy Bridge,而是前一代Westmere甚至是更早的Nehalem。“剛剛好”經(jīng)領(lǐng)導(dǎo)K7救世主的Dirk Meyer就在2011年初從執(zhí)行長大位下臺一鞠躬,代表AMD經(jīng)營階層對采取雙軌路線(推土機(jī)搭配山貓)投下的不信任票。
2012年:打樁機(jī)(Piledriver),32nm制程(SOI晶圓),微幅改進(jìn)微架構(gòu),主要著眼在分支預(yù)測和指令排程,但聊勝于無。這時候,已經(jīng)傳聞AMD準(zhǔn)備全面棄守現(xiàn)有產(chǎn)品時程表,全力投入全新x86微架構(gòu)與開辟ARM服務(wù)器戰(zhàn)線。
2014年:壓路機(jī)(Steamroller),28nm制程,AMD終于真正對癥下藥,疏通指令管線前端的塞車問題,改進(jìn)指令快取的命中率(2路64kB升級為3路96kB),新增微指令回圈緩沖區(qū),也讓叢集多執(zhí)行緒的兩個整數(shù)邏輯運算核心擁有專屬的指令解碼器,但為時已晚,AMD連早已不再閃亮的金雞母Opteron產(chǎn)品線都放棄導(dǎo)入“新”核心了,僅APU產(chǎn)品線有幸一親芳澤。
2015年:Excavator(挖土機(jī)),28nm制程(當(dāng)然有所改進(jìn)),在設(shè)計工具端,因引進(jìn)源自于GPU產(chǎn)品線的高密度函式庫,所以有更小的芯片面積和更好的電力效率,至于支援AVX2指令集與DDR4記憶體就不值得特別著墨了。
AMD原始如意算盤:用比較簡單的微架構(gòu)跟你拼核心數(shù)和電力效率(類似RV770 GPU的概念),日后將雙核心共用的浮點運算單元換裝成GPU更有巨大的應(yīng)用彈性,大概萬萬沒想到Intel真的就脫下褲子跟你拼了。推土機(jī)家族留下的遺產(chǎn),只有在Zen微架構(gòu)開花結(jié)果的先進(jìn)動態(tài)分支預(yù)測技術(shù)。
同場加映Intel 的鐘擺,AMD 戰(zhàn)線不全面崩盤還真的沒有天理:
2011年(Tock):Sandy Bridge,32nm制程,AVX指令集,微指令快取堪稱Intel從NetBurst那激進(jìn)至極的Trace Cache一路摸石過河的最佳集大成,換裝NetBurst系非循序指令執(zhí)行引擎,也結(jié)束了光榮的P6時代。這時候,AMD用兩倍的核心數(shù)勉力抗衡,還稍有喘息空間。
2012年(Tick):Ivy Bridge,22nm制程(Intel不動聲色導(dǎo)入3D電晶體),如過去的Tick,充滿了一堆看起來好像很沒什么但又好像很厲害的“微幅改進(jìn)”,但原生15核心版本,幾乎就是釘在AMD Opteron棺材上的第一根釘子,讓AMD已經(jīng)沒有靠雙餡水餃以量取勝的希望。
2013年(Tock):Haswell,22nm制程3D電晶體,AVX2指令集,Intel主力x86微架構(gòu)發(fā)展史上最大的執(zhí)行單元橫向擴(kuò)張,最大核心數(shù)擴(kuò)張到18核,AMD連核心數(shù)量優(yōu)勢都沒了,棺材再打上一根釘子。值得注意的是,從Haswell開始,Intel開始虛擬化功能,加入更精細(xì)的快取存取QoS機(jī)能。
2014年(Tick):Broadwell,14nm制程3D電晶體,還是依循優(yōu)良傳統(tǒng),充滿一堆看起來好像很沒什么但又好像很厲害的“微幅改進(jìn)”,最大22核心和有點走火入魔的快取存取QoS機(jī)能,讓已經(jīng)被埋在土里的Opteron就算躺著中槍也不會喊痛了。不過Broadwell世代的整合內(nèi)顯處理器卻隱藏了Intel未來在服務(wù)器與高效能運算市場可能隨時上場的超級武器:可能用來當(dāng)L4快取的高容量嵌入式DRAM,這在過去是IBM和日本廠商的強項,未來卻可能變成Intel的王牌。
2015年(Tock):Skylake,14nm制程3D電晶體,鐘擺巨輪終于停下,Intel恐怕也被太過頻繁的制程升級搞到人仰馬翻了,產(chǎn)品持續(xù)推陳出新對業(yè)務(wù)系統(tǒng)造成的銷售壓力大概也不足為外人道也,開始轉(zhuǎn)型成牙膏商,一次Tock擠一次不夠,你可以擠三次。Intel開始好整以暇,慢條斯理的將過去不同插槽的多種服務(wù)器平臺,與FPGA、HPC專用高速介面Omni-Path等特殊應(yīng)用,畢其功于一役整合在Skylake-SP“Purley”上(只差沒趕上3DX Point NVDIMM的Apache Pass),也讓服務(wù)器用處理器有差異化(AVX-512指令集,Mesh匯流排)──然后就被AMD EPYC一口咬上。
洋洋灑灑一大篇,重點只有一句話:AMD的研發(fā)資源遠(yuǎn)遠(yuǎn)不及Intel,沒有任何犯錯的空間,Intel以“擅于站在巨人肩膀上”的以色列海法與“持續(xù)追求激進(jìn)創(chuàng)新”的奧勒岡Hillsboro兩大軸心擔(dān)綱創(chuàng)新的“Tock”,搭配數(shù)個負(fù)責(zé)改良“Tick”或?qū)W⒂谔厥鈶?yīng)用的輔助研發(fā)中心(像總部Santa Clara、加州Folsom、德州Austin、印度Bangalore等),才足以支撐x86單一微架構(gòu)開發(fā)案,因指令集先天毫無道理可尋的高度復(fù)雜性與其帶來的驗證復(fù)雜度,動輒3到5年,卻如此密集的產(chǎn)品更新頻率。
反過來說,鐘擺戰(zhàn)略強迫每個研發(fā)中心“有效分工”,也徹底解放了Intel 的處理器研發(fā)潛能,至于有沒有趁機(jī)解決內(nèi)部政治問題的家務(wù)事,就不是外人可以置喙的了。
AMD 搶灘的希望在云端資料中心,而非傳統(tǒng)套裝服務(wù)器
我們再回頭看看AMD 重回服務(wù)器戰(zhàn)場的Naples 處理器與EPYC 平臺。處理器畢竟是要做出來賣錢的商品,不是只要每年能在ISSCC IEDM HotChips CoolChips 講得很爽的題材,產(chǎn)品特色透露出來的商業(yè)策略,往往比技術(shù)更值得路人關(guān)心。
Google 與云端服務(wù)的崛起,大舉重塑了傳統(tǒng)服務(wù)器市場的生態(tài):云端服務(wù)業(yè)者為了降低營運成本,資料中心的硬體大多自行設(shè)計量身訂做,再發(fā)包給系統(tǒng)代工業(yè)者,等于跳過傳統(tǒng)服務(wù)器大廠與白牌服務(wù)器這關(guān),采購處理器直接與供應(yīng)商議價,藉由一次性的巨量需求,大幅壓低采購單價到外人難以像像的程度。
為何在AMD 在服務(wù)器市場開始衰傾之際,越來越多人“清談”ARM 服務(wù)器?并不是真的相信很快就會誕生各方面足以匹敵x86 的ARM 服務(wù)器處理器與軟體生態(tài)圈,而是為了增加“牽制”Intel 的議價籌碼,因為云端資料中心市場已經(jīng)被吃掉超過95%份額的Intel 變相壟斷了,而剩下的“余額”經(jīng)東扣西扣后,即使產(chǎn)品合用,也根本養(yǎng)不活多少間ARM 處理器供應(yīng)商。
同理可證,IBM 誘拐分?jǐn)倢俜?wù)器研發(fā)費用“分母”的第3 次Power Everywhere,包含從Google 一路到眾多毫無軟體基礎(chǔ)的系統(tǒng)代工廠愿意一同“共襄盛舉”?其理至明。并不是說IBM Power 東西不好(沒人懷疑藍(lán)色巨人數(shù)十年來親手打造的服務(wù)器處理器不是極品),但斧鑿斑斑的策略交鋒,實在無法讓人視而不見。
所以AMD 一開始替EPYC 設(shè)定開辟第二戰(zhàn)場的搶灘登陸點,就是云端資料中心,而非傳統(tǒng)套裝服務(wù)器市場,才更有機(jī)會沖高出貨量和市場占有率,這從諸多產(chǎn)品規(guī)格特性,如8 通道Unbuffered DIMM,彈性化的PCIe 組態(tài),無須外掛系統(tǒng)芯片組就有一定水準(zhǔn)的I/O 界面可用,加裝安全加密機(jī)制等,與核心設(shè)計上的取舍,像精簡SIMD 指令集運算單元,就可以看得一清二楚,一切為降低成本而生,你要32 核心我就包4 顆8 核的水餃給你,甚至連芯片品質(zhì)需不需要像以前那么可靠,都可能存在商量余地,至于能不能正面在所有應(yīng)用場合戰(zhàn)勝Skylake-SP,其實不見得那么重要。
講的更白一點,EPYC 表面上是一臺2 路服務(wù)器,但AMD 實際上賣的,卻是一臺便宜的高密度8 路系統(tǒng)。筆者只能說Intel 花一堆工夫做那20 幾頁簡報數(shù)落AMD EPYC 的不是,完全在打空氣,但即使Intel 心里明白,不會更不能說出來。
“從AMD EPYC 檢視云端資料中心的需求”其實是一個非常有趣的主題,AMD 在制定產(chǎn)品規(guī)格時,也必定“參考”諸多潛在客戶的反饋,假以時日,隨著越來越多資料中心導(dǎo)入EPYC,我們也可以看到越來越清晰的全貌,如果他們肯講。
優(yōu)勢仍在Intel 這邊,AMD 機(jī)會何在?
即使Zen 微架構(gòu)處理器開始讓Intel“有感”,Intel 依舊牢牢掌握市占率、制程技術(shù)、研發(fā)資源與行銷網(wǎng)路的優(yōu)勢,更不可能停止推陳出新,AMD 也很可能再度上演Zen 微架構(gòu)后繼無人、被Intel 重啟鐘擺巨輪輾碎的戲碼,那AMD 還有任何機(jī)會,建立起一條不毀的防線嗎?唯有幾種可能性:
半導(dǎo)體業(yè)界不約而同一起撞上制程之墻,“抵消”Intel 最具威脅力的優(yōu)勢。
AMD 持續(xù)專注于針對特定市場“客制化”降低客戶的持有成本,但這有其極限,畢竟AMD 還有桌機(jī)與筆電市場要顧,不可能做得太極端。
其實處理器業(yè)界在IBM Power7 之后,核心微架構(gòu)的效能發(fā)展就開始趨緩了(蘋果購并的PA Semi 是另一種截然不同的故事),因為投資在記憶體子系統(tǒng)和資料平行化處理,遠(yuǎn)比增加指令派發(fā)寬度來得有效益多了,所以Intel“擠牙膏”其實還算情有可原。既然如此,AMD 重蹈推土機(jī)覆轍的機(jī)率就小多了,當(dāng)然前提也要AMD 能維持核心數(shù)量的優(yōu)勢與一定程度的多核心“水餃”效能延展性。
Intel 自己犯錯,不小心選擇激進(jìn)路線打造驚世駭俗的x86 微架構(gòu),卻又走上“超大+超重+超熱=超生”的NetBurst 老路。
在軟體定義儲存殺聲震天的當(dāng)下、服務(wù)器逐漸“吸回”外接儲存設(shè)備的大勢中,AMD 能不能掌握獨特的優(yōu)勢?
AMD 購并ATI 后,遲遲沒有真正打好GPU 這張牌,看在人工智慧與深度學(xué)習(xí)等新興應(yīng)用開始炙手可熱的份上,這次打鐵趁熱會有機(jī)會嗎?
也許更多的疑惑,早已滿滿溢出各位的大腦:
ARM 服務(wù)器到底還有沒有搞頭?AMD 的K12 跑哪去了?還有人在關(guān)心Cortex-A57 的Opteron 嗎?
還在巨資供養(yǎng)老妖怪魔神Z 和古老商用RISC 之首Power 的IBM,以及共同支撐SPARC 家族的Oracle 與Fujitsu,近況究竟如何?
云端資料中心中不同的服務(wù)也有不同的性能需求,那AMD EPYC 究竟適合哪幾塊?