Marvell甘衛(wèi)寧:芯片公司與云的關(guān)系
日前,第五屆云計(jì)算大會日前在北京國家會議中心召開。Marvell大中華區(qū)系統(tǒng)與解決方案首席規(guī)劃師甘衛(wèi)寧在大會上作了主題為“Marvell的公共云洞察——Web2.0時代的數(shù)據(jù)中心”的演講,重點(diǎn)闡述了Marvell作為一家芯片公司與云的關(guān)系。
以下是演講實(shí)錄:
各位下午好,我看了一下合作伙伴,這些合作伙伴就是一個產(chǎn)業(yè)鏈,前面兩個都是做應(yīng)用的,IBM是做系統(tǒng)的,我們唯一一家做芯片的,后面是做平臺的。經(jīng)常會問,芯片跟云有什么關(guān)系?這就是我今天講的主要內(nèi)容。
從整個產(chǎn)業(yè)鏈的頭端,對整個公共云的影響,這張圖其實(shí)把整個用云的概念顯示的比較豐富一點(diǎn),我們看云的這條線上四個屏,人類在接觸信息的時候,就這四張 屏,根據(jù)屏的大小,各自場景也不一樣。這四個屏,實(shí)際上不斷的向五個云里去的。咱們先從今天的主題公共云來講,我們所有的內(nèi)容幾乎都在右邊的云上,這里像 阿里云、百度,包括我們中國電信移動聯(lián)通這些大的運(yùn)營商,都在建立公共云。
這些云的內(nèi)容,要通過一個基礎(chǔ)設(shè)施,包括寬帶,或者LTE 4G寬帶推到我們的用戶端。用戶端就是根據(jù)我們所在的位置,從家里起來上班,在移動過程中成為移動云,最后到辦公室,成為私有云,這個結(jié)構(gòu)組成了我們現(xiàn)在跟信息交流的主要方式。
Marvell的定位,就是人和人互相之間,通過四個平臺,四個終端,和五個云連接在一起。今天主要講公共云基礎(chǔ)上的變化,做一個公共云數(shù)據(jù)中心,從產(chǎn)業(yè) 鏈上來講,有幾個核心的組成部分。從我們做芯片元器件的產(chǎn)業(yè)鏈一端來說,我們把所有硬件、元器件做出來,然后做系統(tǒng)設(shè)置的各種盒子,包括游戲機(jī)、交換機(jī)以 及服務(wù)器。最后由代工廠把它做成產(chǎn)品,給產(chǎn)品貼上不同的標(biāo)簽,或者沒有標(biāo)簽直接進(jìn)數(shù)據(jù)中心。然后加上Linux,或者各種各樣的Open Stack,一些OS,或者一些應(yīng)用。還有一些根據(jù)各種應(yīng)用有關(guān)的一些軟件,像微信,百度的搜索,阿里云上的一些自己的特殊應(yīng)用,最終組成了一套數(shù)據(jù)中心 的系統(tǒng)。在系統(tǒng)運(yùn)營過程中還要有系統(tǒng)的維護(hù)。所以整個產(chǎn)業(yè)鏈轉(zhuǎn)一圈,一代產(chǎn)品過了,再轉(zhuǎn)一圈,第二代產(chǎn)品過了,這就是它整個核心的產(chǎn)業(yè)鏈。
現(xiàn)在來看我們傳統(tǒng)的數(shù)據(jù)中心是怎么做出來?實(shí)際上有四個組成在其中扮演相關(guān)的角色,我們作為芯片廠商,首先要提供元器件;然后代工廠主要做生產(chǎn);接著廠家 提供一些應(yīng)用軟件;上面有系統(tǒng)集成商(IBM、HP),把系統(tǒng)設(shè)置起來,然后維護(hù)好,做成數(shù)據(jù)中心。這是原來傳統(tǒng)的產(chǎn)業(yè)結(jié)構(gòu)。
從這種結(jié)構(gòu)可以看到,數(shù)據(jù)中心的三項(xiàng)核心技術(shù):計(jì)算、儲存、網(wǎng)絡(luò),這里面有三個代表的廠家,但不是說只是三家在做這件事情,而是在產(chǎn)業(yè)里有代表性。這些廠 家在各個領(lǐng)域是很專長的,專長的結(jié)果是,每家都有每家的特長,這樣的好處是和不同廠家做區(qū)分。從計(jì)算到存儲再到網(wǎng)絡(luò),互相之間都會找差異性。
但實(shí)際上你看數(shù)據(jù)中心并不需要差異性,它需要三者重合的部分——Vanity Free,也就是說去掉多余的花花綴綴的東西,實(shí)際上這是大的公共數(shù)據(jù)中心所需要的東西。這種結(jié)果,就像這兩句話講,廠家相互之間的差異化給廠家?guī)砗芏? 價值,但并非能解決數(shù)據(jù)中心需要的核心的一點(diǎn)東西。它產(chǎn)生的價值,對真正運(yùn)營數(shù)據(jù)中心來說其實(shí)是成本。
所以在新的理念之下,產(chǎn)業(yè)結(jié)構(gòu)有新的變化。最終我們的數(shù)據(jù)中心中間的環(huán)節(jié),系統(tǒng)產(chǎn)業(yè)在陸陸續(xù)續(xù)的走出來,逐漸在消失。那么這些廠家,做芯片,做代工廠,或 者做系統(tǒng)設(shè)計(jì),還包括做開源軟件,包括自己公司內(nèi)部的軟件開發(fā),慢慢的頂起來四條柱子,來支撐幾個數(shù)據(jù)中心,這就是我們經(jīng)常說的白牌(White Box)數(shù)據(jù)中心模型。
這個帶來最大的好處是投入成本,就是硬件成本會降低很多,同時運(yùn)維成本會降低更多。在新的生態(tài)系統(tǒng)產(chǎn)業(yè)鏈結(jié)構(gòu)下,最典型的例子,可以看Facebook, 其實(shí)做這些東西,并不是Facebook第一個做的,可能是Google第一個做的,但Facebook第一個把它的stack整個公開看看它是怎么做 的。Facebook當(dāng)時定義的東西,它有一個使命,把這個東西做的非常便宜,同時非常有效,大家做的量比較大,把它標(biāo)準(zhǔn)公開,這樣比較便宜。
所以整個硬件做數(shù)據(jù)中心,服務(wù)器應(yīng)該做成什么樣,儲存應(yīng)該做成什么樣,數(shù)據(jù)中心里的機(jī)柜應(yīng)該做成什么樣的,網(wǎng)絡(luò)應(yīng)該做成什么樣的,包括整個設(shè)備的管理應(yīng)該 用怎么樣規(guī)范,最終到每個設(shè)備的認(rèn)證都有嚴(yán)格的定義。在這個指導(dǎo)思想下,F(xiàn)acebook第一個數(shù)據(jù)中心,就是在俄勒岡開的數(shù)據(jù)中心,完全按照這個架構(gòu)來 做的。緊接著它宣布在北卡建立新的數(shù)據(jù)中心,在兩邊海岸把美國給覆蓋下來。它在瑞典也做數(shù)據(jù)中心,覆蓋整個歐洲,最近剛宣布在美國中部再蓋個數(shù)據(jù)中心,這 樣就把整個全美三個數(shù)據(jù)中心全部蓋起來。這幾個中心,重頭開始建設(shè),就是根據(jù)這個概念來做的。
所以我剛才說的新的生態(tài)系統(tǒng)是Facebook第一個作為一個產(chǎn)業(yè)和行業(yè)往前走的。做這個東西對我們現(xiàn)在市場的數(shù)據(jù)有什么影響?我們看一個數(shù)值,從服務(wù)器 的角度,去年Q4跟前年的Q4相比,可以看出這幾家廠家的服務(wù)器的成長在降低,紅線畫出的點(diǎn)正在增加。所以Facebook的這種模式給市場帶來了沖擊, 這是整個產(chǎn)業(yè)鏈的變化。
講了很多數(shù)據(jù)中心,實(shí)際上這張圖把整個數(shù)據(jù)中心都覆蓋下來。實(shí)際上這部分是在數(shù)據(jù)中心里頭,運(yùn)營商網(wǎng)絡(luò)建立了防火墻,然后把所有的流量打到外服務(wù)器上,看 你是要干什么的。然后根據(jù)內(nèi)容的不一樣,分散到不同的應(yīng)用服務(wù)器上,有些東西要從數(shù)據(jù)庫拿的,進(jìn)入數(shù)據(jù)庫集群,在數(shù)據(jù)庫中把數(shù)據(jù)拿出來。現(xiàn)在比較流行的是 存放到內(nèi)存緩沖服務(wù)器(Memory cache server)上,下次再拿的時候,就不用到服務(wù)器上,因?yàn)闀r間比較長。對于一些冷數(shù)據(jù),可以放在存儲服務(wù)器(Storage server)上,這個數(shù)據(jù)中心就是這么一個結(jié)構(gòu)。
在我們設(shè)立一種硬件的時候,就有不同的要求。核心起來,整個數(shù)據(jù)中心就是三大技術(shù),從計(jì)算來講的話,在這個種類里頭有三種,一種是專門做計(jì)算的,另外一種專門做存儲,這是它的各種應(yīng)用場景。還有一種是兩者比較均衡。這是從計(jì)算的角度來說的。
從存儲的角度來說,根據(jù)存儲數(shù)據(jù)提取的快慢,那種SSD和硬盤,還有混合硬盤,是三個不同。拿到網(wǎng)絡(luò)上,把數(shù)據(jù)庫這些存儲東西合在一起,最終還有防火墻,還有集成的服務(wù)器,把這些覆蓋均衡。所以整個數(shù)據(jù)中心的核心技術(shù),實(shí)際上歸于三類。[!--empirenews.page--]
然后這三類里頭,有一個技術(shù)上的演變,在計(jì)算上,原來計(jì)算結(jié)構(gòu)比較多,現(xiàn)在數(shù)據(jù)中心最后融到Intel、ARM兩個結(jié)構(gòu)上來,這是從計(jì)算上講。
存儲上講,原來存儲的東西節(jié)點(diǎn)越做越大,現(xiàn)在節(jié)點(diǎn)不需要很大,但是往上越壘越大,所以叫Scale out這種新的結(jié)構(gòu)。
在網(wǎng)絡(luò)上,原來就是我平常希望看到的網(wǎng)絡(luò)之間IP跑來跑去的集成?,F(xiàn)在控制層和數(shù)據(jù)層分開了,就變成軟件定義的網(wǎng)絡(luò)。
所以這是三項(xiàng)技術(shù)的演變,往新的方向演變。
然后我們看計(jì)算怎么回事?傳統(tǒng)計(jì)算是一個用戶加好多應(yīng)用上去,一個服務(wù)器上跑了很多東西,對應(yīng)的結(jié)構(gòu)是實(shí)際上是雙CPU,一個是南橋北橋,把所有的外設(shè)連在一起,加了很多內(nèi)存,然后這個CPU速度會越來越快,可能還多幾個核,就是傳統(tǒng)的計(jì)算結(jié)構(gòu)。
新的方式,一個應(yīng)用只跑一個應(yīng)用,它帶了很多的用戶。如果帶的人數(shù)不夠,可以再加一臺機(jī)器,所以核心點(diǎn),就是一個應(yīng)用,多個用戶。
在這種計(jì)算條件下,計(jì)算的結(jié)構(gòu)就會變成像網(wǎng)格形的結(jié)構(gòu),在每一節(jié)點(diǎn)上都是處理器,內(nèi)存通過交換機(jī)把它合在一起,組成起來,就是一個巨大的計(jì)算機(jī)結(jié)構(gòu),等于說把一萬個手機(jī)合在一起,變成很大計(jì)算機(jī),就是這么一個概念。
那么這種結(jié)構(gòu)怎么適應(yīng)新的計(jì)算環(huán)境?每個上面掛一個應(yīng)用,可能一個不夠,兩個或者三個掛一個,然后它服務(wù)的對象是很多不同的人,你需要干什么事就到哪個臺 上面去,這叫分布式計(jì)算的結(jié)構(gòu)。這種結(jié)構(gòu)是需要一個CPU,雖然不大,但是頂住了很多CPU合在一起,所以ARM結(jié)構(gòu)做這個是非常適合的。
數(shù)據(jù)中心的成本結(jié)構(gòu),剛剛從計(jì)算來講,做的東西要花錢,包括買東西,包括維護(hù)的成本,加起來就是TCU,整體成本是多少。這是行業(yè)的一個數(shù)值,我們拿服務(wù) 器作為一個例子,服務(wù)器在整個運(yùn)行,建數(shù)據(jù)中心過程中占60%,剩下的40%是跟買機(jī)器無關(guān)的。其中18%是空間,因?yàn)楝F(xiàn)在一個機(jī)柜上,插不了多少硬盤機(jī) 柜就滿了,所以很多空間是浪費(fèi)的。我們現(xiàn)在房地產(chǎn)這么貴,一個機(jī)柜占空間是很值錢的,如果你要利用不了空間的話,就是浪費(fèi)資源,這個資源不見得是跟買機(jī)器 有關(guān),這是空間成本。
還有一個成本是系統(tǒng)電力成本,現(xiàn)在電的成本越來越高,除了把系統(tǒng)跑起來以外,還要把溫度給降下來,空調(diào)的成本也在增加,這兩個加起來,降了22%。所以這個占的比重是很大的。
因此我們做傳統(tǒng)數(shù)據(jù)中心的時候,覺得我每花一塊錢,我買了多少主頻,多少內(nèi)存,實(shí)際上你只是想了60%,新的結(jié)構(gòu)上,這個衡量參數(shù),除了這個以外,還加了 另外兩個。我每一寸的空間做了多少事,或者每一瓦電做了多少事,就是從一維衡量一件事情,到三維衡量一件事情。這是整個數(shù)據(jù)中心,從成本結(jié)構(gòu)上的變化。
我拿一個例子,你可以看它的性能好了很多,這個電好了也很多,我們做一個性價比,這個紅線幾乎是兩倍的關(guān)系。40%的空間跟功耗就在這上面體現(xiàn)出來,這就是一個傳統(tǒng)的,從結(jié)構(gòu)上的一個差異。
看儲存最大的趨勢的變化,就是非結(jié)構(gòu)性數(shù)據(jù)和結(jié)構(gòu)性數(shù)據(jù)。結(jié)構(gòu)性數(shù)據(jù)就是數(shù)據(jù)庫固定的數(shù)據(jù),非結(jié)構(gòu)性數(shù)據(jù)是照的照片,微信說幾句話,短信之內(nèi)的都是。這個 數(shù)據(jù)將來會占到80%,對應(yīng)的儲存相應(yīng)的也會有所變化。儲存變化原來是在X86基礎(chǔ)之上,主要是把節(jié)點(diǎn)變得越來越大,新的基于ARM之上,是把節(jié)點(diǎn)變小, 但是我可以累加,所以右邊這個比較適合非結(jié)構(gòu)性數(shù)據(jù)。
在新的結(jié)構(gòu)下,又是一個網(wǎng)格性結(jié)構(gòu),每個芯片帶一個,或帶兩個,把這個東西全部聚集在一起。通過網(wǎng)絡(luò),交換機(jī)整合在一起。這是新的結(jié)構(gòu)下爆發(fā)性發(fā)展比較適合的一種體系結(jié)構(gòu)。
然后再看看網(wǎng)絡(luò),這是比較傳統(tǒng)的網(wǎng)絡(luò),在一個數(shù)據(jù)中心里頭,我們經(jīng)??从芯薮蟮暮诵慕粨Q機(jī),帶著匯聚交換機(jī),最后是接入交換機(jī),把所有服務(wù)器連在一起,這 是比較傳統(tǒng)的三層結(jié)構(gòu),這種結(jié)構(gòu)比較可擴(kuò)展,匯聚起來比較容易。這是被驗(yàn)證過、跑過的一種傳統(tǒng)結(jié)構(gòu)。那么現(xiàn)在新的結(jié)構(gòu),是兩層結(jié)構(gòu),就是通過一層匯聚,網(wǎng) 格形的結(jié)構(gòu)。這樣的話,層次比較短,每個包的延遲會比較少,這是新的結(jié)構(gòu)的特點(diǎn),把數(shù)據(jù)中心所有的服務(wù)器整合起來的結(jié)構(gòu)。
物理結(jié)構(gòu)有兩種比較典型,一種是Top of rack,把服務(wù)器連在一起,匯聚在一起,合在一起像一個大電腦一樣,通過交換機(jī),把它全部連接在一起。這種方式布線比較容易,在一個機(jī)柜全部布置完,交 換機(jī)全部連在服務(wù)器上,你看到的是幾個10G,或者40G的以太線出來,就像大的電腦,出來幾個大的管道,這是一個Top of rack結(jié)構(gòu)。
還有一個方式,是在一排機(jī)柜頭邊,放了一個叫End of Row Switch,把所有的布線,通過這個,連到交換機(jī)上,最后再到匯集到交換機(jī)上,可以使上面的端口充分得到利用,這是新的數(shù)據(jù)中心的一種布線模式,可能在國內(nèi)比較流行一點(diǎn)。
從數(shù)據(jù)中心的網(wǎng)絡(luò)演變,陸陸續(xù)續(xù)變成這種結(jié)構(gòu),我就想拿著這張圖,把這個概念給大家講的比較清楚,什么叫SDN?實(shí)際上就是一句話,把控制交換機(jī)、路由器 的行為,跟它具體做這件事分開,就是控制平面在另外一個地方,執(zhí)行層面,我告訴你干什么,就干什么。原來的交換機(jī)是這樣,做完了就固定死了,就像到了紅綠 燈,幾分鐘后變燈是固定的。所以SDN就是紅綠燈,燈的時間是外面有一個控制中心告訴你什么時候開,什么時候關(guān)?把這兩個給區(qū)分開,可以根據(jù)不同的應(yīng)用, 來調(diào)配這個流量,所以它變成了三成結(jié)構(gòu),從基礎(chǔ)設(shè)施做一些轉(zhuǎn)換,到控制它的高層轉(zhuǎn)換,也就是控制層。那么誰來控制它?就是這些應(yīng)用來控制它,所以這里很多 計(jì)算在另外一層??赡芸刂茖用婧瓦@些應(yīng)用跑在不同的服務(wù)器上。然后交換機(jī)本身就做一些執(zhí)行,大概的理念就是這樣。所以這是數(shù)據(jù)中心的網(wǎng)絡(luò)發(fā)展的趨勢。
總結(jié)起來,有四點(diǎn),一是生態(tài)系統(tǒng)的變化,除了傳統(tǒng)品牌服務(wù)器外,逐漸也出現(xiàn)了白牌服務(wù)器。這樣造成TCO會比較低一點(diǎn)。第二個是從計(jì)算上,網(wǎng)格的計(jì)算,小 的ARM為中心的計(jì)算,慢慢的成為主流,這是從計(jì)算上講。從存儲上講,從原來把儲存節(jié)點(diǎn)做得越來越大,向著變成很多小節(jié)點(diǎn)這種結(jié)構(gòu)上發(fā)展。最后是網(wǎng)絡(luò)上, 就是從SDN,在數(shù)據(jù)中心怎么整合,都是有一個控制平臺。
這是大概今天講的四點(diǎn)內(nèi)容。那么我們芯片做什么東西?三個核心技術(shù),從計(jì)算到儲存到網(wǎng)絡(luò),那么你看業(yè)界做芯片,就是最基礎(chǔ),最頭端的, Marvell是唯一一家這三個都具有的廠商。應(yīng)該說在存儲領(lǐng)域,已經(jīng)做了十代,在以太網(wǎng)交換機(jī)做了第七代,ARM CPU第五代,在網(wǎng)絡(luò)處理器做了第三代。這就是芯片公司為什么跟云有關(guān)系,是因?yàn)槲覀兘⒘巳齻€基礎(chǔ)和臺柱,謝謝大家。[!--empirenews.page--]