對一些人來說,本文列舉的云計算故障可能僅僅表明了云服務提供商在哪些方面需要加強或改進,以便更好地服務于客戶。對另一些人來說,這幾個例子可能更事關個人,因為你的數(shù)據(jù)或應用程序說不定實實在在地受到了影響。
我們大多數(shù)人想必已聽說過至少一起引人注目的云計算故障,有些人甚至受到某起云故障事件的直接影響。雖說云技術和安全機制在不斷成熟,但是它們跟內(nèi) 部基礎設施一樣仍飽受同樣幾種問題的影響。不過主要的區(qū)別在于,云故障影響的用戶數(shù)量要比內(nèi)部問題多得多,因而一旦出現(xiàn)了問題,就會更加備受矚目。
困擾云服務提供商的故障往往可以分為下面三大類:
1.服務提供商方面所犯的“新手常犯的錯誤”。如果提供商一開始或發(fā)展的步伐是其數(shù)據(jù)中心人員無法妥善管理的,就會出現(xiàn)這種情況。每家公司以難以置信的速度迅猛發(fā)展時,云計算巨頭(包括亞馬遜網(wǎng)絡服務和谷歌計算)常常在早期就飽受停運事件的困擾。連比其他廠商晚進入云市場的微軟也很早遇到了停運問題,而且常常遇到。
2.黑客最終暴露的安全漏洞。由于相比專用的數(shù)據(jù)中心,云的規(guī)模很龐大,它們也就成了極容易吸引黑客的重大目標。云公司在屢次泄露客戶數(shù)據(jù)的一系列錯誤中汲取了這個教訓。安全泄密事件是云計算客戶最擔心的一大問題;許多企業(yè)組織小心翼翼,不敢將保護數(shù)據(jù)的重任交給第三方服務提供商。
3.云里面的糟糕流程。安全審計不夠到位,備份程序差強人意,管理員對服務器擁有不太適當?shù)脑L問權,諸如此類的流程都是程序上的問題,它們原本可以規(guī)避。遺憾的是,這些非技術性問題通常被人忽視,等到注意時已為時太晚。
對一些人來說,本文列舉的云計算故障可能僅僅表明了云服務提供商在哪些方面需要加強或改進,以便更好地服務于客戶。對另一些人來說,這幾個例子可能 更事關個人,因為你的數(shù)據(jù)或應用程序產(chǎn)不定實實在在地受到了影響。不管怎樣,我們樂意聽到你覺得哪些云故障是最引人注目,原因何在。歡迎留言交流。
AWS停運事件殃及Netflix
Netflix是最早使用亞馬遜AWS云服務的大公司之一。從許多方面來看,Netflix/AWS這對關系再理想不過了:一方面,Netflix 的媒體流服務其發(fā)展速度實在太快了,該公司內(nèi)部的IT資源滿足不了要求;另一方面,零售業(yè)巨擘亞馬遜站在云計算潮流的最前沿,早就準備憑借新的創(chuàng)業(yè)公司 (AWS)引起轟動。遺憾的是,發(fā)生在圣誕節(jié)前夕的Netflix停運事件受到了廣泛抨擊,而且影響了眾多人,以至于這一起事件就恐怕讓整個企業(yè)云潮流后 退了好幾步。
Dropbox任由大門敞開著
Dropbox允許任何人都可以訪問客戶數(shù)據(jù),只要輸入某個客戶的電子郵件地址。根本不需要什么密碼。這個嚴重的安全錯誤是由代碼更新中的一個軟件錯誤引起的,并不是僅僅持續(xù)了幾分鐘,而是持續(xù)了將近四個小時,之后才有所發(fā)覺,并堵住了漏洞。
CloudFlare導致785000個網(wǎng)站癱瘓
一些云服務提供商提供軟件即服務(SaaS)工具,這類工具旨在為客戶的網(wǎng)上業(yè)務確保安全,并改善網(wǎng)站的正常運行時間。有時候就是這樣,理應有助于 改善正常運行時間的SaaS云恰恰起到了適得其反的效果。CloudFlare的所有邊緣路由器同時更新后,就出現(xiàn)了這種情況,同時更新邊緣路由器導致它 們都崩潰。結果,大約785000個客戶網(wǎng)站大概有一個小時沒法正常使用。