如何查找并修復數(shù)據(jù)中心中的熱點
掃描二維碼
隨時隨地手機看文章
(文章來源:機房360)
數(shù)據(jù)中心中的熱點可能會導致IT設備停機,并可能造成數(shù)據(jù)技失,從而導致企業(yè)數(shù)百萬美元的損失。這就是需要盡快找到并修復所監(jiān)視的數(shù)據(jù)中心中的任何熱點如此重要的原因。為了確保數(shù)據(jù)中心不會遇到問題,需要了解一些有效的熱點檢測和修復技巧。
自動溫度監(jiān)測,當涉及到熱點檢測時,必須隨時了解各個服務器的狀態(tài)。有了自動溫度監(jiān)測,可以不會忽視任何潛在的問題??紤]到熱量自然上升,這些系統(tǒng)的傳感器應安裝在機架頂部附近。此外,它們應安裝在設備入口附近,因為這是熱點成為問題的位置。有了可以監(jiān)測溫度的系統(tǒng),發(fā)生警報時采取措施也很重要。
人工檢查,盡管自動溫度監(jiān)控系統(tǒng)是檢測熱點的最有效方法,但進行人工溫度檢查以確保自動系統(tǒng)正常運行很重要。運營人員需要定期在熱心附近的關鍵區(qū)域進行人工溫度測量,以確保自動系統(tǒng)的傳感器能夠獲取正確的溫度。當然,如果數(shù)據(jù)中心規(guī)模較小,并且無法提供自動溫度監(jiān)控系統(tǒng),則需要進行更頻繁的人工測量。
有效送風,在與熱點的斗爭中,機房空調是最重要的措施。如果沒有高質量的機房空調系統(tǒng),將數(shù)據(jù)中心設備保持在可接受的溫度幾乎是不可能的。但是,只運行機房空調系統(tǒng)并不能防止設備過熱。必須將冷空氣傳送到數(shù)據(jù)中心內(nèi)的關鍵位置,以確保各個服務器上的進氣口能夠獲取所需的冷空氣。如果只是想為整個房間降溫,則進入設備進氣口的空氣不會足夠冷以防止出現(xiàn)熱點。
定期維護,數(shù)據(jù)中心的獨特需求對機房空調系統(tǒng)提出了很高的要求。因此,有時過熱是由空調維護不善引起的??紤]到其幾乎全天候持續(xù)運行,數(shù)據(jù)中心使用的空調必須始終處于高峰運行狀態(tài)。運營人員必須定期清潔過濾器,檢查制冷劑,并對所有設備進行適當潤滑。機空空調效率的任何損失都可能造成災難性的累積后果。
了解狀態(tài),防止數(shù)據(jù)中心過熱的關鍵是不斷了解數(shù)據(jù)中心設施中關鍵指標的狀態(tài)。監(jiān)控溫度,維護機房窗戶系統(tǒng)以及采用人工方法都將對工作人員了解服務器狀態(tài)提供幫助。這樣一來,可以避免許多問題,并且能夠快速發(fā)現(xiàn)并修復出現(xiàn)的任何熱點。