日期:2018-06-08 點擊: 關鍵詞:監(jiān)控系統(tǒng),機房
數(shù)據(jù)中心機房里的設備成千上萬,對這些設備的運行情況進行監(jiān)控非常必要,比如服務器運行的CPU內(nèi)存參數(shù),網(wǎng)絡設備的端口流量,業(yè)務層面的監(jiān)控等等,設備層面的監(jiān)控就更為復雜了,需要對設備的各種運行參數(shù)比較清楚,因此一般設備的監(jiān)控系統(tǒng)都采用設備廠家提供的監(jiān)控軟件或者標準的第三方軟件來進行管理。
監(jiān)控系統(tǒng),機房
(1)通過這些監(jiān)控軟件,7*24小時對設備運行的各種參數(shù)進行監(jiān)控,一旦發(fā)現(xiàn)有異常就發(fā)出告警。
(2)告警的方式也比較多,可以打印到日志主機上,可以通過短信發(fā)送到運維人員的手機上,也可以通過軟件系統(tǒng)自行嘗試修復。
(3)監(jiān)控的軟件做的是否完善將決定故障出現(xiàn)時,能否給出告警,所以涉及設備的監(jiān)控往往是在不斷完善的過程,很多監(jiān)控參數(shù)都是經(jīng)驗之道,甚至是歷史的教訓,只有通過不斷地改進、優(yōu)化,才能將發(fā)生的風險及時發(fā)現(xiàn),當然要做到所有的故障都可能提前預知、發(fā)現(xiàn),是非常困難的。
(4)有時的故障可能無任何征兆,尤其是硬件故障,會突然出現(xiàn),而往往監(jiān)控系統(tǒng)是無法監(jiān)測到硬件級別的、元器件的故障。