zabbix 監(jiān)控Linux
一旦在服務(wù)器上安裝了客戶(hù)端,便會(huì)使用此模型配置服務(wù)器。 它自動(dòng)搜索服務(wù)器上的所有網(wǎng)卡,然后實(shí)時(shí)記錄流量和流量,并在標(biāo)準(zhǔn)顯示中將它們記錄如下。
有這個(gè)粗略的統(tǒng)計(jì)可以幫助運(yùn)維人員了解服務(wù)器的健康情況,但是有時(shí)候我們需要更加精細(xì)的監(jiān)控,監(jiān)控粒度要精細(xì)到某個(gè)端口和,比如統(tǒng)計(jì)端口,端口以時(shí)間為軸的流量變動(dòng)情況。
或者統(tǒng)計(jì)來(lái)自和流量的變化情況,甚至更進(jìn)一步,統(tǒng)計(jì)訪問(wèn)本機(jī)端口產(chǎn)生的流量。
這種需求使用基于網(wǎng)卡的監(jiān)控已經(jīng)不足以實(shí)現(xiàn),必須使用新方法。
好在網(wǎng)絡(luò)流量都會(huì)經(jīng)過(guò)內(nèi)核模塊,能夠以極高的效率進(jìn)行協(xié)議數(shù)據(jù)包和流量的統(tǒng)計(jì),在記錄和統(tǒng)計(jì)時(shí)幾乎不影響系統(tǒng)性能,而且查詢(xún)計(jì)數(shù)器和清零計(jì)數(shù)器也以毫秒為單位。
通過(guò)靈活的過(guò)濾命令,我們可以像配置防火墻一樣配置我們需要監(jiān)控的流量,然后配合自定義輪訓(xùn)取值功能,將客戶(hù)機(jī)統(tǒng)計(jì)的結(jié)果收集到當(dāng)中,并繪制形,就可以直觀準(zhǔn)確的分析流量了。
首先我們要補(bǔ)充一些知識(shí),這里我就不贅述了,可以看下面這篇文章
大體來(lái)說(shuō),就是通過(guò)在表中添加相關(guān)端口和的監(jiān)控條目,然后定時(shí)使用命令查看數(shù)據(jù)包的數(shù)量和流量大小,并定期使用命令清空計(jì)數(shù)器。
最后就得到每分鐘或每小時(shí)某端口的流量了。
我目前設(shè)計(jì)了兩個(gè)場(chǎng)景,一個(gè)是統(tǒng)計(jì)某服務(wù)器端口的流量變化情況,另一個(gè)是統(tǒng)計(jì)訪問(wèn)某服務(wù)器端口的流量情況,服務(wù)器每秒收集一次數(shù)據(jù),并清空計(jì)數(shù)器,然后把收集到的數(shù)據(jù)除以,就是平均每秒的流量。
首先我們?cè)O(shè)置規(guī)則
然后寫(xiě)一個(gè)腳本,用來(lái)調(diào)用,獲取當(dāng)前一段時(shí)間統(tǒng)計(jì)的流量
|
這個(gè)腳本傳入了兩個(gè)參數(shù),是取結(jié)果的第幾行,一般從第三行開(kāi)始就是具體規(guī)則統(tǒng)計(jì)的信息了,通過(guò)上面命令,觀察后得出是第三行和第四行
是來(lái)取值的間隔,單位是秒,通過(guò)某段時(shí)間的流量除以這段時(shí)間的長(zhǎng)度就得出每秒的流量,返回給。
由于只能由用戶(hù)進(jìn)行調(diào)用,客戶(hù)端的用戶(hù)為,沒(méi)有權(quán)限使用,如果不加,調(diào)用時(shí)就會(huì)報(bào)錯(cuò)
所以要添加,可是用戶(hù)并不是想用就可以用的,根據(jù)我另一篇關(guān)于權(quán)限的博客經(jīng)驗(yàn)遠(yuǎn)程命令權(quán)限不足問(wèn)題解決方法,通過(guò)修改文件來(lái)使用戶(hù)可以使用命令。
方法就是在文件中添加下面一行
另外以上不要忘了把也一并關(guān)閉
此時(shí)我們就可以在客戶(hù)機(jī)上測(cè)試這個(gè)腳本是不是可以正常取到流量值了,單位為
上面就是以用戶(hù)運(yùn)行腳本文件,取結(jié)果的第四行中流量值的大小,結(jié)果應(yīng)為正整數(shù),如下
然后需要為設(shè)置一個(gè),用于取值,此時(shí)我們需要在的配置文件夾中增加一個(gè)文件,配置自定義監(jiān)控鍵,我的配置文件夾為,我在里面新建了一個(gè)文件名為,內(nèi)容如下
然后我們客戶(hù)端的工作就已經(jīng)做好了,此時(shí)需要重啟以生效
然后我們登錄服務(wù)器,先使用命令查看一下能否成功取到監(jiān)控值
上面就是客戶(hù)機(jī)的地址,是我們上面客戶(hù)機(jī)配置文件中配置的,是輸出結(jié)果的第三行,對(duì)應(yīng)著表第一條條目監(jiān)控的流量。
是把獲得流量除以,因?yàn)槲以O(shè)置秒收集一次并清空計(jì)數(shù)器,所以每秒的平均流量就除以,你也可以設(shè)置秒或秒,不過(guò)太頻繁也沒(méi)有必要。
如果能取到正整數(shù),那么我們客戶(hù)機(jī)配置的沒(méi)有問(wèn)題,如果取不到,可以逐行屏蔽上面的腳本進(jìn)行調(diào)試。
一般問(wèn)題容易出在的權(quán)限上面。
然后我們就可以到的控制臺(tái)增加監(jiān)控項(xiàng)和表了,如下,主要就是設(shè)置更新間隔和第幾行,保證更新間隔秒和第二個(gè)參數(shù)一致
配置表,如下
主要就是將剛才設(shè)置的監(jiān)控項(xiàng)放進(jìn)去,然后調(diào)整一下坐標(biāo)軸和線(xiàn)的顏色
配置完成后等待幾分鐘,就可以看到了,如下
如果沒(méi)有線(xiàn)出現(xiàn),那么就到的檢測(cè)中最新數(shù)據(jù)里查看報(bào)錯(cuò)內(nèi)容,如下
小彩蛋
很多人在監(jiān)控的時(shí)候還需要同時(shí)監(jiān)控連接情況,尤其是和狀態(tài)的連接數(shù)量,和上面一樣,可以通過(guò)腳本并授權(quán)用戶(hù)獲取
可執(zhí)行腳本文件,第一個(gè)參數(shù)為狀態(tài),如
|,|||,|||,|||,|||,|||,|||,||
的監(jiān)控項(xiàng)配置如下
形配置如下
然后就可以查看連接狀態(tài)的效果了
可以明顯的看到,白天時(shí)候的連接數(shù)比晚上的多。
而且通過(guò)這種方式,可以直觀的看出有沒(méi)有連接泄露之后不的連接。。