一旦在服務器上安裝了客戶端,便會使用此模型配置服務器。 它自動搜索服務器上的所有網(wǎng)卡,然后實時記錄流量和流量,并在標準顯示中將它們記錄如下。
有這個粗略的統(tǒng)計可以幫助運維人員了解服務器的健康情況,但是有時候我們需要更加精細的監(jiān)控,監(jiān)控粒度要精細到某個端口和,比如統(tǒng)計端口,端口以時間為軸的流量變動情況。
或者統(tǒng)計來自和流量的變化情況,甚至更進一步,統(tǒng)計訪問本機端口產(chǎn)生的流量。
這種需求使用基于網(wǎng)卡的監(jiān)控已經(jīng)不足以實現(xiàn),必須使用新方法。
好在網(wǎng)絡流量都會經(jīng)過內(nèi)核模塊,能夠以極高的效率進行協(xié)議數(shù)據(jù)包和流量的統(tǒng)計,在記錄和統(tǒng)計時幾乎不影響系統(tǒng)性能,而且查詢計數(shù)器和清零計數(shù)器也以毫秒為單位。
通過靈活的過濾命令,我們可以像配置防火墻一樣配置我們需要監(jiān)控的流量,然后配合自定義輪訓取值功能,將客戶機統(tǒng)計的結果收集到當中,并繪制形,就可以直觀準確的分析流量了。
首先我們要補充一些知識,這里我就不贅述了,可以看下面這篇文章
大體來說,就是通過在表中添加相關端口和的監(jiān)控條目,然后定時使用命令查看數(shù)據(jù)包的數(shù)量和流量大小,并定期使用命令清空計數(shù)器。
最后就得到每分鐘或每小時某端口的流量了。
我目前設計了兩個場景,一個是統(tǒng)計某服務器端口的流量變化情況,另一個是統(tǒng)計訪問某服務器端口的流量情況,服務器每秒收集一次數(shù)據(jù),并清空計數(shù)器,然后把收集到的數(shù)據(jù)除以,就是平均每秒的流量。
首先我們設置規(guī)則
然后寫一個腳本,用來調(diào)用,獲取當前一段時間統(tǒng)計的流量
|
這個腳本傳入了兩個參數(shù),是取結果的第幾行,一般從第三行開始就是具體規(guī)則統(tǒng)計的信息了,通過上面命令,觀察后得出是第三行和第四行
是來取值的間隔,單位是秒,通過某段時間的流量除以這段時間的長度就得出每秒的流量,返回給。
由于只能由用戶進行調(diào)用,客戶端的用戶為,沒有權限使用,如果不加,調(diào)用時就會報錯
所以要添加,可是用戶并不是想用就可以用的,根據(jù)我另一篇關于權限的博客經(jīng)驗遠程命令權限不足問題解決方法,通過修改文件來使用戶可以使用命令。
方法就是在文件中添加下面一行
另外以上不要忘了把也一并關閉
此時我們就可以在客戶機上測試這個腳本是不是可以正常取到流量值了,單位為
上面就是以用戶運行腳本文件,取結果的第四行中流量值的大小,結果應為正整數(shù),如下
然后需要為設置一個,用于取值,此時我們需要在的配置文件夾中增加一個文件,配置自定義監(jiān)控鍵,我的配置文件夾為,我在里面新建了一個文件名為,內(nèi)容如下
然后我們客戶端的工作就已經(jīng)做好了,此時需要重啟以生效
然后我們登錄服務器,先使用命令查看一下能否成功取到監(jiān)控值
上面就是客戶機的地址,是我們上面客戶機配置文件中配置的,是輸出結果的第三行,對應著表第一條條目監(jiān)控的流量。
是把獲得流量除以,因為我設置秒收集一次并清空計數(shù)器,所以每秒的平均流量就除以,你也可以設置秒或秒,不過太頻繁也沒有必要。
如果能取到正整數(shù),那么我們客戶機配置的沒有問題,如果取不到,可以逐行屏蔽上面的腳本進行調(diào)試。
一般問題容易出在的權限上面。
然后我們就可以到的控制臺增加監(jiān)控項和表了,如下,主要就是設置更新間隔和第幾行,保證更新間隔秒和第二個參數(shù)一致
配置表,如下
主要就是將剛才設置的監(jiān)控項放進去,然后調(diào)整一下坐標軸和線的顏色
配置完成后等待幾分鐘,就可以看到了,如下
如果沒有線出現(xiàn),那么就到的檢測中最新數(shù)據(jù)里查看報錯內(nèi)容,如下
小彩蛋
很多人在監(jiān)控的時候還需要同時監(jiān)控連接情況,尤其是和狀態(tài)的連接數(shù)量,和上面一樣,可以通過腳本并授權用戶獲取
可執(zhí)行腳本文件,第一個參數(shù)為狀態(tài),如
|,|||,|||,|||,|||,|||,|||,||
的監(jiān)控項配置如下
形配置如下
然后就可以查看連接狀態(tài)的效果了
可以明顯的看到,白天時候的連接數(shù)比晚上的多。
而且通過這種方式,可以直觀的看出有沒有連接泄露之后不的連接。。