配電終端接人數(shù)據(jù)分析在電網(wǎng)運行維護(hù)中的應(yīng)用
引言
截至目前,茂名地區(qū)全市范圍內(nèi)已安裝并投運終端數(shù)目達(dá)2000臺,至"十三五"結(jié)束,要求達(dá)到配網(wǎng)自動化全覆蓋后,終端數(shù)量將達(dá)5000~6000臺。
終端的狀態(tài)數(shù)據(jù)是能最直觀地反映終端質(zhì)量問題的標(biāo)準(zhǔn),當(dāng)終端批量掉線時,若不及時處理,故障將會持續(xù)擴(kuò)大,嚴(yán)重時將影響調(diào)度員監(jiān)盤。
面對部分終端出現(xiàn)異常的情況,如何對終端運行數(shù)據(jù)進(jìn)行統(tǒng)計分析,并快速定位異常終端所在服務(wù)器、所在端口、所在進(jìn)程及所在地區(qū),找到終端發(fā)生異常的規(guī)律,成為相對迫切需要解決的問題。
為進(jìn)一步規(guī)范信息管理,提升監(jiān)控業(yè)務(wù)水平,縮短運維人員對于終端異常的處理時間顯得格外重要。
1研究的意義
由于配電網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,點多面廣,因而對設(shè)備和信息的組織可根據(jù)具體情況采用不同的結(jié)構(gòu),目前,"主站一終端"這種模式應(yīng)用廣泛,適用于配電網(wǎng)絡(luò)規(guī)模較小、信息分散的情況。配電終端是配電自動化系統(tǒng)的基礎(chǔ)單元,其性能與可靠性將直接影響整個系統(tǒng)的有效性。從配電自動化主站端運維方面看,終端掉線主要與終端所在的網(wǎng)絡(luò)環(huán)境、裝置本身以及oCs系統(tǒng)運行情況有關(guān),而導(dǎo)致異常成批出現(xiàn)的原因有多種,例如某地區(qū)信號狀態(tài)差、oCs系統(tǒng)與該終端通信的端口被占用、oCs系統(tǒng)中管理該終端的進(jìn)程假死、終端裝置本身質(zhì)量問題等等。
終端裝置成批出現(xiàn)異常會導(dǎo)致終端在線率嚴(yán)重下跌,嚴(yán)重影響調(diào)度員判斷及監(jiān)盤。當(dāng)終端成批出現(xiàn)異常時,以更直觀的方式統(tǒng)計并展示終端所在的地區(qū)、進(jìn)程、端口及服務(wù)器,能快速讓運維人員知道異常點在哪,對于分析以及處理終端運行情況有非常大的幫助!無論調(diào)度專業(yè)還是自動化專業(yè)都非常需要這種技術(shù)的應(yīng)用。
終端掉線數(shù)據(jù)是體現(xiàn)終端質(zhì)量的重要標(biāo)準(zhǔn)之一,當(dāng)終端掉線情況成批出現(xiàn)時,面對海量的終端運行情況,目前的排查方法僅為通過界面工具一個個排查,因此,工作人員很難從中分析出終端成批掉線的深層原因,很難找到終端成批掉線的源頭。
可視化終端在線工具可深度展現(xiàn)數(shù)據(jù)結(jié)果,并對形成過程進(jìn)行深度挖掘,有助于從現(xiàn)有數(shù)據(jù)中獲得更深層次的信息,使運維人員能夠快速把握其中的異常及關(guān)鍵信息,從而進(jìn)一步對決策產(chǎn)生直接有益的影響。
2配電終端接入數(shù)據(jù)分析的整體架構(gòu)
多維度分析可以更全面地利用已有的終端接入數(shù)據(jù),對終端整體的運行狀況進(jìn)行判斷,提高運維人員面對緊急問題時決策的準(zhǔn)確性和可實施性,讓運維管理人員及時掌握配電終端的性能指標(biāo)、運行狀態(tài)和運行風(fēng)險,同時可提高缺陷分析、診斷的效率和水平,縮短處理時間,準(zhǔn)確對問題進(jìn)行定位并及時進(jìn)行處理。
結(jié)構(gòu)示意圖如圖1所示。
充分利用shell語言的便捷及高效性,對終端接入數(shù)據(jù)進(jìn)行快速分析、呈現(xiàn),并通過系統(tǒng)自帶的Excel軟件,以餅圖、柱狀圖等形式進(jìn)行多維展示,展示顆粒度包括管理服務(wù)器、進(jìn)程、端口、該端口管理終端的在線率、該端口管理終端的網(wǎng)絡(luò)情況,可指定特定端口查詢,并支持人工篩選服務(wù)器。該工具支持在主站系統(tǒng)一區(qū)工作站及安全接入?yún)^(qū)發(fā)布并展示,主要針對運維人員使用。
3終端異常情況分析的應(yīng)用
3.1終端異常的分析
主要針對FTU、DTU類型終端,當(dāng)終端所在地區(qū)基站信號不好或者裝置通信模塊異常時,會導(dǎo)致網(wǎng)絡(luò)狀態(tài)異常,一般分為無ping、無TCP鏈路建立、頻繁中斷三種。
對于無法ping通裝置,這類故障只能現(xiàn)場處理,對于此類終端,可以提取其位置信息和運營商信息,若是同一區(qū)域故障,則很可能為該區(qū)域的運營商基站損壞導(dǎo)致。
無TCP鏈路建立和頻繁中斷則可以先從主站側(cè)找問題,若大多數(shù)異常終端都被同一進(jìn)程管理,則可側(cè)面證明該管理進(jìn)程出現(xiàn)異常。管理進(jìn)程的服務(wù)器同理。通過類似結(jié)果驅(qū)動原因的思路,將能快速定位問題、解決問題。
3.2數(shù)據(jù)抽取規(guī)則
在數(shù)據(jù)抽取的過程中,調(diào)用平臺的內(nèi)存庫接口查詢數(shù)據(jù),如何快速建立關(guān)于通信服務(wù)器到端口以及端口到終端IP的對應(yīng)關(guān)系則為最關(guān)鍵的一步。在配網(wǎng)主站中加入終端的參數(shù)后,會形成一套對應(yīng)關(guān)系,以東方配網(wǎng)主站為例,其為:服務(wù)器一RTU一通道一串行路徑,服務(wù)器、IP和port都能在通道參數(shù)中找到。一個port可對應(yīng)多個終端IP,但在正常情況下一個port只能由一個終端服務(wù)器管理。當(dāng)發(fā)生在線率異常時,主站會在實時庫中更新各終端狀態(tài),從終端服務(wù)器開始到端口到終端的遍歷,即可完成對所有終端狀態(tài)的收集。
對于常規(guī)方法,若要知道配置了某端口的終端在線情況,遍歷一次通道參數(shù)即可完成,但由于多端口遍歷,則檢索時間大大增加。為此,使用map容器技術(shù),在遍歷通道參數(shù)時,分別在內(nèi)存中建立服務(wù)器到端口、端口到終端的map容器,則在做數(shù)據(jù)統(tǒng)計時,可一次獲取所需要的數(shù)據(jù),時間復(fù)雜度從n2直接降到1。使用該算法能夠很好地解決端口多、對應(yīng)關(guān)系復(fù)雜的統(tǒng)計問題,全部數(shù)據(jù)遍歷一遍只需6s。
3.3對端口的終端在線情況進(jìn)行統(tǒng)計
對當(dāng)前時刻的終端在線率信息內(nèi)容,基于"服務(wù)器一進(jìn)程一端口一掉線個數(shù)一總數(shù)一在線率"的平衡式展示邏輯,對抽取的數(shù)據(jù)進(jìn)行展示,最后對異常終端進(jìn)行網(wǎng)絡(luò)和內(nèi)存庫參數(shù)檢查,并列舉所有的異常終端信息,點擊"查詢"即可得到結(jié)果。
統(tǒng)計結(jié)果生成相應(yīng)信息內(nèi)容的詳細(xì)記錄,具體樣式可參考表1。
報表提供結(jié)構(gòu)樹選擇,運維人員可以只選擇自己關(guān)心的端口或進(jìn)程,查詢后就只顯示選定的結(jié)果。報表可以對查詢結(jié)果進(jìn)行不同維度的展示,對于網(wǎng)絡(luò)維度,顯示是網(wǎng)絡(luò)異常還是TCP建立異常:對于在線率,會在端口的維度進(jìn)行分析,讓運維人員實時了解各端口的不同情況。模板如圖2、圖3、圖4所示。
網(wǎng)絡(luò)維度分析分為網(wǎng)絡(luò)異常和TCP建立異常,該類方式可按終端是否能ping通和是否穩(wěn)定建立TCP連接的情況進(jìn)行分類,對于具體端口,在通常情況下,若批量出現(xiàn)無TCP連接且網(wǎng)絡(luò)正常的情況,則很可能為管理該端口的進(jìn)程出現(xiàn)異常。端口維度中,可根據(jù)管理終端的端口對終端在線率進(jìn)行分類,對比總體在線率可直觀地得到哪些端口的在線率整體偏低,可針對性地進(jìn)行整改。服務(wù)器維度中,則是在端口維度的基礎(chǔ)上進(jìn)行再分類,目的是能判斷是否為某服務(wù)器整體出現(xiàn)異常。
4結(jié)語
隨著配網(wǎng)建設(shè)的快速推進(jìn),終端接入數(shù)量也呈現(xiàn)出幾何上升的狀態(tài),對終端數(shù)據(jù)的分析能夠更快速、更靈活、也更全面地展示當(dāng)前終端狀態(tài),對終端根據(jù)端口、進(jìn)程及管理服務(wù)器進(jìn)行分類分析,可快速診斷出異常點,減輕運維人員的運維壓力,再加上在系統(tǒng)運行中積累的數(shù)據(jù)和經(jīng)驗,有利于持續(xù)改進(jìn)配網(wǎng)自動化系統(tǒng)設(shè)計、缺陷管理等工作的水平。