基于用電信息采集特征的竊電行為識(shí)別方法
引言
在供電網(wǎng)絡(luò)中,竊電行為頻頻發(fā)生,對(duì)電力企業(yè)用電管理工作造成了嚴(yán)重影響。竊電行為不僅對(duì)供電企業(yè)造成嚴(yán)重的經(jīng)濟(jì)損失,還可能會(huì)對(duì)供電網(wǎng)絡(luò)埋下諸多安全隱患,威脅人們的生命、財(cái)產(chǎn)安全,電力企業(yè)應(yīng)當(dāng)對(duì)此問(wèn)題予以高度重視,不斷完善竊電行為識(shí)別技術(shù),提高供電效率以及供電質(zhì)量。鑒于此,本文提出了一種基于用電信息采集特征的竊電行為識(shí)別方法。
1基于用電信息采集特征的竊電行為識(shí)別方法設(shè)計(jì)
1.1用電信息采集特征數(shù)據(jù)提取
通過(guò)對(duì)已知竊電用戶信息的采集,對(duì)電壓、電流等數(shù)據(jù)進(jìn)行反向分析,并結(jié)合云KEY技術(shù),構(gòu)建本文設(shè)計(jì)的竊電行為識(shí)別方法的模型指標(biāo)體系。其主要內(nèi)容包括兩大部分,分別是對(duì)竊電特征數(shù)據(jù)的篩選和對(duì)用電異常特征信息數(shù)據(jù)的識(shí)別。
首先要對(duì)獲取到的樣本信息進(jìn)行特征數(shù)據(jù)提取,并將其規(guī)范化處理,設(shè)置特征數(shù)據(jù)取值范圍為-1~1。利用過(guò)濾式算法對(duì)樣本數(shù)據(jù)信息進(jìn)行篩選,針對(duì)每個(gè)不同的初始化特點(diǎn),運(yùn)用特征相關(guān)性,權(quán)衡特征對(duì)分類結(jié)果的重要程度。
假設(shè)竊電行為的類型可分為A1種,非竊電的類別可分為A2種,設(shè)置竊電行為的樣本集為1(n1,A1),(n2,A1),(n3,A1),…,(nk,A1)],再依據(jù)竊電行為的樣本集,將得到的非竊電行為的數(shù)據(jù)建立為正常用電行為特征的數(shù)據(jù)樣本集1(n'1,A2),(n'2,A2),(n'3,A2),…,(n'k,A2)],在集合中的每一個(gè)樣本表示為nk,其中k∈11,2,3,…,K],nk包含g∈11,2,3,…,0]個(gè)特征屬性,首先nk在跟它類型一樣的樣本中找到最近的相鄰樣本nk·nb,并把此樣本當(dāng)作猜對(duì)的鄰近樣本,再由與其不相同的異類樣本中選擇一個(gè)nk.nm作為猜錯(cuò)的近鄰樣本。重復(fù)以上操作步
驟找到K個(gè)樣本中所有的猜中和猜錯(cuò)近鄰樣本,然后針對(duì)特征g計(jì)算出與之相關(guān)的統(tǒng)計(jì)量s,計(jì)算公式為:
通過(guò)公式可以得出,若nk跟猜中的鄰近樣本間的距離愈小,那么跟它猜錯(cuò)的鄰近樣本間的距離則愈大,所以有關(guān)統(tǒng)計(jì)量的值也跟著增大,這表明利用用電信息特征的屬性可對(duì)竊電和非竊電行為進(jìn)行區(qū)分,能夠通過(guò)把數(shù)值s降序排列,設(shè)置閾值,并把統(tǒng)計(jì)量遠(yuǎn)遠(yuǎn)超出閾值的特征樣本進(jìn)行篩選,從而獲取到竊電行為的用電信息特征數(shù)據(jù)。
1.2竊電嫌疑用戶識(shí)別模型構(gòu)建
竊電嫌疑用戶識(shí)別模型是本文設(shè)計(jì)的基于用電信息采集特征的竊電行為識(shí)別方法的核心部分,根據(jù)數(shù)據(jù)處理的原理,結(jié)合云KEY技術(shù),模型構(gòu)建主要分為兩部分,分別為模型訓(xùn)練及模型測(cè)試,具體建構(gòu)流程如圖1所示。
構(gòu)建流程具體可分為+個(gè)步驟:
第1步:根據(jù)上文提取到的用電信息采集特征數(shù)據(jù),選擇比例相等的竊電行為的樣本數(shù)據(jù)跟未竊取的正常行為樣本數(shù)據(jù)當(dāng)作此模型的樣本集,在模型樣本集里隨機(jī)選取閾值對(duì)應(yīng)的比例數(shù)據(jù),構(gòu)建模型的訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集:
第2步:在訓(xùn)練數(shù)據(jù)集當(dāng)中對(duì)用戶的樣本集進(jìn)行重新定義y=1y1,y2,y3,…],設(shè)置特征權(quán)重向量為a=(a1,a2,a3,…),則可得出相應(yīng)的目標(biāo)函數(shù)為/(a)=a×y,將迭代次數(shù)初始化,根據(jù)一定的范圍對(duì)a進(jìn)行隨機(jī)賦值:
第3步:進(jìn)行迭代計(jì)算,得出相應(yīng)的結(jié)果:
第8步:對(duì)目標(biāo)函數(shù)進(jìn)行最優(yōu)求解,并計(jì)算出目標(biāo)函數(shù)的梯度:
第5步:將特征權(quán)重向量a帶入到設(shè)置的目標(biāo)函數(shù)當(dāng)中,并判斷誤差是否符合要求,若通過(guò)計(jì)算得出的結(jié)果符合則返回到第3步中,重復(fù)進(jìn)行迭代求解:若結(jié)果不符合相關(guān)要求,則將本次計(jì)算求得的最優(yōu)化目標(biāo)函數(shù)帶入到第6步當(dāng)中進(jìn)行下一步操作:
第6步:根據(jù)上一步中獲取到的最優(yōu)函數(shù)建立竊電嫌疑用戶識(shí)別模型,通過(guò)對(duì)該模型進(jìn)行測(cè)試,從而獲取到相應(yīng)的測(cè)試數(shù)據(jù)結(jié)果:
第7步:對(duì)上一步中的測(cè)試數(shù)據(jù)結(jié)果進(jìn)行檢測(cè),并且判別是不是滿足有竊電嫌疑的用戶識(shí)別需求,如果不滿足,那么返至第2步中對(duì)特征權(quán)重向量a更新隨機(jī)賦值:若滿足,則進(jìn)行下一步操作:
第8步:完成對(duì)竊電嫌疑用戶識(shí)別模型的構(gòu)建,并將本次更新模型的結(jié)果輸出。
2對(duì)比實(shí)驗(yàn)
為了驗(yàn)證本文設(shè)計(jì)的基于用電信息采集特征的竊電行為識(shí)別方法的可行性和有效性,將該方法與傳統(tǒng)識(shí)別方法進(jìn)行對(duì)比實(shí)驗(yàn)。
2.1實(shí)驗(yàn)準(zhǔn)備
本文基于廣東電網(wǎng)有限責(zé)任公司信息中心課題"云KEY技術(shù)在電力行業(yè)移動(dòng)互聯(lián)網(wǎng)的應(yīng)用"作為背景,建立實(shí)驗(yàn)對(duì)比平臺(tái),并把它當(dāng)作數(shù)據(jù)的基礎(chǔ)來(lái)源。設(shè)定識(shí)別竊電嫌疑用戶包括連接外界系統(tǒng)的輸入/輸出信息,存儲(chǔ)單元包括3個(gè)類型的數(shù)據(jù)庫(kù),分別是信息預(yù)定與存儲(chǔ)輸入信息:測(cè)試結(jié)果及存儲(chǔ)解決方案:數(shù)據(jù)庫(kù)存儲(chǔ)樣本特征。
2.2實(shí)驗(yàn)結(jié)果及分析
為了保證對(duì)比實(shí)驗(yàn)的客觀性,在保證兩種識(shí)別方法除涉及的內(nèi)部條件因素不同外,其他影響因素均相同的情況下完成實(shí)驗(yàn),記錄實(shí)驗(yàn)過(guò)程中產(chǎn)生的相關(guān)數(shù)據(jù)信息,通過(guò)相應(yīng)計(jì)算得出實(shí)驗(yàn)組與對(duì)照組識(shí)別結(jié)果的精確度,如表1所示。
通過(guò)實(shí)驗(yàn)對(duì)本文方法中的模型進(jìn)行不斷訓(xùn)練和優(yōu)化,可以有效提高本文識(shí)別方法的識(shí)別能力。本文在構(gòu)建竊電嫌疑用戶識(shí)別模型時(shí),提高了模型的精準(zhǔn)度和泛化能力,提高了對(duì)竊電行為用戶識(shí)別的精準(zhǔn)度。因此,通過(guò)對(duì)比實(shí)驗(yàn)證明,本文設(shè)計(jì)的識(shí)別方法更加高效、可行。
3結(jié)語(yǔ)
本文通過(guò)實(shí)驗(yàn)證明了所設(shè)計(jì)的識(shí)別方法具有更強(qiáng)的反竊電監(jiān)控預(yù)警能力,有利于電力企業(yè)查處整治竊電行為,維護(hù)用電秩序。但該方法仍存在一定的漏洞和不足,在實(shí)際應(yīng)用中,相關(guān)人員還需根據(jù)具體問(wèn)題進(jìn)行相應(yīng)處理,提高電力企業(yè)的供、用電質(zhì)量。