基于多分辨率分析的配網(wǎng)臺(tái)區(qū)戶變關(guān)系辨識(shí)法研究與應(yīng)用
引言
配電網(wǎng)精益化管理是實(shí)現(xiàn)供電企業(yè)提質(zhì)增效的有效措施,其中,正確的戶變關(guān)系是開展配電網(wǎng)精益化管理的前提。當(dāng)前低壓配電網(wǎng)拓?fù)湫畔⒅饕蕾嚾斯や浫?由于歷史記錄丟失、配變擴(kuò)容與線路遷改時(shí)信息更新不及時(shí)等原因,低壓臺(tái)區(qū)檔案混亂,臺(tái)賬中戶變關(guān)系存在不少錯(cuò)誤的情況,嚴(yán)重阻礙了臺(tái)區(qū)故障定位、竊電核查、線損及三相不平衡治理等臺(tái)區(qū)精益化管理工作的開展。因此,研究低壓臺(tái)區(qū)戶變關(guān)系辨識(shí)方法具有理論價(jià)值與現(xiàn)實(shí)意義。
傳統(tǒng)的戶變關(guān)系辨識(shí)方法主要包括人工巡線法、瞬時(shí)停電法、特征信號(hào)法和臺(tái)區(qū)識(shí)別儀法。但上述方法與配電網(wǎng)規(guī)模日趨變大、供電可靠性要求日益提高的發(fā)展趨勢(shì)相矛盾,難以大規(guī)模常態(tài)化開展,弊端日益凸顯。隨著用電采集系統(tǒng)與智能電能表的普及應(yīng)用,海量用戶用電數(shù)據(jù)被廣泛采集,使得利用數(shù)據(jù)挖掘方法實(shí)現(xiàn)低壓臺(tái)區(qū)戶變關(guān)系辨識(shí)成為可能。
文獻(xiàn)指出,具有電氣連接的臺(tái)區(qū)變壓器與低壓用戶的電壓波動(dòng)情況具有相似規(guī)律,提出基于Pearson相關(guān)系數(shù)的戶變關(guān)系辨識(shí)方法。
文獻(xiàn)利用核模糊聚類算法將數(shù)據(jù)映射至高維特征空間完成用戶聚類,并基于進(jìn)化算法完成聚類參數(shù)優(yōu)化,以提高戶變關(guān)系辨識(shí)效果。為進(jìn)一步提高戶變關(guān)系辨識(shí)有效性,部分學(xué)者嘗試在辨識(shí)分析前對(duì)量測數(shù)據(jù)進(jìn)行預(yù)處理。
文獻(xiàn)基于獨(dú)立成分分析提取電壓時(shí)序數(shù)據(jù)特征,并結(jié)合聚類算法完成戶變關(guān)系辨識(shí)。
文獻(xiàn)利用自適應(yīng)分段聚合近似法提取電壓變化特征,并基于改進(jìn)DBsCAN聚類法識(shí)別戶變關(guān)系異常用戶。
綜上所述,現(xiàn)有戶變關(guān)系辨識(shí)方法多從整體角度衡量電壓時(shí)序數(shù)據(jù)間的特征空間距離與形態(tài)相似度,對(duì)時(shí)序數(shù)據(jù)的局部特征細(xì)化不足,未實(shí)現(xiàn)多分辨率特征相似度分析。
針對(duì)上述問題,本文提出了一種基于多分辨率分析的配網(wǎng)臺(tái)區(qū)戶變關(guān)系辨識(shí)法。首先,利用EMD將電壓量測數(shù)據(jù)分解為一系列特征互異的模態(tài)函數(shù),并基于SE度量各子序列的復(fù)雜度,完成相關(guān)序列合并重組:然后,綜合考慮各重組分量的多尺度特征,提出多分辨率距離和相似性測度全面度量電壓時(shí)序數(shù)據(jù)的相似程度,并結(jié)合改進(jìn)K-means算法完成戶變關(guān)系辨識(shí)。算例分析結(jié)果表明,所提多分辨率辨識(shí)法綜合考慮不同分量的細(xì)節(jié)特征,可實(shí)現(xiàn)戶變關(guān)系有效辨識(shí)。
1基于EMD和SE的時(shí)序信號(hào)多分辨率分析
EMD是一種基于多分辨率思想的信號(hào)分解法,可自適應(yīng)分解時(shí)間序列,解耦各特征尺度信息并降低原始時(shí)序數(shù)據(jù)的復(fù)雜度,以實(shí)現(xiàn)對(duì)原始數(shù)據(jù)內(nèi)在規(guī)律、局部特征和變化趨勢(shì)的細(xì)致刻畫。考慮到EMD分解得到的各模態(tài)函數(shù)間存在相關(guān)性,采用SE度量各子序列的復(fù)雜度并完成相似序列合并重組,以強(qiáng)化同類序列的典型特征,并簡化后續(xù)信號(hào)分析的計(jì)算規(guī)模。
1.1基于EMD的時(shí)序信號(hào)多分辨率分解
EMD是由學(xué)者Huang提出的一種基于多分辨率思想的信號(hào)分解法,可將原始信號(hào)自適應(yīng)分解為一系列本征模態(tài)函數(shù)(IntrinsicModeFunction,IMF),細(xì)化表征原始信號(hào)在不同時(shí)間尺度的特性。
EMD具體步驟如下:
(1)尋找原始時(shí)序信號(hào)x(n)的所有極大值和極小值點(diǎn)。
(2)用曲線連接所有極大值點(diǎn),經(jīng)擬合構(gòu)成信號(hào)的上包絡(luò)u(n):用曲線連接所有極小值點(diǎn),經(jīng)擬合構(gòu)成信號(hào)的下包絡(luò)l(n),計(jì)算上下包絡(luò)線的平均值為y(n):
(3)令原始時(shí)序信號(hào)x(n)與平均值y(n)的差值為h(n):
(4)若h(n)不滿足本征模態(tài)函數(shù)的要求,則視h(n)為新的信號(hào)x(n),轉(zhuǎn)至步驟(1):若滿足,則令h(n)為IMF分量。其中,第i個(gè)IMF分量ci(n)表示為:
(5)將原始時(shí)序信號(hào)x(n)與ci(n)差值的剩余分量視為新的信號(hào)x(n),并轉(zhuǎn)至步驟(1),直至得到所有的分量。
由此,原始時(shí)序信號(hào)x(n)經(jīng)EMD分解為K個(gè)IMF分量ci(n)和1個(gè)剩余分量r(n),則x(n)可表示為:
式中:K為IMF分量個(gè)數(shù)。
1.2基于SE的時(shí)序信號(hào)分量重構(gòu)
EMD分解得到的模態(tài)函數(shù)數(shù)目較多且存在一定相關(guān)性,因此,為強(qiáng)化同類序列的典型特征并簡化后續(xù)信號(hào)分析的計(jì)算規(guī)模,本文采用SE度量各子序列的復(fù)雜度,并將各子序列合并重構(gòu)為趨勢(shì)分量、細(xì)節(jié)分量和隨機(jī)分量。
SE是由學(xué)者Richman提出的一種時(shí)序數(shù)據(jù)復(fù)雜度量化指標(biāo),其中,時(shí)序數(shù)據(jù)的樣本嫡越小,表明時(shí)序數(shù)據(jù)的復(fù)雜度越小:時(shí)序數(shù)據(jù)的樣本嫡越大,表明時(shí)序數(shù)據(jù)的復(fù)雜度越大。
SE具體步驟如下:
(1)將經(jīng)EMD分解得到的分量序列:(n)構(gòu)成一組m維的向量序列Zm(1),Zm(2),…,Zm(i),…,Zm(N-m+1)。其中,Zm(i)={:(i),:(i+1),…,:(i+m-1)},1≤i≤N-m+1,N為分量序列的數(shù)據(jù)點(diǎn)數(shù)。
(2)定義向量Zm(i)和Zm(j)間的距離為:
式中:1≤j≤N-m+1且j≠i:0≤a≤m-1。
(3)設(shè)定相似容限1,統(tǒng)計(jì)向量Zm(i)和Zm(j)間距離小于1的個(gè)數(shù)與距離總數(shù)N-m的比值:
(4)求上述比值的平均值:
(5)將序列維度由m維改為m+1維,重復(fù)步驟(1)~(4),計(jì)算得到Bm+1(1)。
(6)當(dāng)N為有限值時(shí),樣本嫡為:
其中,m和1常取值2和0.2std,std為時(shí)序標(biāo)準(zhǔn)差。
若分量的樣本嫡數(shù)值接近,則表示分量相關(guān)性高、融合性好,其產(chǎn)生信號(hào)新模式的概率基本一致,由此,依據(jù)嫡值數(shù)量級(jí)將各分量合并重構(gòu)。其中,樣本嫡為0.01數(shù)量級(jí)的分量合并為趨勢(shì)分量,樣本嫡為0.1數(shù)量級(jí)的分量合并為細(xì)節(jié)分量,樣本嫡為1數(shù)量級(jí)的分量合并為隨機(jī)分量。
式中:7為趨勢(shì)分量:D為細(xì)節(jié)分量:R為隨機(jī)分量。
子序列合并重構(gòu)后,可強(qiáng)化同類序列的典型特征。其中,趨勢(shì)分量7波動(dòng)平緩,反映時(shí)間序列的整體趨勢(shì)特征,具有較小的復(fù)雜度:細(xì)節(jié)分量D波動(dòng)規(guī)律,反映時(shí)間序列的局部細(xì)節(jié)特征:隨機(jī)分量R波動(dòng)隨機(jī),反映時(shí)間序列的隨機(jī)波動(dòng)特征,具有較大的復(fù)雜度。
由此,基于多分辨率分析將原始時(shí)序信號(hào)分解為趨勢(shì)、細(xì)節(jié)和隨機(jī)三類分量,實(shí)現(xiàn)從不同層次細(xì)化信號(hào)多尺度特征。
2基于多分辨率分析的改進(jìn)K-means聚類
2.1K-means聚類
K-means聚類算法利用距離測度度量樣本間相似性,并將樣本分為k個(gè)簇。其中,簇內(nèi)樣本間呈現(xiàn)較高的相似性,而不同簇樣本間呈現(xiàn)較低的相似性。K-means算法流程如下:
(1)在樣本集中隨機(jī)選取k個(gè)初始聚類中心。
(2)計(jì)算所有樣本與k個(gè)聚類中心的距離,將各樣本歸于距離最小的聚類中心所在簇。
(3)所有樣本完成分簇后,令各簇內(nèi)樣本均值為新聚類中心,完成各聚類中心的更新:
式中:μi為簇Ci的聚類中心:x為樣本。
(4)重復(fù)步驟(2)(3),直至誤差函數(shù)收斂,則算法流程結(jié)束:
式中:E為聚類平方誤差。
2.2基于多分辨率分析的改進(jìn)K-means聚類
K-means聚類算法效果受初始聚類中心的影響大,隨機(jī)設(shè)置初始聚類中心難以保證聚類結(jié)果的有效性與穩(wěn)定性。此外,傳統(tǒng)相似性測度僅從整體上度量樣本間相似度,不具備多分辨率分析和多尺度特征刻畫能力,難以體現(xiàn)樣本局部細(xì)節(jié)特征的影響。針對(duì)上述問題,本文提出一種基于多分辨率分析的改進(jìn)K-means聚類算法。
2.2.1初始聚類中心設(shè)置
本文研究低壓用戶與臺(tái)變連接關(guān)系辨識(shí),因此,可將聚類類別數(shù)設(shè)為待分析臺(tái)變數(shù),初始聚類中心設(shè)為各臺(tái)變電壓。
2.2.2多分辨率距離和相似性測度
令電壓序列樣本x的趨勢(shì)分量、細(xì)節(jié)分量和隨機(jī)分量分別為7x、Dx和Rx,則重構(gòu)分量矩陣Mx可表示為:
式中:7jx、Djx和Rjx分別為7x、Dx和Rx的第j個(gè)元素。
綜合考慮趨勢(shì)分量、細(xì)節(jié)分量和隨機(jī)分量的多尺度特征,提出多分辨率距離和多分辨率相似性測度以全面度量電壓時(shí)間序列間的相似性。
2.2.2.1多分辨率距離測度
在計(jì)算樣本x和N的距離時(shí),綜合考慮多分量特征計(jì)算樣本間距離,得到樣本x和N的多分辨率距離計(jì)算公式為:
式中:7jN、DjN和RjN分別為電壓序列樣本N的趨勢(shì)分量、細(xì)節(jié)分量和隨機(jī)分量的第j個(gè)元素。
2.2.2.2多分辨率相似性測度
基于矩陣相似度原理,綜合考慮多分量特征計(jì)算樣本間的相似度,得到樣本x和N的多分辨率相似度計(jì)算公式為:
式中:yxN為樣本x和N的多分辨率相似度:rx(i,j)和rN(i,j)分別為矩陣Mx和MN中i行j列的元素:rEQ \* jc3 \* hps11 \o\al(\s\up 3(和rEQ \* jc3 \* hps11 \o\al(\s\up 3(分別為矩陣Mx和MN中i行的平均值。
3算法流程
本文所提基于多分辨率分析的配網(wǎng)臺(tái)區(qū)戶變關(guān)系辨識(shí)法的算法流程如下:
步驟1:提取低壓用戶電能表電壓數(shù)據(jù)和臺(tái)變低壓側(cè)電壓數(shù)據(jù),將各電壓序列樣本值減去樣本平均值,完成數(shù)據(jù)中心化處理。
步驟2:利用EMD提取電壓序列數(shù)據(jù)的IMF分量和剩余分量,并基于SE重組得到趨勢(shì)分量、細(xì)節(jié)分量和隨機(jī)分量。
步驟3:初始化改進(jìn)K-means聚類算法參數(shù),聚類類別數(shù)k取待分析臺(tái)變數(shù),以各臺(tái)變低壓側(cè)三相電壓平均值為初始聚類中心。
步驟4:由式(l5)計(jì)算出各用戶與k個(gè)聚類中心的電壓時(shí)序數(shù)據(jù)多分辨率距離,將用戶歸類于距離最小的聚類中心所在簇。
步驟5:各用戶完成類別劃分后,令各簇樣本的均值為新聚類中心,并利用EMD和SE分解重組得到新聚類中心的趨勢(shì)分量、細(xì)節(jié)分量和隨機(jī)分量。
步驟6:重復(fù)步驟4、5,直至誤差函數(shù)收斂,則算法流程結(jié)束,完成戶變關(guān)系辨識(shí)。
若采用多分辨率相似性測度,則將步驟4改為:由式(16)計(jì)算出各用戶與k個(gè)聚類中心的電壓時(shí)序數(shù)據(jù)多分辨率相似度,將用戶歸類于相似度最大的聚類中心所在簇。
4算例分析
本文選取廣東某地2個(gè)臺(tái)區(qū)的電壓時(shí)序數(shù)據(jù)開展算例分析。臺(tái)區(qū)A、B共有187個(gè)用戶,用戶電壓數(shù)據(jù)采樣頻率為1h/點(diǎn),選取某4周共28天數(shù)據(jù)進(jìn)行臺(tái)區(qū)戶變關(guān)系辨識(shí)。
4.1臺(tái)區(qū)戶變關(guān)系辨識(shí)
經(jīng)核查,臺(tái)區(qū)A、B的戶變關(guān)系信息正確。為了驗(yàn)證所提戶變關(guān)系辨識(shí)法的計(jì)算效果,隨機(jī)抽取2個(gè)臺(tái)區(qū)共10個(gè)用戶,將其臺(tái)賬檔案調(diào)整至另一臺(tái)區(qū),并選擇8種方法分別進(jìn)行配網(wǎng)臺(tái)區(qū)戶變關(guān)系辨識(shí),對(duì)比不同方法的辨識(shí)效果。其中,方法1和方法2為基于K-means算法的戶變關(guān)系辨識(shí)法,分別采用歐氏距離和皮爾遜相關(guān)系數(shù)度量樣本相似性:方法3和方法4為基于自動(dòng)編碼器和K-means算法的戶變關(guān)系辨識(shí)法,分別采用歐氏距離和皮爾遜相關(guān)系數(shù)度量樣本相似性:方法5和方法6為基于t分布隨機(jī)近鄰嵌入和K-means算法的戶變關(guān)系辨識(shí)法,分別采用歐氏距離和皮爾遜相關(guān)系數(shù)度量樣本相似性:方法7和方法8為基于多分辨率分析和K-means算法的戶變關(guān)系辨識(shí)法,分別采用多分辨率距離和多分辨率相似度度量樣本相似性。8種方法辨識(shí)結(jié)果如表1所示。
觀察表1可知,方法3的辨識(shí)效果略優(yōu)于方法1、2,方法4、6的辨識(shí)效果優(yōu)于方法1、2,而方法7、8分別在基于距離和相似性測度的方法中辨識(shí)效果最優(yōu)。結(jié)果表明,在分析前對(duì)電壓時(shí)序數(shù)據(jù)進(jìn)行特征預(yù)處理有助于提升戶變關(guān)系辨識(shí)效果,且基于多分辨率分析的辨識(shí)法綜合考慮不同分量的細(xì)節(jié)特征,可實(shí)現(xiàn)戶變關(guān)系有效辨識(shí)。此外,由于歐氏距離關(guān)注時(shí)序數(shù)據(jù)在特征空間的絕對(duì)距離,未能有效反映時(shí)序數(shù)據(jù)曲線的形態(tài)與波動(dòng)情況,因此,基于歐氏距離的戶變關(guān)系辨識(shí)法計(jì)算效果整體劣于基于相似性測度的辨識(shí)法。
4.2數(shù)據(jù)長度對(duì)辨識(shí)效果的影響
為分析數(shù)據(jù)長度對(duì)戶變關(guān)系辨識(shí)效果的影響,分別抽取計(jì)算長度為1天、3天、7天、14天和21天的時(shí)序數(shù)據(jù),基于方法7和方法8開展配網(wǎng)臺(tái)區(qū)戶變關(guān)系辨識(shí)。不同時(shí)段的負(fù)荷特征不同,電壓時(shí)序數(shù)據(jù)特征存在差異,因此,采用滑動(dòng)窗形式重復(fù)進(jìn)行戶變關(guān)系辨識(shí),統(tǒng)計(jì)分析數(shù)據(jù)長度對(duì)辨識(shí)效果的影響。
以數(shù)據(jù)長度7天為例說明計(jì)算方式,設(shè)定時(shí)間窗窗寬為7×24個(gè)數(shù)據(jù)點(diǎn),以固定窗寬的滑動(dòng)窗隨機(jī)抽取時(shí)序數(shù)據(jù)進(jìn)行戶變關(guān)系辨識(shí),重復(fù)50次統(tǒng)計(jì)辨識(shí)結(jié)果的平均值,結(jié)果如表2所示。
觀察表2可知,方法7的辨識(shí)準(zhǔn)確率隨數(shù)據(jù)長度的增加呈現(xiàn)先增大、后減小的特點(diǎn),而方法8的辨識(shí)準(zhǔn)確率隨數(shù)據(jù)長度的增加而提高。上述結(jié)果與高維空間距離度量失效有關(guān),即多分辨率距離測度在高維空間無法準(zhǔn)確度量樣本距離。
由表1、表2可知,基于多分辨率相似度的戶變關(guān)系辨識(shí)法計(jì)算效果優(yōu)于基于多分辨率距離的戶變關(guān)系辨識(shí)法。
5結(jié)論
(1)在戶變關(guān)系分析前對(duì)電壓時(shí)序數(shù)據(jù)進(jìn)行特征預(yù)處理有助于提升辨識(shí)效果,且多分辨率辨識(shí)法綜合考慮不同分量的細(xì)節(jié)特征,可實(shí)現(xiàn)戶變關(guān)系有效辨識(shí)。
(2)基于多分辨率相似度的戶變關(guān)系辨識(shí)法準(zhǔn)確率隨數(shù)據(jù)長度的增加而提高,而基于多分辨率距離的戶變關(guān)系辨識(shí)法在高維空間的準(zhǔn)確率降低。
(3)基于多分辨率相似度的戶變關(guān)系辨識(shí)法計(jì)算效果優(yōu)于基于多分辨率距離的戶變關(guān)系辨識(shí)法。