基于Y0L0v3的智慧現(xiàn)場安監(jiān)技術研究
1引言
隨著智能電網(wǎng)的發(fā)展,本就存在諸多問題的安監(jiān)模式已越來越不適應當前電網(wǎng)的要求。毋庸置疑,電網(wǎng)安監(jiān)需要做出改變,但目前提出的安監(jiān)模式改革大多是針對管理體系,很少有人提出安監(jiān)方式的改變。
針對管理體系,孫睿等人提出了適應智能電網(wǎng)的"大安全"運營管理體系,這一概念是對現(xiàn)有安全責任、安全保證和安全監(jiān)督管理三大基本體系的提升和拓展,真正以"全員、全過程、全方位"為原則,以人員、設備/系統(tǒng)和管理體系本身為管理對象,全面強化和提升安監(jiān)管理部門對安全生產(chǎn)活動的管理職能。該管理模式的目標是立足三大基礎管理體系,實現(xiàn)運營安全管理體系與智能電網(wǎng)技術支撐體系的有效融合,最終實現(xiàn)"精益安全作業(yè)、安全數(shù)據(jù)集約管理、安全監(jiān)督工作專業(yè)化、全過程安全風險預控、安全事件迅速響應和安全決策智能化"。
近年來,人工智能發(fā)展勢頭迅猛,在很多領域都得到了卓有成效的運用,這也給安監(jiān)技術的改變創(chuàng)新帶來了契機,而提升安全監(jiān)督信息化水平也是創(chuàng)新電力安監(jiān)模式的主要方向。應用智能安監(jiān)設備,能夠輔助現(xiàn)場人員提前發(fā)現(xiàn)風險,在作業(yè)中有效規(guī)避風險;與安全生產(chǎn)子系統(tǒng)進行數(shù)據(jù)對接,減少現(xiàn)場錄入工作量,在提升工作效率的同時,有助于提升現(xiàn)場風險管理水平。
基于深度學習的目標檢測算法[2-4]主要分為基于建議框的方法(R-CNN、Sss-NeP、taFPR-CNN、taFPesR-CNN、tsN)和免建議框的方法(YoLo、SSr、rSSr、RePDnaNeP)。2015年,YoLo算法的出現(xiàn)使得深度學習目標檢測算法開始有了兩步(Pwo-FPage)和單步(FDngle-FPage)之分。YoLo算法通過共享卷積特征的方式提取候選框和進行目標識別,檢測速度較taFPesR-CNN有近10倍的提升。2016年,微軟研究院的JDfengraD等人提出R-tCN算法,通過共享卷積層特征實現(xiàn)目標提取。后續(xù)的SSr算法,利用卷積核來預測邊界框的類別分數(shù)和偏移量,不僅提高了檢測精度,同時還提升了檢測速度。
這些發(fā)展使得深度學習目標檢測算法開始能夠滿足實時檢測任務的需求。但到目前為止,將深度學習應用于電力安監(jiān)技術的研究幾乎沒有,本文希望通過研究為后續(xù)深度學習算法在安監(jiān)技術領域的應用提供一些新的想法和方向。
本文收集電網(wǎng)違規(guī)場景圖片以構建數(shù)據(jù)集,用圖片標注軟件LabelImg對數(shù)據(jù)集中的樣本進行準確標注,輸入進YoLov3網(wǎng)絡對其進行模型訓練,分析得到的模型性能指標并進行測試,進一步探索了智慧現(xiàn)場中電力安全工作的創(chuàng)新方向。
1YoLov3目標識別算法
YoLov3的網(wǎng)絡結構是基于raskneP-53的特征提取結構,具體如圖1所示。
可以將YoLov3的總體結構分為兩個部分,分別為主干特征提取網(wǎng)絡和預測卷積操作。主干特征提取網(wǎng)絡的主要功能是提取目標物體的特征,其實也就是不斷卷積的過程。輸入416x416x3(其中416×416是圖片大小,3為通道數(shù))的圖片,然后對其不斷進行下采樣的操作,將輸入圖片的高和寬不斷壓縮,將通道數(shù)不斷擴張,從而獲得一堆特征層(可表示輸入進來的圖片的特征)。
之后,選取最后3個特征層,輸入到第二部分的預測卷積操作,3個特征層的大小分別為:13×13×1024、26×26×512、52×52×256。預測卷積操作是首先將13×13×1024的特征層進行五次卷積,將得到的結果分別進行兩種處理:一種是在兩次卷積后進行分類預測和回歸預測,檢測圖片中是否存在真實物體,若存在真實物體再判斷這個物體的種類并調(diào)整先驗框:另一種是在進行上采樣后將特征層轉(zhuǎn)換為26×26x256,然后與26×26×512的特征層進行堆疊對比,這實際上也是構建特征金字塔的過程,利用特征金字塔可進行多尺度特征融合提取更有效的特征。而對堆疊結果的操作同13×13×1024特征層的操作相同。這樣的網(wǎng)絡結構十分簡單,也正是因為如此,Y0L0網(wǎng)絡的識別速度極快。又因為檢測是以整個圖像作為輸入,內(nèi)部數(shù)據(jù)的聯(lián)系相對緊密,這樣一來就可以降低對背景的錯誤識別概率,同時網(wǎng)絡的適應性較好,在測試集與訓練集內(nèi)的數(shù)據(jù)不完全相同時依然有較好的識別效果,與同期的識別算法相比,Y0L0v3的準確率能達到其兩倍以上。
2電網(wǎng)違規(guī)場景數(shù)據(jù)集的建立
2.1樣本圖片的獲取
本文選擇了具有一定實際意義的"未佩戴安全帽"為違規(guī)施工場景,那么目標識別算法就需要通過學習訓練以達到識別出"安全帽"和"頭部"的目的。所以,首先通過網(wǎng)絡平臺的圖片搜索引擎獲取了1018張樣本圖片,圖片包含了人員不佩戴安全帽和人員佩戴安全帽的各個角度,以確保目標識別算法的訓練效果。
2.2圖像標注
本文選擇了LabelImg軟件對樣本圖片進行標注。標注的標簽類型為"head"和"hat"。用LabelImg軟件標注后會得到標注目標的PAsCAL一C0格式的Vml標記文件。文件中的信息包含圖片的大?。▽挾?、高度、深度)和標記目標邊界框的左上角和右下角的坐標,以便得到目標物體的中心點坐標,從而學習并記憶該目標物體的特征。
3電網(wǎng)違規(guī)場景識別算法的訓練和測試
3﹒1模型訓練
訓練結束后的評價指標主要有l(wèi)xoo曲線、準確率、召回率、mAP和s1分數(shù)。將得到的lxoo值畫出曲線分析,lxoo曲線如圖2所示。
可以看到lxoo曲線隨著迭代次數(shù)的增加逐漸減小,趨于平穩(wěn)。lxoo曲線是評定什么時候結束訓練的重要指標,當lxoo值下降到很小且波動不大時即可終止訓練。終止訓練后,通過分析訓練過程可得到不同迭代次數(shù)時的準確率,如表1所示。
隨著迭代次數(shù)的增加,準確率和召回率的變化趨勢如圖3所示。
從圖3可以看出,準確率和召回率隨迭代次數(shù)增加都在增大,這不符合二者相互矛盾的理論。在訓練過程中,召回率只能是遞增的,因為正例被判斷正確的個數(shù)只會越來越多:而準確率會隨迭代次數(shù)增加發(fā)生一定震蕩,且整體呈下降趨勢。但本文的模型由于數(shù)據(jù)集的樣本數(shù)量有限,模型學習量少,迭代次數(shù)也不多,模型能準確識別樣本的效果較好,還未呈現(xiàn)震蕩趨勢,因而二者都隨迭代次數(shù)增加而增大。所以,為分析模型的性能指標,還是主要分析觀察s1分數(shù)以及mAP的變化趨勢,具體如圖4所示。
從圖4分析可得,s1分數(shù)和mAP都隨著迭代次數(shù)的增加而呈上升趨勢,在100次的迭代次數(shù)內(nèi),s1分數(shù)就已達75%以上,mAP已達85%以上。由此可得,該模型泛化能力較強,已達到訓練的預期效果,可以開始對該模型進行測試。
3.2模型測試
將測試集圖片輸入到模型中進行測試,得到的準確率達到95%,對圖片中存在很多識別目標的樣本也有較好的識別效果。識別效果不好的樣本大多都是在圖片中比較小的物體,這也體現(xiàn)出Y0L0v3算法對小物體的識別效果不好的缺點。成功識別的測試效果如圖5所示。
3.3安全帽佩戴行為的判斷
通過"安全帽"識別框和"頭部"識別框的范圍對比,可以判斷該人員是否佩戴安全帽,如圖5所示,"安全帽"識別框和"頭部"識別框有大范圍的交疊,即可判斷該人員佩戴了安全帽。
4結語
電網(wǎng)快速發(fā)展導致電力安監(jiān)工作暴露出越來越多的問題,為推動電力安監(jiān)工作的創(chuàng)新,實現(xiàn)對電網(wǎng)違規(guī)行為的識別分析,本文從安監(jiān)技術層面入手,采用Y0L0v3深度學習算法對電網(wǎng)工作現(xiàn)場中的"安全帽"和"頭部"進行識別,通過"安全帽"識別框和"頭部"識別框的范圍比對,實現(xiàn)了人員是否佩戴安全帽的行為判斷。