基于譜聚類的退役電池一致性評(píng)估方法研究
引言
隨著國內(nèi)新能源汽車的迅速發(fā)展與普及,大批量新能源汽車上的動(dòng)力電池將達(dá)到使用壽命,面臨退役的問題[1]。若退役電池處理不當(dāng),其中的Ni、Co等重金屬有害物質(zhì)將污染環(huán)境,甚至通過溶解作用,進(jìn)入并危害人體健康[2]。截至2022年底,我國伴隨著新能源汽車報(bào)廢的退役電池總量已達(dá)24.4 GW.h[3]。盡管這些退役電池不能繼續(xù)應(yīng)用在電動(dòng)汽車上,但仍然可以梯次利用在其他領(lǐng)域,如電網(wǎng)側(cè)儲(chǔ)能、低速電動(dòng)車及一些示范項(xiàng)目[4]。梯次利用不僅可以發(fā)揮電池的剩余價(jià)值,還可以降低動(dòng)力電池的全生命周期成本,推動(dòng)電動(dòng)汽車產(chǎn)業(yè)鏈的健全和可持續(xù)發(fā)展[5]。
目前,已有大量學(xué)者在退役動(dòng)力電池梯次利用領(lǐng)域開展研究,主要涉及梯次利用安全管理、篩選成組、實(shí)際應(yīng)用和報(bào)廢回收等[6]。在梯次利用篩選成組方面,文獻(xiàn)[7]提出了一種快速測(cè)試方法,采用融合Canopy的K—means++聚類對(duì)電池進(jìn)行分選;文獻(xiàn)[8]通過分析動(dòng)力電池的交流阻抗譜,提出基于EIS的電池分選策略,分選后的電池組容量衰減率低于常規(guī)方法分選出的電池組;文獻(xiàn)[9]基于模糊理論構(gòu)建了電池綜合評(píng)價(jià)體系,并進(jìn)行重組均衡實(shí)驗(yàn),驗(yàn)證了該方法可行;文獻(xiàn)[10]基于改進(jìn)的DBSCAN聚類方法,對(duì)退役電池進(jìn)行深度配組,有效提高了電池單體間的一致性。
盡管上述文獻(xiàn)通過觀察重組后電池的測(cè)試狀況,驗(yàn)證了其在電池分選中的有效性,但在驗(yàn)證過程中僅考慮了部分參數(shù)如容量、電壓,并沒有測(cè)定完整的電池?cái)?shù)據(jù),且大多選用算法較為傳統(tǒng),仍存在局限性。
譜聚類是一種不需要假設(shè)數(shù)據(jù)形狀、不簡(jiǎn)化實(shí)際問題的聚類算法,不受高維數(shù)據(jù)特征向量奇異性的影響[11]。考慮到退役電池的一致性分選對(duì)于梯次利用的重要意義,本文將對(duì)10節(jié)拆機(jī)18650型動(dòng)力電池進(jìn)行多次測(cè)試,提取相關(guān)特征參數(shù)作為數(shù)據(jù),并視每組數(shù)據(jù)由一個(gè)電池單體產(chǎn)生?;谧V聚類算法和傳統(tǒng)的K—means聚類算法對(duì)數(shù)據(jù)進(jìn)行聚類,構(gòu)建混淆矩陣評(píng)估并對(duì)比同一電池生成的多組數(shù)據(jù)聚成一類的有效性。
1基于機(jī)器學(xué)習(xí)的電池篩選算法
1.1 K—means算法
K—means聚類算法因其復(fù)雜度低,聚類效果較好,已成為目前流行的一種聚類算法。K—means的主要思想是不斷更新各聚類中心而達(dá)到局部最優(yōu)的效果。
K—means算法如表1所示[12]。
盡管K—means聚類算法簡(jiǎn)單、高效,但對(duì)于非凸形狀數(shù)據(jù)聚類效果差,對(duì)于離群點(diǎn)較敏感。因此引入譜聚類算法,進(jìn)行聚類對(duì)比。
1.2譜聚類算法
譜聚類本質(zhì)上是一種基于圖論的聚類算法,它將每個(gè)數(shù)據(jù)視為圖G(V,E)中的點(diǎn),并通過邊的連接關(guān)系來刻畫數(shù)據(jù)點(diǎn)之間的相似度[13]。任意兩個(gè)點(diǎn)連接邊的權(quán)重值與距離成反比,兩點(diǎn)距離越近,權(quán)重值越高。
算法的核心思想是通過對(duì)數(shù)據(jù)圖進(jìn)行切割,使得切割后不同子圖之間的連接邊權(quán)重盡可能低,而子圖內(nèi)的連接邊權(quán)重盡可能高,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的聚類分離。
對(duì)于退役電池?cái)?shù)據(jù),在進(jìn)行一致性分選研究時(shí),一般選取至少三個(gè)維度以上的特征參數(shù),維度較高?;厥盏耐艘垭姵貋碓磸V泛,較大可能有某幾組某一項(xiàng)數(shù)據(jù)與整體偏差較大,對(duì)聚類產(chǎn)生噪聲干擾,影響聚類結(jié)果。而譜聚類能夠有效處理非凸形狀的聚類結(jié)構(gòu),具有較強(qiáng)魯棒性,在處理高維數(shù)據(jù)和噪聲數(shù)據(jù)方面具有一定的優(yōu)勢(shì)。
譜聚類算法如表2所示。
2實(shí)驗(yàn)及數(shù)據(jù)獲取
2.1實(shí)驗(yàn)儀器及樣本
實(shí)驗(yàn)基于搭建的MJS-SP250電池恒溫測(cè)試柜的電池性能評(píng)估系統(tǒng)(圖1),該系統(tǒng)包括核心設(shè)備MJS-SP250電池恒溫測(cè)試柜、chroma數(shù)據(jù)采集器及其可用于獲取、分析和處理實(shí)驗(yàn)數(shù)據(jù)的配套軟件。恒溫測(cè)試柜可以保證在充放電過程中電池的溫度不會(huì)發(fā)生劇烈變化,從而影響數(shù)據(jù)的準(zhǔn)確性或引發(fā)安全問題。chroma數(shù)據(jù)采集器采集頻率為『=1次/s,可采集的數(shù)據(jù)有電壓、電流、電量、總電量和溫度等。
實(shí)驗(yàn)對(duì)象為10節(jié)樂金(LG)INR18650MH1退役電池。電池額定電壓4.2 V,額定容量3 200 mAh。
2.2實(shí)驗(yàn)特征參數(shù)的選取
電池一次充放電實(shí)驗(yàn)的電壓、電流變化如圖2所示。由于各退役電池的初始狀態(tài)如初始電壓、電阻、容量等不盡相同[10],在對(duì)每塊電池進(jìn)行充放電前,需要對(duì)其進(jìn)行放電實(shí)驗(yàn)直至放電截止電壓。因此,充放電實(shí)驗(yàn)中有意義的數(shù)據(jù)范圍從恒流充電開始到恒流放電結(jié)束。本文選用一次標(biāo)準(zhǔn)充放電過程中的恒壓充電時(shí)間T(s)、半小時(shí)電壓降U(V)、恒流放電至放電截止電壓的放電容量Q(mAh)作為實(shí)驗(yàn)特征參數(shù)。
2.3實(shí)驗(yàn)數(shù)據(jù)的獲取
根據(jù)2.2節(jié)中選定的三項(xiàng)特征參數(shù),同時(shí)結(jié)合GB/T 42260—2022《磷酸鐵鋰電化學(xué)性能測(cè)試循環(huán)壽命測(cè)試方法》,制定的實(shí)驗(yàn)過程主要包括恒流充電、恒壓充電、恒流放電及靜置的步驟。具體實(shí)驗(yàn)流程如圖3所示。
單次實(shí)驗(yàn)耗時(shí)約4.5 h,能夠經(jīng)歷一次完整的電池充放電過程,所測(cè)得數(shù)據(jù)更全面。由于電池內(nèi)部的化學(xué)反應(yīng),在靜置過程中會(huì)出現(xiàn)電壓的波動(dòng),因此在每次充電前對(duì)其進(jìn)行放電能夠保證每次測(cè)試的初始狀態(tài)相同,即電池端電壓為2.5 V。
由于電池?cái)?shù)量受限,每節(jié)電池不循環(huán)地重復(fù)10次上述實(shí)驗(yàn)步驟,最終得到100組數(shù)據(jù),將該100組數(shù)據(jù)視作100個(gè)電池單體產(chǎn)生的數(shù)據(jù)。同一電池單體任一時(shí)刻的充放電響應(yīng)理論上是一致的[7],即由各電池產(chǎn)生的10組數(shù)據(jù)可視為一致性最好的梯次利用電池組。
本文將用所研究的譜聚類和主流聚類方法K—means聚類對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行聚類,并根據(jù)已知的聚類結(jié)果對(duì)算法的聚類效果進(jìn)行評(píng)價(jià)。
3實(shí)驗(yàn)結(jié)果
本節(jié)主要比較本文研究的譜聚類算法和主流的K—means算法聚類結(jié)果的差異。在2.3節(jié)提到,考慮到實(shí)驗(yàn)數(shù)據(jù)是由10節(jié)電池各做10次實(shí)驗(yàn)獲取的,在理論上各節(jié)電池10次實(shí)驗(yàn)數(shù)據(jù)的一致性是最強(qiáng)的,故預(yù)先設(shè)定兩種算法的簇?cái)?shù)k=10,構(gòu)造混淆矩陣觀察聚類的結(jié)果與實(shí)際結(jié)果的差異。
3.1譜聚類
3.1.1分類結(jié)果
由于電池?cái)?shù)據(jù)的大小為10×10,將其編號(hào)00、01、…、99,其中尾數(shù)相同的表示同一節(jié)電池的不同實(shí)驗(yàn)數(shù)據(jù)?;趐ython的分類結(jié)果如圖4、表3所示。
從整體上看三維散點(diǎn)圖,數(shù)據(jù)分散,屬非球形狀。通過譜聚類的各簇大小比較均勻,聚類效果較理想。其中,電池編號(hào)#1和電池編號(hào)#8產(chǎn)生的10次數(shù)據(jù)均被完整地分別歸類至簇8和簇5?;趫D論的譜聚類通過特征向量的線性組合表示數(shù)據(jù)間相似性,有能力處理非球形數(shù)據(jù)。同時(shí),盡管從圖中可以看出有少許離群數(shù)據(jù),但在特征向量分解下過濾了冗雜信息,導(dǎo)致離群數(shù)據(jù)也很好地適應(yīng)了簇,并未單獨(dú)成簇。下面通過混淆矩陣進(jìn)一步檢驗(yàn)其聚類效果。
3.1.2構(gòu)建混淆矩陣
根據(jù)表3,可以先確定電池#1——類別8,電池#2——類別9,電池#3——類別3,電池#4——類別1,電池#5——類別4,電池#6——類別7,電池#7——類別6,電池#8——類別5,電池#9——類別2,再確定電池#0——類別0。
已經(jīng)獲得了每個(gè)數(shù)據(jù)的真實(shí)類別和譜聚類的“預(yù)測(cè)”類別,構(gòu)建的混淆矩陣如圖5所示,用于進(jìn)一步分析。
3.1.3數(shù)據(jù)分析
對(duì)于一個(gè)混淆矩陣,常用精準(zhǔn)度(P)、召回率(R)及F1—score(F)來評(píng)判聚類效果的好壞[14]。為計(jì)算上述指標(biāo),有以下4個(gè)定義:
True positive(Tp):把正樣本成功預(yù)測(cè)為正。
True Negative(TN):把負(fù)樣本成功預(yù)測(cè)為負(fù)。
False positive(Fp):把負(fù)樣本錯(cuò)誤地預(yù)測(cè)為正。False Negative(FN):把正樣本錯(cuò)誤地預(yù)測(cè)為負(fù)。精準(zhǔn)度(P)計(jì)算公式:
對(duì)于圖5的混淆矩陣,計(jì)算出的各類別相關(guān)指標(biāo)如表4、圖6所示。
為了綜合分析譜聚類的聚類效果,采用Micro—average方法計(jì)算Micro—precise(MP)、Micro—Recall(MR)、Micro—F1score(MF):
3.2 K—means聚類
3.2.1分類結(jié)果
k—means的聚類結(jié)果三維散點(diǎn)圖如圖7所示。整體上看'有兩簇(cluster 3和cluster 5)只包含單個(gè)數(shù)據(jù)點(diǎn)'聚類效果并不理想。
3.2.2構(gòu)建混淆矩陣
按照3.2.1節(jié)對(duì)k—means聚類結(jié)果構(gòu)建混淆矩陣'如圖8所示。
主對(duì)角線零元素較多'非主對(duì)角元素?cái)?shù)量多'該聚類效果欠佳。
3.2.3數(shù)據(jù)分析
通過k—means聚類計(jì)算出的MP=0.14'遠(yuǎn)差于譜聚類的結(jié)果。
數(shù)據(jù)樣本的形狀可能是凸形'也可能是非凸形狀'譜聚類可以發(fā)現(xiàn)非凸形狀的簇'而k—means聚類假設(shè)數(shù)據(jù)簇為凸形'因此在處理非凸形的數(shù)據(jù)樣本時(shí),K-means的聚類效果會(huì)比譜聚類差。除此之外,若數(shù)據(jù)樣本中存在離群點(diǎn),即噪聲數(shù)據(jù),K-means對(duì)噪聲比較敏感,會(huì)大幅影響聚類效果,而譜聚類具有較好的魯棒性,不易受影響。但是在處理大樣本數(shù)據(jù)時(shí),由于譜聚類的計(jì)算復(fù)雜度高于K-means聚類,其計(jì)算速度會(huì)慢于K-means聚類。
4結(jié)論
針對(duì)退役電池梯次利用的一致性分選問題,本文提供了一種新的解決方案,通過測(cè)試樂金(LG)INR18650MH1電池單次充放電實(shí)驗(yàn)的數(shù)據(jù),基于譜聚類算法,對(duì)100個(gè)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行聚類,并通過外部指標(biāo)構(gòu)建混淆矩陣,驗(yàn)證了譜聚類在退役電池分選中的有效性、可行性。具體工作如下:
1)基于電池的充放電曲線,從靜態(tài)和動(dòng)態(tài)性能兩方面考慮,選取了三項(xiàng)特征指標(biāo):放電容量、恒壓充電時(shí)間和半小時(shí)電壓降,作為后續(xù)分選的重要依據(jù)。
2)依據(jù)選取的三項(xiàng)特征指標(biāo)設(shè)計(jì)實(shí)驗(yàn),在保證采集到精確數(shù)據(jù)的同時(shí),電池完成一輪充放電過程??紤]到電池在使用過程中不循環(huán)充放電,驗(yàn)未采用循環(huán)方式,而采用一次充放電實(shí)驗(yàn),更加貼合實(shí)際情況。
3)基于譜聚類、k-means聚類算法和各樣本中提取出的三項(xiàng)特征指標(biāo)數(shù)據(jù)對(duì)退役電池進(jìn)行分選,譜聚類的簇大小較為均勻,而k-means聚類的簇大小差距較大。由于已知真實(shí)的聚類結(jié)果,本文通過構(gòu)建外部指標(biāo)混淆矩陣來評(píng)價(jià)聚類效果。由混淆矩陣計(jì)算出譜聚類和k-means聚類的準(zhǔn)確率分別為0.69、0.14,譜聚類的聚類結(jié)果更為準(zhǔn)確,也貼近真實(shí)結(jié)果。這表明,譜聚類在小樣本電池?cái)?shù)據(jù)分選中更具優(yōu)勢(shì)。
本文所研究?jī)?nèi)容是基于簇?cái)?shù)指定的情況,對(duì)于未指定具體分類情況的電池分選有待進(jìn)一步探究。