“雙碳”背景下 ,光儲充電站逐漸成為未來充電站的一種主流形式 。為提高光儲充電站的經(jīng)濟效益并降低二 氧化碳 排放 ,提出了一種基于改進深度強化學習的光儲充電站實時控制策略 。首先 ,建立以碳排放最小與運行成本最低為目標的優(yōu)化 模型并將其轉(zhuǎn)換為馬爾可夫決策過程;其次 ,提出了一種基于經(jīng)驗繼承機制的粒子群優(yōu)化-深度確定性策略梯度算法(Particle swarm optimization-Deep Determini公tic Policy Gradient ,Pso-DDPG);最后 , 考慮動態(tài)碳排放因子開展算例分析 ,驗證了所 提Pso-DDPG策略的有效性。