本技術(shù)涉及電網(wǎng)調(diào)度領(lǐng)域或其他相關(guān)領(lǐng)域,具體而言,涉及一種配電網(wǎng)資源的調(diào)度方法、裝置以及電子設(shè)備。
背景技術(shù):
1、在當(dāng)今全球能源轉(zhuǎn)型的背景下,可再生能源廣泛接入,例如分布式光伏電源的大量部署正在重塑配電網(wǎng)的運(yùn)行模式。而隨著氣候變化的持續(xù)影響以及對(duì)清潔、低碳能源的追求,高比例可再生能源并網(wǎng)已成為必然趨勢(shì)。分布式光伏電源的普及,不僅有助于能源的自給自足,也推動(dòng)了能源結(jié)構(gòu)的清潔轉(zhuǎn)型,但如何有效管理源側(cè)的間歇性與負(fù)荷側(cè)的動(dòng)態(tài)性,確保配電網(wǎng)的穩(wěn)定性和效率成為了新的挑戰(zhàn)。
2、光伏電源出力的不確定性主要源自其對(duì)光照條件的高度依賴(lài)性,如云層遮擋、天氣變化等,這些自然因素的隨機(jī)性導(dǎo)致光伏輸出功率無(wú)法準(zhǔn)確預(yù)測(cè)。同樣,用戶側(cè)負(fù)荷的預(yù)測(cè)也變得日益復(fù)雜,由于用戶行為的多樣性、特殊事件的突發(fā)性,特別是智能電器和電動(dòng)汽車(chē)的普及,負(fù)荷需求呈現(xiàn)出明顯的波動(dòng)性和不可預(yù)見(jiàn)性。源荷兩端的不確定性疊加,對(duì)配電網(wǎng)的安全運(yùn)行和調(diào)度策略的有效性構(gòu)成了重大挑戰(zhàn)。傳統(tǒng)配電網(wǎng)調(diào)度方法,如基于確定性優(yōu)化的策略,往往依賴(lài)于精確的預(yù)測(cè)模型,尤其是對(duì)光伏出力和負(fù)荷需求的預(yù)估。然而,現(xiàn)有調(diào)度方法對(duì)光伏出力和負(fù)荷波動(dòng)特性分析不足,導(dǎo)致調(diào)度策略在魯棒性和自適應(yīng)性方面存在缺陷,加劇了調(diào)度的難度和不確定性管理的復(fù)雜度,例如,調(diào)度方案因預(yù)測(cè)偏差而無(wú)法有效平衡供需,導(dǎo)致電網(wǎng)的功率失衡、電壓波動(dòng)、線路過(guò)載等問(wèn)題,影響電網(wǎng)的穩(wěn)定性和可再生能源的消納,同時(shí),過(guò)保守的調(diào)度策略限制了可再生能源的充分利用,從而增加運(yùn)行成本。
3、為應(yīng)對(duì)源荷不確定性,強(qiáng)化學(xué)習(xí)(reinforcement?learning,rl)作為一種通過(guò)與環(huán)境交互學(xué)習(xí)決策策略的方法被應(yīng)用于配電網(wǎng)調(diào)度中,以期通過(guò)學(xué)習(xí)過(guò)程獲得最優(yōu)調(diào)度策略。但現(xiàn)有的方法在處理配電網(wǎng)中源荷的快速波動(dòng)和突變方面能力有限,且在高維狀態(tài)空間中訓(xùn)練效率低,泛化能力不足,難以保障調(diào)度策略在面對(duì)多樣化和極端不確定性時(shí)的性能。
4、針對(duì)相關(guān)技術(shù)中高比例光伏配電網(wǎng)存在魯棒調(diào)度能力低、穩(wěn)定性差的技術(shù)問(wèn)題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)的主要目的在于提供一種配電網(wǎng)資源的調(diào)度方法、裝置以及電子設(shè)備,以解決相關(guān)技術(shù)中高比例光伏配電網(wǎng)存在魯棒調(diào)度能力低、穩(wěn)定性差的技術(shù)問(wèn)題。
2、為了實(shí)現(xiàn)上述目的,根據(jù)本技術(shù)的一個(gè)方面,提供了一種配電網(wǎng)資源的調(diào)度方法。該方法包括:獲取配電網(wǎng)在預(yù)設(shè)時(shí)間段內(nèi)的運(yùn)行數(shù)據(jù)以及氣象數(shù)據(jù),其中,運(yùn)行數(shù)據(jù)至少包括以下之一:光伏數(shù)據(jù)、負(fù)荷值數(shù)據(jù)以及荷電狀態(tài)數(shù)據(jù);將運(yùn)行數(shù)據(jù)和氣象數(shù)據(jù)輸入對(duì)抗博弈模型,輸出調(diào)度動(dòng)作數(shù)據(jù),其中,調(diào)度動(dòng)作數(shù)據(jù)表征配電網(wǎng)的儲(chǔ)能充放電功率調(diào)整策略;基于調(diào)度動(dòng)作數(shù)據(jù)對(duì)配電網(wǎng)的資源進(jìn)行調(diào)度調(diào)整,其中,調(diào)度調(diào)整的方式至少包括以下之一:調(diào)整配電網(wǎng)的儲(chǔ)能充放電功率、協(xié)調(diào)調(diào)度配電網(wǎng)的分布式資源。
3、進(jìn)一步地,對(duì)抗博弈模型包括擾動(dòng)生成器和儲(chǔ)能優(yōu)化判別器,擾動(dòng)生成器包括特征提取層、時(shí)序建模層以及全連接輸出層,將運(yùn)行數(shù)據(jù)和氣象數(shù)據(jù)輸入對(duì)抗博弈模型,輸出調(diào)度動(dòng)作數(shù)據(jù)包括:根據(jù)運(yùn)行數(shù)據(jù)以及氣象數(shù)據(jù)確定狀態(tài)數(shù)據(jù)矩陣;由特征提取層提取狀態(tài)數(shù)據(jù)矩陣中的空間特征,輸出空間特征,其中,特征提取層包括n層子特征提取層,每一子特征提取層關(guān)聯(lián)一個(gè)第一權(quán)重矩陣和一個(gè)第一偏置參數(shù)向量,n為正整數(shù);由時(shí)序建模層對(duì)空間特征進(jìn)行時(shí)序建模,輸出時(shí)序特征,其中,時(shí)序建模層包括y個(gè)子時(shí)序建模層,每一子時(shí)序建模層關(guān)聯(lián)一個(gè)第二權(quán)重矩陣和一個(gè)第二偏置參數(shù)向量,y為正整數(shù);由全連接輸出層根據(jù)預(yù)設(shè)激活函數(shù)對(duì)時(shí)序特征進(jìn)行計(jì)算,輸出擾動(dòng)參數(shù),并將擾動(dòng)參數(shù)輸入儲(chǔ)能優(yōu)化判別器,輸出調(diào)度動(dòng)作數(shù)據(jù)。
4、進(jìn)一步地,儲(chǔ)能優(yōu)化判別器包括隱藏層、輸出層,將擾動(dòng)參數(shù)輸入儲(chǔ)能優(yōu)化判別器,輸出調(diào)度動(dòng)作數(shù)據(jù)包括:將狀態(tài)數(shù)據(jù)矩陣和擾動(dòng)參數(shù)進(jìn)行拼接,得到輸入向量;基于隱藏層的網(wǎng)絡(luò)參數(shù)對(duì)輸入向量進(jìn)行計(jì)算,得到隱藏層數(shù)據(jù)矩陣;獲取預(yù)設(shè)時(shí)間段內(nèi)的k個(gè)候選調(diào)度動(dòng)作數(shù)據(jù),由輸出層根據(jù)隱藏層數(shù)據(jù)矩陣對(duì)k個(gè)候選調(diào)度動(dòng)作數(shù)據(jù)進(jìn)行計(jì)算,得到k個(gè)候選調(diào)度動(dòng)作數(shù)據(jù)的動(dòng)作價(jià)值函數(shù)向量,其中,k為正整數(shù);對(duì)k個(gè)候選調(diào)度動(dòng)作數(shù)據(jù)進(jìn)行篩選,得到動(dòng)作價(jià)值函數(shù)向量最大的候選調(diào)度動(dòng)作數(shù)據(jù),將動(dòng)作價(jià)值函數(shù)向量最大的候選調(diào)度動(dòng)作數(shù)據(jù)確定為調(diào)度動(dòng)作數(shù)據(jù)。
5、進(jìn)一步地,對(duì)抗博弈模型通過(guò)以下方式訓(xùn)練得到:獲取配電網(wǎng)在歷史時(shí)間段的m類(lèi)配電網(wǎng)歷史運(yùn)行數(shù)據(jù)和歷史氣象數(shù)據(jù),并獲取配電網(wǎng)在歷史時(shí)間段的歷史狀態(tài)數(shù)據(jù),其中,m類(lèi)配電網(wǎng)歷史運(yùn)行數(shù)據(jù)至少包括以下之一:配電網(wǎng)拓?fù)鋽?shù)據(jù)、歷史負(fù)荷數(shù)據(jù)、歷史光伏處理數(shù)據(jù)以及儲(chǔ)能系統(tǒng)數(shù)據(jù),歷史狀態(tài)數(shù)據(jù)用于配電網(wǎng)在歷史時(shí)間段運(yùn)行時(shí)的狀態(tài)情況,m為正整數(shù);分別將每類(lèi)配電網(wǎng)歷史運(yùn)行數(shù)據(jù)進(jìn)行預(yù)處理,得到m類(lèi)處理后的運(yùn)行數(shù)據(jù),并將歷史氣象數(shù)據(jù)進(jìn)行預(yù)處理,得到處理后的歷史氣象數(shù)據(jù);將m類(lèi)處理后的運(yùn)行數(shù)據(jù)進(jìn)行標(biāo)幺值轉(zhuǎn)換,得到m類(lèi)轉(zhuǎn)換后的運(yùn)行數(shù)據(jù),并利用歷史狀態(tài)數(shù)據(jù)、m類(lèi)處理后的運(yùn)行數(shù)據(jù)以及處理后的氣象數(shù)據(jù)構(gòu)成樣本集,其中,樣本集包括樣本輸入數(shù)據(jù)和樣本輸出數(shù)據(jù),由m類(lèi)處理后的運(yùn)行數(shù)據(jù)以及處理后的氣象數(shù)據(jù)構(gòu)成樣本輸入數(shù)據(jù),由歷史狀態(tài)數(shù)據(jù)構(gòu)成樣本輸出數(shù)據(jù);利用樣本集對(duì)預(yù)設(shè)對(duì)抗博弈模型進(jìn)行訓(xùn)練,得到對(duì)抗博弈模型,其中,預(yù)設(shè)對(duì)抗博弈模型包括預(yù)設(shè)擾動(dòng)生成器和預(yù)設(shè)儲(chǔ)能優(yōu)化判別器。
6、進(jìn)一步地,利用歷史狀態(tài)數(shù)據(jù)、m類(lèi)處理后的運(yùn)行數(shù)據(jù)以及處理后的氣象數(shù)據(jù)構(gòu)成樣本集包括:從m類(lèi)處理后的運(yùn)行數(shù)據(jù)中提取處理后的歷史負(fù)荷數(shù)據(jù)和處理后的光伏處理數(shù)據(jù),得到第一運(yùn)行數(shù)據(jù);利用小波基函數(shù)對(duì)第一運(yùn)行數(shù)據(jù)進(jìn)行離散小波變換,得到分量向量,其中,小波基函數(shù)用于捕捉第一運(yùn)行數(shù)據(jù)中的時(shí)頻特性,分量向量包括第一分量向量和第二分量向量,第一分量向量的頻率小于第二分量向量的頻率,第一分量向量對(duì)應(yīng)趨勢(shì)性特征,第二分量向量對(duì)應(yīng)波動(dòng)性特征;獲取稀疏自編碼器,利用稀疏自編碼器提取分量向量的分量特征,得到可調(diào)度分量特征和不可控波動(dòng)分量特征;根據(jù)可調(diào)度分量特征、不可控波動(dòng)分量特征、處理后的歷史負(fù)荷數(shù)據(jù)、處理后的光伏處理數(shù)據(jù)、處理后的氣象數(shù)據(jù)構(gòu)建得到樣本輸入數(shù)據(jù),根據(jù)歷史狀態(tài)數(shù)據(jù)構(gòu)建得到樣本輸出數(shù)據(jù)。
7、進(jìn)一步地,利用樣本集對(duì)預(yù)設(shè)對(duì)抗博弈模型進(jìn)行訓(xùn)練,得到對(duì)抗博弈模型包括:由所述預(yù)設(shè)擾動(dòng)生成器根據(jù)所述樣本集中的樣本輸入數(shù)據(jù)輸出擾動(dòng)分布,從所述歷史狀態(tài)數(shù)據(jù)中采樣得到歷史擾動(dòng)分布,并根據(jù)所述擾動(dòng)分布和所述歷史擾動(dòng)分布確定插值擾動(dòng)分布;獲取配電網(wǎng)的懲罰參數(shù),根據(jù)所述擾動(dòng)分布、所述插值擾動(dòng)分布、所述歷史狀態(tài)數(shù)據(jù)以及所述懲罰參數(shù)計(jì)算所述預(yù)設(shè)儲(chǔ)能優(yōu)化判別器的第一損失函數(shù),得到第一損失函數(shù);獲取折扣因子以及網(wǎng)絡(luò)參數(shù),根據(jù)樣本集中的m類(lèi)轉(zhuǎn)換后的運(yùn)行數(shù)據(jù)、折扣因子以及網(wǎng)絡(luò)參數(shù)計(jì)算梯度目標(biāo)值,并根據(jù)折扣因子確定預(yù)設(shè)儲(chǔ)能優(yōu)化判別器的第二損失函數(shù),得到第二損失函數(shù);計(jì)算第一損失函數(shù)和第二損失函數(shù)的和,得到判別器損失函數(shù);獲取預(yù)設(shè)優(yōu)化器,利用預(yù)設(shè)優(yōu)化器以及梯度上升算法確定判別器損失函數(shù)的最小值,得到第一最小損失函數(shù)值;確定第一最小損失函數(shù)值對(duì)應(yīng)的經(jīng)驗(yàn)參數(shù),根據(jù)第一最小損失函數(shù)值對(duì)應(yīng)的經(jīng)驗(yàn)參數(shù)確定判別器網(wǎng)絡(luò)參數(shù),基于判別器網(wǎng)絡(luò)參數(shù)對(duì)預(yù)設(shè)儲(chǔ)能優(yōu)化判別器進(jìn)行模型參數(shù)調(diào)整,得到對(duì)抗博弈模型中的儲(chǔ)能優(yōu)化判別器。
8、進(jìn)一步地,利用樣本集對(duì)預(yù)設(shè)對(duì)抗博弈模型進(jìn)行訓(xùn)練,得到對(duì)抗博弈模型包括:獲取預(yù)設(shè)擾動(dòng)生成器輸出的擾動(dòng)分布;由預(yù)設(shè)擾動(dòng)生成器根據(jù)樣本集計(jì)算擾動(dòng)評(píng)分,基于擾動(dòng)評(píng)分以及擾動(dòng)分布確定預(yù)設(shè)擾動(dòng)生成器的損失函數(shù),得到生成器損失函數(shù);獲取預(yù)設(shè)優(yōu)化器,利用預(yù)設(shè)優(yōu)化器以及梯度下降算法確定生成器損失函數(shù)的最小值,得到第二最小損失函數(shù)值;確定第二最小損失函數(shù)值對(duì)應(yīng)的經(jīng)驗(yàn)參數(shù),根據(jù)第二最小損失函數(shù)值對(duì)應(yīng)的經(jīng)驗(yàn)參數(shù)確定生成器網(wǎng)絡(luò)參數(shù),基于生成器網(wǎng)絡(luò)參數(shù)對(duì)預(yù)設(shè)擾動(dòng)生成器進(jìn)行模型參數(shù)調(diào)整,得到對(duì)抗博弈模型中的擾動(dòng)生成器。
9、為了實(shí)現(xiàn)上述目的,根據(jù)本技術(shù)的另一方面,提供了一種配電網(wǎng)資源的調(diào)度裝置。該裝置包括:獲取單元,用于獲取配電網(wǎng)在預(yù)設(shè)時(shí)間段內(nèi)的運(yùn)行數(shù)據(jù)以及氣象數(shù)據(jù),其中,運(yùn)行數(shù)據(jù)至少包括以下之一:光伏數(shù)據(jù)、負(fù)荷值數(shù)據(jù)以及荷電狀態(tài)數(shù)據(jù);輸入單元,用于將運(yùn)行數(shù)據(jù)和氣象數(shù)據(jù)輸入對(duì)抗博弈模型,輸出調(diào)度動(dòng)作數(shù)據(jù),其中,調(diào)度動(dòng)作數(shù)據(jù)表征配電網(wǎng)的儲(chǔ)能充放電功率調(diào)整策略;調(diào)整單元,用于基于調(diào)度動(dòng)作數(shù)據(jù)對(duì)配電網(wǎng)的資源進(jìn)行調(diào)度調(diào)整,其中,調(diào)度調(diào)整的方式至少包括以下之一:調(diào)整配電網(wǎng)的儲(chǔ)能充放電功率、協(xié)調(diào)調(diào)度配電網(wǎng)的分布式資源。
10、根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),計(jì)算機(jī)存儲(chǔ)介質(zhì)用于存儲(chǔ)程序,其中,程序運(yùn)行時(shí)控制計(jì)算機(jī)存儲(chǔ)介質(zhì)所在的設(shè)備執(zhí)行一種配電網(wǎng)資源的調(diào)度方法。
11、根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種電子設(shè)備,包含一個(gè)或多個(gè)處理器和存儲(chǔ)器;存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)可讀指令,處理器用于運(yùn)行計(jì)算機(jī)可讀指令,其中,計(jì)算機(jī)可讀指令運(yùn)行時(shí)執(zhí)行一種配電網(wǎng)資源的調(diào)度方法。
12、根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)執(zhí)行一種配電網(wǎng)資源的調(diào)度方法。
13、通過(guò)本技術(shù),采用以下步驟:獲取配電網(wǎng)在預(yù)設(shè)時(shí)間段內(nèi)的運(yùn)行數(shù)據(jù)以及氣象數(shù)據(jù),其中,運(yùn)行數(shù)據(jù)至少包括以下之一:光伏數(shù)據(jù)、負(fù)荷值數(shù)據(jù)以及荷電狀態(tài)數(shù)據(jù);將運(yùn)行數(shù)據(jù)和氣象數(shù)據(jù)輸入對(duì)抗博弈模型,輸出調(diào)度動(dòng)作數(shù)據(jù),其中,調(diào)度動(dòng)作數(shù)據(jù)表征配電網(wǎng)的儲(chǔ)能充放電功率調(diào)整策略;基于調(diào)度動(dòng)作數(shù)據(jù)對(duì)配電網(wǎng)的資源進(jìn)行調(diào)度調(diào)整,其中,調(diào)度調(diào)整的方式至少包括以下之一:調(diào)整配電網(wǎng)的儲(chǔ)能充放電功率、協(xié)調(diào)調(diào)度配電網(wǎng)的分布式資源,解決了相關(guān)技術(shù)中高比例光伏配電網(wǎng)存在魯棒調(diào)度能力低、穩(wěn)定性差的技術(shù)問(wèn)題,通過(guò)獲取配電網(wǎng)的運(yùn)行數(shù)據(jù)以及氣象數(shù)據(jù),利用對(duì)抗博弈模型對(duì)其進(jìn)行處理,生成調(diào)度動(dòng)作數(shù)據(jù),基于該數(shù)據(jù)進(jìn)行資源的調(diào)度調(diào)整,進(jìn)而達(dá)到了顯著提高高比例光伏配電網(wǎng)運(yùn)行的穩(wěn)定性和魯棒性的效果。