本發(fā)明公開了一種基于神經(jīng)網(wǎng)絡(luò)和強化學習的混合能量管理方法,屬于自動化技術(shù)領(lǐng)域。本發(fā)明采用模糊控制器的輸出作為神經(jīng)網(wǎng)絡(luò)初始的離線數(shù)據(jù)集來進行訓練,應(yīng)用學習得到的神經(jīng)網(wǎng)絡(luò)產(chǎn)生新的數(shù)據(jù)加入至原有的數(shù)據(jù)集中,并反復(fù)更迭這兩個過程。針對每個時刻的狀態(tài),采用訓練之后的神經(jīng)網(wǎng)絡(luò)來預(yù)測當前狀態(tài)在采取相應(yīng)動作之后轉(zhuǎn)移到的下一狀態(tài),根據(jù)累計獎勵最大化的原則選擇一定長度的最優(yōu)動作序列,選取動作序列的第一個動作作為當前狀態(tài)的最優(yōu)控制動作。利用該方法可有效減少能量的浪費并且通過超級電容輔助
鋰電池供電,減少了鋰電池的使用,達到了延長鋰電池壽命的目標。
聲明:
“基于神經(jīng)網(wǎng)絡(luò)和強化學習的混合能量管理方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)