国产在线一区二区不卡|在线观看中文字幕一区|亚洲中文无码h在线观看|欧美 亚洲 图色 另类|免费人成视频x8x8入口|国产福利观看天堂素人约啪|人妻无码专区一专区二专区三|国产婷婷成人久久AV免费高清

合肥金星智控科技股份有限公司
宣傳

位置:中冶有色 >

有色技術(shù)頻道 >

> 化學(xué)分析技術(shù)

> 基于強(qiáng)化學(xué)習(xí)的目標(biāo)追蹤的訓(xùn)練方法、追蹤方法

基于強(qiáng)化學(xué)習(xí)的目標(biāo)追蹤的訓(xùn)練方法、追蹤方法

904   編輯:管理員   來源:中冶有色技術(shù)網(wǎng)  
2023-03-19 07:00:54
本發(fā)明實(shí)施例公開一種基于強(qiáng)化學(xué)習(xí)的目標(biāo)追蹤的訓(xùn)練方法、追蹤方法。本發(fā)明實(shí)施例的基于強(qiáng)化學(xué)習(xí)的目標(biāo)追蹤訓(xùn)練方法,在傳統(tǒng)ppo算法的策略網(wǎng)絡(luò)損失函數(shù)上增加正則項(xiàng)對(duì)狀態(tài)價(jià)值函數(shù)估計(jì)器網(wǎng)絡(luò)和策略網(wǎng)絡(luò)進(jìn)行訓(xùn)練,強(qiáng)化學(xué)習(xí)的訓(xùn)練過程分為兩個(gè)階段,在第一階段訓(xùn)練強(qiáng)化學(xué)習(xí)前期的策略,在第二階段只采集設(shè)置好的閾值距離之內(nèi)的數(shù)據(jù)進(jìn)行訓(xùn)練,使近距離下的控制更加精確。本發(fā)明利用強(qiáng)化學(xué)習(xí)的方法不需要顯式的預(yù)測未來時(shí)刻目標(biāo)的加速度,只要知道了高速目標(biāo)歷史時(shí)刻的加速度狀態(tài),利用仿真環(huán)境中大量數(shù)據(jù)的訓(xùn)練以及正確的訓(xùn)練方法,可訓(xùn)練出一個(gè)合理的追擊策略。解決了目標(biāo)追蹤的模型給出的加速度波動(dòng)過大以及最終的訓(xùn)練精度不夠的問題。
聲明:
“基于強(qiáng)化學(xué)習(xí)的目標(biāo)追蹤的訓(xùn)練方法、追蹤方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)
分享 0
         
舉報(bào) 0
收藏 0
反對(duì) 0
點(diǎn)贊 0
標(biāo)簽:
化學(xué)分析
全國熱門有色金屬技術(shù)推薦
展開更多 +

 

中冶有色技術(shù)平臺(tái)微信公眾號(hào)
了解更多信息請(qǐng)您掃碼關(guān)注官方微信
中冶有色技術(shù)平臺(tái)微信公眾號(hào)中冶有色技術(shù)平臺(tái)

最新更新技術(shù)

報(bào)名參會(huì)
更多+

報(bào)告下載

第二屆中國微細(xì)粒礦物選礦技術(shù)大會(huì)
推廣

熱門技術(shù)
更多+

衡水宏運(yùn)壓濾機(jī)有限公司
宣傳
環(huán)磨科技控股(集團(tuán))有限公司
宣傳

發(fā)布

在線客服

公眾號(hào)

電話

頂部
咨詢電話:
010-88793500-807
專利人/作者信息登記