所描述的是一種使用深度強化學習來生成環(huán)境特征的系統(tǒng)。該系統(tǒng)接收策略網(wǎng)絡架構(gòu)、初始化參數(shù)以及仿真環(huán)境,該仿真環(huán)境是對通過物理環(huán)境的目標系統(tǒng)的軌跡進行建模的。對從策略網(wǎng)絡采樣的地標特征進行初始化,并且通過使用強化學習算法對該策略網(wǎng)絡進行訓練來生成經(jīng)訓練的策略網(wǎng)絡。使用經(jīng)訓練的策略網(wǎng)絡來生成環(huán)境特征集并在顯示設(shè)備上進行顯示。
聲明:
“生成環(huán)境特征的深度強化學習方法以用于計算機視覺系統(tǒng)的漏洞分析與改進性能” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)