本發(fā)明公開(kāi)了一種應(yīng)用于?;翻h(huán)境下多機(jī)器人路徑規(guī)劃方法,屬于機(jī)器人路徑規(guī)劃技術(shù)領(lǐng)域。此方法應(yīng)用于智能機(jī)器人,可以在動(dòng)態(tài)性強(qiáng)的復(fù)雜?;翻h(huán)境下進(jìn)行多機(jī)的全地圖巡檢,并對(duì)特殊事件實(shí)時(shí)編隊(duì)反應(yīng)。該方法的核心算法是好奇心驅(qū)使算法與深度確定性策略梯度相結(jié)合的深度強(qiáng)化學(xué)習(xí)算法,該算法避免了同類(lèi)算法中人工設(shè)計(jì)環(huán)境獎(jiǎng)勵(lì)這一復(fù)雜繁瑣的步驟,而是通過(guò)智能體自身內(nèi)在獎(jiǎng)勵(lì)與稀疏的環(huán)境獎(jiǎng)勵(lì)對(duì)未知復(fù)雜環(huán)境進(jìn)行探索、適應(yīng);同時(shí),多機(jī)器人之間采用多Agent協(xié)作學(xué)習(xí)算法獲得最優(yōu)的協(xié)同工作策略。
聲明:
“應(yīng)用于?;翻h(huán)境下多機(jī)器人路徑規(guī)劃方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)