本發(fā)明公開了基于深度強(qiáng)化學(xué)習(xí)的服務(wù)機(jī)器人人群感知導(dǎo)航方法及系統(tǒng),包括:獲取智能體的可觀測(cè)狀態(tài)和不可觀測(cè)狀態(tài);所述智能體,包括服務(wù)機(jī)器人和行人;根據(jù)智能體的可觀測(cè)狀態(tài)和不可觀測(cè)狀態(tài),找到服務(wù)機(jī)器人在每個(gè)時(shí)間步的最優(yōu)導(dǎo)航策略,以實(shí)現(xiàn)機(jī)器人在n個(gè)行人之間導(dǎo)航,并在沒有任何碰撞的情況下到達(dá)目標(biāo)所在地;最優(yōu)導(dǎo)航策略以滿足最大化期望累積獎(jiǎng)賞為目標(biāo);所述最優(yōu)導(dǎo)航策略包括服務(wù)機(jī)器人在每個(gè)時(shí)間步的動(dòng)作指令,即在每個(gè)時(shí)間步服務(wù)機(jī)器人需實(shí)現(xiàn)的速度。本發(fā)明能夠有效預(yù)測(cè)行人的未來運(yùn)動(dòng)軌跡,進(jìn)而提升機(jī)器人決策水平,實(shí)現(xiàn)機(jī)器人在人群環(huán)境中的可靠導(dǎo)航。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的服務(wù)機(jī)器人人群感知導(dǎo)航方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)