在一個(gè)實(shí)施方式中,系統(tǒng)使用演員評(píng)判家強(qiáng)化學(xué)習(xí)(RL)模型來(lái)生成開放空間中的ADV的軌跡。系統(tǒng)感知ADV周圍的環(huán)境,包括一個(gè)或多個(gè)障礙物。系統(tǒng)基于感知的環(huán)境將RL算法應(yīng)用于規(guī)劃軌跡的初始狀態(tài),以基于ADV的地圖和車輛控制信息確定ADV達(dá)到多個(gè)軌跡狀態(tài)的多個(gè)控制。系統(tǒng)根據(jù)目標(biāo)目的地狀態(tài)為每個(gè)控制確定通過(guò)RL算法的獎(jiǎng)勵(lì)預(yù)測(cè)。系統(tǒng)通過(guò)最大化獎(jiǎng)勵(lì)預(yù)測(cè)來(lái)從軌跡狀態(tài)生成第一軌跡,以根據(jù)第一軌跡來(lái)自動(dòng)地控制ADV。
聲明:
“規(guī)劃用于自動(dòng)駕駛車輛的開放空間軌跡的在線代理” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)