本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的工業(yè)機(jī)器人位姿精度在線補(bǔ)償方法,包括以下步驟:在不同運(yùn)行狀態(tài)下操作機(jī)器人,獲取機(jī)器人的實(shí)際位姿,將所述實(shí)際位姿與理論位姿做誤差運(yùn)算,作為訓(xùn)練集;構(gòu)建深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)模型,確定所述學(xué)習(xí)網(wǎng)絡(luò)的輸入輸出層;完成所述深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)模型的預(yù)訓(xùn)練,訓(xùn)練得到網(wǎng)絡(luò)模型參數(shù);利用訓(xùn)練好的所述深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)模型,在線預(yù)測機(jī)器人的位姿偏差,實(shí)現(xiàn)閉環(huán)的實(shí)時(shí)誤差補(bǔ)償返回,對非系統(tǒng)誤差進(jìn)行在線補(bǔ)償。該方法通過使用兩個(gè)功能不同的網(wǎng)絡(luò)共同實(shí)現(xiàn)機(jī)器人模型與當(dāng)前環(huán)境的交互學(xué)習(xí),動(dòng)態(tài)地調(diào)整控制參數(shù),解決了工業(yè)機(jī)器人的非系統(tǒng)誤差位姿補(bǔ)償問題。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的工業(yè)機(jī)器人位姿精度在線補(bǔ)償方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)