本發(fā)明屬于信息技術(shù)領(lǐng)域,公開(kāi)了一種面向MADDPG多智能體強(qiáng)化學(xué)習(xí)模型的可視分析方法,包括如下步驟:步驟1:選取一款合作類(lèi)游戲作為MADDPG模型的運(yùn)行環(huán)境,并定義相關(guān)的參數(shù)集合;步驟2:訓(xùn)練MADDPG模型,保存并計(jì)算重要的中間數(shù)據(jù);步驟3:設(shè)計(jì)標(biāo)簽板,標(biāo)識(shí)智能體和地標(biāo);步驟4:設(shè)計(jì)統(tǒng)計(jì)視圖;步驟5:設(shè)計(jì)評(píng)論家行為視圖,用于評(píng)估模型學(xué)習(xí)得到的評(píng)論家的性能;步驟6:設(shè)計(jì)交互視圖。本發(fā)明提出了一種新的可視分析方法,能支持交互式地分析合作類(lèi)環(huán)境中MADDPG模型的工作流程和內(nèi)部原理。該發(fā)明設(shè)計(jì)了多個(gè)協(xié)同的視圖,從不同角度揭示MADDPG模型的內(nèi)部執(zhí)行機(jī)制。
聲明:
“面向MADDPG多智能體強(qiáng)化學(xué)習(xí)模型的可視分析方法” 該技術(shù)專(zhuān)利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)