本發(fā)明公開了一種基于深度強(qiáng)化學(xué)習(xí)的無線網(wǎng)絡(luò)擁塞控制方法,屬于無線網(wǎng)絡(luò)資源管理以及強(qiáng)化學(xué)習(xí)領(lǐng)域。該方法包括:無線接入網(wǎng)信息預(yù)測網(wǎng)絡(luò)的初始化和預(yù)訓(xùn)練,獎勵函數(shù)再分配網(wǎng)絡(luò)的初始化和預(yù)訓(xùn)練,動作控制網(wǎng)絡(luò)、價值評價網(wǎng)絡(luò)和表示網(wǎng)絡(luò)的初始化和訓(xùn)練,最后實現(xiàn)無線網(wǎng)絡(luò)擁塞控制。本發(fā)明得到的擁塞控制方法相較于以往的傳統(tǒng)擁塞控制方法,能得到更高的吞吐量和更低的往返時間,并具有更好的公平性。
聲明:
“基于深度強(qiáng)化學(xué)習(xí)的無線網(wǎng)絡(luò)擁塞控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)