本公開提供了一種基于自學(xué)習(xí)對話模型的人機對話方法及系統(tǒng);所述方案利用預(yù)定義的角色信息訓(xùn)練一個角色信息記憶網(wǎng)絡(luò),預(yù)測回復(fù)時首先利用角色信息記憶網(wǎng)絡(luò)生成與當(dāng)前語境相關(guān)程度最高的角色信息,并將角色信息輸入到對話生成網(wǎng)絡(luò)中;通過適當(dāng)?shù)厝谌虢巧畔⒏嫌脩糁g的對話習(xí)慣,使模型生成的回復(fù)更加具有個性和多樣性;同時,本公開所述方案將基于馬爾可夫決策過程的強化學(xué)習(xí)方式融入模型的學(xué)習(xí)過程中,對模型的參數(shù)進行微調(diào)和優(yōu)化,利用對話生成的模型初始化兩個學(xué)習(xí)體,讓它們進行多輪的對話探索;隨著學(xué)習(xí)體的探索,每個學(xué)習(xí)體的角色信息記憶選擇網(wǎng)絡(luò)會完善對對方的印象描述,一組成功的對話可以讓對話雙方通過對話的內(nèi)容和對話者的特點增強對對方的了解。
聲明:
“基于自學(xué)習(xí)對話模型的人機對話方法及系統(tǒng)” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)