本發(fā)明公開了一種基于用戶體驗分析的深度強化學習式智能門鎖系統(tǒng)及裝置。首先,我們設(shè)計出智能門鎖系統(tǒng)的強化學習模型,并提出改進的線上線下強化學習算法,該算法對用戶體驗質(zhì)量(QoE)分析,通過分析將搜索空間的狀態(tài)?行為對降維;其次,為克服強化學習帶有的延遲獎勵或者懲罰,而影響到后續(xù)學習過程,為此,我們采用帶有臨時記錄功能的資格跡進行信用評分,從而避免強化學習中具有的延遲賞罰的弊端。最后,該算法作為核心模塊,設(shè)計出智能門鎖系統(tǒng)的裝置,從而實現(xiàn)多元化、智能化學習式的開/關(guān)鎖系統(tǒng)。避免了用戶用人臉/指紋/密碼開鎖的費時費心的操作,增強門鎖的智能化和人性化。
聲明:
“基于用戶體驗分析的深度強化學習式智能門鎖系統(tǒng)及裝置” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)