本發(fā)明涉及一種基于KL散度優(yōu)化對(duì)數(shù)據(jù)進(jìn)行分類的方法:將原始的圖像、文本等數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,將對(duì)象建模成多維分布;從有標(biāo)簽的訓(xùn)練數(shù)據(jù)中選擇一定量的三元組進(jìn)行模型訓(xùn)練;將所選擇的三元組作為訓(xùn)練數(shù)據(jù),在所有的均值向量上施加一個(gè)線性映射A并通過迭代優(yōu)化學(xué)習(xí)最佳的線性映射,學(xué)習(xí)過程基于度量學(xué)習(xí)的基本假設(shè),即同類樣本之間的距離變小,不同類樣本之間的距離變大;采用一種內(nèi)蘊(yùn)的梯度下降算法進(jìn)行優(yōu)化,將目標(biāo)函數(shù)的梯度投影到同一個(gè)流形的切線空間之后,在給定一個(gè)仿射不變黎曼度量的SPD矩陣的流形上執(zhí)行黎曼梯度下降;計(jì)算測試集與訓(xùn)練集之間的KL散度,采用K近鄰(KNN)分類器對(duì)樣本進(jìn)行分類。本方法能夠有效地提高系統(tǒng)的分類精度,并且擁有更穩(wěn)定的性能。
聲明:
“基于KL散度優(yōu)化的數(shù)據(jù)分類系統(tǒng)與方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)