權(quán)利要求書: 1.考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,其特征在于,包括以下步驟:步驟S1,采集回轉(zhuǎn)窯的工況數(shù)據(jù);
步驟S2,對(duì)熱工信號(hào)進(jìn)行特征提取,轉(zhuǎn)化成用于分類的訓(xùn)練數(shù)據(jù);
步驟S3,對(duì)預(yù)處理后的訓(xùn)練數(shù)據(jù)計(jì)算出核矩陣;
步驟S4,將核矩陣和訓(xùn)練數(shù)據(jù)進(jìn)行ODM訓(xùn)練學(xué)習(xí)得到訓(xùn)練分類器C;
步驟S5,運(yùn)用訓(xùn)練分類器C計(jì)算出訓(xùn)練樣本到分類面的間隔,并計(jì)算出間隔均值;
步驟S6,根據(jù)計(jì)算的間隔和間隔均值,計(jì)算得到保角變換函數(shù);
步驟S7,根據(jù)保角變換函數(shù)對(duì)核函數(shù)進(jìn)行修正,得到新的核矩陣;
步驟S8,使用修正后的核矩陣進(jìn)行ODM訓(xùn)練,得到分類器,可以識(shí)別出燒結(jié)狀態(tài)是正常還是異常,然后采取相關(guān)措施。
2.根據(jù)權(quán)利要求1所述的考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,其特征在于,所述步驟S1中,工況數(shù)據(jù)包括八種熱工信號(hào),包括喂煤速度CF、投原料速度RMF、一次空氣PA、窯尾負(fù)壓NP、窯頭氣體溫度KHT、窯尾氣體溫度KTT、主機(jī)電流MDC和燒結(jié)區(qū)火焰的溫度ST。
3.根據(jù)權(quán)利要求1所述的考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,其特征在于,所述步驟S2的具體過程是:
步驟S2.1,通過下述公式:
其中, 是指加入s個(gè)熱工信號(hào)XD所求得的李普希茨商,L(k)是所有 中第k大的商,s是熱工信號(hào)XD的個(gè)數(shù),XD(i)表示作為輸入的熱工信號(hào)XD中的第i個(gè)數(shù)據(jù),XD(j)表示作為輸入的熱工信號(hào)XD中的第j個(gè)數(shù)據(jù),XD(i?s)表示作為輸入的熱工信號(hào)XD中的第i?s個(gè)數(shù)據(jù),XD(j?s)表示作為輸入的熱工信號(hào)XD中的第j?s個(gè)數(shù)據(jù),XD屬于{CF,RMF,PA,NP,KHT,KTT,MDC,ST}八種熱工信號(hào)之一,XRT(i)、XRT(j)表示作為模型輸出的熱工信號(hào)RT中的第i個(gè)數(shù)據(jù)和第s
j個(gè)數(shù)據(jù),L表示加入s個(gè)熱工信號(hào)XD后,所求得的李普希茨數(shù);
s
隨著熱工信號(hào)XD中的內(nèi)容增加,即增加s,計(jì)算不同s值下的李普希茲數(shù)L ,隨著s值的增s
大,畫出s與李普希茲數(shù)L之間的曲線關(guān)系圖,通過在圖上找出下降轉(zhuǎn)折點(diǎn)、上升轉(zhuǎn)折點(diǎn),找出最后一個(gè)相關(guān)輸入LRI,第一個(gè)相關(guān)輸入FRI和最后一個(gè)相關(guān)輸入LRI之間的時(shí)間段就是該熱工信號(hào)XD的相關(guān)時(shí)段RP;
步驟S2.2,對(duì)熱工信號(hào)進(jìn)行打標(biāo),找出欠燒、過燒和正常三種工況時(shí)刻的數(shù)據(jù),進(jìn)行標(biāo)簽劃分;
步驟S2.3,提取熱工信號(hào)的統(tǒng)計(jì)特征,統(tǒng)計(jì)特征包括平均值特征和趨勢(shì)特征:步驟S2.3.1,提取熱工信號(hào)的平均值特征:通過式(1)計(jì)算相關(guān)時(shí)段RP中各熱工信號(hào)的平均值:其中,MD為熱工信號(hào)XD的平均特征,DR為熱工信號(hào)XD的RP,LDR是DR的長度;
步驟S2.3.2,提取熱工信號(hào)的趨勢(shì)特征;
熱工信號(hào)趨勢(shì)定義為由熱工信號(hào)值線性擬合得到的斜率,線性擬合模型如下:g(tD)=atD+b(2)其中,a和b分別為擬合直線的斜率和截距,tD為熱工信號(hào)XD對(duì)應(yīng)的時(shí)刻;
擬合直線g(tD)與XD之間的誤差通過最小化平均擬合損失來最小化:其中,tD(i)為熱工信號(hào)XD相關(guān)時(shí)段內(nèi)第i個(gè)數(shù)據(jù)對(duì)應(yīng)的時(shí)刻,以相關(guān)時(shí)段起點(diǎn)為0時(shí)刻,XDR(i)為熱工信號(hào)XD相關(guān)時(shí)段內(nèi)的第i個(gè)數(shù)據(jù),斜率a的最優(yōu)值為趨勢(shì)特征,將熱工信號(hào)XD的趨勢(shì)特征表示為AD;
步驟S2.4,提取熱工信號(hào)的動(dòng)態(tài)特征,動(dòng)態(tài)特征包括短時(shí)能量和樣本熵特征:步驟S2.4.1,提取短時(shí)能量特征對(duì)于熱工信號(hào)的短時(shí)能量定義為:
其中,En(t)為t時(shí)刻的短時(shí)能量,w()為窗口函數(shù),Nc為窗口寬度,此處的i表示從t?(Nc?
1)時(shí)刻迭代到t時(shí)刻的一個(gè)迭代變量;
當(dāng)矩形窗口w(n)定義為:
其中,若n時(shí)刻在熱工信號(hào)XD的相關(guān)時(shí)段內(nèi),則w(n)=1,否則為0;
將式(5)代入到式(4)中,RP中熱工信號(hào)的短時(shí)能量ED由下式計(jì)算:步驟S2.4.2,提取樣本熵特征;
對(duì)于時(shí)序熱工信號(hào) 可得到一組按序號(hào)順序排列的m維向量向量Um(i)與Um(j)之間的最大距離定義為:其中,Um(j)為Um向量中的第j個(gè)元素,i,j,k為Um向量中的元素位置;
對(duì)于給定的向量Um(i),滿足{Um(j)|1≤j≤t?m,j≠i}條件的向量Um(i)和Um(j)之間的最大距離不大于給定閾值η的數(shù)表示為Bi,對(duì)于維數(shù)m,兩個(gè)向量匹配m個(gè)點(diǎn)的概率定義為:則該熱工信號(hào)的樣本熵為:
m+1 m
其中,B 為B中m維數(shù)取m+1時(shí)的值,各燒結(jié)狀態(tài)樣本由MD,AD,ED和SED四個(gè)特征組成,RP中各熱工信號(hào)可表示為{MCF,...,MST,...,SECF,...,SEST},由此可以得到訓(xùn)練樣本Xtrain由N個(gè)包含{MCF,...,MST,...,SECF,...,SEST}這些特征的向量組成的一個(gè)矩陣,N為訓(xùn)練樣本個(gè)數(shù)。
4.根據(jù)權(quán)利要求1所述的考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,其特征在于,所述步驟S3的具體過程是:
選擇RBF核作為核函數(shù),根據(jù)式(10)計(jì)算訓(xùn)練樣本的核矩陣K:其中,K(i,j)表示核矩陣K中的第i行j列的元素,Xtrain(i)、Xtrain(j)分別為訓(xùn)練樣本Xtrain中的第i個(gè)樣本和第j個(gè)樣本,σ為RBF核中的參數(shù)。
5.根據(jù)權(quán)利要求4所述的考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,其特征在于,所述步驟S4的具體過程是:
用于判別欠燒、過燒和正常三種狀態(tài)的分類器可以表示為 即訓(xùn)練數(shù)據(jù)通過映射函數(shù) 映射到RBF核空間后,由分類器進(jìn)行分離,其中y表示訓(xùn)練樣本標(biāo)簽, 表示實(shí)際訓(xùn)練樣本空間到RBF核空間的映射函數(shù),映射函數(shù)與核矩陣的關(guān)系為xi為Xtrain的第i個(gè)訓(xùn)練樣本的特征向量,xj為Xtrain的第j個(gè)訓(xùn)練樣本的特征向量,T表示ω向量的轉(zhuǎn)置,(xi,yi)樣本的邊際定義為:其中,f()表示計(jì)算間隔關(guān)于xi的函數(shù),γi中定義(xi,yi)樣本的間隔,xi為Xtrain的第i個(gè)訓(xùn)練樣本的特征向量,yi為Xtrain中的第i個(gè)訓(xùn)練樣本的標(biāo)簽;
間隔均值表示為:
其中,ω為線性分類器中的系數(shù);然后通過計(jì)算每個(gè)樣本的間隔與間隔均值之間的差值,得到間隔方差如下:
yi為Xtrain中的第i個(gè)訓(xùn)練樣本的標(biāo)簽,N為訓(xùn)練樣本個(gè)數(shù);
考慮到間隔均值和間隔方差的計(jì)算效率較低,通過縮放將邊緣均值設(shè)置為1,通過最小化邊際方差,優(yōu)化邊際分布,表示ODM的目標(biāo)函數(shù)為:其中,ξi、εi分別為xi樣本的間隔與間隔均值的下界偏差、xi樣本的間隔與間隔均值的上界偏差,S為ODM的稀疏參數(shù),決定哪些樣本是支持向量,C1和C2為懲罰參數(shù),C1和C2分別控制ξi和εi在目標(biāo)函數(shù)中的權(quán)重,C1作為分類器間隔下界錯(cuò)分的懲罰,C2作為分類器間隔上界錯(cuò)分的懲罰,N為訓(xùn)練樣本個(gè)數(shù);
得到了ODM分類器凸函數(shù)形式,進(jìn)行ODM訓(xùn)練,ODM訓(xùn)練輸入是訓(xùn)練樣本Xtrain和訓(xùn)練樣本標(biāo)簽y,輸出是計(jì)算Xtrain間隔的函數(shù)f()。
6.根據(jù)權(quán)利要求1所述的考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,其特征在于,所述步驟S5的具體過程是:
當(dāng)ODM學(xué)習(xí)訓(xùn)練結(jié)束后,將每個(gè)回轉(zhuǎn)窯數(shù)據(jù)樣本代入式(15)中即可求出樣本到分類面的間隔:
其中,Xtrain(j)為第j個(gè)訓(xùn)練樣本,Xtrain(i)為第i個(gè)訓(xùn)練樣本,yj為Xtrain中的第j個(gè)訓(xùn)練樣本的標(biāo)簽,yi為Xtrain中的第i個(gè)訓(xùn)練樣本的標(biāo)簽,K(Xtrain(i),Xtrain(j))為K核矩陣中訓(xùn)練樣本Xtrain(i)對(duì)應(yīng)的行和訓(xùn)練樣本Xtrain(j)對(duì)應(yīng)列的元素,α為訓(xùn)練后得到的分類面系數(shù),f(x)表示計(jì)算間隔關(guān)于x的函數(shù);
之后根據(jù)式(16)計(jì)算間隔均值:其中,為間隔均值,∑f(Xtrain(i))為所有訓(xùn)練樣本間隔之和,N為訓(xùn)練樣本個(gè)數(shù)。
7.根據(jù)權(quán)利要求1所述的考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,其特征在于,所述步驟S6中,計(jì)算保角變換函數(shù)具體步驟為:其中,S是ODM的稀疏參數(shù),f(Xtrain)和 分別表示間隔和間隔均值,Kn和Kf為特征空間中控制不同區(qū)域體積膨脹系數(shù)的懲罰參數(shù),Kn控制 區(qū)域內(nèi)的體積膨脹,Kf控制 區(qū)域內(nèi)的體積膨脹,e為自然常數(shù),NIR為訓(xùn)練樣本的不平衡比IR,控制不同標(biāo)簽樣本的空間膨脹系數(shù)定義為:+ ? + ?
其中,Xtrain表示訓(xùn)練樣本,X為多數(shù)類樣本,X為少數(shù)類樣本,n 和n 分別表示多數(shù)樣本個(gè)數(shù)和少數(shù)樣本個(gè)數(shù),多數(shù)類樣本為正常燒結(jié)狀態(tài)樣本,少數(shù)類樣本為過燒和欠燒燒結(jié)狀態(tài)樣本。
8.根據(jù)權(quán)利要求1所述的考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,其特征在于,所述步驟S7包括:
T
求得向量d=(d1,d2,...,dN) 表示由公式(17)計(jì)算得到的一個(gè)N維向量,di=D(Xtrain(i)),i=1,…,N,當(dāng)i=1,…,N時(shí),di表示N維向量d中的d1,d2,...,dN個(gè)元素,N為訓(xùn)練樣本T T
個(gè)數(shù),dd 是d與d的矩陣相乘,結(jié)果是一個(gè)N行N列的正(半)定矩陣,修正后的新核矩陣由下T
列矩陣形式保角變換公式求得,為dd和K組成的一個(gè)哈達(dá)瑪積:T
Knew=dd*K(19)其中,Knew為通過保角變換修正后的新的核矩陣。
9.根據(jù)權(quán)利要求5所述的考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,其特征在于,所述步驟S8包括:將Knew替換步驟S3中公式(10)計(jì)算得到的核矩陣K,再進(jìn)行ODM訓(xùn)練,可以得到分類器 重復(fù)進(jìn)行步驟S3?S7兩遍,訓(xùn)練出兩個(gè)分類器,第一次訓(xùn)練將欠燒和過燒的樣本標(biāo)簽設(shè)為1,正常樣本標(biāo)簽設(shè)為?1,得到分類器一;第二次訓(xùn)練將正常樣本剔除,在欠燒和過燒之間訓(xùn)練分類器;將欠燒樣本標(biāo)簽設(shè)為1,過燒樣本設(shè)為?1,得到分類器二;通過兩個(gè)分類器,特征提取后熱工信號(hào)的數(shù)據(jù)的燒結(jié)狀態(tài)可以得到有效的識(shí)別,將特征提取后熱工信號(hào)的數(shù)據(jù)替換掉分類器中的Xtrain,求出對(duì)應(yīng)的樣本標(biāo)簽,先通過分類器一識(shí)別出燒結(jié)狀態(tài)是正常還是異常,若為異常燒結(jié)狀態(tài),再通過分類器二判斷出是欠燒還是過燒,采取相關(guān)措施。
說明書: 考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法技術(shù)領(lǐng)域[0001] 本發(fā)明主要涉及回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別技術(shù)領(lǐng)域,特別是涉及一種核修正和最優(yōu)間隔分布的類別不均衡分類方法。
背景技術(shù)[0002] 回轉(zhuǎn)窯是廣泛應(yīng)用于鋼鐵、電力、水泥等領(lǐng)域的核心生產(chǎn)設(shè)備?;剞D(zhuǎn)窯的燒結(jié)狀態(tài)直接影響熟料質(zhì)量。以
氧化鋁回轉(zhuǎn)窯為例,回轉(zhuǎn)窯燒結(jié)主要有正常燒結(jié)、欠燒燒結(jié)和過燒燒
結(jié)三種燒結(jié)狀態(tài)。欠燒和過燒是不正常的狀態(tài)。在欠燒狀態(tài)下,原料熔化不充分,導(dǎo)致后期
冶煉過程中氧化鋁提取不完全。熟料在過燒的情況下,會(huì)產(chǎn)生粘性,容易結(jié)塊,不利于破碎
和冶煉。另外,過熱會(huì)對(duì)耐火材料造成損傷,增加回轉(zhuǎn)窯的維護(hù)成本。燒結(jié)狀態(tài)的準(zhǔn)確判斷
和識(shí)別對(duì)保證安全生產(chǎn)和提高生產(chǎn)效率至關(guān)重要,控制系統(tǒng)采取適當(dāng)?shù)拇胧﹣砭S持正常生
產(chǎn)也是前提。
[0003] 燒結(jié)狀態(tài)識(shí)別(SCR)一直不是一項(xiàng)簡單的工作。物理測(cè)量設(shè)備測(cè)得的溫度是控制回轉(zhuǎn)窯的一個(gè)重要指標(biāo)。然而,僅僅通過溫度來估計(jì)燒結(jié)狀態(tài)是不夠的。例如,在正常燒結(jié)
狀態(tài)下,氧化鋁回轉(zhuǎn)窯的火焰溫度(ST)會(huì)根據(jù)材料組成或供煤值等諸多復(fù)雜因素變化,在
1000℃到1300℃之間。另外,由于回轉(zhuǎn)窯延遲大,溫度變化一般滯后于燒結(jié)狀態(tài)的變化,氧
化鋁回轉(zhuǎn)窯的燒結(jié)溫度不能及時(shí)反映當(dāng)前燒結(jié)狀態(tài)。
[0004] 由于燒結(jié)過程涉及復(fù)雜的物理和化學(xué)反應(yīng),回轉(zhuǎn)窯的機(jī)理模型難以建立。事實(shí)上,在大多數(shù)燃煤工業(yè)領(lǐng)域,燒結(jié)狀態(tài)是由操作人員根據(jù)經(jīng)驗(yàn)通過工藝數(shù)據(jù)的變化來判斷的。
近年來,利用現(xiàn)場(chǎng)工藝數(shù)據(jù)對(duì)燒結(jié)狀態(tài)或相關(guān)參數(shù)進(jìn)行自動(dòng)識(shí)別的研究很多?;剞D(zhuǎn)窯燒結(jié)
狀態(tài)識(shí)別的過程場(chǎng)數(shù)據(jù)包括火焰圖像和熱信號(hào)?;诨鹧鎴D像的方法以其直觀、快速的特
點(diǎn)在燒結(jié)狀態(tài)識(shí)別中占有重要的地位。研究人員提取了各種視覺特征,并開發(fā)了基于火焰
圖像的分類器。但在煤粉場(chǎng)中,煙塵干擾會(huì)造成圖像的破壞,嚴(yán)重影響算法的精度。與此同
時(shí),許多研究人員分析了熱信號(hào)的特性,并利用軟計(jì)算技術(shù)對(duì)燒結(jié)狀態(tài)識(shí)別進(jìn)行了研究。通
過建立了預(yù)測(cè)模型,并根據(jù)實(shí)際與預(yù)測(cè)值的差值確定了燒結(jié)狀態(tài)。這在利用熱信號(hào)識(shí)別燒
結(jié)狀態(tài)方面也取得了良好的性能。
[0005] 上述數(shù)據(jù)驅(qū)動(dòng)方法在燒結(jié)狀態(tài)識(shí)別方面取得了很大的成就。但是,由于異常情況發(fā)生的概率遠(yuǎn)遠(yuǎn)小于正常情況發(fā)生的概率,因此采集到的工業(yè)數(shù)據(jù)通常是類別不平衡的,
現(xiàn)有的方法通常忽略了這一點(diǎn)。在類別不平衡的情況下,識(shí)別模型的學(xué)習(xí)分隔符總是傾向
于少數(shù)類,這使得識(shí)別模型的泛化性能和異常狀態(tài)的識(shí)別精度下降。在回轉(zhuǎn)窯現(xiàn)場(chǎng),對(duì)異常
情況的誤判可能會(huì)導(dǎo)致一系列的誤操作,造成嚴(yán)重的后果。例如,當(dāng)過燒狀態(tài)被誤判為欠燒
狀態(tài)時(shí),控制系統(tǒng)可能會(huì)進(jìn)行一系列與欠燒狀態(tài)相對(duì)應(yīng)的操作,如增加輸煤量,導(dǎo)致燒結(jié)區(qū)
溫度不斷升高,從而降低熟料質(zhì)量,破壞設(shè)備。回轉(zhuǎn)窯類別不平衡數(shù)據(jù)的存在,對(duì)燒結(jié)狀態(tài)
識(shí)別模型的設(shè)計(jì)提出了挑戰(zhàn)。
發(fā)明內(nèi)容[0006] 本發(fā)明實(shí)施例的目的在于提供一種考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,針對(duì)現(xiàn)有技術(shù)沒有考慮到回轉(zhuǎn)窯燒結(jié)狀態(tài)存在數(shù)據(jù)類別不均衡,從而造成燒結(jié)狀態(tài)在異常
狀態(tài)下識(shí)別精度低,泛化性能差的問題。
[0007] 為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,包括以下步驟:
[0008] 步驟S1,采集回轉(zhuǎn)窯的工況數(shù)據(jù);[0009] 步驟S2,對(duì)熱工信號(hào)進(jìn)行特征提取,轉(zhuǎn)化成用于分類的訓(xùn)練數(shù)據(jù);[0010] 步驟S3,對(duì)預(yù)處理后的訓(xùn)練數(shù)據(jù)計(jì)算出核矩陣;[0011] 步驟S4,將核矩陣和訓(xùn)練數(shù)據(jù)進(jìn)行ODM訓(xùn)練學(xué)習(xí)得到訓(xùn)練分類器C;[0012] 步驟S5,運(yùn)用訓(xùn)練分類器C計(jì)算出訓(xùn)練樣本到分類面的間隔,并計(jì)算出間隔均值;[0013] 步驟S6,根據(jù)計(jì)算的間隔和間隔均值,計(jì)算得到保角變換函數(shù);[0014] 步驟S7,根據(jù)保角變換函數(shù)對(duì)核函數(shù)進(jìn)行修正,得到新的核矩陣;[0015] 步驟S8,使用修正后的核矩陣進(jìn)行ODM訓(xùn)練,得到分類器,可以識(shí)別出燒結(jié)狀態(tài)是正常還是異常,然后采取相關(guān)措施。
[0016] 與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)在于:[0017] (1)本發(fā)明將熱工信號(hào)中的統(tǒng)計(jì)特征和動(dòng)態(tài)特征相結(jié)合,動(dòng)態(tài)特征的引入使燒結(jié)狀態(tài)描述更加全面,可以有效提高燒結(jié)狀態(tài)樣品的可分性,并且能夠有效的解決了回轉(zhuǎn)窯
熱工數(shù)據(jù)強(qiáng)耦合、大時(shí)滯的特點(diǎn),使提取出的特征具有更好的可分性,進(jìn)而提高燒結(jié)狀態(tài)識(shí)
別的精度,避免識(shí)別錯(cuò)誤導(dǎo)致的影響,有利于工廠的自動(dòng)化生產(chǎn)。
[0018] (2)本發(fā)明能夠在類別不均衡的情況下,有效的進(jìn)行分類,避免了多數(shù)類對(duì)分類面的干擾,增加了欠燒和過燒兩種不正常燒結(jié)狀態(tài)的識(shí)別精度。這種分類識(shí)別方法,泛化能力
強(qiáng),可以大大提高回轉(zhuǎn)窯燒結(jié)狀態(tài)的識(shí)別精度。
[0019] (3)本發(fā)明所構(gòu)造的新的保角變換函數(shù),能夠有效提高分類器的數(shù)據(jù)可分性和泛化能力,構(gòu)造時(shí)引入了不均衡參數(shù),增加了少數(shù)類樣本對(duì)分類器的影響,可以緩解由于數(shù)據(jù)
不均衡造成的少數(shù)類分類面偏移和檢測(cè)精度下降的問題。
附圖說明[0020] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本
發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以
根據(jù)這些附圖獲得其他的附圖。
[0021] 圖1為本發(fā)明的分類算法在實(shí)施例的方法流程圖。[0022] 圖2為通過ODM和本文提出的方法KMODM得到各燒結(jié)狀態(tài)的邊緣分布比較圖。[0023] 圖3為在使用不均衡率為10的半月牙數(shù)據(jù)集上,本文提出的方法KMODM和ODM學(xué)習(xí)的分類面的比較圖。
[0024] 圖4(a)是李普希茨數(shù)與相關(guān)輸入之間的折線示意圖,注明了最后一個(gè)相關(guān)輸入的位置。對(duì)熱工信號(hào)進(jìn)行相關(guān)時(shí)段分析,即Lipschitz方法,李普希茨數(shù)下降轉(zhuǎn)折的位置就是
最后一個(gè)相關(guān)輸入的位置。
[0025] 圖4(b)是李普希茨數(shù)與相關(guān)輸入之間的折線示意圖,注明了第一個(gè)相關(guān)輸入的位置。對(duì)熱工信號(hào)進(jìn)行相關(guān)時(shí)段分析,李普希茨數(shù)的第一個(gè)突變是輸入就是第一個(gè)相關(guān)輸入
的位置。
具體實(shí)施方式[0026] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本
發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)
施例,都屬于本發(fā)明保護(hù)的范圍。
[0027] 如圖1所示,本發(fā)明實(shí)施例的考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法,具體步驟是:
[0028] 步驟S1,采集回轉(zhuǎn)窯的工況數(shù)據(jù);[0029] 步驟S2,對(duì)熱工信號(hào)進(jìn)行特征提取,轉(zhuǎn)化成用于分類的訓(xùn)練數(shù)據(jù);[0030] 步驟S3,對(duì)預(yù)處理后的數(shù)據(jù)計(jì)算出核矩陣;[0031] 步驟S4,將核矩陣和訓(xùn)練樣本進(jìn)行ODM(optimalmargindistributionmachine最優(yōu)間隔分布機(jī):一種在支持向量機(jī)最大化最小間隔原理基礎(chǔ)上,考慮最優(yōu)間隔分布進(jìn)行
改進(jìn)的分類方法)訓(xùn)練學(xué)習(xí)得到訓(xùn)練分類器C。
[0032] 步驟S5,運(yùn)用訓(xùn)練分類器C計(jì)算出訓(xùn)練樣本到分類面的間隔,并計(jì)算出間隔均值。[0033] 步驟S6,根據(jù)計(jì)算的間隔和間隔均值,計(jì)算得到保角變換函數(shù)。[0034] 步驟S7,根據(jù)保角變換函數(shù)對(duì)核函數(shù)進(jìn)行修正,得到新的核矩陣。[0035] 步驟S8,使用修正后的核矩陣進(jìn)行ODM訓(xùn)練,得到分類器。[0036] 進(jìn)一步的,步驟S1,采集回轉(zhuǎn)窯中八種熱工信號(hào),包括喂煤速度(CF)、投原料速度(RMF)、一次空氣(PA)(一次空氣又叫一次風(fēng),是指回轉(zhuǎn)窯燃燒時(shí),與煤粉混合一起送入爐膛
的空氣;一次風(fēng)對(duì)鍋爐的燃燒起主導(dǎo)作用)、窯尾負(fù)壓(NP)、窯頭氣體溫度(KHT)、窯尾氣體
溫度(KTT)、主機(jī)電流(MDC)和燒結(jié)區(qū)火焰的溫度(ST),如表1。
[0037] 表1回轉(zhuǎn)窯的熱工變量[0038] 變量 描述 單位CF 喂煤速率 t/h
RMF 投放原料速率 t/h
3
PA 一次空氣 m/h
NP 窯尾負(fù)壓 Pa
KHT 窯頭氣體溫度 ℃
KTT 窯尾氣體溫度 ℃
MDC 主機(jī)電流 A
ST 用比色溫度計(jì)測(cè)量燒結(jié)區(qū)火焰的溫度 ℃
[0039] 步驟S2具體過程是:[0040] 步驟S2.1,對(duì)熱工信號(hào)進(jìn)行相關(guān)時(shí)段分析。[0041] 一般來說,輸入信號(hào)的變化需要一段時(shí)間來改變系統(tǒng)的輸出(例如,投放煤料的速度增加了,不會(huì)立刻導(dǎo)致溫度的增加,需要等投放的煤料充分燃燒時(shí)才會(huì)導(dǎo)致溫度的增
加)。為了估計(jì)輸入變量(即八個(gè)熱工信號(hào),其中ST信號(hào)輸入輸出都是本身,是以本身為輸入
輸出求出的相關(guān)時(shí)段)的相關(guān)時(shí)間段的變化,采用了一種無模型的方法,即Lipschitz方法,
該方法首先用于確定非線性系統(tǒng)的階數(shù),改進(jìn)方法可用于估計(jì)復(fù)雜非線性系統(tǒng)的輸入延
遲。Lipschitz方法的估計(jì)結(jié)果可以揭示第一個(gè)相關(guān)輸入(FRI)和最后一個(gè)相關(guān)輸入(LRI),
因此第一個(gè)和最后一個(gè)相關(guān)輸入之間的時(shí)間段可以定義為相關(guān)時(shí)段(RP)。為了得到各輸入
信號(hào)的相對(duì)速度,本發(fā)明建立了以單熱工信號(hào)為輸入,以單熱工信號(hào)為輸出的幾個(gè)模型,求
出了每個(gè)熱工信號(hào)的相關(guān)時(shí)段(RP)。
[0042] 首先通過下述公式:[0043][0044][0045] 其中, 是指加入s個(gè)熱工信號(hào)XD所求得的李普希茨商,L(k)是李普希茨商,L(k)是所有 中第k大的商,s是熱工信號(hào)XD的個(gè)數(shù)。XD(i)表示作為輸入的熱工信號(hào)XD中的第i
個(gè)數(shù)據(jù),XD(j)表示作為輸入的熱工信號(hào)XD中的第j個(gè)數(shù)據(jù),XD(i?s)表示作為輸入的熱工信
號(hào)XD中的第i?s個(gè)數(shù)據(jù),XD(j?s)表示作為輸入的熱工信號(hào)XD中的第j?s個(gè)數(shù)據(jù)。XD屬于{CF,
RMF,PA,NP,KHT,KTT,MDC,ST}八種熱工信號(hào)之一。XRT(i)、XRT(j)表示作為模型輸出的熱工
s
信號(hào)RT中的第i個(gè)數(shù)據(jù)和第j個(gè)數(shù)據(jù)。L表示加入s個(gè)熱工信號(hào)XD后,所求得的李普希茨數(shù)。
[0046] 隨著加入模型中熱工信號(hào)XD中的內(nèi)容增加,即增加s,計(jì)算不同s值下的李普希茲s s
數(shù)L。隨著s值的增大,可以畫出s與李普希茲數(shù)L 之間的曲線關(guān)系圖,通過在圖上找出下降
轉(zhuǎn)折點(diǎn)(如圖4(a))上升轉(zhuǎn)折點(diǎn)(如圖4(b))。圖4(a)可找出最后一個(gè)相關(guān)輸入(LRI)。圖4(b)
值第一次突然增加的地方稱為第一個(gè)相關(guān)輸入(FRI)。第一個(gè)相關(guān)輸入(FRI)和最后一個(gè)相
關(guān)輸入(LRI)之間的時(shí)間段就是該熱工信號(hào)XD的相關(guān)時(shí)段(RP)。
[0047] 步驟S2.2,對(duì)熱工信號(hào)進(jìn)行打標(biāo),找出欠燒、過燒和正常三種工況時(shí)刻的數(shù)據(jù),進(jìn)行標(biāo)簽劃分。具體是在所有熱工信號(hào)中找出欠燒、過燒和正常的時(shí)刻點(diǎn),再選取以該時(shí)刻為
末尾,截取之前一段相關(guān)時(shí)段DR內(nèi)的時(shí)刻點(diǎn),以這一段序列共同作為一個(gè)樣本。
[0048] 步驟S2.3,提取熱工信號(hào)的統(tǒng)計(jì)特征,統(tǒng)計(jì)特征包括平均值特征和趨勢(shì)特征。[0049] 步驟S2.3.1,提取熱工信號(hào)的平均值特征。[0050] 相關(guān)時(shí)段(RP)中各熱工信號(hào)的平均值與燒結(jié)狀態(tài)密切相關(guān),通過式(1)計(jì)算相關(guān)時(shí)段(RP)中各熱工信號(hào)的平均值:
[0051][0052] 其中,MD為熱工信號(hào)XD的平均特征,XD為熱工信號(hào),XD(i)為XD中的第i個(gè)數(shù)據(jù),DR為熱工信號(hào)XD的RP,LDR是DR的長度,XD∈{CF,RMF,PA,NP,KHT,KTT,MDC,ST}。
[0053] 步驟S2.3.2,提取熱工信號(hào)的趨勢(shì)特征[0054] 熱工信號(hào)趨勢(shì)是燒結(jié)狀態(tài)識(shí)別不可忽視的特征,它定義為由熱工信號(hào)值線性擬合得到的斜率。線性擬合模型如下:
[0055] g(tD)=atD+b(2)[0056] 其中,a和b分別為擬合直線的斜率和截距,tD為熱工信號(hào)XD對(duì)應(yīng)的時(shí)刻。[0057] 擬合直線g(tD)與XD之間的誤差通過最小化平均擬合損失來最小化:[0058][0059] 其中,tD(i)為熱工信號(hào)XD相關(guān)時(shí)段內(nèi)第i個(gè)數(shù)據(jù)對(duì)應(yīng)的時(shí)刻,以相關(guān)時(shí)段起點(diǎn)為0時(shí)刻,XDR(i)為熱工信號(hào)XD相關(guān)時(shí)段內(nèi)的第i個(gè)數(shù)據(jù)。斜率a的最優(yōu)值為趨勢(shì)特征,本發(fā)明將
熱工信號(hào)XD的趨勢(shì)特征表示為AD。
[0060] 步驟S2.4,提取熱工信號(hào)的動(dòng)態(tài)特征,動(dòng)態(tài)特征包括短時(shí)能量和樣本熵特征。[0061] 步驟S2.4.1,提取短時(shí)能量特征[0062] 短時(shí)能量可以在短時(shí)間內(nèi)分辨出信號(hào)的穩(wěn)定性,在語音信號(hào)處理和識(shí)別中得到了廣泛的應(yīng)用。對(duì)于熱工信號(hào)的短時(shí)能量定義為:
[0063][0064] 其中,En(t)為t時(shí)刻的短時(shí)能量,w()為窗口函數(shù),Nc為窗口寬度,i表示從t?(Nc?1)時(shí)刻迭代到t時(shí)刻的一個(gè)迭代變量。
[0065] 根據(jù)專家經(jīng)驗(yàn),不同燒結(jié)狀態(tài)下的熱工信號(hào)穩(wěn)定性存在顯著差異。例如,在欠燒狀態(tài)下,KHT的波動(dòng)比其他狀態(tài)下更為嚴(yán)重。因此,提取RP中熱工信號(hào)的短時(shí)能量作為燒結(jié)狀
態(tài)識(shí)別的特征。
[0066] 當(dāng)矩形窗口w(n)定義為:[0067][0068] 其中,若n時(shí)刻在熱工信號(hào)XD的相關(guān)時(shí)段內(nèi),則w(n)=1,否則為0。[0069] 將式(5)代入到式(4)中,RP中熱工信號(hào)的短時(shí)能量ED由下式計(jì)算:[0070][0071] 步驟S2.4.2,提取樣本熵特征[0072] 在故障診斷任務(wù)中,經(jīng)常使用樣本熵來分析信號(hào)的復(fù)雜度或提取相關(guān)特征。同樣,在不同的燒結(jié)狀態(tài)下,熱工信號(hào)的復(fù)雜性也不同,可計(jì)算出RP中熱工信號(hào)的樣本熵來描述
它。
[0073] 對(duì)于時(shí)序熱工信號(hào) 可以得到一組按序號(hào)順序排列的m維向量向量Um(i)與Um(j)之間的最大距離定義為:
[0074][0075] 其中,Um(j)為Um向量中的第j個(gè)元素,i,j,k為Um向量中的元素位置。[0076] 此處的i與上文的i意思相同,i與j元素位置既可以相同也可以不同,上式只作為一個(gè)最大距離的定義計(jì)算方法,表示如何計(jì)算m維向量之間的最大距離,k表示從1到m?1的
一個(gè)迭代量。上式表示計(jì)算XD(i)與XD(j)兩個(gè)向量之間的最大距離,先求m維每個(gè)維數(shù)之間
的差的絕對(duì)值,然后m個(gè)絕對(duì)值中的最大值就表示最大距離。
[0077] 對(duì)于給定的向量Um(i),滿足{Um(j)|1≤j≤t?m,j≠i}條件的向量Um(i)和Um(j)之間的最大距離不大于給定閾值η的數(shù)表示為Bi。對(duì)于維數(shù)m,兩個(gè)向量匹配m個(gè)點(diǎn)的概率定義
為:
[0078][0079] 則該熱工信號(hào)的樣本熵為:[0080][0081] 其中,Bm+1為Bm中m維數(shù)取m+1時(shí)的值。[0082] 各燒結(jié)狀態(tài)樣本由MD,AD,ED和SED四個(gè)特征組成,RP中各熱工信號(hào)可表示為{MCF,...,MST,...,SECF,...,SEST}。由此可以得到訓(xùn)練樣本Xtrai由N個(gè)包含{MCF,...,
MST,...,SECF,...,SEST}這些特征的向量組成的一個(gè)矩陣。N為訓(xùn)練樣本個(gè)數(shù)。
[0083] 步驟S3選擇RBF核作為核函數(shù)。根據(jù)式(10)計(jì)算訓(xùn)練樣本的核矩陣K:[0084][0085] 其中,K(i,j)表示核矩陣K中的第i行j列的元素,Xtrain(i)、Xtrain(j)分別為訓(xùn)練樣本Xtrain中的第i個(gè)樣本和第j個(gè)樣本,σ為RBF核中的參數(shù)。
[0086] 步驟S4,一般情況下,用于判別欠燒、過燒和正常三種狀態(tài)的分類器可以表示為即訓(xùn)練數(shù)據(jù)通過映射函數(shù) 映射到RBF核空間后,由分類器進(jìn)行分離,徑向
基(RBF)核函數(shù)能將原始空間映射到無窮維特征空間即RBF核空間。在RBF核空間中,樣本之
間的相關(guān)關(guān)系可由核矩陣表示。其中y表示訓(xùn)練樣本的標(biāo)簽, 表示實(shí)際訓(xùn)練樣本空間到
RBF核空間的映射函數(shù),映射函數(shù)與核矩陣的關(guān)系為 xi為Xtrain的第i個(gè)
訓(xùn)練樣本的特征向量,xj為Xtrain的第j個(gè)訓(xùn)練樣本的特征向量,T表示ω向量的轉(zhuǎn)置。(xi,yi)
樣本的邊際可定義為:
[0087][0088] 其中,f()表示計(jì)算間隔關(guān)于xi的函數(shù),γi中定義(xi,yi)樣本的間隔,xi為Xtrain的第i個(gè)訓(xùn)練樣本的特征向量,yi為Xtrain中的第i個(gè)訓(xùn)練樣本的標(biāo)簽。
[0089] 間隔均值可以表示為:[0090][0091] 其中,ω為線性分類器中的系數(shù);然后通過計(jì)算每個(gè)樣本的間隔與間隔均值之間的差值,得到間隔方差如下:
[0092][0093] yi為Xtrain中的第i個(gè)訓(xùn)練樣本的標(biāo)簽,N為訓(xùn)練樣本個(gè)數(shù)。[0094] 考慮到間隔均值和間隔方差的計(jì)算效率較低,通過縮放將邊緣均值設(shè)置為1。通過最小化邊際方差,優(yōu)化邊際分布,表示ODM的目標(biāo)函數(shù)為:
[0095][0096] 其中,ξi、εi分別為xi樣本的間隔與間隔均值的下界偏差、xi樣本的間隔與間隔均值的上界偏差,S為ODM的稀疏參數(shù),決定哪些樣本是支持向量,C1和C2為懲罰參數(shù),C1和C2分
別控制ξi和εi在目標(biāo)函數(shù)中的權(quán)重,C1作為分類器間隔下界錯(cuò)分的懲罰,C2作為分類器間隔
上界錯(cuò)分的懲罰,N為訓(xùn)練樣本個(gè)數(shù)。
[0097] 得到了ODM分類器凸函數(shù)形式,進(jìn)行ODM訓(xùn)練,ODM訓(xùn)練輸入是訓(xùn)練樣本Xtrain和訓(xùn)練樣本標(biāo)簽y,輸出是計(jì)算Xtrain間隔的函數(shù)f()。
[0098] 步驟S5,當(dāng)ODM學(xué)習(xí)訓(xùn)練結(jié)束后,就得到了一個(gè)訓(xùn)練好的分類面,將每個(gè)回轉(zhuǎn)窯數(shù)據(jù)樣本代入式(15)中即可求出樣本到分類面的間隔:
[0099][0100] 其中,Xtrain(j)為第j個(gè)訓(xùn)練樣本,Xtrain(i)為第i個(gè)訓(xùn)練樣本,yj為Xtrain中的第j個(gè)訓(xùn)練樣本的標(biāo)簽,yi為Xtrain中的第i個(gè)訓(xùn)練樣本的標(biāo)簽,K(Xtrain(i),Xtrain(j))為K核矩陣中
訓(xùn)練樣本Xtrain(i)對(duì)應(yīng)的行和訓(xùn)練樣本Xtrain(j)對(duì)應(yīng)列的元素。α為訓(xùn)練后得到的分類面系
數(shù),f(x)表示計(jì)算間隔關(guān)于x的函數(shù):
[0101] 之后根據(jù)式(16)計(jì)算間隔均值:[0102][0103] 其中,為間隔均值,∑f(Xtrain(i))為所有訓(xùn)練樣本間隔之和,N為訓(xùn)練樣本個(gè)數(shù)。[0104] 步驟S6,計(jì)算保角變換函數(shù)具體步驟為:[0105][0106] 其中,S是ODM的稀疏參數(shù),f(Xtrain)和 分別表示間隔和間隔均值。Kn和Kf為特征空間中控制不同區(qū)域體積膨脹系數(shù)的懲罰參數(shù),Kn控制 區(qū)域內(nèi)的體積膨
脹,Kf控制 區(qū)域內(nèi)的體積膨脹。e為自然常數(shù)。NIR為訓(xùn)練樣本的不平衡
比(IR),控制不同標(biāo)簽樣本的空間膨脹系數(shù)定義為:
[0107][0108] 其中,Xtrain表示訓(xùn)練樣本,X+為多數(shù)類樣本,X?為少數(shù)類樣本。n+和n?分別表示多數(shù)樣本個(gè)數(shù)和少數(shù)樣本個(gè)數(shù)。在本實(shí)例中,多數(shù)類樣本為正常燒結(jié)狀態(tài)樣本,少數(shù)類樣本為過
燒和欠燒燒結(jié)狀態(tài)樣本。
[0109] 步驟S7,求得向量d=(d1,d2,...,dN)T表示由公式(17)計(jì)算得到的一個(gè)N維向量,di=D(Xtrain(i)),i=1,…,N。i=1,…,N時(shí),di表示N維向量d中的d1,d2,...,dN個(gè)元素,N為訓(xùn)
T T
練樣本個(gè)數(shù),dd是d與d 的矩陣相乘,結(jié)果是一個(gè)N行N列的正(半)定矩陣。修正后的新核矩
T
陣可以由下列矩陣形式保角變換公式求得,為dd和K組成的一個(gè)哈達(dá)瑪積:
[0110] Knew=ddT*K(19)[0111] 其中,Knew為通過保角變換修正后的新的核矩陣。[0112] 由于ODM的原有效核矩陣是一個(gè)正(半)定矩陣。根據(jù)舒爾定理,可以很容易地證明它是一個(gè)正(半)定矩陣,從而證明它是一個(gè)有效的核矩陣(Mercer定理)。
[0113] 步驟S8,將Knew替換步驟S3中公式(10)計(jì)算得到的核矩陣K,再進(jìn)行ODM訓(xùn)練,可以得到分類器 由于ODM分類器屬于二分類。本實(shí)例中有欠燒、過燒和正常
三個(gè)標(biāo)簽,要重復(fù)進(jìn)行上述S3?S7步驟兩次,訓(xùn)練出兩個(gè)分類器。第一次訓(xùn)練將欠燒和過燒
的樣本標(biāo)簽設(shè)為1,正常樣本標(biāo)簽設(shè)為?1,得到分類器一。第二次訓(xùn)練將正常樣本剔除,在欠
燒和過燒之間訓(xùn)練分類器。將欠燒樣本標(biāo)簽設(shè)為1,過燒樣本設(shè)為?1,得到分類器二。通過兩
個(gè)分類器,特征提取后熱工信號(hào)的數(shù)據(jù)的燒結(jié)狀態(tài)可以得到有效的識(shí)別。將特征提取后熱
工信號(hào)的數(shù)據(jù)替換掉分類器中的Xtrain,求出對(duì)應(yīng)的樣本標(biāo)簽。先通過分類器一識(shí)別出燒結(jié)
狀態(tài)是正常還是異常(欠燒、過燒)。若為異常燒結(jié)狀態(tài),再通過分類器二判斷出是欠燒還是
過燒。若是欠燒則需要采取相關(guān)措施,如適當(dāng)增加喂煤量。若是過燒也需要采取相關(guān)措施,
如適當(dāng)減少喂煤量。
[0114] 本發(fā)明設(shè)計(jì)了一個(gè)新的保角變換函數(shù),并在ODM分類器的基礎(chǔ)上進(jìn)行核修正。針對(duì)類別不均衡的數(shù)據(jù)有更好的分類效果和更好的泛化性能。在保角變換函數(shù)構(gòu)造中,加入優(yōu)
化參數(shù)Kn和Kf,可以放大初始分界附近區(qū)域的膨脹系數(shù),從而間接提高類邊界的空間分辨
率,可以有效地提高分類器的數(shù)據(jù)可分性和泛化性能。引入?yún)?shù)NIR來反映訓(xùn)練數(shù)據(jù)的IR,可
以對(duì)少數(shù)樣本自動(dòng)賦值。這樣增加了這些少數(shù)樣品對(duì)最終分類器的影響??梢跃徑庥捎跀?shù)
據(jù)不平衡而導(dǎo)致的少數(shù)類分離偏移和檢測(cè)精度下降的問題。
[0115] 分別利用統(tǒng)計(jì)特征和本發(fā)明提出的方法兩種特征提取方法分別進(jìn)行欠燒、過燒、正常三類數(shù)據(jù)進(jìn)行特征提取,并記錄各分類模型的性能。對(duì)比的方法有mcSM、mcODM、ODM、
PIBoost、FIECOC、DOO、DECOC、WKSMOTE、BAdaCos、LCSDM、FocalNN。每個(gè)分類器使用不同特
征的實(shí)驗(yàn)重復(fù)30次,F(xiàn)1得分的均值和標(biāo)準(zhǔn)差如表1所示。括號(hào)內(nèi)的數(shù)字代表標(biāo)準(zhǔn)差,粗體數(shù)
據(jù)是最好的結(jié)果。
[0116] 表1不同分類器使用分別使用兩種特征提取方法所得到平均識(shí)別精度的比較[0117][0118] 對(duì)比使用不同特征的燒結(jié)狀態(tài)下各模型的識(shí)別精度,可以看出,在大多數(shù)情況下,引入動(dòng)態(tài)特征可以將整體識(shí)別精度提高2%以上。說明本發(fā)明中動(dòng)態(tài)特征的引入使燒結(jié)狀
態(tài)描述更加全面,可以有效提高燒結(jié)狀態(tài)樣品的可分性。從而證明了所提取的動(dòng)態(tài)特征的
有效性。
[0119] 從各燒結(jié)狀態(tài)的識(shí)別精度可以看出,由于欠燒樣品與正常樣品的可分性較低,因此mcSM獲得的欠燒狀態(tài)識(shí)別率最低。通過優(yōu)化訓(xùn)練樣本的邊緣分布,mcODM、LCSDM和KMODM
可以獲得更合理的分選器,提高欠燒樣本的檢出率。特別是本發(fā)明的KMODM繼承了ODM強(qiáng)大
的分類能力,通過修改其內(nèi)核函數(shù)提高了處理類不平衡數(shù)據(jù)的能力。因此,它的欠燒檢出率
比其他方法至少提高了4%。
[0120] 此外,由于mcSM、mcODM和ODM沒有考慮到數(shù)據(jù)不均衡的影響,所以它們對(duì)正常情況的識(shí)別率遠(yuǎn)遠(yuǎn)高于對(duì)異常情況的識(shí)別率。但是,考慮訓(xùn)練數(shù)據(jù)分布不均衡的KMODM等分類
器可以顯著提高兩種異常情況的識(shí)別精度,獲得更高的整體檢出率。其中FIECOC、DECOC、
LCSDM和KMODM的整體識(shí)別正確率均在86%以上,特別是提出的KMODM的識(shí)別正確率在90%
左右。出現(xiàn)這種情況的原因是,反映不平衡度的參數(shù)N被嵌入到所提出的保角變換函數(shù)中。
使用保形函數(shù)來修改RBF核的ODM,膨脹系數(shù)小的少數(shù)類樣本位于核空間的地區(qū)被壓縮,分
類面被迫向多數(shù)類地區(qū)偏移,因此少數(shù)類的邊緣分布優(yōu)化和提高檢測(cè)精度。其他依賴于數(shù)
據(jù)預(yù)處理或代價(jià)敏感方法的分類器無法優(yōu)化樣本在核空間中的空間分布,得到的分類超平
面更接近于少數(shù)類,因此很難準(zhǔn)確識(shí)別測(cè)試數(shù)據(jù)集中的異常情況。
[0121] 圖2顯示了在回轉(zhuǎn)窯欠燒、過燒、正常三種樣本數(shù)據(jù)上,KMODM方法與ODM方法的比較。樣本的邊際分布可以反映分類器的泛化性能。邊際分布越好,模型的泛化性能越好。
KMODM和ODM各燒結(jié)狀態(tài)的邊緣分布如圖3所示。圖中x軸表示KMODM和ODM得到的訓(xùn)練樣本的
間隔,y軸表示每個(gè)間隔的統(tǒng)計(jì)頻率。由此可見,KMODM得到的異常情況的邊緣分布要大于
ODM得到的異常情況的邊緣分布。KMODM正常狀態(tài)的邊緣分布與ODM相似。也就是說,本發(fā)明
KMODM的方法可以實(shí)現(xiàn)更好的邊緣分布,對(duì)于異常情況的識(shí)別將會(huì)更加準(zhǔn)確。
[0122] 圖3表示在使用不均衡率為10的半月牙數(shù)據(jù)集上,KMODM和ODM學(xué)習(xí)的分類面的比較,以說明所提模型的有效性。在該圖中,ODM的分隔符嚴(yán)重傾向于少數(shù)類。然而,所提出的
KMODM采用核修正法,因此可以減輕分類器的偏度。從而優(yōu)化了邊緣分布和少數(shù)類的檢出
率。
[0123] 此外,為了驗(yàn)證所提出的KMODM模型對(duì)其他不平衡分類任務(wù)的適用性,還對(duì)UCI標(biāo)準(zhǔn)數(shù)據(jù)集的部分實(shí)驗(yàn)進(jìn)行了記錄。本發(fā)明采用F1評(píng)分來評(píng)估不同類別檢出率的平衡程度,
計(jì)算方法為:
[0124][0125] 式中,TP為真陽性,F(xiàn)N為假陰性,F(xiàn)P為假陽性,recall為召回率,pre為準(zhǔn)確率。[0126] 本實(shí)例還選擇了5個(gè)多類標(biāo)準(zhǔn)UCI數(shù)據(jù)集來評(píng)估KMODM的性能。實(shí)驗(yàn)結(jié)果如表2所示。可以看出,mcSM、mcODM和ODM對(duì)大多數(shù)多類不平衡數(shù)據(jù)的結(jié)果都不理想。其他為不平衡
數(shù)據(jù)設(shè)計(jì)的分類器可以實(shí)現(xiàn)更高的平衡檢出率和更好的F1分?jǐn)?shù)。提出的KMODM算法在大多
數(shù)數(shù)據(jù)集上都取得了最好的結(jié)果。通過分析KMODM在二維可視化數(shù)據(jù)和UCI標(biāo)準(zhǔn)數(shù)據(jù)集上的
性能,可以得出KMODM模型能夠有效地處理不平衡數(shù)據(jù)分類任務(wù)的結(jié)論。
[0127] 表2基于RBF核的KMODM與其他算法在F1評(píng)價(jià)標(biāo)準(zhǔn)在多類數(shù)據(jù)集上的均值和標(biāo)準(zhǔn)差比較
[0128]Dataset hayes newthy balance car thyroid
mcSM 78.3±2.0 91.5±2.8 65.7±2.5 95.2±2.8 63.1±2.3
mcODM 81.2±1.9 92.3±2.5 67.4±1.9 96.0±2.3 65.4±2.2
ODM 78.7±2.4 90.6±2.9 66.7±1.8 95.0±1.5 63.5±1.6
PIBoost 78.4±2.0 93.3±2.2 68.4±1.9 96.3±2.4 68.6±2.8
FIECOC 78.1±2.3 92.5±3.1 68.8±2.1 97.2±1.7 68.4±2.0
DOO 80.5±1.7 93.7±2.6 67.4±1.7 97.9±1.3 69.5±1.4
DECOC 81.7±2.1 94.3±3.0 70.6±2.3 98.4±2.7 70.5±2.0
WKSMOTE 80.2±2.6 92.6±3.5 68.2±3.0 97.1±2.2 67.7±2.5
BAdaCost 82.1±2.3 94.6±1.8 72.0±2.1 97.7±2.3 69.8±2.6
LCSDM 83.5±1.9 95.1±1.8 69.0±2.4 97.0±1.4 68.9±1.9
FocalNN 82.7±1.5 95.4±2.0 69.5±2.7 98.9±1.9 69.3±2.0
KMODM 85.9±2.0 97.9±2.1 69.7±1.8 99.1±1.2 72.9±6.3
[0129] 以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍
內(nèi)。
聲明:
“考慮類別不平衡的回轉(zhuǎn)窯燒結(jié)狀態(tài)識(shí)別方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請(qǐng)聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)