位置:中冶有色 >
> 礦石分類與實(shí)時定量分析的光譜檢測新方法
權(quán)利要求
1.基于激光誘導(dǎo)擊穿光譜對礦石分類與實(shí)時定量分析的檢測新方法,其特征在于:包括如下步驟:
步驟1:用15Mpa的機(jī)械粉末壓餅機(jī)將礦石樣品壓制成厚2mm、直徑為13mm的小圓餅。獲取同一類樣品不同位置被激光激發(fā)后等離子體的光譜數(shù)據(jù),每個位置重復(fù)測量5次,每種樣品采集100組光譜數(shù)據(jù)。對同一樣品分別重復(fù)測試N組,平均樣品元素分布不均勻的影響,進(jìn)而獲取每個樣品中元素成分的真實(shí)含量;
步驟2:利用拉依達(dá)準(zhǔn)則對各個樣品的異常光譜數(shù)據(jù)進(jìn)行剔除,拉依達(dá)準(zhǔn)則一般假設(shè)數(shù)據(jù)具有征態(tài)分布,計(jì)算數(shù)據(jù)的標(biāo)準(zhǔn)偏差并根據(jù)要求劃定概率區(qū)間,最后對超出概率區(qū)間的粗大誤差進(jìn)行剔除、對峰位漂移修正和缺失峰補(bǔ)全。
異常光譜剔除算法實(shí)現(xiàn):
(1)采集到的LIBS光譜用Xij表示,Xij指編號為i的樣品第j個樣本點(diǎn)的光譜數(shù)據(jù),將每個通道光譜強(qiáng)度求和,各通道總光強(qiáng)中位數(shù)對應(yīng)的光譜作為該樣本中心點(diǎn)
(2)求出每一個樣本點(diǎn)離中心點(diǎn)的距離(即歐式距離之后將其歸一化(0-1);
(3)計(jì)算剩余誤差并按貝塞爾公式算出標(biāo)準(zhǔn)偏差σ,若某個測量值Dj的剩余誤差vj滿足則認(rèn)為是含有粗大誤差值的壞值,應(yīng)予剔除。
步驟3:采用主成分分析結(jié)合支持向量機(jī)的分類方法。利用支持向量機(jī)對模型分類,將預(yù)處理后的全部光譜數(shù)據(jù)采用主成分分析法降維,在降維之后,隨機(jī)選擇了訓(xùn)練集和預(yù)測集,提取訓(xùn)練集的前10個主成分構(gòu)造特征空間,在特征空間下采用小樣本的5-折交叉驗(yàn)證來對訓(xùn)練集訓(xùn)練,然后對建模集和預(yù)測集進(jìn)行分類正確率達(dá)到100%,可以對礦石進(jìn)行準(zhǔn)確分類。
步驟4:利用步驟(3)所述的方法進(jìn)行分類后,對光譜數(shù)據(jù)進(jìn)行相關(guān)性變量篩選偏最小二乘回歸法(R-PLS)。將全部光譜強(qiáng)度作為輸入數(shù)據(jù),F(xiàn)e的含量作為回歸目標(biāo)變量。模型的回歸效果、定標(biāo)精度、預(yù)測精度、預(yù)測誤差分別用決定系數(shù)(R2)、校正集的均方根誤差(RMSEC)、預(yù)測集的均方根誤差(RMSEP)、平均相對誤差(ARE)來綜合衡量。
步驟5:對礦石分類后在進(jìn)行R-PLS,最終得到待測物中Fe的含量,其正確率相比未分類+PLS和分類+PLS有了很大的提高。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟2中從待測物質(zhì)的全部光譜數(shù)據(jù)中:首先對其進(jìn)行異常光譜數(shù)據(jù)的篩選與剔除降低譜線的波動性,然后將光譜背景積分強(qiáng)度歸一化、峰位漂移修正和缺失峰補(bǔ)全。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟3中采用主成分分析結(jié)合支持向量機(jī)的分類方法,先進(jìn)行分類,在進(jìn)行降維,在特征空間下采用小樣本的5-折交叉驗(yàn)證來對訓(xùn)練集訓(xùn)練。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于:先用支持向量機(jī)進(jìn)行準(zhǔn)確分類后,再對光譜數(shù)據(jù)進(jìn)行相關(guān)性變量篩選偏最小二乘回歸法(R-PLS)進(jìn)行分析,將全部光譜強(qiáng)度作為輸入數(shù)據(jù),F(xiàn)e的含量作為回歸目標(biāo)變量。
5.一種測試系統(tǒng),其特征在于:包括:主動調(diào)Q的Nd:YAG 1064nm脈沖激光器、三維電動平臺、四通道光纖光譜儀(Avantes Avsdesktop USB2,Netherlands)。
其中,所述Nd:YAG納秒激光器均作為激發(fā)光源,激光光束聚焦于物體表面;
所述四通道光纖光譜儀用于采集物體被激發(fā)產(chǎn)生的等離子體的光譜數(shù)據(jù),所述光譜數(shù)據(jù)被用于按照權(quán)利要求1-4任一項(xiàng)所述方法來獲取樣品中Fe元素的含量。
說明書
技術(shù)領(lǐng)域
本發(fā)明屬于全新的礦石分類與實(shí)時定量定性分析的光譜檢測新方法,具體涉及一種利用激光誘導(dǎo)擊穿光譜的成分定量分析方法、測試系統(tǒng)及處理算法,用于實(shí)現(xiàn)在低材料損耗的情況下,快速便捷地對礦石進(jìn)行分類和定量分析。
背景技術(shù)
激光誘導(dǎo)擊穿光譜技術(shù)是一種利用脈沖激光對樣品表面的小部分材料進(jìn)行擊穿并產(chǎn)生等離子體,等離子體冷卻發(fā)光,隨后對該等離子體所發(fā)射出的光譜進(jìn)行分析,即是分析樣品材料的組成成分的全元素檢測手段。該測試手段具有諸多特點(diǎn)及優(yōu)勢。首先,激光誘導(dǎo)擊穿光譜技術(shù)的檢測過程對目標(biāo)樣品損傷小,僅需要對目標(biāo)樣品表面微克級別的材料進(jìn)行擊穿,可以認(rèn)為是無損檢測;其次,激光誘導(dǎo)擊穿光譜技術(shù)的測試過程不需要對目標(biāo)樣品進(jìn)行復(fù)雜的預(yù)處理,處理過程不需要使用化學(xué)試劑,對環(huán)境無污染。在測試過程中僅需要直接將脈沖激光聚焦于待測樣品表面,即可得到其元素組成的相關(guān)信息;同時激光誘導(dǎo)擊穿光譜技術(shù)對目標(biāo)樣品的形態(tài)沒有特定的要求,對于氣態(tài),液態(tài)和固態(tài)的樣品均可以進(jìn)行測試;最后,由于激光誘導(dǎo)擊穿光譜技術(shù)的測試過程是通過對光譜信息進(jìn)行分析從而得到測試結(jié)果,因此其測試過程也相對傳統(tǒng)的檢測方法比較快速。
現(xiàn)如今,在科研以及工業(yè)應(yīng)用領(lǐng)域,如生物醫(yī)學(xué),環(huán)境檢測,港口海關(guān),材料分析等諸多領(lǐng)域,對于目標(biāo)樣品的元素成分檢測的需求都非常迫切。與化學(xué)分析方法或者高能射線探測法等傳統(tǒng)元素測試方法相比較,激光誘導(dǎo)擊穿光譜技術(shù)在測試過程中具備對于樣品的損傷更小,樣品制備等測試前準(zhǔn)備過程更加便捷,測試過程耗時更短等特點(diǎn)。因此更加適合于各種需樣品進(jìn)行元素測試的場合。例如在生物醫(yī)學(xué)相關(guān)等場合,要求測試手段能夠在顯微鏡下操作。在港口海關(guān),為了應(yīng)對大量的貨物吞吐量,在對貨物進(jìn)行檢測時,則需要測試手段方便快速,且對于貨物的損傷較小。在材料分析領(lǐng)域,則需要其測試手段的測試范圍足夠?qū)?,并且能夠盡可能地對目標(biāo)樣品中的各種成分進(jìn)行測試和分析。正是因?yàn)榧す庹T導(dǎo)擊穿光譜技術(shù)的各種特點(diǎn)和優(yōu)勢,其能夠很好的滿足上述各種測試場合的要求。
目前大多數(shù)研究多集中在對礦物成分、地理來源進(jìn)行分類與鑒別上,以及LIBS結(jié)合化學(xué)計(jì)量學(xué)方法提升礦石分析精度。將分類和定量分析方法結(jié)合,通過支持向量機(jī)對光譜進(jìn)行分類,然后采用相關(guān)性變量篩選偏最小二乘回歸進(jìn)行定量分析;在光譜的選擇方面,依托主成分分析方法,建立光譜數(shù)據(jù)和典型元素含量線性關(guān)系,依次取出相關(guān)系數(shù)R大于0.9,0.85,…,0的光譜進(jìn)行偏最小二乘回歸,分別計(jì)算出決定系數(shù)R2,預(yù)測集的均方根誤差(RMSEP),平均相對誤差(ARE)等信息。未經(jīng)過分類的礦石經(jīng)過全譜偏最小二乘回歸分析后,RMSEP=3.227%,ARE=31.75%。而將礦石利用我們提出的這種新方法即進(jìn)行分類后再進(jìn)行相關(guān)性變量篩選偏最小二乘回歸分析(R-PLS),鐵礦石、錳礦石、鉻礦石的RMSEP分別降至0.975%、0.418%、0.123%,ARE分別降至1.46%、6.72%、1.09%。表明將礦石分類后再進(jìn)行相關(guān)性變量篩選偏最小二乘回歸分析大大提升了定量分析的準(zhǔn)確性。因此,這種對礦石分類與實(shí)時定量分析的光譜檢測新方法具有很大的優(yōu)勢。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種礦石分類和實(shí)時定量分析方法、測試系統(tǒng),其利用激光誘導(dǎo)穿擊光譜的技術(shù)來實(shí)現(xiàn)礦石分類和實(shí)時定量分析檢測。
一方面,本發(fā)明提供了一種元素定量分析方法,包括如下步驟:
步驟1:獲取同一類樣品不同位置被激光激發(fā)后等離子體的光譜數(shù)據(jù),每個位置重復(fù)測量5次,每種樣品采集100組光譜數(shù)據(jù)。對同一樣品分別重復(fù)測試N組,平均樣品元素分布不均勻的影響,進(jìn)而獲取每個樣品中元素成分的真實(shí)含量;
所述同一類樣品是指成分相同,含量不同的同類樣品,譬如其含量是由國標(biāo)測定;
步驟2:采用主成分分析結(jié)合支持向量機(jī)的分類方法。利用支持向量機(jī)對模型分類,將預(yù)處理后的全部光譜數(shù)據(jù)采用主成分分析法降維,在降維之后,隨機(jī)選擇了訓(xùn)練集和預(yù)測集,提取訓(xùn)練集的前10個主成分構(gòu)造特征空間,在特征空間下采用小樣本的5-折交叉驗(yàn)證來對訓(xùn)練集訓(xùn)練,之后對礦石進(jìn)行準(zhǔn)確分類。
步驟3:利用步驟(2)所述的方法進(jìn)行分類后,對光譜數(shù)據(jù)進(jìn)行相關(guān)性變量篩選偏最小二乘回歸法(R-PLS)。將全部光譜強(qiáng)度作為輸入數(shù)據(jù),F(xiàn)e的含量作為回歸目標(biāo)變量。模型的回歸效果、定標(biāo)精度、預(yù)測精度、預(yù)測誤差分別用決定系數(shù)(R2)、校正集的均方根誤差(RMSEC)、預(yù)測集的均方根誤差(RMSEP)、平均相對誤差(ARE)來綜合衡量。
步驟4:對礦石分類后在進(jìn)行相關(guān)性變量篩選偏最小二乘回歸分析算法(R-PLS),最終得到待測物中Fe的含量,其正確率相比未分類+偏最小二乘(PLS)和支持向量機(jī)分類+PLS有了很大的提高
使用傳統(tǒng)未分類+全譜PLS和分類+全譜PLS的方法計(jì)算所帶來的誤差比較大,其計(jì)算結(jié)果的不準(zhǔn)確性主要來自于以下幾個方面:(一)樣品中冷卻原子的自吸收效應(yīng),導(dǎo)致光譜信息中特征峰的強(qiáng)度與樣品中實(shí)際的成分濃度出現(xiàn)一定程度的非線性依賴關(guān)系。(二)不同成分互相干涉,各個成分的特征峰之間可能存在一定程度的互相重疊并因此影響到定量分析結(jié)果的準(zhǔn)確性。(三)樣品在被激發(fā)后所產(chǎn)生的等離子氣體在空間上和時間上存在一定程度的不均勻性,因此也會使得傳統(tǒng)“偏最小二乘法回歸”的計(jì)算結(jié)果的誤差增大。本裝置所采用的定量分析算法中,加入了支持向量機(jī)來分類,即:支持向量機(jī)分類+相關(guān)性變量篩選偏最小二乘回歸分析改進(jìn)算法進(jìn)行定量分析時,其誤差大大降低,提高了準(zhǔn)確分類的精確度。
進(jìn)一步優(yōu)選,步驟3的執(zhí)行過程如下:
從待測物質(zhì)中的光譜數(shù)據(jù)中獲取所述貢獻(xiàn)度滿足預(yù)設(shè)標(biāo)準(zhǔn)時所在波長點(diǎn)對應(yīng)的光譜數(shù)據(jù),并輸入訓(xùn)練后的所述偏最小二乘法回歸模型得到待測物質(zhì)中各個成分的預(yù)測含量;
將待測物質(zhì)中的光譜數(shù)據(jù)輸入訓(xùn)練后的所述支持向量機(jī)回歸模型得到待測物質(zhì)中各個成分對應(yīng)的殘差;
最后,將待測物質(zhì)中各個成分的預(yù)測含量減去對應(yīng)殘差得到各個成分的含量。
進(jìn)一步優(yōu)選,步驟2中貢獻(xiàn)度滿足預(yù)設(shè)標(biāo)準(zhǔn)的光譜數(shù)據(jù)是指貢獻(xiàn)度最大所在波長點(diǎn)對應(yīng)的光譜數(shù)據(jù)。
進(jìn)一步優(yōu)選,步驟1中獲取光譜數(shù)據(jù)后,再對每個樣品的所述光譜數(shù)據(jù)進(jìn)行去噪處理,所述去噪處理包括:采用數(shù)據(jù)窗口移動的局部加權(quán)回歸散點(diǎn)平滑法對光譜數(shù)據(jù)進(jìn)行背景連續(xù)光譜去除處理,其中,數(shù)據(jù)窗口中包含了n個波長點(diǎn)的光譜數(shù)據(jù),n的取值范圍為1-jm*c1,jm表示一個掃描通道中得到波長點(diǎn)總數(shù),c1為掃描通道個數(shù)。
進(jìn)一步優(yōu)選,步驟1中獲取光譜數(shù)據(jù)后,再對每個樣品的所述光譜數(shù)據(jù)進(jìn)行去噪處理,所述去噪處理包括:對光譜數(shù)據(jù)進(jìn)行歸一化處理,所述歸一化計(jì)算公式如下:
式中,I′ij表示樣品在第c個掃描通道進(jìn)行的第i次掃描中第j個波長點(diǎn)對應(yīng)的歸一化后的光譜數(shù)據(jù),表示樣品在第c個掃描通道進(jìn)行的第i次掃描中第j個波長點(diǎn)對應(yīng)的歸一化前的光譜數(shù)據(jù),jm表示一個掃描通道中得到波長點(diǎn)總數(shù)。
進(jìn)一步優(yōu)選,利用粒子群算法對所述支持向量機(jī)模型的懲罰參數(shù)c和核參數(shù)g進(jìn)行尋優(yōu)。
第二方面,本發(fā)明提供一種測試系統(tǒng),包括:主動調(diào)Q的Nd:YAG 1064nm脈沖激光器、三維電動平臺、四通道光纖光譜儀(Avantes Avsdesktop USB2,Netherlands);
其中,所述Nd:YAG 1064nm脈沖激光器作為激發(fā)源,激光光束經(jīng)過透鏡組之后聚焦于物體表面;所述三維電動平臺用來以一定的速率調(diào)節(jié)樣品,使每一次激光都能作用于新的樣品區(qū)域;所述四通道光纖光譜儀用在收集處,通過透鏡將光耦合進(jìn)光纖中傳輸?shù)焦庾V儀。
第三方面,本發(fā)明提供一種計(jì)算機(jī),所述計(jì)算機(jī)上安裝了可以運(yùn)行的程序,所述處理器執(zhí)行程序時實(shí)現(xiàn)上述方法的步驟。
有益效果
1、本發(fā)明構(gòu)建的支持向量機(jī)分類+相關(guān)性變量篩選偏最小二乘回歸分析改進(jìn)算法,該方法首先采用拉依達(dá)準(zhǔn)則對異常光譜進(jìn)行剔除,其次采用主成分分析結(jié)合支持向量機(jī)的方法構(gòu)建分類模型,對礦石快速、高準(zhǔn)確度分類。隨后通過相關(guān)性變量篩選偏最小二乘回歸法,提高了模型的回歸效果、定標(biāo)精度、預(yù)測精度、預(yù)測誤差分別用決定系數(shù)(R2)、校正集的均方根誤差(RMSEC)、預(yù)測集的均方根誤差(RMSEP)、平均相對誤差(ARE)。實(shí)現(xiàn)了成分的定量分析,是一種礦石分類和實(shí)時定量分析的光譜檢測新方法。
2、本發(fā)明構(gòu)建的測試系統(tǒng)通過使用納秒激光器作為激發(fā)光源,使得激光誘導(dǎo)擊穿光譜在實(shí)現(xiàn)全成分元素激發(fā)的前提下維持了較小的體積,利用本發(fā)明構(gòu)建的測試系統(tǒng),被測物體的前置準(zhǔn)備工作需求少,測量方便,快捷,且該系統(tǒng)的適用范圍廣,可以研究任何形態(tài),任何形貌的材料,提高了激光誘導(dǎo)擊穿光譜的測量的準(zhǔn)確性。
附圖說明
圖1是本發(fā)明實(shí)施例提供的測試系統(tǒng)的結(jié)構(gòu)示意圖;
圖2是分類前后對35種礦石采用全譜偏最小二乘回歸法得到的Fe含量的定標(biāo)曲線(a)全部礦石;(b)鐵礦石;(c)錳礦石;(d)鉻礦石;
圖3是對35種礦石分類后再進(jìn)相關(guān)性變量篩選偏最小二乘回歸分析得到的Fe含量的定標(biāo)曲線。(a)鐵礦石;(b)錳礦石;(c)鉻礦石;(d)全部礦石。
具體實(shí)施方式
下面將結(jié)合實(shí)施例對本發(fā)明做進(jìn)一步的說明。如圖1所示,本發(fā)明實(shí)施例提供的是一種基于納秒激光誘導(dǎo)擊穿光譜的礦石分類和定時定量分析的測試系統(tǒng),下述以其為實(shí)例進(jìn)行具體的闡述,但是應(yīng)當(dāng)理解,本發(fā)明所述測試系統(tǒng)不限于本實(shí)施例中說限定的。
本實(shí)施例中,測試系統(tǒng)包括:1064nm波長的Nd:YAG納秒激光器、三維電動平臺,四通道光纖光譜儀。
激光器的能量、頻率均為可調(diào)的,經(jīng)過透鏡聚焦后,激光聚焦于樣品的表面。其中移動顯微系統(tǒng)可以作為承載原件,在三軸上調(diào)節(jié)樣品位置,輔助對焦,以及按照一定的步進(jìn)位移樣品,采集盡可能多的新的點(diǎn)。收集系統(tǒng)將等離子體發(fā)出的光耦合進(jìn)入光纖中,進(jìn)入光譜儀中,與PC相連,進(jìn)行下一步的處理。
基于本實(shí)施例提供上述測試系統(tǒng),操作人員僅需要將待測樣品放置于激光定位指示位置,即可對樣品進(jìn)行元素成分含量測量,然后對礦石進(jìn)行分類以及實(shí)時定量分析。
應(yīng)當(dāng)理解,其他可行的實(shí)施例中,Nd:YAG納秒激光器、三維電動位移臺、和收集光纖的安裝位置可以進(jìn)行相應(yīng)調(diào)整,但是應(yīng)當(dāng)至少保證各個部件實(shí)現(xiàn)其基本功能,譬如,Nd:YAG皮秒激光器的激光束聚焦于待測物質(zhì)的表面,光纖光譜儀可以采集到光譜數(shù)據(jù),三位電動位移臺有足夠的移動空間。
本應(yīng)用案例所用樣品為35種礦石,其中鐵礦石14種,錳礦石12種和鉻礦石9種列于表1。用15Mpa的機(jī)械粉末壓片機(jī)將樣品壓制成厚為2mm、直徑為13mm的小圓餅。
表1鐵礦石、錳礦石和鉻礦石的樣品型號及Fe含量
Table 1Sample type and Fe content of the iron ore,manganese ore andchromium ore
為了實(shí)現(xiàn)成分含量的測量,本發(fā)明基于激光誘導(dǎo)擊穿光譜提供了一種成分定量分析方法,包括如下步驟:
步驟1:獲取若干同一類樣品被激光激發(fā)后等離子體的光譜數(shù)據(jù)并分別重復(fù)N組,以及獲取每個樣品中成分的真實(shí)含量。
本實(shí)施例中,光譜信號通過光纖光譜儀進(jìn)行收集。光纖光譜儀將樣品被激發(fā)后所產(chǎn)生的等離子體發(fā)光的光譜信息進(jìn)行收集。每次收集將得到一個完整的光譜數(shù)據(jù),該光譜數(shù)據(jù)包含了各個波長上樣品的等離子體發(fā)光的強(qiáng)度數(shù)值,按照波長的順序依次排列,每一次掃描得到了jm*c1個數(shù)據(jù)點(diǎn)的光譜數(shù)據(jù),jm表示一個掃描通道中得到波長點(diǎn)總數(shù),c1為掃描通道個數(shù),本實(shí)施例中共有4個掃描通道,jm等于2048,一共得到8192個數(shù)據(jù)點(diǎn)。本實(shí)施例中,每個位置重復(fù)測量5次,針對每個樣品重復(fù)N=20次,進(jìn)而將得到100個完整的光譜信息,將這100個光譜信息排列成為一個矩陣,即為本裝置掃描測試一個樣品所得到的原始光譜數(shù)據(jù)矩陣X,Xij為其矩陣元素,i代表掃描測試的次數(shù),j代表光纖光譜儀所取得的光譜數(shù)據(jù)中的強(qiáng)度數(shù)值按照波長順序排列的次序,該強(qiáng)度數(shù)值的次序與其相應(yīng)波長的數(shù)值一一對應(yīng),因此j的數(shù)值事實(shí)上也代表了該強(qiáng)度數(shù)值所代表的波長的信息。因此,矩陣X中的每一個成分即代表了光纖光譜儀100次測試中的第i次測試所取得的第j個強(qiáng)度數(shù)值。其他可行的實(shí)施例中,N為正整數(shù)。
本實(shí)施例中優(yōu)選采集到光譜數(shù)據(jù)后對其進(jìn)行去噪處理,包括去除背景連續(xù)光譜以及歸一化處理。
去除雜亂光譜:
為避免其對測量結(jié)果的影響,采用拉依達(dá)準(zhǔn)則對異常光譜進(jìn)行剔除。拉依達(dá)準(zhǔn)則一般假設(shè)測量數(shù)據(jù)具有正態(tài)分布,計(jì)算數(shù)據(jù)的標(biāo)準(zhǔn)偏差并根據(jù)要求劃定概率區(qū)間,最后對超出概率區(qū)間的粗大誤差進(jìn)行剔除。
算法實(shí)現(xiàn):
(1)采集到的LIBS光譜用Xij表示,Xij指編號為i的樣品第j個樣本點(diǎn)的光譜數(shù)據(jù),將每個通道光譜強(qiáng)度求和,各通道總光強(qiáng)中位數(shù)對應(yīng)的光譜作為該樣本中心點(diǎn)
(2)求出每一個樣本點(diǎn)離中心點(diǎn)的距離(即歐式距離),如圖2(a)所示為樣品的光譜數(shù)據(jù)對應(yīng)的歐式距離分布圖。之后將其歸一化(0-1)。
(3)為了更直觀地看出距離的概率密度分布規(guī)律,可畫出分段距離與頻數(shù)的關(guān)系。
(4)計(jì)算剩余誤差并按貝塞爾公式算出標(biāo)準(zhǔn)偏差σ,若某個測量值Dj的剩余誤差vj滿足則認(rèn)為vj是含有粗大誤差值的壞值,應(yīng)予剔除。
去除異常光譜后,大部分譜線的波動性均有所下降。然后采用光譜背景積分強(qiáng)度歸一化和峰位漂移修正和缺失峰補(bǔ)全對去除異常光譜后的數(shù)據(jù)進(jìn)行處理。
歸一化處理:
修正后的線狀光譜數(shù)據(jù)將通過“光譜背景積分強(qiáng)度歸一化法”進(jìn)行光譜不確定性的處理。即對每一個通道的背景光譜強(qiáng)度進(jìn)行單獨(dú)的歸一化,以此減少光譜的不確定性,方便后續(xù)步驟分析各成分的濃度差異。線狀光譜中的光譜異常,如光譜漂移,偶爾出現(xiàn)的噪音光譜等也將在這一步中被去除。計(jì)算公式如下:
式中,表示樣品在第c個掃描通道進(jìn)行的第i次掃描中第j個波長點(diǎn)對應(yīng)的歸一化后的光譜數(shù)據(jù),表示樣品在第c個掃描通道進(jìn)行的第i次掃描中第j個波長點(diǎn)對應(yīng)的歸一化前的光譜數(shù)據(jù),即本實(shí)施例中對應(yīng)為光譜數(shù)據(jù)Sik展開后的數(shù)據(jù),N*K個光譜數(shù)據(jù)Sik展開后又是N*(jm*c1)大小的矩陣,為矩陣元素,此時,再以各個掃描通道的光譜數(shù)據(jù)為單元分別進(jìn)行歸一化處理。
步驟2:利用支持向量機(jī)結(jié)合主成分分析進(jìn)行分類:由于礦石中光譜特征峰數(shù)量非常多,光譜特征峰數(shù)量相近,但譜線強(qiáng)度及峰位置存在明顯差異。將預(yù)處理后的全部光譜數(shù)據(jù)(3500*8192)即3500組光譜,一個譜有8192個點(diǎn),采用主成分分析降維,假設(shè)前M個主成分累計(jì)解釋率達(dá)到92%以上,可以認(rèn)為前M個主成分已經(jīng)涵蓋了礦石光譜數(shù)據(jù)的絕大部分信息。在降維之后,隨機(jī)選擇了訓(xùn)練集和預(yù)測集的比例關(guān)系為:25:10,提取訓(xùn)練集的前10個主成分構(gòu)建特征空間,在特征空間下采用小樣本的5-折交叉驗(yàn)證法來對訓(xùn)練集進(jìn)行訓(xùn)練,其建模集和預(yù)測集的分類正確率均為100%。采用主成分分析結(jié)合支持向量機(jī)的分類方法,可以實(shí)現(xiàn)礦石快速、高準(zhǔn)確度分類鑒別。
步驟3:相關(guān)性變量篩選偏最小二乘回歸法
由于支持向量機(jī)可以實(shí)現(xiàn)對全部礦石準(zhǔn)確的分類,因此對經(jīng)過分類后的光譜數(shù)據(jù)進(jìn)行相關(guān)性變量篩選偏最小二乘回歸法(R-PLS)。該方法去除了冗余的數(shù)據(jù),使建模變量數(shù)大大減少,提高了運(yùn)算速度。模型的回歸效果、定標(biāo)精度、預(yù)測精度、預(yù)測誤差分別用決定系數(shù)(R2)、校正集的均方根誤差(RMSEC)、預(yù)測集的均方根誤差(RMSEP)、平均相對誤差(ARE)來綜合衡量。
具體如下:
基于訓(xùn)練后的支持向量機(jī)+相關(guān)性變量篩選偏最小二乘回歸法,利用待測物質(zhì)的光譜數(shù)據(jù)得到待測元素的含量。具體如下:
1、利用支持向量機(jī)結(jié)合主成分分析進(jìn)行分類,具體如下:
主成分分析主成分個數(shù)選取準(zhǔn)則:隨著主成分個數(shù)的增多,建模效果越好。當(dāng)主成分的個數(shù)較少時,預(yù)測精度不夠,所以隨著主成分個數(shù)的增加,RMSEP值變小,預(yù)測精度上升,但主成分的個數(shù)太多時又會導(dǎo)致過擬合,RMSEP值變大,預(yù)測精度降低。因此主成分個數(shù)的選取通過RMSEP最小方法確定。
2、進(jìn)行相關(guān)性變量篩選,具體如下:
首先建立光譜數(shù)據(jù)和Fe元素含量線性關(guān)系,分別選出相關(guān)系數(shù)R大于0.9、0.85、…、0.05、0的光譜數(shù)據(jù),依次進(jìn)行偏最小二乘回歸分析。
當(dāng)選擇的相關(guān)系數(shù)較小(R∈[0-0.5])時,預(yù)測集的均方根誤差(RMSEP)隨R的變化,其變化規(guī)律不明顯,但整體上RMSEP偏大。當(dāng)R大于0.5時,RMSEP隨R的變化呈現(xiàn)出先減小后增大的趨勢,這是因?yàn)楫?dāng)R太小時,與Fe元素含量相關(guān)性較弱峰被選擇的多,使得分析精度不夠。而當(dāng)R取的太大時,由于選擇的變量太少,容易造成過擬合且容差能力弱,同樣影響了分析精度。相關(guān)性變量篩選偏最小二乘回歸分析達(dá)到最佳預(yù)測效果的選擇依據(jù)是:選擇RMSEP最小對應(yīng)的相關(guān)系數(shù)。
全文PDF