權(quán)利要求書: 1.基于多智能體TLBO算法的球磨機(jī)制粉優(yōu)化控制方法,包括:建立球磨機(jī)制粉控制模型;
對基本TLBO算法進(jìn)行改進(jìn),包括教學(xué)因子TF的改進(jìn),改進(jìn)之后的教學(xué)因子如式(1):式(1)中,令TF最大值TFmax,TFi的初始值設(shè)計(jì)TF1=1,iter_max表示最大迭代次數(shù),iter表示當(dāng)前迭代次數(shù);
建立控制器的狀態(tài)空間模型,將改進(jìn)的TLBO算法用于球磨機(jī)制粉系統(tǒng)控制器的參數(shù)優(yōu)化。
2.根據(jù)權(quán)利要求1所述的球磨機(jī)制粉優(yōu)化控制方法,其特征在于:基本TLBO算法的改進(jìn)還包括多智能體構(gòu)造,構(gòu)造過程如下:構(gòu)造多智能體狀態(tài)空間函數(shù):在多智能體系統(tǒng)中當(dāng)選取未經(jīng)過學(xué)習(xí)的學(xué)員表示為智能體的聯(lián)合狀態(tài)空間S=[s1,s2,…sn],式中:s1~sn是未經(jīng)過學(xué)習(xí)的學(xué)員的多智能體狀態(tài)空間;構(gòu)造多智能體動(dòng)作相位:使用聯(lián)合動(dòng)作相位A=[a1,a2,…an]式中:a1~an為動(dòng)作相位。
3.根據(jù)權(quán)利要求2所述的球磨機(jī)制粉優(yōu)化控制方法,其特征在于:基本TLBO算法的改進(jìn)還包括Stackelberg博弈均衡:選取最優(yōu)秀的學(xué)員作為領(lǐng)導(dǎo)者,目標(biāo)函數(shù)為f領(lǐng)導(dǎo)者(x)f領(lǐng)導(dǎo)者(x)=max(U領(lǐng)導(dǎo)者智能體(s,[a1,…an]))式中:ωi(s,[a1,…an])學(xué)員群體中領(lǐng)導(dǎo)者智能體i的性能函數(shù),θi(s,[a1,…an])學(xué)員群體中領(lǐng)導(dǎo)者智能體i的損失函數(shù),n表示整個(gè)學(xué)員群體中領(lǐng)導(dǎo)者智能體的個(gè)數(shù);
最優(yōu)化學(xué)員自身收益,目標(biāo)函數(shù)為f跟隨者(x):f跟隨者(x)=max(U跟隨智能體(s,[a1,…an]))式中:φi(s,[a1,…an])學(xué)員群體中跟隨者智能體i的性能函數(shù), 學(xué)員群體中跟隨者智能體i的損失函數(shù),k整個(gè)學(xué)員群體中跟隨者智能體的個(gè)數(shù)。
4.根據(jù)權(quán)利要求2或3所述的球磨機(jī)制粉優(yōu)化控制方法,其特征在于:基本TLBO算法的改進(jìn)還包括改進(jìn)“學(xué)”階段:
多智能體TLBO算法依次選中每一個(gè)學(xué)員,然后挑選一個(gè)優(yōu)秀的學(xué)員作為比較,基于自學(xué)習(xí)的學(xué)習(xí)過程為:
式(2)中:Xnew,i,表示第i個(gè)學(xué)員學(xué)習(xí)后的狀態(tài)值;Xold,i表示原來的狀態(tài)值;r1,r2表示[0,1]之間的隨機(jī)數(shù)。
5.根據(jù)權(quán)利要求1~4任一項(xiàng)所述的球磨機(jī)制粉優(yōu)化控制方法,其特征在于:控制器的狀態(tài)空間模型為:
使用TLBO算法多智能體學(xué)員對控制器Ka,Kb統(tǒng)一進(jìn)行編碼:設(shè)計(jì)多智能體TLBO算法的適應(yīng)度函數(shù)J,選擇ITAE作為目標(biāo)函數(shù),其表達(dá)式為:式(3)中,t表示時(shí)間,e(t)為系統(tǒng)誤差;
調(diào)用多智能體TLBO算法進(jìn)行優(yōu)化,由系統(tǒng)誤差通過ITAE函數(shù)計(jì)算學(xué)員/個(gè)體適應(yīng)度Ji;
判斷適應(yīng)度函數(shù)值是否達(dá)到要求,輸出最優(yōu)學(xué)員/個(gè)體對應(yīng)的參數(shù)。
6.根據(jù)權(quán)利要求5所述的球磨機(jī)制粉優(yōu)化控制方法,其特征在于:所述球磨機(jī)制粉控制系統(tǒng)模型為雙輸入雙輸出的耦合對象,分解后的雙輸入雙輸出耦合對象的數(shù)學(xué)模型表示為:
C(s)=G(s)R(s)
其中C(s)是輸出信號(hào),R(s)是輸入信號(hào),G(s)是傳遞函數(shù)矩陣,即:T T
C(s)=[T,P],R(s)=[RT,RP],其中,T是出口溫度,P是入口負(fù)壓,RT是熱風(fēng)量,RP是再循環(huán)風(fēng)量,G11(s)是T對RT的傳遞函數(shù),G12(s)是T對RP的傳遞函數(shù),G21(s)是P對RT的傳遞函數(shù),G22(s)是P對RP的傳遞函數(shù)。
7.根據(jù)權(quán)利要求6所述的球磨機(jī)制粉優(yōu)化控制方法,其特征在于:整個(gè)球磨機(jī)控制系統(tǒng)算法流程如下:
S1)TLBO學(xué)員/個(gè)體數(shù)量及科目初始化,設(shè)定最大迭代次數(shù)iter_max;
S2)將 進(jìn)行編碼,依次代入控制器;
S3)計(jì)算球磨機(jī)輸出,并計(jì)算系統(tǒng)誤差;
S4)由系統(tǒng)誤差通過ITAE函數(shù)計(jì)算學(xué)員/個(gè)體適應(yīng)度;
S5)調(diào)用多智能體TLBO算法優(yōu)化,更新學(xué)員/個(gè)體參數(shù)值;
S6)判斷適應(yīng)度函數(shù)值是否達(dá)到要求或是否達(dá)到最大迭代次數(shù);如未達(dá)到要求或最大迭代次數(shù),iter=iter+1,返回S2),進(jìn)一步計(jì)算;其中,達(dá)到要求的標(biāo)準(zhǔn)為步驟S4中采用的ITAE標(biāo)準(zhǔn)優(yōu)化函數(shù),在迭代計(jì)算過程中,三次出現(xiàn)ITAE函數(shù)計(jì)算出來的適應(yīng)度值相同,則判斷該值為最優(yōu)值;
S7)達(dá)到要求或達(dá)到最大迭代次數(shù)后,輸出最優(yōu)學(xué)員/個(gè)體對應(yīng)的參數(shù)Aka,Bka,…Dka,將Akb,Bkb,…Dkb代入球磨機(jī)的控制系統(tǒng)模型,計(jì)算系統(tǒng)輸出。
8.一種球磨機(jī)制粉的方法,包括使用權(quán)利要求1~7任一項(xiàng)所述的球磨機(jī)制粉優(yōu)化控制方法進(jìn)行控制。
9.一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于由處理器加載并執(zhí)行如權(quán)利要求1至7中任意一項(xiàng)的方法步驟。
10.一種電子設(shè)備,其特征在于,包括:處理器和存儲(chǔ)器;其中,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序適于由所述處理器加載并執(zhí)行如權(quán)利要求1至7中任意一項(xiàng)的方法步驟。
說明書: 基于多智能體TLBO算法的球磨機(jī)制粉優(yōu)化控制方法技術(shù)領(lǐng)域[0001] 本發(fā)明涉及球磨機(jī)制粉的控制方法,特別涉及基于多智能體TLBO算法的球磨機(jī)制粉優(yōu)化控制方法。
背景技術(shù)[0002] 在工業(yè)生產(chǎn)領(lǐng)域,常常需要用到無機(jī)粉體。球磨機(jī)是常用的制粉設(shè)備,也是制粉系統(tǒng)的核心設(shè)備,在電力、化工、冶金、陶瓷等領(lǐng)域有著不可替代的地位。目前,陶瓷企業(yè)都采
用大型球磨機(jī)進(jìn)行粉磨,采用噴霧干燥塔進(jìn)行造粒,用噴霧干燥塔制備的粉料含水率小,粒
度分布范圍滿足成形要求,因此廣泛應(yīng)用于陶瓷自動(dòng)化生產(chǎn)。球磨機(jī)是一個(gè)復(fù)雜的對象,具
有時(shí)滯性大、耦合性強(qiáng)、變量多、非線性等特點(diǎn)。典型的球磨機(jī)系統(tǒng)模型可以看作是具有三
個(gè)輸入量和三個(gè)輸出量,加上多干擾量的復(fù)雜系統(tǒng),三個(gè)輸入量即給煤量、熱風(fēng)量、再循環(huán)
風(fēng)量,三個(gè)輸出量即進(jìn)出口壓差、入口負(fù)壓、出口溫度。使得實(shí)現(xiàn)其優(yōu)化控制成為一個(gè)復(fù)雜
的問題。
[0003] 已有的球磨機(jī)制粉系統(tǒng)常用控制方法主要有常規(guī)比例積分微分(PID)控制,解耦控制、預(yù)測控制、模糊控制、自尋優(yōu)控制、神經(jīng)網(wǎng)絡(luò)控制等。教與學(xué)優(yōu)化(teaching?
learning?basedoptimization,TLBO)算法是一種新型的智能優(yōu)化技術(shù),其利用群體信息
進(jìn)行啟發(fā)式搜索。TLBO算法對優(yōu)化對象的優(yōu)化速度快,收斂特性強(qiáng)。但是TLBO算法在解決復(fù)
雜高維問題時(shí),表現(xiàn)容易陷入局部最優(yōu),多樣性丟失過快等不足的問題。
[0004] 如何對TLBO算法進(jìn)行優(yōu)化,使其可以更好地應(yīng)用于球磨機(jī)制粉的優(yōu)化控制方法中,是一項(xiàng)有待解決的技術(shù)問題。
發(fā)明內(nèi)容[0005] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)的至少一個(gè)不足,提供一種基于多智能體TLBO算法的球磨機(jī)制粉優(yōu)化控制方法。
[0006] 本發(fā)明所采取的技術(shù)方案是:[0007] 本發(fā)明的第一個(gè)方面,提供:[0008] 基于多智能體TLBO算法的球磨機(jī)制粉優(yōu)化控制方法,包括:[0009] 建立球磨機(jī)制粉控制模型;[0010] 對基本TLBO算法進(jìn)行改進(jìn),包括教學(xué)因子TF的改進(jìn),改進(jìn)之后的教學(xué)因子如式(1):
[0011][0012] 式(1)中,令TF最大值TFmax,TFi的初始值設(shè)計(jì)TF1=1,iter_max表示最大迭代次數(shù),iter表示當(dāng)前迭代次數(shù);
[0013] 建立控制器的狀態(tài)空間模型,將改進(jìn)的TLBO算法用于球磨機(jī)制粉系統(tǒng)控制器的參數(shù)優(yōu)化。
[0014] 在一些實(shí)例中,基本TLBO算法的改進(jìn)還包括多智能體構(gòu)造,構(gòu)造過程如下:[0015] 構(gòu)造多智能體狀態(tài)空間函數(shù):在多智能體系統(tǒng)中當(dāng)選取未經(jīng)過學(xué)習(xí)的學(xué)員表示為智能體的聯(lián)合狀態(tài)空間S=[s1,s2,…sn],式中:s1~sn是未經(jīng)過學(xué)習(xí)的學(xué)員的多智能體狀態(tài)
空間;
[0016] 構(gòu)造多智能體動(dòng)作相位:使用聯(lián)合動(dòng)作相位A=[a1,a2,…an][0017] 式中:a1~an為動(dòng)作相位。[0018] 在一些實(shí)例中,基本TLBO算法的改進(jìn)還包括Stackelberg博弈均衡:[0019] 選取最優(yōu)秀的學(xué)員作為領(lǐng)導(dǎo)者,目標(biāo)函數(shù)為f領(lǐng)導(dǎo)者(x)[0020] f領(lǐng)導(dǎo)者(x)=max(U領(lǐng)導(dǎo)者智能體(s,[a1,…an]))[0021][0022] 式中:ωi(s,[a1,…an])學(xué)員群體中領(lǐng)導(dǎo)者智能體i的性能函數(shù),θi(s,[a1,…an])學(xué)員群體中領(lǐng)導(dǎo)者智能體i的損失函數(shù),n表示整個(gè)學(xué)員群體中領(lǐng)導(dǎo)者智能體的個(gè)數(shù);
[0023] 最優(yōu)化學(xué)員自身收益,目標(biāo)函數(shù)為f跟隨者(x):[0024] f跟隨者(x)=max(U跟隨智能體(s,[a1,…an]))[0025][0026] 式中:φi(s,[a1,…an])學(xué)員群體中跟隨者智能體i的性能函數(shù),學(xué)員群體中跟隨者智能體i的損失函數(shù),k整個(gè)學(xué)員群體中跟隨者智能體的個(gè)數(shù)。
[0027] 在一些實(shí)例中,基本TLBO算法的改進(jìn)還包括改進(jìn)“學(xué)”階段:[0028] 多智能體TLBO算法依次選中每一個(gè)學(xué)員,然后挑選一個(gè)優(yōu)秀的學(xué)員作為比較,基于自學(xué)習(xí)的學(xué)習(xí)過程為:
[0029][0030] 式(2)中:Xnew,i,表示第i個(gè)學(xué)員學(xué)習(xí)后的狀態(tài)值;Xold,i表示原來的狀態(tài)值;r1,r2表示[0,1]之間的隨機(jī)數(shù)。
[0031] 在一些實(shí)例中,控制器的狀態(tài)空間模型為:[0032][0033] 使 用T LBO算法 多智能體學(xué) 員對控制器K a,Kb統(tǒng) 一進(jìn)行編碼 :[0034] 設(shè)計(jì)多智能體TLBO算法的適應(yīng)度函數(shù)J,選擇ITAE作為目標(biāo)函數(shù),其表達(dá)式為:[0035][0036] 式(3)中,t表示時(shí)間,e(t)為系統(tǒng)誤差;[0037] 調(diào)用多智能體TLBO算法進(jìn)行優(yōu)化,由系統(tǒng)誤差通過ITAE函數(shù)計(jì)算學(xué)員/個(gè)體適應(yīng)度Ji;判斷適應(yīng)度函數(shù)值是否達(dá)到要求,輸出最優(yōu)學(xué)員/個(gè)體對應(yīng)的參數(shù)。
[0038] 在一些實(shí)例中,所述球磨機(jī)制粉控制系統(tǒng)模型為雙輸入雙輸出的耦合對象,分解后的雙輸入雙輸出耦合對象的數(shù)學(xué)模型表示為:
[0039] C(s)=G(s)R(s)[0040] 其中C(s)是輸出信號(hào),R(s)是輸入信號(hào),G(s)是傳遞函數(shù)矩陣,即:[0041][0042] 其中,T是出口溫度,P是入口負(fù)壓,RT是熱風(fēng)量,RP是再循環(huán)風(fēng)量,G11(s)是T對RT的傳遞函數(shù),G12(s)是T對RP的傳遞函數(shù),G21(s)是P對RT的傳遞函數(shù),G22(s)是P對RP的傳遞函
數(shù)。
[0043] 在一些實(shí)例中,整個(gè)球磨機(jī)控制系統(tǒng)算法流程如下:[0044] S1)TLBO學(xué)員/個(gè)體數(shù)量及科目初始化,設(shè)定最大迭代次數(shù)iter_max;[0045] S2)將 進(jìn)行編碼,依次代入控制器;
[0046] S3)計(jì)算球磨機(jī)輸出,并計(jì)算系統(tǒng)誤差;[0047] S4)由系統(tǒng)誤差通過ITAE函數(shù)計(jì)算學(xué)員/個(gè)體適應(yīng)度;[0048] S5)調(diào)用多智能體TLBO算法優(yōu)化,更新學(xué)員/個(gè)體參數(shù)值;[0049] S6)判斷適應(yīng)度函數(shù)值是否達(dá)到要求或是否達(dá)到最大迭代次數(shù);如未達(dá)到要求或最大迭代次數(shù),iter=iter+1,返回S2),進(jìn)一步計(jì)算;其中,達(dá)到要求的標(biāo)準(zhǔn)為步驟S4中采
用的ITAE標(biāo)準(zhǔn)優(yōu)化函數(shù),在迭代計(jì)算過程中,三次出現(xiàn)ITAE函數(shù)計(jì)算出來的適應(yīng)度值相同,
則判斷該值為最優(yōu)值;
[0050] S7)達(dá)到要求或達(dá)到最大迭代次數(shù)后,輸出最優(yōu)學(xué)員/個(gè)體對應(yīng)的參數(shù)Aka,Bka,…Dka,將Akb,Bkb,…Dkb代入球磨機(jī)的控制系統(tǒng)模型,計(jì)算系統(tǒng)輸出。
[0051] 在一些實(shí)例中,初始化階段一般是將每個(gè)TLBO學(xué)員在搜索空間中生成隨機(jī)數(shù)。[0052] 在一些實(shí)例中,迭代次數(shù)可以根據(jù)經(jīng)驗(yàn)或相關(guān)參考文獻(xiàn)設(shè)定。[0053] 在一些實(shí)例中,最大迭代次數(shù)不超過300,不少于20次。優(yōu)選的,最大迭代次數(shù)不低于50次,最大迭代次數(shù)不超過200次,150次,100次。
[0054] 本發(fā)明的第二個(gè)方面,提供:[0055] 一種球磨機(jī)制粉的方法,包括使用本發(fā)明第一個(gè)方面所述的球磨機(jī)制粉優(yōu)化控制方法進(jìn)行控制。
[0056] 本發(fā)明的第三個(gè)方面,提供:[0057] 一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于由處理器加載并執(zhí)行本發(fā)明第一個(gè)方面所述的球磨機(jī)制粉優(yōu)化控制方法。
[0058] 本發(fā)明的第四個(gè)方面,提供:[0059] 一種電子設(shè)備,包括處理器和存儲(chǔ)器;其中,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序適于由所述處理器加載并執(zhí)行本發(fā)明第一個(gè)方面所述的球磨機(jī)制粉優(yōu)化控制
方法。
[0060] 本發(fā)明的有益效果是:[0061] 本發(fā)明的一些實(shí)例,通過在基本TLBO算法基礎(chǔ)上,對教學(xué)因子TF的進(jìn)行了改進(jìn);在改進(jìn)“學(xué)”階段引入了多智能體算子,克服了基本TLBO算法易于陷入局部最優(yōu)的不足,可以
更好地對球磨機(jī)制粉控制方法進(jìn)行優(yōu)化。能夠提高瓷磚生產(chǎn)過程的制粉工藝效率,具有較
好的經(jīng)濟(jì)效益,減少人工成本、縮短球磨時(shí)間、節(jié)省電耗以及減少粉塵污染,推動(dòng)球磨技術(shù)
的產(chǎn)業(yè)化,不僅會(huì)取得很好的經(jīng)濟(jì)效應(yīng)和社會(huì)效應(yīng),也會(huì)推動(dòng)瓷磚行業(yè)的可持續(xù)發(fā)展。
[0062] 本發(fā)明的一些實(shí)例,進(jìn)一步采用Stackelberg博弈規(guī)則,能夠在種群中擴(kuò)大搜索范圍,使得種群多樣性增加,避免TLBO算法陷入局部最優(yōu)。
附圖說明[0063] 圖1是基于多智能體TLBO算法的瓷磚球磨機(jī)制粉優(yōu)化控制方法步驟流程圖;[0064] 圖2是球磨機(jī)控制系統(tǒng)圖;[0065] 圖3是不同TLBO算法求解的適應(yīng)度函數(shù)曲線。具體實(shí)施方式[0066] 下面結(jié)合陶瓷工業(yè)球磨機(jī)的系統(tǒng)控制為例,進(jìn)一步說明本發(fā)明的技術(shù)方案。[0067] 參照圖1和圖2,基于改進(jìn)TLBO算法的陶瓷工業(yè)球磨機(jī)優(yōu)化控制方法,包括如下步驟:
[0068] 建立陶瓷工業(yè)球磨機(jī)系統(tǒng)控制器模型:所述球磨機(jī)系統(tǒng)控制器模型簡化的雙輸入雙輸出的耦合模型:
[0069] C(s)=G(s)R(s)[0070] 其中C(s)是輸出信號(hào),R(s)是輸入信號(hào),G(s)是傳遞函數(shù)矩陣,即:[0071][0072] 其中,T是出口溫度,P是入口負(fù)壓,RT是熱風(fēng)量,RP是再循環(huán)風(fēng)量,G11(s)是T對RT的傳遞函數(shù),G12(s)是T對RP的傳遞函數(shù),G21(s)是P對RT的傳遞函數(shù),G22(s)是P對RP的傳遞函
數(shù),G(s)描述了兩回路之間的耦合關(guān)系;球磨機(jī)控制系統(tǒng)的結(jié)構(gòu)圖如圖2所示,其中T0是出
口溫度的給定值,P0是入口負(fù)壓的給定值,分別采用兩個(gè)控制器對兩個(gè)變量進(jìn)行閉環(huán)控制。
[0073] 針對基本TLBO算法做出改進(jìn):[0074] 教學(xué)因子改進(jìn)[0075] TLOB算法的優(yōu)化過程主要分為兩個(gè)階段:教學(xué)階段與學(xué)習(xí)階段,在教學(xué)階段,班級(jí)中的各個(gè)學(xué)員通過全體學(xué)員成績的均值Mean與教師成績之間的差異difference來向老師
學(xué)習(xí).
[0076][0077] difference=ri(Xteacher?TFiMean)[0078][0079] 其中,ri為隨機(jī)因子;TFi為教學(xué)因子;[0080] 改進(jìn)之后的教學(xué)因子如下式:[0081][0082] 式中,令TF最大值TFmax,TFi的初始值設(shè)計(jì)TF1=1;iter_max表示最大迭代次數(shù);iter表示當(dāng)前迭代次數(shù)
[0083] 多智能體構(gòu)造[0084] 構(gòu)造多智能體狀態(tài)空間函數(shù):在多智能體系統(tǒng)中當(dāng)選取未經(jīng)過學(xué)習(xí)的學(xué)員表示為智能體的聯(lián)合狀態(tài)空間,
[0085] S=[s1,s2,…sn][0086] 式中:s1~sn是未經(jīng)過學(xué)習(xí)的學(xué)員的多智能體狀態(tài)空間;[0087] 構(gòu)造多智能體動(dòng)作相位:使用聯(lián)合動(dòng)作相位,[0088] A=[a1,a2,…an][0089] 式中:a1~an動(dòng)作相位;[0090] Stackelberg博弈均衡:[0091] 將Stackelberg博弈引入基于多智能體TLBO算法中,智能體的效益方程如下式所示,并且該節(jié)點(diǎn)的控制目標(biāo)是選取最優(yōu)秀的學(xué)員作為領(lǐng)導(dǎo)者,目標(biāo)函數(shù)為f領(lǐng)導(dǎo)者(x):
[0092] f領(lǐng)導(dǎo)者(x)=max(U領(lǐng)導(dǎo)者智能體(s,[a1,…an]))[0093][0094] 式中:ωi(s,[a1,…an])學(xué)員群體中領(lǐng)導(dǎo)者智能體i的性能函數(shù),θi(s,[a1,…an])學(xué)員群體中領(lǐng)導(dǎo)者智能體i的損失函數(shù),n表示整個(gè)學(xué)員群體中領(lǐng)導(dǎo)者智能體的個(gè)數(shù);
[0095] 學(xué)員群體中跟隨者智能體的效益方程如下式所示,并且該節(jié)點(diǎn)的控制目標(biāo)是最優(yōu)化學(xué)員自身收益,目標(biāo)函數(shù)為f跟隨者(x):
[0096] f跟隨者(x)=matx(U跟隨智能體(s,[a1,…an]))[0097][0098] 式中:φi(s,[a1,…an])學(xué)員群體中跟隨者智能體i的性能函數(shù),學(xué)員群體中跟隨者智能體i的損失函數(shù),k整個(gè)學(xué)員群體中跟隨者智能體的個(gè)數(shù);
[0099] 改進(jìn)“學(xué)”階段:[0100] 依次選中每一個(gè)學(xué)員,然后隨機(jī)挑選一個(gè)優(yōu)秀的學(xué)員作為比較,基于自學(xué)習(xí)的學(xué)習(xí)過程為:
[0101][0102] 式中:Xnew,i,表示第i個(gè)學(xué)員學(xué)習(xí)后的狀態(tài)值;Xold,i表示原來的狀態(tài)值;r1,r2,r3,r4表示[0,1]之間的隨機(jī)數(shù);
[0103] 將改進(jìn)的TLBO算法用于陶瓷工業(yè)球磨機(jī)系統(tǒng)控制器,對參數(shù)進(jìn)行優(yōu)化:建立球磨機(jī)的控制器模型,該控制器結(jié)構(gòu)采用狀態(tài)空間模型表示
[0104][0105][0106] 將 TL B O 算 法多 智 能 體學(xué) 員對 控 制器 K a ,K b 統(tǒng) 一 進(jìn)行 編 碼 :調(diào)用多智能體TLBO算法進(jìn)行優(yōu)化,由系
統(tǒng)誤差通過ITAE函數(shù)計(jì)算學(xué)員/個(gè)體適應(yīng)度;判斷適應(yīng)度函數(shù)值是否達(dá)到要求,輸出最優(yōu)學(xué)
員/個(gè)體對應(yīng)的參數(shù),計(jì)算系統(tǒng)輸出。
[0107] 整個(gè)球磨機(jī)控制系統(tǒng)算法流程如下:[0108] S1)TLBO學(xué)員/個(gè)體數(shù)量及科目初始化,設(shè)定最大迭代次數(shù)iter_max;[0109] S2)將 進(jìn)行編碼,依次代入控制器;
[0110] S3)計(jì)算球磨機(jī)輸出,并計(jì)算系統(tǒng)誤差;[0111] S4)由系統(tǒng)誤差通過ITAE函數(shù)計(jì)算學(xué)員/個(gè)體適應(yīng)度;[0112] S5)調(diào)用多智能體TLBO算法優(yōu)化,更新學(xué)員/個(gè)體參數(shù)值;[0113] S6)判斷適應(yīng)度函數(shù)值是否達(dá)到要求,或判斷是否達(dá)到最大送代次數(shù)。如未達(dá)到要求或最大迭代次數(shù),iter=iter+1,返回S2),進(jìn)一步計(jì)算;其中,達(dá)到要求的標(biāo)準(zhǔn)為步驟S4
中采用的ITAE標(biāo)準(zhǔn)優(yōu)化函數(shù),在迭代計(jì)算過程中,三次出現(xiàn)ITAE函數(shù)計(jì)算出來的適應(yīng)度值
相同,則判斷該值為最優(yōu)值;
[0114] S7)輸出最優(yōu)學(xué)員/個(gè)體對應(yīng)的參數(shù)Aka,Bka,…Dka,Akb,Bkb,…Dkb代入球磨機(jī)的控制系統(tǒng)模型,計(jì)算系統(tǒng)輸出。
[0115] 如圖3所示,實(shí)線表示采用本發(fā)明改進(jìn)方法多智能體TLBO算法求解的適應(yīng)度函數(shù)曲線,黑色虛線表示原始TLBO算法對比曲線,可以看出,本發(fā)明提出的多智能體TLBO算法的
在求解適應(yīng)度函數(shù)值時(shí),收斂速度更快,最大迭代次數(shù)達(dá)到50次左右后就具有較好的適應(yīng)
度,最大迭代次數(shù)達(dá)到100次左右基本可以獲得最佳的適應(yīng)度。而原始TLBO算法在迭代50次
后,適應(yīng)度依然較差,難以滿足生產(chǎn)的需求。
[0116] 本發(fā)明的控制方法,能夠在種群中產(chǎn)生方向劇烈變化的隨機(jī)游走,擴(kuò)大搜索范圍,使得種群多樣性增加,避免TLBO算法陷入局部最優(yōu),能夠提高瓷磚生產(chǎn)過程的制粉工藝效
率,具有較好的經(jīng)濟(jì)效益,減少人工成本、縮短球磨時(shí)間、節(jié)省電耗以及減少粉塵污染,推動(dòng)
球磨技術(shù)的產(chǎn)業(yè)化,不僅會(huì)取得很好的經(jīng)濟(jì)效應(yīng)和社會(huì)效應(yīng),也會(huì)推動(dòng)瓷磚行業(yè)的可持續(xù)
發(fā)展。
[0117] 本發(fā)明一些實(shí)施例還提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有多條指令,所述指令適于由處理器加載并執(zhí)行上述實(shí)施例的方法步驟。本實(shí)施例提供的計(jì)算
機(jī)存儲(chǔ)介質(zhì),可執(zhí)行本發(fā)明前述實(shí)施例提供的球磨機(jī)制粉優(yōu)化控制方法,具體相應(yīng)的功能
和有益效果。
[0118] 本發(fā)明一些實(shí)施例還提供了一種電子設(shè)備,包括:處理器和存儲(chǔ)器;其中,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序適于由所述處理器加載并執(zhí)行上述實(shí)施例的方法
步驟。本實(shí)施例提供的電子設(shè)備,可執(zhí)行本發(fā)明前述實(shí)施例提供的球磨機(jī)制粉優(yōu)化控制方
法,具體相應(yīng)的功能和有益效果。
[0119] 以上是對本發(fā)明的較佳實(shí)施進(jìn)行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實(shí)施例,熟悉本領(lǐng)域的技術(shù)人員在不違背本發(fā)明精神的前提下還可做出種種的等同變形或替
換,這些等同的變型或替換均包含在本申請權(quán)利要求所限定的范圍內(nèi)。
聲明:
“基于多智能體TLBO算法的球磨機(jī)制粉優(yōu)化控制方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)