1.本發(fā)明涉及污染物溯源技術(shù)領(lǐng)域,特別是涉及一種基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法。
背景技術(shù):
2.隨著我國經(jīng)濟(jì)快速發(fā)展、工業(yè)化和城鎮(zhèn)化進(jìn)程不斷加速、能源消耗增加,出現(xiàn)了一系列的大氣環(huán)境問題。相比于水體、土壤等環(huán)境中的污染物,大氣污染物更具有易擴(kuò)散、易混合、污染路徑不清晰等的特性,會受到排放源、污染過程、氣象條件等影響。其中,排放源是內(nèi)因、氣象條件是外因、污染過程是動因。由于動因和外因主要受到自然客觀規(guī)律的影響,以至于人力難以控制,因此,控制內(nèi)因則是大氣污染防治、環(huán)境管理最有效的方法,其核心就是找準(zhǔn)污染源頭,厘清污染成因,實現(xiàn)靶向治理,提高控制效率。
3.找準(zhǔn)大氣污染源頭可分為兩大類,一是污染溯源,側(cè)重于時空分布上的排放源追溯;二是排放源解析,側(cè)重于排放源成分和行業(yè)解析。大氣精細(xì)化網(wǎng)格體系是環(huán)境空氣質(zhì)量精準(zhǔn)治理及科學(xué)管控的主要手段,應(yīng)用較為廣泛?;诰W(wǎng)格化的環(huán)境專業(yè)統(tǒng)計學(xué)數(shù)據(jù)分析可實現(xiàn)粗略的大氣污染溯源,但響應(yīng)時間較長。因此,研究者們采用基于模型軟件、機(jī)器學(xué)習(xí)算法的大氣污染溯源來提高響應(yīng)時間,但是現(xiàn)有的方法在實現(xiàn)大氣污染溯源時存在著不足,具體表現(xiàn)如下:(1)后向軌跡法:是一種用于計算和分析氣流運動、沉降及擴(kuò)散軌跡的綜合模式系統(tǒng),其核心是通過三維氣象場中的風(fēng)向、風(fēng)速來計算和描述氣團(tuán)的運動,進(jìn)而通過氣團(tuán)軌跡鎖定污染源位置。但該方法對風(fēng)場數(shù)據(jù)的依賴性較強(qiáng),且受到多種氣象要素輸入場的局限,目前研究主要集中于短時間尺度的長距離輸送和外來污染源的確定,在應(yīng)對境外污染源、區(qū)域聯(lián)防聯(lián)控治理方面可提供理論借鑒,但在應(yīng)對小尺度的區(qū)域內(nèi)源污染溯源方面暫不適用。(2)概率方法:主要是針對大氣污染物理化學(xué)過程的復(fù)雜性和數(shù)值模式的離散性而發(fā)展一種污染溯源方法,主要原理是將可用的濃度觀測數(shù)據(jù)與先驗信息相結(jié)合,基于大量歷史數(shù)據(jù)分析和挖掘得到的后驗參數(shù)的不確定性及置信區(qū)間。在應(yīng)用時需要有大量的數(shù)據(jù)進(jìn)行支撐,且需要已知污染源的先驗信息,這在大氣應(yīng)急響應(yīng)中是難以實現(xiàn)的。(3)顆粒物來源解析法:通過分析環(huán)境空氣中的顆粒物和污染源樣品的物理化學(xué)特性,定性識別污染源。同時,可結(jié)合數(shù)理統(tǒng)計、數(shù)值模式模擬定量計算污染源貢獻(xiàn)率。但該方法著重解析的是排放源成分和行業(yè),尚不能獲得地理空間上的污染源鎖定及源貢獻(xiàn)率,因此,該方法難以滿足大氣污染精準(zhǔn)溯源、難以實現(xiàn)大氣污染靶向治理與高效管控的需求。
4.現(xiàn)階段根據(jù)模型進(jìn)行溯源的方式多從邊界條件對污染物擴(kuò)散影響的角度進(jìn)行溯源分析,如風(fēng)向、風(fēng)力等因素,此類模型不具備普適性,無法實現(xiàn)不同區(qū)域場景的快速部署,需要具有一定知識背景的人員進(jìn)行本地化參數(shù)調(diào)整。同時,也沒有考慮污染物傳輸過程中實時數(shù)據(jù)的變化,因此屬于穩(wěn)態(tài)建模,無法根據(jù)時空污染物濃度瞬態(tài)數(shù)據(jù)對模型進(jìn)行動態(tài)響應(yīng)修正;并且現(xiàn)有模型無法有效考慮污染物濃度傳輸過程中的延時效應(yīng)以及污染物事件有效時間窗口不確定的問題。
技術(shù)實現(xiàn)要素:
5.本發(fā)明的目的是提供一種基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,根據(jù)區(qū)域網(wǎng)格源時空污染物濃度數(shù)據(jù),利用耦合機(jī)器學(xué)習(xí)和相關(guān)性分析方法,對污染物傳輸通道和污染源區(qū)域進(jìn)行智能識別。
6.為實現(xiàn)上述目的,本發(fā)明提供一種基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,具體包括以下步驟:
7.s1、獲取目標(biāo)區(qū)域內(nèi)每個網(wǎng)格源站點的實時時空數(shù)據(jù)和歷史時空數(shù)據(jù);
8.s2、根據(jù)所述實時時空數(shù)據(jù)和所述歷史時空數(shù)據(jù),構(gòu)建數(shù)據(jù)庫;并從所述數(shù)據(jù)庫中提取一段時間內(nèi)的歷史時空數(shù)據(jù);
9.s3、根據(jù)所述一段時間內(nèi)的歷史時空數(shù)據(jù),構(gòu)建污染物濃度分布瞬態(tài)模型;
10.s4、利用高斯回歸對所述污染物濃度分布瞬態(tài)模型進(jìn)行特征提取,并對提取的特征進(jìn)行標(biāo)準(zhǔn)化處理;
11.s5、利用機(jī)器學(xué)習(xí)算法構(gòu)建可能污染源選取模型,并將提取的所述一段時間內(nèi)的歷史時空數(shù)據(jù)作為訓(xùn)練集對所述可能污染源選取模型進(jìn)行訓(xùn)練;然后將所述提取的特征輸入到訓(xùn)練完成的可能污染源選取模型中,輸出網(wǎng)格源是否在傳輸路徑上的結(jié)果;
12.s6、將所述實時時空數(shù)據(jù)重復(fù)步驟s3~s4,獲取特征r2,μ,δ,并對所述特征進(jìn)行標(biāo)準(zhǔn)化處理,得到預(yù)處理后的新增數(shù)據(jù);
13.s7、將所述預(yù)處理后的新增數(shù)據(jù)作為輸入到訓(xùn)練完成的可能污染源選取模型中,輸出網(wǎng)格源是否在傳輸路徑上;并將輸出的結(jié)果增加到所述訓(xùn)練集中對所述可能污染源選取模型進(jìn)行優(yōu)化和不間斷學(xué)習(xí)。
14.優(yōu)選的,所述實時時空數(shù)據(jù)和所述歷史時空數(shù)據(jù)均包括:地理位置信息、各污染物濃度信息、采樣時間和氣象信息。
15.優(yōu)選的,所述s3具體為:
16.從所述歷史時空數(shù)據(jù)中提取各污染物濃度信息,然后以傳輸通道網(wǎng)格源k構(gòu)建的層級樹結(jié)構(gòu)為基礎(chǔ),并根據(jù)設(shè)定的污染事件得到有效時間窗口i和傳輸響應(yīng)延時j,實時構(gòu)建逐級待比較矩陣和相關(guān)系數(shù)矩陣,即污染物濃度分布瞬態(tài)模型。
17.優(yōu)選的,所述s4具體為:
18.將所述相關(guān)系數(shù)矩陣轉(zhuǎn)換成相關(guān)系數(shù)向量,然后利用高斯回歸對所述相關(guān)系數(shù)向量進(jìn)行特征提取,得到高斯回歸特征值r
2k
、μ
k
,δ
k
。
19.優(yōu)選的,所述可能污染源選取模型的表達(dá)式為:
[0020][0021]
其中,y
k
∈[0,1],0代表網(wǎng)格源k不在傳輸路徑上,1代表網(wǎng)格源k在傳輸路徑上;f
k
表示可能污染源選取模型,根據(jù)f
k
對每一個站點進(jìn)行分析,記錄y
k
=1的網(wǎng)格源k。
[0022]
優(yōu)選的,所述機(jī)器學(xué)習(xí)算法包括隨機(jī)森林、決策樹、聚類、貝葉斯分類、支持向量機(jī)、em和adaboost。
[0023]
優(yōu)選的,所述s7具體為:
[0024]
對污染事件發(fā)生時刻和污染事件濃度向量重新賦值,重復(fù)步驟s1~s5,并進(jìn)行逐級標(biāo)記,直至相關(guān)系數(shù)最低,輸出標(biāo)記結(jié)果,即為傳輸通道與可能的污染源區(qū)域,結(jié)束迭代
計算,實現(xiàn)模型不間斷學(xué)習(xí)和優(yōu)化。
[0025]
優(yōu)選的,構(gòu)建所述污染物濃度分布瞬態(tài)模型的方法具體為:
[0026]
步驟1、根據(jù)國家標(biāo)準(zhǔn)設(shè)定污染事件觸發(fā)條件,自動標(biāo)記污染事件發(fā)生時刻t;
[0027]
步驟2、基于所述步驟1,并通過設(shè)定的污染事件有效時間窗口i和傳輸響應(yīng)延時j構(gòu)建污染事件濃度向量x
i
和逐級待比較向量y
i,jk
:
[0028]
步驟3、根據(jù)所述逐級待比較向量y
i,jk
,構(gòu)建逐級待比較矩陣z
i,jk
;
[0029]
步驟4、基于所述逐級待比較矩陣z
i,jk
,構(gòu)建網(wǎng)格源k的相關(guān)系數(shù)矩陣r
i,jk
,即污染物濃度分布瞬態(tài)模型。
[0030]
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下技術(shù)效果:
[0031]
由于現(xiàn)階段溯源模型多為考慮邊界對污染物擴(kuò)散影響的穩(wěn)態(tài)建模,且沒有考慮污染物濃度傳輸過程中的延時效應(yīng)和污染物事件有效時間窗口不確定的問題,以及存在無法不間斷的提升模型穩(wěn)定性、普適性和準(zhǔn)確度的問題,本發(fā)明通過基于區(qū)域網(wǎng)格源時空污染物濃度數(shù)據(jù)的瞬態(tài)建模方式,并結(jié)合高斯回歸和相關(guān)性分析的手段對污染物濃度時空相關(guān)性矩陣進(jìn)行特征提取,解決污染物濃度的延時響應(yīng)和時間窗口不確定的問題,并利用機(jī)器學(xué)的算法實現(xiàn)了模型訓(xùn)練數(shù)據(jù)的不間斷更新,從而保證了溯源算法準(zhǔn)確度的持續(xù)有效提升。
附圖說明
[0032]
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0033]
圖1為本發(fā)明方法流程圖。
具體實施方式
[0034]
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0035]
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0036]
實施例1
[0037]
參照圖1所示,本發(fā)明提出一種基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,具體包括以下步驟:
[0038]
s1、獲取目標(biāo)區(qū)域內(nèi)每個網(wǎng)格源站點的實時時空數(shù)據(jù)和歷史時空數(shù)據(jù);
[0039]
實時時空數(shù)據(jù)和歷史時空數(shù)據(jù)均包括:地理位置信息(經(jīng)度、緯度)、采樣時間、氣象信息(風(fēng)力、風(fēng)向等)、各污染物濃度信息等。
[0040]
s2、根據(jù)實時時空數(shù)據(jù)和所述歷史時空數(shù)據(jù),構(gòu)建數(shù)據(jù)庫;并從所述數(shù)據(jù)庫中提取一段時間內(nèi)的歷史時空數(shù)據(jù);
[0041]
s3、基于所述一段時間內(nèi)的歷史時空數(shù)據(jù),構(gòu)建污染物濃度分布瞬態(tài)模型,提高模型動態(tài)響應(yīng)速度;
[0042]
從所述歷史時空數(shù)據(jù)中提取各污染物濃度信息,然后以傳輸通道網(wǎng)格源k構(gòu)建的層級樹結(jié)構(gòu)為基礎(chǔ),并根據(jù)設(shè)定的污染事件有效時間窗口i和傳輸響應(yīng)延時j,構(gòu)建逐級待比較矩陣和相關(guān)系數(shù)矩陣,即污染物濃度分布瞬態(tài)模型,具體為:
[0043]
s3.1、根據(jù)國家標(biāo)準(zhǔn)設(shè)定污染事件觸發(fā)條件,自動標(biāo)記污染事件發(fā)生時刻t。
[0044]
s3.2、構(gòu)建污染事件濃度向量x
i
,如式(1)所示:
[0045]
x
i
=(x
t
,x
t+1
,
…
,x
t+i
)
???
(1)
[0046]
其中,x
t
表示發(fā)生標(biāo)準(zhǔn)事件的網(wǎng)格源在t時刻污染物濃度;i表示設(shè)定的污染物事件有效時間窗口,i∈[3,i];
[0047][0048]
i表示i的取值上限;運算符表示向上取整;t為污染事件前驅(qū)時長;
△
t為網(wǎng)格源數(shù)據(jù)監(jiān)測周期。
[0049]
s3.3、構(gòu)建逐級待比較向量y
i,jk
,如式(3)
?
(5)所示:
[0050]
y
i,jk
=(y
t
?
jk
,y
t
?
j+1k
,
…
,y
t
?
j+ik
)
???
(3)
[0051][0052][0053]
其中,y≠x,y
i,jk
表示k站點在t
?
j時刻染物濃度;j表示設(shè)定的污染物傳輸響應(yīng)延時,j∈[1,j];j表示j的取值上限;v為風(fēng)速;α為風(fēng)向與空間兩點的夾角;d為任意兩個網(wǎng)格源平均距離;m、n∈k,k為網(wǎng)格源總數(shù);d
m,n
為網(wǎng)格源m和n之間的距離;為從k個網(wǎng)格源中取出任意2個網(wǎng)格源的組合數(shù)。
[0054]
s3.4、根據(jù)逐級待比較向量y
i,jk
,構(gòu)建逐級待比較矩陣z
i,jk
,如式(6)所示:
[0055][0056]
s3.5、基于所述逐級待比較矩陣z
i,jk
,構(gòu)建網(wǎng)格源k的相關(guān)系數(shù)矩陣r
i,jk
,如式(7)所示:
[0057]
[0058][0059]
s4、利用高斯回歸對網(wǎng)格源污染物濃度相關(guān)系數(shù)矩陣進(jìn)行特征提取,并對提取的特征進(jìn)行標(biāo)準(zhǔn)化處理,得到高斯回歸特征值:r
2k
、μ
k
,δ
k
;
[0060]
將相關(guān)系數(shù)矩陣轉(zhuǎn)r
i,jk
換成向量r
rk
;
[0061]
r=(i
?
2)
·
j
???
(9)
[0062]
再利用高斯回歸對r
rk
進(jìn)行特征提取,得到高斯回歸特征值:r
2k
、μ
k
,δ
k
;r2表示高斯回歸擬合效果,μ表示相關(guān)系數(shù)的平均值,δ表示相關(guān)系數(shù)的方差。
[0063]
s5、利用機(jī)器學(xué)習(xí)算法構(gòu)建可能污染源選取模型,并將提取的所述一段時間內(nèi)的歷史時空數(shù)據(jù)作為訓(xùn)練集對所述可能污染源選取模型進(jìn)行訓(xùn)練;然后將所述提取的特征輸入到訓(xùn)練完成的可能污染源選取模型中,輸出網(wǎng)格源是否在傳輸路徑上的結(jié)果,對污染物傳輸通道和污染源區(qū)域進(jìn)行智能識別,降低人工分析難度,提高模型的普適性;具體為:
[0064]
利用隨機(jī)森林的機(jī)器學(xué)習(xí)算法,結(jié)合污染物濃度分布瞬態(tài)模型f
k
進(jìn)行可能污染源選取模型的建立,如式(10)所示:
[0065][0066]
其中,y
k
∈[0,1],0代表網(wǎng)格源k不在傳輸路徑上,1代表網(wǎng)格源k在傳輸路徑上;此處采用專業(yè)人士人工標(biāo)注該網(wǎng)格源站點是否在污染傳輸路徑上(0代表網(wǎng)格源不在傳輸路徑上,1代表網(wǎng)格源在傳輸路徑上)。
[0067]
再根據(jù)f
k
對每一個站點進(jìn)行分析,記錄y
k
=1的網(wǎng)格源k。
[0068]
其中,機(jī)器學(xué)習(xí)算法包括隨機(jī)森林、決策樹、聚類、貝葉斯分類、支持向量機(jī)、em和adaboost等多種機(jī)器學(xué)習(xí)算法沒包括但不限于隨機(jī)森林;利用多種機(jī)器學(xué)習(xí)算法進(jìn)行建模,選出冠軍模型作為可能污染源選取模型;
[0069]
s6、當(dāng)有新的污染途徑網(wǎng)格源(新增數(shù)據(jù))出現(xiàn)后,即實時時空數(shù)據(jù),然后提取新的地理位置信息:經(jīng)度、緯度;各污染物濃度信息等;采樣時間;氣象信息:風(fēng)力、風(fēng)向等,重復(fù)步驟s3~s4進(jìn)行相關(guān)性動態(tài)分析,獲取特征r2,μ,δ,并對特征進(jìn)行標(biāo)準(zhǔn)化處理,得到預(yù)處理后的新增數(shù)據(jù);
[0070]
s7、將得到的預(yù)處理后的新增數(shù)據(jù)輸入到所述可能污染源選取模型,得到該網(wǎng)格源是否在傳輸路徑上的結(jié)論;并根據(jù)可能污染源選取模型的應(yīng)用反饋,增加到訓(xùn)練集,實現(xiàn)模型可以根據(jù)新增數(shù)據(jù)不間斷學(xué)習(xí)和優(yōu)化,從而提高判斷精度。
[0071]
根據(jù)公式(11)和(12)重新賦值,循環(huán)步驟s1~s5,并逐級標(biāo)記k
w
,直至相關(guān)系數(shù)r
i,jk
過低,輸出k
w
,即為傳輸通道與可能的污染源區(qū)域,結(jié)束迭代計算,實現(xiàn)模型不間斷學(xué)習(xí)和優(yōu)化。w表示第w次循環(huán)。
[0072]
t=t
?
j
???
(11)
[0073][0074]
以上所述的實施例僅是對本發(fā)明的優(yōu)選方式進(jìn)行描述,并非對本發(fā)明的范圍進(jìn)行限定,在不脫離本發(fā)明設(shè)計精神的前提下,本領(lǐng)域普通技術(shù)人員對本發(fā)明的技術(shù)方案做出的各種變形和改進(jìn),均應(yīng)落入本發(fā)明權(quán)利要求書確定的保護(hù)范圍內(nèi)。技術(shù)特征:
1.一種基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,其特征在于,具體包括以下步驟:s1、獲取目標(biāo)區(qū)域內(nèi)每個網(wǎng)格源站點的實時時空數(shù)據(jù)和歷史時空數(shù)據(jù);s2、根據(jù)所述實時時空數(shù)據(jù)和所述歷史時空數(shù)據(jù),構(gòu)建數(shù)據(jù)庫;并從所述數(shù)據(jù)庫中提取一段時間內(nèi)的歷史時空數(shù)據(jù);s3、根據(jù)所述一段時間內(nèi)的歷史時空數(shù)據(jù),構(gòu)建污染物濃度分布瞬態(tài)模型;s4、利用高斯回歸對所述污染物濃度分布瞬態(tài)模型進(jìn)行特征提取,并對提取的特征進(jìn)行標(biāo)準(zhǔn)化處理;s5、利用機(jī)器學(xué)習(xí)算法構(gòu)建可能污染源選取模型,并將提取的所述一段時間內(nèi)的歷史時空數(shù)據(jù)作為訓(xùn)練集對所述可能污染源選取模型進(jìn)行訓(xùn)練;然后將所述提取的特征輸入到訓(xùn)練完成的可能污染源選取模型中,輸出網(wǎng)格源是否在傳輸路徑上的結(jié)果;s6、將所述實時時空數(shù)據(jù)重復(fù)步驟s3~s4,獲取特征r2,μ,δ,并對所述特征進(jìn)行標(biāo)準(zhǔn)化處理,得到預(yù)處理后的新增數(shù)據(jù);s7、將所述預(yù)處理后的新增數(shù)據(jù)作為輸入到訓(xùn)練完成的可能污染源選取模型中,輸出網(wǎng)格源是否在傳輸路徑上;并將輸出的結(jié)果增加到所述訓(xùn)練集中對所述可能污染源選取模型進(jìn)行優(yōu)化和不間斷學(xué)習(xí)。2.根據(jù)權(quán)利要求1所述的基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,其特征在于,所述實時時空數(shù)據(jù)和所述歷史時空數(shù)據(jù)均包括:地理位置信息、各污染物濃度信息、采樣時間和氣象信息。3.根據(jù)權(quán)利要求2所述的基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,其特征在于,所述s3具體為:從所述歷史時空數(shù)據(jù)中提取各污染物濃度信息,然后以傳輸通道網(wǎng)格源k構(gòu)建的層級樹結(jié)構(gòu)為基礎(chǔ),并根據(jù)設(shè)定的污染事件得到有效時間窗口i和傳輸響應(yīng)延時j,實時構(gòu)建逐級待比較矩陣和相關(guān)系數(shù)矩陣,即污染物濃度分布瞬態(tài)模型。4.根據(jù)權(quán)利要求3所述的基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,其特征在于,所述s4具體為:將所述相關(guān)系數(shù)矩陣轉(zhuǎn)換成相關(guān)系數(shù)向量,然后利用高斯回歸對所述相關(guān)系數(shù)向量進(jìn)行特征提取,得到高斯回歸特征值r
2k
、μ
k
,δ
k
。5.根據(jù)權(quán)利要求1所述的基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,其特征在于,所述可能污染源選取模型的表達(dá)式為:其中,y
k
∈[0,1],0代表網(wǎng)格源k不在傳輸路徑上,1代表網(wǎng)格源k在傳輸路徑上;f
k
表示可能污染源選取模型,根據(jù)f
k
對每一個站點進(jìn)行分析,記錄y
k
=1的網(wǎng)格源k。6.根據(jù)權(quán)利要求5所述的基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,其特征在于,所述機(jī)器學(xué)習(xí)算法包括隨機(jī)森林、決策樹、聚類、貝葉斯分類、支持向量機(jī)、em和adaboost。7.根據(jù)權(quán)利要求5所述的基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,其特征在于,所述s7具體為:
對污染事件發(fā)生時刻和污染事件濃度向量重新賦值,重復(fù)步驟s1~s5,并進(jìn)行逐級標(biāo)記,直至相關(guān)系數(shù)最低,輸出標(biāo)記結(jié)果,即為傳輸通道與可能的污染源區(qū)域,結(jié)束迭代計算,實現(xiàn)模型不間斷學(xué)習(xí)和優(yōu)化。8.根據(jù)權(quán)利要求3所述的基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,其特征在于,構(gòu)建所述污染物濃度分布瞬態(tài)模型的方法具體為:步驟1、根據(jù)國家標(biāo)準(zhǔn)設(shè)定污染事件觸發(fā)條件,自動標(biāo)記污染事件發(fā)生時刻t;步驟2、基于所述步驟1,并通過設(shè)定的污染事件有效時間窗口i和傳輸響應(yīng)延時j構(gòu)建污染事件濃度向量x
i
和逐級待比較向量步驟3、根據(jù)所述逐級待比較向量構(gòu)建逐級待比較矩陣步驟4、基于所述逐級待比較矩陣構(gòu)建網(wǎng)格源k的相關(guān)系數(shù)矩陣即污染物濃度分布瞬態(tài)模型。
技術(shù)總結(jié)
本發(fā)明公開了一種基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法,具體包括以下步驟:利用區(qū)域網(wǎng)格源時空污染物濃度數(shù)據(jù),建立污染物濃度分布瞬態(tài)模型;利用高斯回歸對網(wǎng)格源污染物濃度相關(guān)系數(shù)矩陣進(jìn)行特征提取,耦合機(jī)器學(xué)習(xí)算法對污染物傳輸通道和污染源區(qū)域進(jìn)行智能識別。本發(fā)明基于區(qū)域網(wǎng)格源時空污染物濃度數(shù)據(jù)的瞬態(tài)建模方式,并結(jié)合高斯回歸和相關(guān)性分析的手段對污染物濃度時空相關(guān)性矩陣進(jìn)行特征提取,解決污染物濃度的延時響應(yīng)和時間窗口不確定的問題,并利用機(jī)器學(xué)的算法實現(xiàn)了模型訓(xùn)練數(shù)據(jù)的不間斷更新,從而保證了溯源算法準(zhǔn)確度的持續(xù)有效提升。溯源算法準(zhǔn)確度的持續(xù)有效提升。溯源算法準(zhǔn)確度的持續(xù)有效提升。
技術(shù)研發(fā)人員:龐繼偉 張栩 郭煒 李麗芬 高敏
受保護(hù)的技術(shù)使用者:中節(jié)能天融科技有限公司
技術(shù)研發(fā)日:2021.08.12
技術(shù)公布日:2021/11/5
聲明:
“基于耦合機(jī)器學(xué)習(xí)和相關(guān)性分析的大氣污染物溯源方法與流程” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)