北方偉業(yè)計(jì)量集團(tuán)有限公司
在減少信息丟失的基礎(chǔ)上降低預(yù)測模型的輸入維度,首先利用PCA計(jì)算水質(zhì)溶解氧主成分因子的累計(jì)方差貢獻(xiàn)率,選擇90%的累計(jì)方差貢獻(xiàn)率為閾值,把方差貢獻(xiàn)率的累加值超過90%的因子數(shù)作為特征變量的選取個(gè)數(shù),如圖2所示。從圖2中可以看出,當(dāng)?shù)?個(gè)特征因子出現(xiàn)的時(shí)候,其總體的累計(jì)方差貢獻(xiàn)率超過了90%,因此選取8個(gè)特征因子代替原變量作為預(yù)測模型的輸入。再利用互信息分別求出14個(gè)影響因子與溶解氧之間的互信息值,可以得出溶解氧與各個(gè)水質(zhì)指標(biāo)的依賴程度較高,與空氣中的污染物因素依賴程度較低。其重要影響因子依次為電導(dǎo)率、總磷、濁度、高錳酸鉀指數(shù)、PH、氨氮、水溫、總氮、PM2.5、NO2、PM10、O3、CO、SO2,如表1所示。
在選取的樣本信息中,水質(zhì)指標(biāo)濁度與水溫之間的相關(guān)系數(shù)為0.58>0.5,氨氮與電導(dǎo)率之間的相關(guān)系數(shù)為0.547>0.5,在99%的置信區(qū)間下,具有顯著相關(guān)性。而互信息值0.7759(濁度)>0.6800(水溫),0.7854(電導(dǎo)率)>0.7598(氨氮),因此選取電導(dǎo)率、總磷、濁度、高錳酸鉀指數(shù)、PH、總氮等作為水質(zhì)指標(biāo)中影響溶解氧含量的特征變量。
由相關(guān)性分析得到污染物各因子間的相關(guān)系數(shù)如表2。由表2可以看出,污染物各指標(biāo)因子之間具有強(qiáng)相關(guān)性甚至多重相關(guān)性,因環(huán)境系統(tǒng)是一個(gè)復(fù)雜的化學(xué)系統(tǒng),指標(biāo)間相互制約會(huì)引起一些冗余信息,最終會(huì)影響預(yù)測模型的精度,增大誤差。
綜上,本文最終選擇了電導(dǎo)率、總磷、濁度、高錳酸鉀指數(shù)、PH、總氮、PM2.5、O3等8個(gè)影響因子作為溶解氧的關(guān)鍵指標(biāo),此方法是通過篩選出合適的特征子集進(jìn)行組合,對(duì)已有數(shù)據(jù)進(jìn)行描述、建模,以達(dá)到優(yōu)化目標(biāo)函數(shù)的目的,有效解決變量間的冗余性在系統(tǒng)建模中的不良作用,避免預(yù)測模型出現(xiàn)過擬合現(xiàn)象。
基于GNIPSO-SVR的溶解氧預(yù)測模型是在Intel(R) Core(TM) i7-10510U(8核),內(nèi)存12GB,Win10 64位操作系統(tǒng),編程語言為MATLAB R2018a的開發(fā)環(huán)境中進(jìn)行仿真實(shí)驗(yàn)。在GNIPSO算法中:wmax=0.9,wmin=0.4,種群規(guī)模大小為30,個(gè)體學(xué)習(xí)因子c1=1.7,社會(huì)學(xué)習(xí)因子c2=1.5,最大迭代次數(shù)為100。通過GNIPSO算法獲得SVR模型的最優(yōu)參數(shù)(cbest,gbest)=(39.0125,0.5013),將最優(yōu)參數(shù)(cbest,gbest)代入預(yù)測模型中。
式(22)的均方誤差(MSE)作為算法的適應(yīng)度函數(shù)fitness,求得適應(yīng)度曲線如圖3所示,可以看出慣性權(quán)重非線性遞減的PSO-SVR的適應(yīng)度值始終小于標(biāo)準(zhǔn)的PSO-SVR,而且慣性權(quán)重非線性遞減的PSO-SVR算法能較快的完成迭代且誤差較小,該算法在全局尋優(yōu)上具有較高的性能。
聲明:本文所用圖片、文字來源《信息與控制》,版權(quán)歸原作者所有。如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)與本網(wǎng)聯(lián)系刪除。
采集到的數(shù)據(jù)一般不直接采用,需經(jīng)過數(shù)據(jù)的歸一化處理。這是因?yàn)樗|(zhì)因子指標(biāo)的范圍比較大,不同的數(shù)據(jù)具有不同的量綱單位,為了消除水質(zhì)指標(biāo)彼此之間的量綱影響及保證這些數(shù)據(jù)之間具有可比性以及提高模型的運(yùn)行速度和預(yù)測精度。本文采用MATLAB R2018a的map-maxmin函數(shù)進(jìn)行歸一化處理,如式(23)所示,“apply”模式是將數(shù)據(jù)指標(biāo)轉(zhuǎn)化到[-1,1]之間,便于對(duì)比預(yù)測,而“resver”模式可以將數(shù)據(jù)反歸一化回去。
了解更多> >在選取的樣本信息中,水質(zhì)指標(biāo)濁度與水溫之間的相關(guān)系數(shù)為0.58>0.5,氨氮與電導(dǎo)率之間的相關(guān)系數(shù)為0.547>0.5,在99%的置信區(qū)間下,具有顯著相關(guān)性。而互信息值0.7759(濁度)>0.6800(水溫),0.7854(電導(dǎo)率)>0.7598(氨氮),因此選取電導(dǎo)率、總磷、濁度、高錳酸鉀指數(shù)、PH、總氮等作為水質(zhì)指標(biāo)中影響溶解氧含量的特征變量。
了解更多> >綜上所述,在研究水質(zhì)指標(biāo)溶解氧問題時(shí)選擇的特征變量過少導(dǎo)致建模效果不佳,預(yù)測結(jié)果不具有代表性,特征變量多可以提供描述問題的更多信息,但數(shù)據(jù)中會(huì)存在無關(guān)和弱相關(guān)且冗余的特征變量,會(huì)降低模型的泛化性能。在對(duì)溶解氧預(yù)測實(shí)踐中,PCA-MI特征選擇方法選取的特征變量更具有代表性,能更有效的提高模型預(yù)測性能。
了解更多> >在解決水質(zhì)指標(biāo)溶解氧的預(yù)測問題時(shí),將經(jīng)過PCA和MI組合特征選擇的溶解氧數(shù)據(jù)作為GNIPSO-SVR預(yù)測模型的輸入,并與BP神經(jīng)網(wǎng)絡(luò)、SVR、PSO-SVR等預(yù)測模型進(jìn)行對(duì)比分析。各個(gè)溶解氧預(yù)測模型的總體趨勢與實(shí)際值都比較吻合,但本文提出的GNIPSO-SVR模型預(yù)測DO的曲線更接近實(shí)際值的曲線,PSO-SVR模型的預(yù)測效果次之,SVR的預(yù)測曲線與實(shí)際值曲線擬合度最差,尤其是對(duì)突變值的擬合情況,各個(gè)模型的預(yù)測值和實(shí)際值的擬合曲線的可視化結(jié)果如圖4-圖7所示。
了解更多> >本文利用主成分分析(PCA)、互信息(MI)、非線性慣性權(quán)重遞減的粒子群優(yōu)化算法(GNIPSO)和支持向量回歸機(jī)(SVR),提出了一種基于高斯函數(shù)的非線性權(quán)重遞減的粒子群算法優(yōu)化支持向量回歸機(jī)(GNIPSO-SVR)的預(yù)測模型,通過實(shí)驗(yàn)證明了GNIPSO算法優(yōu)化SVR的參數(shù)優(yōu)于標(biāo)準(zhǔn)的PSO算法和慣性權(quán)重線性遞減的PSO算法。
了解更多> >通話對(duì)您免費(fèi),請(qǐng)放心接聽
溫馨提示:
1.手機(jī)直接輸入,座機(jī)前請(qǐng)加區(qū)號(hào) 如13803766220,010-58103678
2.我們將根據(jù)您提供的電話號(hào)碼,立即回電,請(qǐng)注意接聽
3.因?yàn)槟潜唤蟹剑ㄔ拰?duì)您免費(fèi),請(qǐng)放心接聽
登錄后才可以評(píng)論