題目
基于多人工神經(jīng)網(wǎng)絡自適應選擇和城市河流高光譜圖像的水質參數(shù)制圖
應用關鍵詞
自適應、深度學習、多神經(jīng)網(wǎng)絡、高光譜圖像、水質監(jiān)測
背景
水質參數(shù)主要包括磷、氮、生化需氧量(Biochemical oxygen demand, BOD)、化學需氧量(Chemical oxygen demand, COD)、葉綠素a。水質參數(shù)的異常會影響水生生物生存以及產(chǎn)生水污染,因此需要一種快速、高效的計算方法對水體污染物進行定量預測。
隨著計算機科學和遙感技術的迅速發(fā)展,高光譜遙感圖像分析已被廣泛應用于大氣、土壤和水的參數(shù)預測。目前,利用高光譜進行水質估測的研究中,大多將其看成分類問題而不是回歸問題,并且研究中構建的模型較難適應水質的突然變化。同時,傳統(tǒng)的特征選擇過程是低效的,并且只能預測一個水質參數(shù)。
為解決上述問題,本研究提出了多神經(jīng)網(wǎng)絡自適應選擇方法(Self-adapting selection of multiple neural networks, SSNN),它是一種集相關和逐步回溯為一體的端到端方法,可以在不同設置下選擇最佳模型,并能定量預測6個水質參數(shù)。在本研究中,使用數(shù)學和統(tǒng)計檢驗標準支持所提出模型的可靠性。本研究利用地面分析光譜儀(ASD)采集的水體的修正光譜反射率,建立了基于遙感數(shù)據(jù)的自適應人工神經(jīng)網(wǎng)絡(ANN),對水體氮、磷、BOD、COD、濁度和Chla進行預測。
試驗設計
試驗地點位于廣東省中山市的石岐河。北京大學劉瑜教授團隊利用ASD(325 nm ~ 1075 nm)采集地下水地表光譜反射率,共獲得79個點的地面測量數(shù)據(jù)。每個采樣點獲取其水體氮、磷、BOD、COD、濁度和Chla數(shù)據(jù)。本研究使用的無人機為大疆M600,高光譜成像儀為Gaiasky-mini2-VN(江蘇雙利合譜),其波長范圍為401.81 nm ~ 999.28 nm,在120米高的天空中飛行,空間分辨率為40 cm。
ASD和高光譜成像儀的波段值不同,前者的波段范圍覆蓋后者的波段范圍。根據(jù)測量輻射度的協(xié)議和輻射度-反射率傳遞法獲得ASD反射率后,我們將ASD的波長投影到高光譜成像儀上,使其具有相同的中心和波段數(shù)。然后,通過特征工程,在404.0 nm ~ 894.3 nm范圍內選取145個特征波段。UAV高光譜圖像數(shù)據(jù)中每個像元點包含的270個波段的反射率數(shù)據(jù)可以轉移成145個特征波段。由于未對圖像進行大氣校正,我們選擇地面點來消除ASD與高光譜成像儀反射率的差異。
圖1顯示了用于估計水質參數(shù)的方法。首先,地面樣本包含ASD反射率數(shù)據(jù)和水質參數(shù)兩部分,用于建立SSNN模型。其次,利用非線性反射率傳遞模型中的UAV高光譜圖像數(shù)據(jù)作為輸入,通過將UAV的反射率傳遞到ASD來細化數(shù)據(jù)。第三,傳遞的UAV反射率數(shù)據(jù)被用于SSNN模型,從而對水質參數(shù)進行定量估計,并利用ArcGIS軟件包生成專題圖。
本文提出的SSNN模型主要由神經(jīng)網(wǎng)絡、線性回歸和反饋機三部分組成(圖2)。ANN是傳統(tǒng)的數(shù)值預測ANN,包括特征選擇、逐步回溯和權重相關性。線性回歸被設計用于調整最終結果。反饋機用于SSNN模型的自適應,更新神經(jīng)網(wǎng)絡結構的設置,如隱藏層數(shù)、激活函數(shù)和每個隱藏層的神經(jīng)元數(shù)。
SSNN的訓練數(shù)據(jù)包括每個點的水面反射率和所有污染物的含量水平。該方法通過對所有ANN - BP進行比較,篩選出最優(yōu)的反演模型。在SSNN模型中進行反向傳播、逐步回溯、Pearson相關和余弦相關。根據(jù)均方根誤差(RMSE)、F統(tǒng)計量、t統(tǒng)計量和R平方值,使用具有不同隱層數(shù)、隱層節(jié)點數(shù)、優(yōu)化器和激活函數(shù)的各種神經(jīng)網(wǎng)絡來選擇其中的最佳神經(jīng)網(wǎng)絡。
圖1 用于水質參數(shù)的多神經(jīng)網(wǎng)絡自適應選擇法(SSNN)的工作流程
圖2 SSNN模型結構
結論
表1展示了不同路線的水質參數(shù)。D1的渾濁度、Chla、BOD、COD和氮在各樣地中最高,因為水樣采集于養(yǎng)魚池。有機物導致高濃度的BOD、COD和氮。由于缺乏良好的出水口和進水口,水池濁度高度集中,造成水池濁度迅速增加。其他路線的水質參數(shù)濃度較低,這是因為存在水交換,生活廢物較少。
表1 研究區(qū)79個訓練數(shù)據(jù)組成的不同路線水質參數(shù)的范圍和平均值
圖3展示了迭代次數(shù)從100到1000次過程中,每100次迭代的精度變化,以及所選ANN-BP模型精度優(yōu)于其他4個模型。所選模型在隱層數(shù)、隱層節(jié)點數(shù)、優(yōu)化器的選擇、激活函數(shù)的選擇等方面與其他四個模型不同。從圖3a-c可以看出,在100 ~ 400次迭代下,所選ANN-BP模型的性能并沒有優(yōu)于其他4個ANN-BP模型,但逐漸優(yōu)于其余模型。經(jīng)過600次迭代,圖3a-c獲得相對穩(wěn)定的精度,模型達到平衡。
圖3 不同水質參數(shù)和訓練迭代的精度圖
表2給出了所選ANN-BP模型的評價標準以及t統(tǒng)計量對應的p值。濁度和Chla有最大的RMSE,因為濁度和Chla在單位的量級和范圍上都大于其他值。F檢驗零假設表明,模型2并不比模型1更能顯著擬合數(shù)據(jù)。一個好的ANN-BP模型通常會給出一個較大的F統(tǒng)計量,并且所有模型之間只對一種水質參數(shù)進行比較。表2中的P值都大于0.05,表明在95%的置信水平下,接受無效假設,對于其中一個水質參數(shù)而言,模型產(chǎn)生的平均值等于真實模型的分布。R2值均大于0.5,表明超過50%的方差可以被自變量解釋。
表2 SSNN方法中有關水質的參數(shù)
表3列出了不同方法在整個區(qū)域測試集上的性能,包括SSNN、傳統(tǒng)單層神經(jīng)網(wǎng)絡和Liew等人的經(jīng)驗方法。本研究所提出方法在RMSE和MPAE方面優(yōu)于其他方法。SSNN對氮的估算效果最佳(MPAE最低)。MPAE比RMSE更有說服力,因為它有效地證明了所提出方法的數(shù)值預測的準確性。后期需要在整個區(qū)域內收集更多的數(shù)據(jù),以確保對各項水質參數(shù)進行準確的數(shù)值預測。氮的R2值比其他的R2值大,而一些R2值高的水質參數(shù)由于隨機樣本量小,其MPAE可能并不低。本研究所提出的方法對大多數(shù)水質參數(shù)的預測是正確的,盡管樣本沒有覆蓋整個區(qū)域上所有間隔40厘米的像素點。
表3 不同模式的統(tǒng)計參數(shù)比較
如前所述,將地面ASD反射率和水質參數(shù)作為SSNN模型的輸入,建立訓練模型,然后將UAV高光譜反射率圖像作為SSNN模型的輸入,預測水質參數(shù)。圖4顯示了在480、550和670 nm三個波長下估計水質參數(shù)的結果圖像。各個水質參數(shù)的分布可以很容易地觀察到,當?shù)丨h(huán)保部門可以追蹤各個水質參數(shù)含量水平隨時間的分布和變化情況,以確定污染源。雖然圖4只顯示了整個研究區(qū)域的一部分,但其結果具有代表性。結果表明,人們居住的地方或生產(chǎn)皮革和塑料的工廠大多被高濁度、COD、BOD和磷污染。特征波長可以定量和定性地解釋水質參數(shù)的變化。
圖4 SSNN在水質參數(shù)反演中的應用
作者信息
劉瑜,博士,北京大學地球與空間科學學院教授,博士生導師。
主要研究方向:基于時空大數(shù)據(jù)的人文社會科學研究。
參考文獻:
Zhang, Y., Wu, L., Ren, H., Liu, Y., Zheng, Y., Liu, Y., & Dong, J. (2020). Mapping Water Quality Parameters in Urban Rivers from Hyperspectral Images Using a New Self-Adapting Selection of Multiple Artificial Neural Networks. Remote Sensing, 12(2).
https://doi.org/10.3390/rs12020336
地址:無錫市梁溪區(qū)南湖大道飛宏路58-1-108
電話:13810664973
郵箱:info@dualix.com.cn
地址:北京市海淀區(qū)中關村大街19號
電話:13810664973
郵箱:info@dualix.com.cn
地址:陜西省西安市高新區(qū)科技一路40號盛方科技園B座三層東區(qū)
電話:13810664973
郵箱:info@dualix.com.cn
地址:成都市青羊區(qū)順城大街206號四川國際大廈七樓G座
電話:13810664973
郵箱:info@dualix.com.cn