【ZiDongHua 之技術(shù)文章區(qū)收錄關(guān)鍵詞: 人工智能 流量計 人工神經(jīng)網(wǎng)絡(luò) ANN 機器學習
 
  使用監(jiān)督機器學習方法直接和間接模擬和預測水文干旱
 
  題目:Direct and Indirect Simulating and Projecting Hydrological Drought Using A Supervised Machine Learning Method期刊:Science of the Total Environment
 
 
 
  01 研究背景
 
  水文研究領(lǐng)域中使用人工智能方法作為模擬工具已成主流趨勢,如河流流量模擬、干旱預測和作物產(chǎn)量模擬。近期研究表明,人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(SVM)、隨機森林(RF)和分類回歸樹(CART)等監(jiān)督方法在干旱模擬中得到了廣泛運用,并在不同研究中均得到了可靠結(jié)果。而在基于人工智能的建模方法中,選擇預測器(作為輸入)起著至關(guān)重要的作用。氣象干旱指標在使用基于人工智能的模型時對水文干旱模擬有重要影響。一種是根據(jù)輸入直接計算以模擬干旱指標,另一種間接模擬方法,則基于人工智能模型模擬的徑流來計算。然而,直接方法和間接方法的結(jié)果優(yōu)劣性則是懸而未決的問題。
 
  對此,Eini等人(2023)利用人工神經(jīng)網(wǎng)絡(luò)(ANN),選擇最高和最低溫度、降水和氣象干旱指標(標準化降水指數(shù),SPI)作為預報因子,通過直接方法和間接方法對標準化徑流指數(shù)(SRI)進行模擬和預測,以評估兩種方法預測結(jié)果的優(yōu)劣。本研究主要考慮了三個科學問題:(1)人工神經(jīng)網(wǎng)絡(luò)在徑流和干旱模擬中是否具有更高的精度?(2)氣象干旱指標(即SPI)是否可以作為徑流和水文干旱的預報因子?(3)在相同的預報因子下,直接方法和間接方法在估計水文干旱指標時差異大不大?
 
  02 研究數(shù)據(jù)與方法
 
  2.1 研究區(qū)域和數(shù)據(jù)
 
  奧德拉河流域(ORB)位于波羅的海地區(qū)(分別位于波蘭(89%)、德國(4.9%)和捷克共和國(6.1%),年平均河流流量154mm(567m3/s),常年平均降水量約650mm。ORB流域大部分橫跨中歐平原,只有最南部是山區(qū)(圖1)。其上游是一條狹窄的多山河流,在其下游(瓦爾塔河出口)流域較為平坦,坡度在0.05m/km和0.001m/km之間變化。研究地區(qū)和中歐在2015年夏季經(jīng)歷了嚴重干旱。
 
  使用的氣象數(shù)據(jù)為區(qū)域網(wǎng)格天氣數(shù)據(jù)集(波蘭領(lǐng)土與維斯圖拉和奧德拉盆地聯(lián)合的網(wǎng)格每日2公里氣候數(shù)據(jù)集,G2DC-PL+:https://opendap.4tu.nl/thredds/catalog/data2/uuid/e939aec0-bdd1-440f-bd1e-c49ff10d0a07/catalog.html)2000-2019年的日降水量以及日最高和最低溫度,使用的河流流量數(shù)據(jù)來自氣象和水管理研究所(IMGW-PIB:https://danepubliczne.imgw.pl/)。依據(jù)年河道流量選擇了四個河流排放站,這些河流排放站可以被認為是主要的河流排放站。河流年平均排水量在61m3/s(米多尼亞-拉西布爾茲排放站)和472m3/s(戈茲多伊斯排放站)之間變化。
 
  

 
  圖1  中歐奧德拉河流域的位置、選定的排放站和流域及其河網(wǎng)。
 
  2.2 標準化干旱指標SPI和SRI
 
  SPI作為短期和長期氣象干旱的指標,可以增加模擬河流流量和水文干旱的數(shù)據(jù)驅(qū)動模型的可靠性。本研究選擇SPI-1到SPI-12作為影響數(shù)據(jù)驅(qū)動模型模擬水文干旱的輸入?yún)?shù),并同時考慮降水和溫度的影響,以評估SRI-3(短期干旱)、SRI-6(中期干旱)、SRI-9(中期干旱)和SRI-12(長期干旱)。對于未來水文干旱指標,首先利用歷史時間序列擬合伽馬分布(SPI和SRI的參考期分別為1990-2019年和2000-2019年),然后采用擬合分布進行預測。其次,采用Run理論評估水文干旱特性,包括干旱嚴重程度、持續(xù)時間和頻率。
 
  2.3 人工神經(jīng)網(wǎng)絡(luò)設(shè)計(ANN)
 
  人工神經(jīng)網(wǎng)絡(luò)設(shè)計(ANN)作為有監(jiān)督的機器學習模型,被廣泛應用于地球過程模擬和預測,其中前饋傳播神經(jīng)網(wǎng)絡(luò)(FFBPNN)為一種用于輸入和輸出之間分類、回歸和模式編碼的穩(wěn)健算法。在本研究中,我們使用月最低和最高氣溫、月降水量、SPI-1到SPI-12作為徑流(間接方法)和SRI(直接方法)的預測因子。在直接方法中,SRI是由上述預測因子直接模擬和預測的;在間接方法中,利用ANN輸出的河流流量計算得到SRI。
 
  2.4 氣候變化情景
 
  基于LARS-WG6.0軟件中建立的GCM模型,本研究選取4個GCM模型(基于CMIP5),提取高排放情景(RCP8.5)下2021-2060年(2021-2040年為近期,NF;2041-2060年為遠期,F(xiàn)F)的降水和溫度變化,同時以1990-2019年為基準期,對數(shù)據(jù)進行了降尺度處理。在選擇GCM和確定未來氣候情景的過程中,本研究對每個GCM的溫度和降水的年平均變化進行了評估,最后根據(jù)最大溫度增量和最大降水減少量,選擇了暖干情景下的GCM。
 
  2.5 績效指標、工具和工作流
 
  本研究使用KGE(Kling-Gupta效率)、RMSE(均方根誤差)、PBIAS(偏差百分比)和R2(決定系數(shù))評估模擬數(shù)據(jù)集的精度。這些績效指標的選擇沒有指導原則,可以根據(jù)用戶的體驗和模擬數(shù)據(jù)的類型來選擇。該研究的工作流程如圖2所示。
 
  
 
  圖2 實現(xiàn)方法的圖形示意圖(從上往下四個藍色虛線框分別代表:所用數(shù)據(jù)和干旱指標類型和尺度、直接模擬過程、間接模擬過程以及不同氣候模式下不同情景下的直接和間接模擬過程)。
 
  03 主要發(fā)現(xiàn)
 
  3.1 水文干旱的間接模擬
 
 ?。?)河流流量模擬
 
  利用人工神經(jīng)網(wǎng)絡(luò)(ANN)對四個排放站的河流流量進行模擬,可以發(fā)現(xiàn)在低地集水區(qū)(排放站C)的流量模擬效果很好,特別是在低流量情況下(圖3)。對整個盆地(排放站A)的模擬效果也較好,而在山區(qū)(排放站D)和半山區(qū)(排放站B)流域的模擬效果較差,且這兩個流域的低流量被嚴重低估,以至于模型模擬了幾個月的零流量。
 
  圖3 根據(jù)人工神經(jīng)網(wǎng)絡(luò)方法和觀測數(shù)據(jù)模擬的2000-2019年四個排放站(A、B、C、D)流量時間序列變化趨勢。
 
 ?。?)水文干旱間接計算的精度
 
  基于人工神經(jīng)網(wǎng)絡(luò)模擬的河流流量計算的SRI值在大多數(shù)情況下表現(xiàn)良好,和基于觀測數(shù)據(jù)計算的SRI值一樣精度很高。同時,比較基于觀測數(shù)據(jù)、間接方法和直接方法三種方法計算的SRI值分布趨勢可以發(fā)現(xiàn),間接方法和直接方法都能很好地捕捉SRI值的分布(圖4)。
 
  
 
  圖4 所有排放站計算和模擬(間接方法和直接方法)得到的SRI3、SRI6、SRI9和SRI12值、平均值及平均值的標準差小提琴曲線分布圖。
 
  3.2 水文干旱指標的直接模擬
 
  直接模擬是指從預報器直接模擬不同尺度下的SRI值。研究表明,ANN從預測器直接模擬的SRI值一般。雖然直接模擬和根據(jù)觀測數(shù)據(jù)計算SRI的相關(guān)性(R2)較好(表1),但就KGE而言,ANN模擬的精度不高。
 
  表1 根據(jù)KGE、RMSE和R2評估直接模擬的2000-2019年不同尺度SRI與根據(jù)觀測數(shù)據(jù)計算的SRI精度。
 
  
 
  3.3 水文干旱特征
 
  采用三種方法(直接模擬、間接模擬和根據(jù)觀測數(shù)據(jù)計算)并基于Run理論對四個排放站2000-2019年的嚴重水文干旱(SRI≤?1)特征進行估計(見原文表8),可以發(fā)現(xiàn)基于間接方法計算得到的結(jié)果較好,這一結(jié)果可能是由于最低流量被低估導致的??傮w而言,流域面積越大,發(fā)生干旱事件的次數(shù)越少、強度越低。
 
  3.4 河流流量和水文干旱的預測
 
 ?。?)河流流量的間接預測
 
  通過對不同時期情景下訓練的人工神經(jīng)網(wǎng)絡(luò)在間接方法中使用氣候參數(shù)預估來預測河流流量(圖5),結(jié)果表明,ORB的出口(排放站A)在今年第一季度(1-3月,JFM)的河流流量可能會大幅減少,5、6月份的河流流量也可能會減少。而在所有排放站中,大部分月份的近期中度情景預測的河流流量最低,遠期中度情景預測的河流流量最高。出水口年平均徑流量在484 m3/s(中度FF)和440 m3/s(中度NF)之間變化。
 
 
 
  圖5 根據(jù)歷史數(shù)據(jù)預測的不同情景下排放站A、B、C和D的月流量趨勢(FF:遠期,NF:近期;暖濕情景、暖干情景及中度情景(介于暖濕和暖干之間))。
 
 ?。?)水文干旱的間接預測
 
  研究表明,通過間接方法預測水文干旱指標中的最嚴重事件比根據(jù)歷史觀測數(shù)據(jù)計算的更顯著(圖6)。與歷史時期相比,未來極端干旱事件次數(shù)(單位:月)沒有明顯變化(不包括排放站D)。在上述3.4的所有情況下,預計干旱嚴重程度(SRI≤-1的總和)會增加。因此,所有預測結(jié)果都表明水文干旱強度會增強。
 
  
 
  圖6 基于Run理論使用間接方法預測的不同時期排放站A、B、C和D的SRI3、SRI6、SRI9和SRI12評估值(FF:遠期,NF:近期),綠色、黃色和紅色色階在預測中依次顯示最小值到最高值。
 
 ?。?)水文干旱的直接預測
 
  基于Run理論,依據(jù)直接方法預測的短期干旱指標數(shù)值明顯較高。與歷史時期和間接方法預測結(jié)果相比,中度情景下直接方法預測得到的SRI3和SRI6值更大、干旱持續(xù)時間更長且干旱強度更大(圖7)。因此,更干燥和更溫暖的氣候變化情景不一定能表明未來會出現(xiàn)更嚴重的干旱。
 
  
 
  圖7 基于Run理論使用直接方法預測的不同時期排放站A、B、C和D的SRI3、SRI6、SRI9和SRI12評估值(FF:遠期,NF:近期),綠色、黃色和紅色色標在預測中依次顯示最小值到最高值。
 
  04 主要結(jié)論
 
 ?。?)人工神經(jīng)網(wǎng)絡(luò)在河流流量和水文干旱模擬中表現(xiàn)良好,尤其是在低地徑流和水文干旱模擬中的性能明顯高于山區(qū)集水區(qū)。相較于直接方法,間接方法在水文干旱的河流流量模擬中表現(xiàn)更好;(2)兩種方法在對水文干旱的預測上區(qū)別很大。與歷史時期相比,通過間接方法預測水文干旱指標得到的極端水文干旱事件更強烈,干旱嚴重程度和干旱強度更大,而中度情景下直接方法預測得到的短期干旱指標值更大、干旱持續(xù)時間更長且干旱強度更大;(3)人工神經(jīng)網(wǎng)絡(luò)與基于過程的模型不同,其結(jié)果在較低的降水或較高的溫度方面不是線性的,反而會導致更嚴重和長時間的干旱。
 
  05 引發(fā)思考
 
  本研究利用人工神經(jīng)網(wǎng)絡(luò)(ANN),選擇最高和最低溫度、降水和氣象干旱指標(標準化降水指數(shù)(SPI))作為預報因子,對標準化徑流指數(shù)(SRI)進行模擬和預測。評估了直接方法(直接模擬和預測SRI)和間接方法(模擬和預測河流流量,然后計算SRI)的模擬結(jié)果,對比發(fā)現(xiàn)2000-2019年間在奧德拉河流域四個排污站的SRI模擬中,間接方法比直接方法表現(xiàn)得更好。然而,人工神經(jīng)網(wǎng)絡(luò)在其他氣候區(qū)域的方法適用性還需要進一步調(diào)查和分析。
 
  其次,本研究只使用最高和最低溫度以及降水作為氣候預測因子,在未來的研究中還可以使用氣候參數(shù)(如太陽輻射、濕度和風速)、遙感干旱因子和潛在蒸散發(fā)(PET)作為預測因子,以獲得更可靠的模型。
 
  編者注
 
  以上總結(jié)僅代表個人對論文的理解,僅供研究參考所用,不用于商業(yè)用途。若上述理解內(nèi)容有誤,請以論文原文為主。
 
  原文出處
 
  Eini M R, Najminejad F, Piniewski M. Direct and indirect simulating and projecting hydrological drought using a supervised machine learning method[J]. Science of The Total Environment, 2023: 165523. Doi: https://doi.org/10.1016/j.scitotenv.2023.165523.