Modelling reference evapotranspiration using principal component analysis and machine learning methods under different climatic environments
Abstract
Reference evapotranspiration (ETo) is a complex process in the hydrologic cycle that influences several hydrologic parameters. Although several methods have been developed to model ETo, a reliable method that can use limited climatic input parameters for data-limited regions is still limited. This study evaluated four machine learning (ML) methods: M5 pruned (M5P) tree, sequential minimal optimization (SMO), radial basis function neural regression (RBFNreg) and multilinear regression (MLR). The major objective of this study was to identify the best approach to estimate ETo with minimum input data in five stations (Multan, Jacobabad, Faisalabad, Islamabad and Skardu) located in Pakistan. The datasets of these stations comprised maximum and minimum temperatures (Tmax, Tmin), average relative humidity (RHavg), average wind speed (Ux), and sunshine hours (n) variables. Two scenarios were used for ETo modelling. In the first scenario, five climatic variables were used as inputs to estimate ETo as obtaining full climatic parameters is the biggest challenge in developing countries. Principal component analysis (PCA) was used as a clustering technique in the second scenario to reduce the climatic input parameters. The PCA results indicated that Tmax, Tmin and n were identified as effective inputs for ETo estimation. Based on statistical indicators, the M5P tree outperformed the other applied ML methods in estimating ETo under various climatic environments. This study recommends focusing on areas with high ETo values and adequate irrigation scheduling of crops to achieve water sustainability.RésuméL'évapotranspiration de référence (ETo) est un processus complexe du cycle hydrologique qui influence plusieurs paramètres hydrologiques. Bien que plusieurs méthodes aient été mises au point pour modéliser l'ETo, une méthode fiable qui peut utiliser des paramètres d'entrée climatiques limités pour des régions où les données sont limitées est encore limitée. Cette étude a évalué quatre méthodes d'apprentissage automatique (ML): arbre M5 élagué (M5P), optimisation minimale séquentielle (SMO), régression neuronale à fonction de base radiale (RBFNreg), et régression multilinéaire (MLR). Cette étude visait à identifier la meilleure approche pour estimer l'ETo avec un minimum de données d'entrée dans 5 stations (Multan, Jacobabad, Faisalabad, Islamabad et Skardu) situées au Pakistan. L'ensemble de données de ces stations comprend les températures maximales et minimales (Tmax, Tmin), l'humidité relative moyenne (RH), la vitesse moyenne du vent (Ux) et les heures d'ensoleillement (n). Deux scénarios ont été utilisés pour la modélisation de l'ETo. Dans le premier scénario, cinq variables climatiques ont été utilisées comme intrants pour estimer l'ETo, car l'obtention de paramètres climatiques complets est le plus grand défi en face des pays en développement. L'analyse des composantes principales (PCA) a été utilisée comme technique de regroupement dans le deuxième scénario pour réduire les paramètres d'entrée climatiques. Les résultats de la PCA ont indiqué que Tmax, Tmin et n ont été identifiés comme des intrants efficaces pour l'estimation de l'ETo. Sur la base des indicateurs statistiques, l'arbre M5P a surpassé les autres méthodes ML appliquées pour estimer l'ETo dans divers environnements climatiques. Cette étude recommande de se concentrer sur les zones présentant des valeurs élevées de l'ETo et sur un calendrier adéquat d'irrigation des cultures pour assurer la durabilité de l'eau.
- Publication:
-
Irrigation and Drainage
- Pub Date:
- October 2023
- DOI:
- 10.1002/ird.2838
- Bibcode:
- 2023IrrDr..72..945R