Tác giả

Đơn vị công tác

1 Trường Đại học Tài nguyên và Môi trường thành phố Hồ Chí Minh; pthuynh@hcmunre.edu.vn
*Tác giả liên hệ: pthuynh@hcmunre.edu.vn; Tel.: +84–977003834

Tóm tắt

Việt Nam là quốc gia có địa hình đồi núi dốc và nằm trong vùng mưa nhiệt đới gió mùa, vì vậy hiện tượng sạt lở đất diễn ra khá phổ biến. Nghiên cứu này tập trung vào việc dự đoán khả năng sạt lở đất ở Việt Nam bằng các thuật toán hồi quy, Random Forest (RF), Extreme Gradient Boosting (XGBoost), K-Nearest Neighbor regression (KNN), Linear Support Vector Regressor (SVR), và Linear Regression (LR). Các biến đặc trưng có liên quan đến sạt lở đất được sử dụng, bao gồm độ ẩm đất, địa chấn động đất, lượng mưa, độ cao và độ dốc. Các thuật toán được huấn luyện trên tập dữ liệu mẫu để đánh giá hiệu suất của chúng. Kết quả nghiên cứu cho thấy thuật toán Random Forest (RF) có thể dự đoán tốt khả năng sạt lở đất. Kết quả dự đoán từ tập huấn luyện và tập kiểm tra, với hệ số xác định R2 có giá trị cao nhất 0,85, thể hiện khả năng giải thích biến động dữ liệu tốt. Bên cạnh đó các giá trị (MSE) và (RMSE) thấp nhất lần lượt là 150,21 và 12,25. Các thuật toán khác cũng cho kết quả tương đối tốt, nhưng (RF) vượt trội hơn. Điều đó cho thấy cần kết hợp năm thuật toán này lại với nhau để xử lý một lượng lớn các dữ liệu có độ phức tạp cao, nhằm tạo ra một mô hình dự đoán sạt lở đất ở Việt Nam bằng các thuật toán Học máy có tính ổn định, chính xác.

Từ khóa

Trích dẫn bài báo

Huynh, P.T. Dự đoán khả năng sạt lở đất ở Việt Nam bằng các thuật toán học máy. Tạp chí Khí tượng Thuỷ văn 2023, 751, 78-90.

Tài liệu tham khảo

1. Fadhillah, M.F.; Hakim, W.L.; Panahi, M.; Rezaie, M.; Lee, C.W.; Lee, S. Mapping of landslide potential in Pyeongchang-gun, South Korea, using machine learning meta-based optimization algorithms. Egypt. J. Remote Sens. Space Sci. 2022, 25, 463–472. https://doi.org/10.1016/j.ejrs.2022.03.008.

2. Liu, Y.; Xu, C.; Huang, B.; Ren, X.; Liu, C.; Hu, B.; Chen, Z. Landslide displacement prediction based on multi-source data fusion and sensitivity states. Eng. Geol. 2020, 271, 105608. https://doi.org/10.1016/j.enggeo.2020.105608.

3. Wang, J.; Xiao, L.; Ward, S.N. Tsunami Squares modeling of landslide tsunami generation considering the ‘Push Ahead’ effects in slide/water interactions: Theory, experimental validation, and sensitivity analyses. Eng. Geol. 2021, 288, 106141. https://doi.org/10.1016/j.enggeo.2021.106141.

4. Bragagnolo, L.; da Silva, R.V.; Grzybowski, J.M.V. Landslide susceptibility mapping with landslide: A free open-source GIS-integrated tool based on Artificial Neural Networks. Environ. Model. Softw. 2020, 123, 104565. https://doi.org/10.1016/j.envsoft.2019.104565.

5. Huang, F.; Cao, Z.; Guo, J.; Jiang, S. H.; Li, S.; Guo, Z. Comparisons of heuristic, general statistical and machine learning models for landslide susceptibility prediction and mapping. Catena 2020, 191, 104580. https://doi.org/10.1016/j.catena.2020.104580.

6. Małka, A. Landslide susceptibility mapping of Gdynia using geographic information system-based statistical models. Nat. Hazards 2021, 107, 639–674. https://doi.org/10.1007/s11069-021-04599-8.

7. Das, S.; Sarkar, S.; Kanungo, D.P. GIS-based landslide susceptibility zonation mapping using the analytic hierarchy process (AHP) method in parts of Kalimpong Region of Darjeeling Himalaya. Environ. Monit. Assess. 2022, 194, 234. https://doi.org/10.1007/s10661-022-09851-7.

8. Ba, Q.; Chen, Y.; Deng, S.; Wu, Q.; Yang, J.; Zhang, J. An Improved Information Value Model Based on Gray Clustering for Landslide Susceptibility Mapping. ISPRS Int. J. Geo-Inf. 2017, 6, 18. https://doi.org/10.3390/ijgi6010018.

9. Ilia, I.; Tsangaratos, P. Applying weight of evidence method and sensitivity analysis to produce a landslide susceptibility map. Landslides 2016, 13, 379–397. https://doi.org/10.1007/s10346-015-0576-3.

10. Lambie, S.M.; Awatera, S.; Daigneault, A.; Kirschbaum, M.U.F.; Marden, M.; Soliman, T.; Spiekermann, R.I.; Walsh, P.J. Trade-offs between environmental and economic factors in conversion from exotic pine production to natural regeneration on erosion prone land. N. Z. J. For. Sci. 2021, 51, 14.

11. Wang, G.; Chen, X.; Chen, W. Spatial Prediction of Landslide Susceptibility Based on GIS and Discriminant Functions. ISPRS Int. J. Geo-Inf. 2020, 9, 144. https://doi.org/10.3390/ijgi9030144.

12. Tehrani, F.S.; Calvello, M.; Liu, Z.; Zhang, L.; Lacasse, S. Machine learning and landslide studies: recent advances and applications. Nat. Hazards. 2022, 114, 1197–1245. https://doi.org/10.1007/s11069-022-05423-7.

13. Bergen, K.J.; Johnson, P.A.; de Hoop, M.V.; Beroza, G.C. Machine learning for data-driven discovery in solid Earth geoscience. Science 2019, 363(6433), 1–11.

14. Wicki, A.; Lehmann, P.; Hauck, C.; Seneviratne, S.I.; Waldner, P.; Stähli, M. Assessing the potential of soil moisture measurements for regional landslide early warning. Landslides 2020, 17, 1881–1896. https://doi.org/10.1007/s10346-020-01400-y.

15. Johnston, E.C.; Davenport, F.V.; Wang, L.; Caers, J.K.; Muthukrishnan, S.; Burke, M.; Diffenbaugh, N.S. Quantifying the Effect of Precipitation on Landslide Hazard in Urbanized and Non-Urbanized Areas. Geophys. Res. Lett. 2021, 48, e2021GL094038. https://doi.org/10.1029/2021GL094038.

16. Abraham, M.T.; Satyam, N.; Pradhan, B.; Alamri, A.M. Forecasting of Landslides Using Rainfall Severity and Soil Wetness: A Probabilistic Approach for Darjeeling Himalayas. Water 2020, 12, 804. https://doi.org/10.3390/w12030804.

17. Martino, S.; Fiorucci, M.; Marmoni, G.M.; Casaburi, L.; Antonielli, B.; Mazzanti, P. Increase in landslide activity after a low-magnitude earthquake as inferred from DInSAR interferometry. Sci. Rep. 2022, 12, 2686. https://doi.org/10.1038/s41598-022-06508-w.

18. Nakileza, B.R.; Nedala, S. Topographic influence on landslides characteristics and implication for risk management in upper Manafwa catchment, Mt Elgon Uganda. Geoenvironmental Disasters 2020, 7, 27. https://doi.org/10.1186/s40677-020-00160-0.

19. Hosseini, S.A.; Lotfi, R.; Lotfalian, M.; Kavian, A.; Parsakhoo, A. The effect of terrain factors on landslide features along forest road. Afr. J. Biotechnol. 2011, 10, 14108–14115. https://doi.org/10.4314/ajb.v10i64.

20. Bergen, K.J.; Johnson, P.A.; de Hoop, M.V.; Beroza, G.C. Machine learning for data-driven discovery in solid Earth geoscience. Science 2019, 363, 1-10. https://doi.org/10.1126/science.aau0323.

21. Goetz, J.N.; Brenning, A.; Petschko, H.; Leopold, P. Evaluating machine learning and statistical prediction techniques for landslide susceptibility modeling. Comput. Geosci. 2015, 81, 1–11. https://doi.org/10.1016/j.cageo.2015.04.007.

22. Chen, T.; Zhu, L.; Niu, R.; Trinder, C.J.; Peng, L.; Lei, T. Mapping landslide susceptibility at the Three Gorges Reservoir, China, using gradient boosting decision tree, random forest and information value models. J. Mt. Sci. 2020, 17, 670–685. https://doi.org/10.1007/s11629-019-5839-3.

23. Stumpf, A.; Kerle, N. Combining Random Forests and object-oriented analysis for landslide mapping from very high resolution imagery. Procedia Environ. Sci. 2011, 3, 123–129. https://doi.org/10.1016/j.proenv.2011.02.022.

24. Lei, T.; Zhang, Y.; Lv, Z.; Li, S.; Liu, S.; Nandi, A.K. Landslide Inventory Mapping From Bitemporal Images Using Deep Convolutional Neural Networks. IEEE Geosci. Remote Sens. Lett. 2019, 16, 982–986. https://doi.org/10.1109/LGRS.2018.2889307.

25. Ma, Z.; Mei, G.; Piccialli, F. Machine learning for landslides prevention: a survey. Neural Comput. Appl. 2021, 33, 10881–10907. https://doi.org/10.1007/s00521-020-05529-8.

26. Mohr, K. NASA-USDA Global Soil Moisture Data. Earth, Online avaliable: https://earth.gsfc.nasa.gov/hydro/data/nasa-usda-global-soil-moisture-data.

27. GES DISC Dataset: Global Landslide Nowcasts from LHASA L4 1 day 1 km x 1 km version 1.1 (Global_Landslide_Nowcast) at GES DISC (Global_Landslide_Nowcast 1.1). https://disc.gsfc.nasa.gov/datasets/Global_Landslide_Nowcast_1.1/summary

28. Branco, P.; Torgo, L.; Ribeiro, R.P. SMOGN: a Pre-processing Approach for Imbalanced Regression. Proceedings of the First International Workshop on Learning with Imbalanced Domains: Theory and Applications, 2017, pp. 36–50.

29. Hamadani, A.; Ganai, N.A.; Raja, T.; Alam, S.; Andrabi, S.M.; Hussain, I.; Ahmad, H.A. Outlier Removal in Sheep Farm Datasets Using Winsorization. Bhartiya Krishi Anusandhan Patrika, 2022.

30. Online avaliable: http://www.ss-pub.org/wp  content/uploads/2019/09/JMSS18122402.pdf.

31. Ahsan, M.M.; Mahmud, M.A.P.; Saha, P.K.; Gupta, K.D.; Siddique, Z. Effect of Data Scaling Methods on Machine Learning Algorithms and Model Performance. Technologies 2021, 9, 52. https://doi.org/10.3390/technologies9030052.

32. Mielniczuk, J.; Teisseyre, P. Model Selection in Logistic Regression Using p-Values and Greedy Search. In: Bouvry, P. Kłopotek, M.A. Leprévost, F. Marciniak, M. Mykowiecka, A. and Rybiński, H. (Eds.) Security and Intelligent Information Systems. Springer, Berlin, Heidelberg, 2012, pp. 128–141.

33. Sulaiman, M.A.; Labadin, J. Feature selection based on mutual information. In: 2015 9th International Conference on IT in Asia (CITA), 2015, pp. 1–6.

34. Sulaiman, M.A.; Labadin, J. Feature selection with mutual information for regression problems. Proceeding of the 9th International Conference on IT in Asia (CITA), 2015, pp. 1–6.