Tác giả

Đơn vị công tác

1 Khoa Môi trường, Trường ĐH Khoa học tự nhiên, ĐHQG-HCM; phuchieu50@gmail.com; vanhoanggg25@gmail.com; dnkhoi@hcmus.edu.vn

*Tác giả liên hệ: dnkhoi@hcmus.edu.vn; Tel.: +84–088304379

Tóm tắt

Nghiên cứu áp dụng các mô hình học máy bao gồm MLP (Multi-layer Perceptron), RF (Random Forest) và SVR (Support Vector Regression) để dự báo chỉ số chất lượng không khí tại Tp. Hồ Chí Minh. Dữ liệu đầu vào bao gồm chỉ số chất lượng không khí AQI (Air Quality Index) và 5 biến khí tượng (điểm sương, áp suất, nhiệt độ, độ ẩm, tốc độ gió) từ tháng 3/2019 đến tháng 6/2021, với 70% dữ liệu đầu vào được sử dụng cho giai đoạn huấn luyện và 30% dữ liệu còn lại sử dụng cho giai đoạn kiểm tra. Thông qua phân tích tương quan và phân tích tự tương quan một phần, 6 kịch bản với các thông số đầu vào khác nhau được xây dựng để mô phỏng chỉ số AQI. Kết quả cho thấy cả 3 mô hình đều có hiệu suất dự báo tốt ở cả 6 kịch bản. Trong đó, mô hình MLP với 5 thông số đầu vào (MLP-K5) cho hiệu quả dự báo tốt nhất với MSE = 0,0045, R2 = 0,89, NSE = 0,886. Đối với mô hình SVR, mô hình SVR với 6 thông số đầu vào (SVR-K6) cho kết quả dự báo tốt nhất với MSE = 0,0048, R2 = 0,88, NSE = 0,879. Đối với mô hình RF, mô hình RF với 6 thông số đầu vào (RF-K6) cho kết quả dự báo tốt nhất với MSE = 0,005, R2 = 0,88, NSE = 0,875. Kết quả cho thấy, mô hình MLP có khả năng mô phỏng tốt chỉ số chất lượng không khí cho thành phố Hồ Chí Minh.

Từ khóa

Trích dẫn bài báo

Hiếu, N.P.; Vân, Đ.D.H.; Khôi, Đ.N. Xây dựng mô hình mô phỏng chỉ số chất lượng không khí cho thành phố Hồ Chí Minh bằng phương pháp học máy. Tạp chí Khí tượng Thuỷ văn 2024, 761, 13-24.

Tài liệu tham khảo

1. Nguyen, T.N.T.; Bui, Q.H.; Pham, V.H.; Luu, V.H.; Man, D.C.; Pham, N.H.; Le, T.H.; Nguyen, T.T. Particulate matter concentration mapping from MODIS satellite data: a Vietnamese case study. Environ. Res. Lett. 2015, 10(9), 095016.

2. Lelieveld, J.; Poschl, U. Chemists can help to solve the air pollution health crisis. Nature 2017, 551, 291–293.

3. World Bank. Vietnam - Country climate and development report. Washington DC., Chapter 1: Vietnam’s Development Model and Climate Challenges. 2022, pp.9.

4. Sở Tài Nguyên và Môi trường TP.HCM. Báo cáo hiện trạng môi trường TP.HCM năm 2021.

5. Tổng Cục Thống Kê. Kết quả toàn bộ tổng điều tra dân số và nhà ở năm 2022.

6. Gou, Q.; He, Z.; Li, S.; Li, X.; Meng, J.; Hou, Z.; Liu, J.; Chen, Y. Air pollution forecasting using artificial and wavelet neural networks with meteorological conditions. Aerosol Air Qual. Res. 2020, 20, 1429–1439.

7. Karimian, H.; Li, Q.; Wu, C.; Qi, Y.; Mo, Y.; Chen, G.; Zhang, X.; Sachdeva, S. Evaluation of different machine learning approaches to forecasting PM2.5 mass concentrations. Aerosol Air Qual. Res. 2019, 19, 1400–1410.

8. Doreswamy.; Harishkumar, K.S.; Yogesh, K.M.; Gad, I. Forecasting air pollution particular matter (PM2.5) using machine learning regression models. Procedia Comput. Sci. 2020, 171, 2057–2066.

9. Zaman, N.A.F.K.; Kanniah, K.D.; Kaskaoutis, D.G.; Latif, M.T. Evaluation of machine learning models for estimating PM2.5 concentrations across Malaysia. Appl. Sci. 2021, 11(16), 7326.

10. Preetham Vignesh, P.; Hiang, J.H.; Kishore, P. Predicting PM2.5 concentration across USA using machine learning. Earth Space Sci. 2023, 10(10), e2023EA002911.

11. Zamani Joharestani, M.; Cao, C.; Ni, X.; Bashir, B.; Talebiesfandarani, S. PM2.5 prediction based on Random Forest, XGBoost and Deep Learning multisource remote sensing data. Atmos. 2019, 10(7), 373.

12. Castelli, M.; Clemente, F.M.; Popovic, A.; Silva, S.; Vanneschi, L. A machine learning approach to predict air quality in California. Complexity 2020, 8049504.

13. Doreswamy, Harishkumar, K.S.; Yogesh, K.M.; Ibrahim, G. Forecasting air pollution particulate matter (PM2.5) using machine learning regression models. Procedia Comput. Sci. 2020, 171, 2057-2066.

14. Hưng, M.D.; Dũng, N.T.; Cơ, H.X. Nghiên cứu ứng dụng mạng nơron nhân tạo để xây dựng mô hình dự báo nồng độ SO2 cực đại ngày. Tạp chí Khoa Học & Công Nghệ Đại học Thái Nguyên 2017, 166(06), 127–132.

15. Phuong, N.T.T.; Hung, M.D.; Nam, D.T.; Dung, N.T. Forecast of hourly tropospheric ozone concentration in Quang Ninh using MLP and SVM. J. Sci: Earth Env. Sci. 2020, 36(3), 46–54.

16. Gardner, M.W.; Dorling, S.R. Artificial neural networks (the multilayer perceptron) - A review of applications in the atmosphere sciences. Atmos. Environ. 1998, 32(14), 2627–2636.

17. Tiệp, V.H. Machine Learning cơ bản. https://machinelearningcoban.com/.

18. Cabaneros, S.M.; Calautit, J.K.; Hughes, B.R. A review of artificial neural network models for ambient air pollution prediction. Environ. Modell. Software 2019, 119, 285–304.

19. Chen, Y.; Song, L.; Liu, Y.; Yang, L.; Li, D. A review of the artificial neural network models for water quality prediction. Appl. Sci. 2020, 10(17), 5776.

20. Flores, J.H.F.; Engel, P.M.; Pinto, R.C. Autocorrelation and partial autocorrelation functions to improve neural networks models on univarite time series forecasting. Proceeding of the 2012 International Joint Conference on Neural Networks, 2012, pp. 1–8.