Tác giả

Đơn vị công tác

1 Khoa Môi trường, Trường ĐH Khoa học tự nhiên, ĐHQG-HCM; phuchieu50@gmail.com; 19170139@student.hcmus.edu.vn; dqlinh@hcmus.edu.vn; dnkhoi@hcmus.edu.vn

*Tác giả liên hệ: dnkhoi@hcmus.edu.vn; Tel.: +84–088304379

Tóm tắt

Nghiên cứu áp dụng ba thuật toán học máy Random Forest Regression (RFR), XGBoost Regression (XGBR), Multilayer Perceptron Regression (MLPR) và một thuật toán học sâu Convolutional Neural Network (CNN) để mô phỏng nồng độ bụi PM2.5 tại khu vực trung tâm Thành phố Hồ Chí Minh. Bộ dữ liệu được sử dụng trong nghiên cứu là dữ liệu ngày trong giai đoạn từ 2016-2021 bao gồm nồng độ bụi PM2.5 thu thập từ trạm Lãnh Sự Quán Mỹ và sáu thông số khí tượng bao gồm nhiệt độ trung bình, hướng gió, tốc độ gió, độ ẩm, số giờ nắng và lượng mưa tại trạm Tân Sơn Hòa. Bộ dữ liệu được chuẩn hóa và phân chia với tỷ lệ 80:20 phục vụ quá trình huấn luyện và kiểm tra các thuật toán. Sau đó, sáu kịch bản các thông số đầu vào khác nhau được xây dựng dựa trên kết quả phân tích tương quan riêng phần giữa các thông số khí tượng với nồng độ bụi PM2.5. Kết quả nghiên cứu cho thấy cả ba thuật toán học máy đều có khả năng mô phỏng tốt nồng độ PM2.5 với giá trị hệ số tương quan r dao động trong khoảng 0,770 đến 0,854, trong đó thuật toán XGBR với sáu thông số khí tượng đầu vào cho hiệu quả mô phỏng tốt nhất với r = 0,854, IOA = 0,922 và NMB = 6,711. Bên cạnh đó, kết quả mô phỏng nồng độ PM2.5của thuật toán CNN là chưa đạt với giá trị r nhỏ hơn 0,5 ở tất cả kịch bản mô phỏng.

Từ khóa

Trích dẫn bài báo

Hiếu, N.P.; Dương, N.N.; Lĩnh, Đ.Q.; Khôi, Đ.N. Mô phỏng nồng độ bụi PM2.5 tại khu vực trung tâm Thành phố Hồ Chí Minh bằng thuật toán học máy và học sâu. Tạp chí Khí tượng Thuỷ văn 2024762, 62-72.

Tài liệu tham khảo

1. Riojas-Rodríguez, H.; Romieu, I.; Hernández-Ávila, M. Air pollution. Occupational and Environmental Health. Oxford University Press: Oxford, UK, 2017, pp. 345–364.

2. Brunekreef, B.; Holgate, S.T. Air pollution and health. Lancet 2002, 360, 1233–1242.

3. Guarnieri, M.; Balmes, J.R. Outdoor air pollution and asthma. Lancet 2014, 383, 1581–1592.

4. Akimoto, H. Global air quality and pollution. Science 2003, 302, 1716–1719.

5. Wang, Z. Energy and air pollution. Comprehensive Energy Systems. Elsevier: Amsterdam, Netherlands, 2018, pp. 909–949.

6. Nowak, D.J.; Crane, D.E.; Stevens, J.C. Air pollution removal by urban trees and shrubs in the United States. Urban For. Urban Green 2006, 4, 115–123.

7. WHO. 7 million premature deaths annually linked to air pollution, 2014.

8. Bộ Tài nguyên và Môi trường. Báo cáo hiện trạng môi trường quốc gia năm 2021 - Môi trường không khí, thực trạng và giải pháp, 2022.

9. Shen, H.; Li, T.; Yuan, Q.; Zhang, L. Estimating regional ground-level PM2.5 directly from satellite top-of-atmosphere reflectance using deep belief networks. J. Atmos. Oceanic Technol. 2018, 123, 13875–13886.

10. Al Hanai, A.H.; Antkiewicz, D.S.; Hemming, J.D.C.; Shafer, M.M.; Lai, A.M.; Arhami, M.; Hosseini, V.; Schauer, J.J. Seasonal variations in the oxidative stress and inflammatory potential of PM2.5 in Tehran using an alveolar macrophage model: The role of chemical composition and sources. Environ. Int. 2019, 417–427.

11. Laden, F.; Schwartz, J.; Speizer, F.E.; Dockery, D.W. Reduction in fine particulate air pollution and mortality: Extended follow-up of the Harvard Six Cities Study. Am. J. Respir. Crit. Care Med. 2006, 173, 667–672.

12. Evans, J.; van Donkelaar, A.; Martin, R.V.; Burnett, R.; Rainham, D.G.; Birkett, N.J.; Krewski, D. Estimates of global mortality attributable to particulate air pollution using satellite imagery. Environ. Res. 2013, 120, 33–42.

13. Rojas-Rueda, D.; de Nazelle, A.; Teixidó, O.; Nieuwenhuijsen, M.J. Health impact assessment of increasing public transport and cycling use in Barcelona: A morbidity and burden of disease approach. Prev. Med. 2013, 57, 573–579.

14. IQAir/AirVisual. World Air Quality Report 2021, 2022.

15. VNU-UET, Live&Learn và USAID. Hiện trạng bụi PM2.5 ở Việt Nam giai đoạn 2019-2020 sử dụng dữ liệu đa nguồn. Báo cáo được phối hợp thực hiện bởi Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội (VNU-UET), Trung tâm Sống và Học tập vì Môi trường và Cộng đồng (Live&Learn) và Cơ quan Phát triển Quốc tế Hoa Kỳ (USAID), 2021, tr. 34-35.

16. VNU-UET, Live&Learn và USAID. Báo cáo hiện trạng bụi PM2.5 và tác động sức khoẻ tại Việt Nam năm 2021. Báo cáo được phối hợp thực hiện bởi Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội (VNU-UET), Trung tâm Sống và Học tập vì Môi trường và Cộng đồng (Live&Learn) và Cơ quan Phát triển Quốc tế Hoa Kỳ (USAID), 2022.

17. Pak, U; Ma, J; Ryu, U; Ryom, K; Juhyok, U; Pak, K; Pak, C. Deep learning-based PM2.5 prediction considering the spatiotemporal correlations: A case study of Beijing, China. Sci. Total Environ. 2020, 699, 133561.

18. Jinghui, M.; Zhongqi, Y.; Qu, Y.; Xu, J.; Cao, Y. Application of the XGBoost Machine Learning Method in PM2.5 Prediction: A Case Study of Shanghai. Aerosol Air Qual. Res. 2020, 20, 128–138.

19. Yumimoto, K.; Uno, I. Adjoint inverse modeling of CO emissions over Eastern Asia using four dimensional variational data assimilation. Atmos. Environ. 2006, 40, 6836–6845.

20. Zamani Joharestani, M.; Cao, C.; Ni, X.; Bashir, B.; Talebiesfandarani, S. PM2.5 Prediction Based on Random Forest, XGBoost, and Deep Learning Using Multisource Remote Sensing Data. Atmosphere 201910, 373.

21. Plocoste, T.; Laventure, S. Forecasting PM10 Concentrations in the Caribbean Area Using Machine Learning Models. Atmosphere 202314, 134.

22. Lei, T.M.T.; Siu, S.W.I.; Monjardino, J.; Mendes, L.; Ferreira, F. Using machine learning methods to forecast air quality: A case study in Macao. Atmosphere 202213, 1412.

23. Mahmud, S.; Ridi, T.B.I.; Miah, M.S.; Sarower, F.; Elahee, S. Implementing machine learning algorithms to predict particulate matter (PM2.5): A case study in the Paso del Norte Region. Atmosphere 202213, 2100.

24. Huang, C.J.; Kuo, P.H. A deep CNN-LSTM model for particulate matter (PM2.5) forecasting in smart cities. Sensors 2018, 18, 2220.

25. Qi, Y.; Li, Q.; Karimian, H.; Liu, D. A hybrid model for spatiotemporal forecasting of PM2.5 based on graph convolutional neural network and long short-term memory. Sci. Total Environ. 2019, 664, 1–10.

26. Qin, D.; Yu, J.; Zou, G.; Yong, R.; Zhao, Q.; Zhang, B. A novel combined prediction scheme based on CNN and LSTM for urban PM2.5 concentration. IEEE Access 2019, 7, 20050–20059.

27. Tong, W.; Li, L.; Zhou, X.; Hamilton, A.; Zhang, K. Deep learning PM2.5 concentrations with bidirectional LSTM RNN. Air Qual. Atmos. Health 2019, 12, 411–423.

28. Liaw, A.; Wiener. Classcácification and Regression by RandomForest. R. News 2002, 2(3), 18–22.

29. Chen, H.; Deng, G.; Liu, Y. Monitoring the influence of industrialization and urbanization on spatiotemporal variations of AQI and PM2.5 in three provinces, China. Atmosphere 2022, 13(9), 1377.

30. Lecun, Y.; Bottou, L.; Bengio, Y.; Haffner, P. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 1998, 86(11), 2278–2324.

31. Huang, L.; Zhu, Y.; Zhai, H.; Xue, S.; Zhu, T.; Shao, Y.; Liu, Z.; Emery, C.; Yarwood, G.; Wang, Y.; Fu, J.; Zhang, K.; Li, L. Recommendations on benchmarks for numerical air quality model applications in China - Part 1: PM2.5 and chemical species. Atmos. Chem. Phys. 2021, 21, 2725–2743.