Tác giả

Đơn vị công tác

1Học viện Kỹ thuật quân sự

2Viện AI Việt nam

3Đại học Mỏ-Địa Chất

4Trung tâm Thông tin và Dữ liệu khí tượng thủy văn

Tóm tắt

Dự báo lượng mưa là một trong những bài toán thách thức nhất, vì nó thể hiện các đặc điểm rất độc đáo không tồn tại trong dữ liệu chuỗi thời gian khác. Hơn nữa, lượng mưa là một thành phần chính và rất cần thiết cho việc áp dụng quy hoạch tài nguyên nước. Chính vì vậy, bài viết này tập trung vào việc dự đoán lượng mưa sử dụng dữ liệu từ Cơ quan Khí tượng Việt Nam. Hiện nay trong hầu hết các nghiên cứu dự báo lượng mưa, quá trình dự báo thường bị chi phối bởi các mô hình thống kê, cụ thể là sử dụng chuỗi Markov được mở rộng với dự báo lượng mưa (MCRP). Trong bài báo này, nghiên cứu trình bày một phương pháp mới để giải quyết bài toán dự đoán lượng mưa là lập trình di truyền (Genetic Programming - GP). Đây là lần đầu tiên GP được sử dụng trong bối cảnh dự báo lượng mưa ở một số thành phố tại Việt Nam. Nghiên cứu sẽ so sánh hiệu suất của GP và các thuật toán học máy khác như SVM, MLP, DCT, kNN trên 3 bộ dữ liệu khác nhau của các thành phố tại Việt Nam và báo cáo kết quả. Mục tiêu là để xem liệu GP có khả năng dự báo tốt hơn so với các phương pháp học máy khác hay không? Các kết quả đều chỉ ra rằng nói chung GP vượt trội đáng kể so với các phương pháp học máy khác, đó là cách tiếp cận chủ đạo trong bài viết.

Từ khóa

Trích dẫn bài báo

Nguyễn Thị Hiền, Nguyễn Xuân Hoài, Đặng Văn Nam, Ngô Văn Mạnh (2019), Dự báo lượng mưa tại một số trạm quan trắc Việt Nam dựa trên lập trình di truyền. Tạp chí Khí tượng Thủy văn 707, 1-10.

Tài liệu tham khảo

1. Hastie, T.T., (2009), The Elements of Statistical Learning: Data Mining, Inference and Prediction. New York: Springer.

2. Khu, S.T., (2004), An evolutionary-based real-time updating technique for an operational rainfall-runoff forecasting model. Proceedings of the 2nd Biennial Meeting of the International Environmental Modelling and Software Society, Manno, Switzerland, 141-146.

3. Koza, J.R., (1992), Genetic Programming: On the Programming of Computers by Means of Natural Selection. Cambridge, MA, USA: MIT Press.

4. Madsen, H.B., (2000), Data assimilation in rainfall-runoff forecasting. Hydroinformatics 2000, 4th International Conference of Hydroinformatics , (pp. 1-6). Iowa, USA.

5. ̈olkop, A.J., (2004), A tutorial on support vector regression. Statistics and Computing, 14(3), 199-222.

6. Rokach, L., Maimon, O. (Eds). Data mining with decision trees: theory and applications. World Scientific Publishing Co., Inc. River Edge, NJ, USA, Series in Machine Perception and Artificial Intelligence, 81, pp. 328.

7. Rosenblatt, F., (1961), Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Arch Gen Psychiatry. 7(3), 218-219.

8. Whigham, P.A. (2001), Modelling rainfall-runoff using genetic programming. Mathematical and Computer Modelling, 33, (6–7), 707-721.