BTNMT
TTKTTVQGBỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRUNG TÂM KHÍ TƯỢNG THUỶ VĂN QUỐC GIA
Số 4 Đặng Thái Thân - Quận Hoàn Kiếm - Hà Nội
********
BÁO CÁO
TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ
ĐỀ TÀI:
NGHIÊN CỨU THỬ NGHIỆM DỰ BÁO
ĐỊNH LƯỢNG MƯA TỪ SẢN PHẨM CỦA
MÔ HÌNH HRM VÀ GSM
Chủ nhiệm: TS. Bùi Minh Tăng
Chủ nhiệm: TS. Bùi Minh Tăng
HÀ NỘI, 11-2009
BỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRUNG TÂM KHÍ TƯỢNG THUỶ VĂN QUỐC GIA
Số 4 Đặng Thái Thân - Quận Hoàn Kiếm - Hà Nội
********
BÁO CÁO
TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ
ĐỀ TÀI:
NGHIÊN CỨU THỬ NGHIỆM DỰ BÁO ĐỊNH LƯỢNG MƯA TỪ
SẢN PHẨM CỦA MÔ HÌNH HRM VÀ GSM
Chỉ số đăng ký :
Chỉ số phân loại :
Chỉ số lưu trữ :
DANH SÁCH CÁC CHỮ VIẾT TẮT
ANN Mạng thần kinh nhân tạo
(Artifical Neural Network)
BIAS Sai số hệ thống
BoM Cơ quan khí tượng Australia
(Bureau of Meteorology)
BPNN Mạng ANN đa lớp lan truyền ngược sai số
(Error Back Propogation Neural Network)
BS Chỉ số Brier
(Brier Score)
BSS Chỉ số kỹ năng Brier
(Brier Skill Score)
CMC Cơ quan khí tượng Canada
(Canadian Meteorological C
entre)
DA Phân tích phân biệt
(Discriminant Analysis)
DMO Dự báo trực tiếp từ mô hình
(Direct Model Output)
(Global Spectral Model)
HK Chỉ số đánh giá HK
(Hanssen and Kuiper discriminant)
JMA Cơ quan khí tượng Nhật bản
(Japan Meteorological Agency)
LDA Phân tích phân biệt tuyến tính
(Linear Discriminant Analysis)
LR Hồi quy Logistic
(Logistic Regression)
MAE Sai số tuyệt đối trung bình
(Mean Absolute Error)
ME Sai số trung bình
(Mean Error)
MDA Phân tích phân biệt đa nhóm
(Multiple Discriminant Analysis)
MLR Hồi quy tuyến tính đa biến
(Multiple Linear Regression)
MOS Thống kê sau mô hình
(Model Ouput Statistics)
NCEP Trung tâm dự báo môi trường quốc gia Mỹ
(Re-Analysis)
RMSE Sai số quân phương
(Root Mean Square Error)
ROC Biểu đồ đường đặc trưng hoạt độ
ng - ROC
(Relative Operating Characteristics Diagram)
ROCA Diện tích của đường cong ROC
(ROC Area)
TS Chỉ số đánh giá TS
(Threat Score)
TTDBTƯ Trung tâm Dự báo Khí tượng Thủy văn Trung ương
UMOS Thống kê sau mô hình có cập nhập hệ số
(Updatable Model Ouput Statistics)
35
8 2.2.6 Tương tự bảng 2.2.5 nhưng cho số liệu GSM vào mùa đông 36
9 2.2.7 Tần xuất tuyển chọn ít nhất 10% của các nhân tố dự báo theo
ANN từ GSM vào mùa hè với số nút ẩn khác nhau
37
10 2.2.8 BSS trung bình trên khu vực Việt Nam từ tập dữ liệu độc lập
theo ANN từ GSM vào mùa hè với số nút ẩn khác nhau
38
11 2.2.9 Mức độ tin cậy (%) kiểm nghiệm dự báo theo ANN04 có kỹ
năng cao hơn các dự báo khác theo ANN với số nút ẩn > 4
38
12 2.2.10 ROCA trên khu vực Việt Nam từ tập dữ liệu độc lập theo ANN
từ GSM vào mùa hè với số nút ẩn khác nhau
39
13 2.2.11 Điểm số BSS trung bình trên khu vực Việt Nam từ tập dữ liệu
độc lập theo 4 phương pháp MLR, LR, FDA và ANN từ GSM
vào mùa hè
40
14 2.2.12 Tương tự bảng 2.2.11 nhưng cho số liệu GSM vào mùa đông 40
15 2.2.13 Tương tự bảng 2.2.11 nhưng cho số liệu HRM vào mùa hè 40
16 2.2.14 Tương tự bảng 2.2.11 nhưng cho số liệu HRM vào mùa đông 41
17 2.2.15 Mức độ tin cậy (%) kiểm nghiệm dự báo theo MLR có kỹ năng
cao hơn các dự báo khác theo LR, FDA và ANN từ GSM vào
mùa hè
41
18 2.2.16 Tương tự bảng 2.2.15 nhưng cho số liệu GSM vào mùa đông 41
19 2.2.17 Tương tự bảng 2.2.15 nhưng cho số liệu HRM vào mùa hè 41
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
iv
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia
35 3.2.7 Tương tự bảng 3.2.5 nhưng cho các lưu vực sông vào mùa hè 67
36 3.2.8 Tương tự bảng 3.2.5 nhưng cho các lưu vực sông vào mùa đông 67
37 3.2.9 Số nút ẩn tối ưu của phương pháp FE-BPNN cho 9 khu vực
nghiên cứu
68
38 3.2.10 Số nút ẩn tối ưu của phương pháp FE-BPNN cho 7 lưu vực
sông nghiên cứu
68
39 3.2.11 Kết quả đánh giá và so sánh kỹ năng dự báo QPF trên tập số
liệu độc lập cho toàn bộ khu vực Việt Nam với số liệu mô hình
HRM
69
40 3.2.12 Tương tự bảng 3.2.11 nhưng cho mô hình GSM 70
41 3.2.13 Chỉ số ME (mm/24h) trên tập số liệu độc lập cho QPF trực tiếp
từ mô hình và các phương pháp thống kê thử nghiệm với số liệu
HRM đối với 9 khu vực nghiên cứu
71
42 3.2.14 Tương tự bảng 3.2.13 nhưng cho mô hình GSM 71
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
v
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia 43 3.2.15 Chỉ số RMSE (mm/24h) trên tập số liệu độc lập cho QPF trực
tiếp từ mô hình và các phương pháp thống kê thử nghiệm với số
liệu HRM đối với 9 khu vực nghiên cứu
73
44 3.2.16 Tương tự bảng 3.2.15 nhưng cho mô hình GSM 73
45 3.2.17 Tần xuất xuất hiện mưa theo các ngưỡng mưa cho trước tương
ứng cho tập số liệu độc lập mùa hè và mùa đông đối với 9 khu
89
58 4.2.2 Tương tự bảng 4.2.1 nhưng cho 10 lưu vực sông nghiên cứu 91
59 4.2.3 Tương tự bảng 4.2.1 nhưng cho chỉ số ROCA 92
60 4.2.4 Tương tự bảng 4.2.2 nhưng cho chỉ số ROCA 92
61 4.2.5 Kết quả đánh giá và so sánh giữa dự báo trực tiếp từ GSM và
dự báo từ mô hình thống kê MLR cho mùa hè năm 2009
94
62 4.2.6 Tương tự bảng 4.2.5 nhưng cho 10 lưu vực sông nghiên cứu 94
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
vi
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia DANH SÁCH CÁC HÌNH VẼ VÀ BIỂU ĐỒ
TT
Số thứ tự
hình
Nội dung
Trang
1 1.1.1 Sự khác biệt giữa thế giới thực tế với thế giới được mô phỏng
bởi các mô hình NWP
5
2 1.1.2 Sự khác biệt giữa cách tiếp cận thống kê cổ điển và PP 6
3 1.1.3 Sự khác biệt giữa cách tiếp cận PP và MOS 7
4 1.2.1 Một ví dụ so sánh đường dự báo xác suất mưa từ phương trình
hồi quy tuyến tính (đường đứt nét) và hồi quy logistic (đường
liền nét) trong đó các điểm dữ liệu được chỉ ra bởi các dấu
chấm đen (theo Wilks, 2006)
16
51
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
vii
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia 17 3.1.1 Sự biến thiên của chỉ số RMSE trung bình trên khu vực Việt
Nam theo các trị tỷ lệ dừng khác nhau với phương pháp MLR
cho bài toán QPF từ mô hình GSM (trái) và HRM (phải) đối
với mùa hè
56
18 4.1.1 Sơ đồ dự báo PQPF và QPF nghiệp vụ 88
19 4.2.1 Biểu đồ tin cậy cho toàn bộ Việt Nam theo mô hình MLR với
số liệu GSM vào mùa hè năm 2009 với các ngưỡng mưa khác
nhau
89
20 4.2.2 Tương tự hình 4.2.1 nhưng cho một số khu vực và ngưỡng
mưa khác nhau
90
21 4.2.3 Tương tự hình 4.2.1 nhưng cho một số lưu vực sông và
ngưỡng mưa khác nhau
91
22 4.2.4 Tương tự hình 4.2.1 nhưng cho chỉ sổ đánh giá ROCA 93
23 4.2.5 Lượng mưa 24h từ 00Z 08/05/2009 đến 00Z 09/05/2009: Dự
báo theo PQPF-MLR (phải) và quan trắc (trái) cho các ngưỡng
mưa 10mm (hình a) và 20mm (hình b)
96
24 4.2.6 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
15/05/2009
96
34 4.2.16 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
08/09/2009
99
35 4.2.17 Lượng mưa tích lũy 24h từ 7h ngày 05/07/2009 - 7h ngày
06/07/2009: dự báo trực tiếp từ mô hình GSM (trái), quan trắc
(giữa) và dự báo từ phương pháp MLR (phải)
100
36 4.2.18 Tương tự hình 4.2.17 nhưng cho lượng mưa tích lũy 24h tính
từ 7h ngày 18/07/2009 đến 7h ngày 19/07/2009
100
37 4.2.19 Tương tự hình 4.2.17 nhưng cho lượng mưa tích lũy 24h tính
từ 7h ngày 22/07/2009 đến 7h ngày 23/07/2009
101
38 4.2.20 Tương tự hình 4.2.17 nhưng cho lượng mưa tích lũy 24h tính
từ 7h ngày 05/09/2009 đến 7h ngày 06/09/2009
101
MỞ ĐẦU 1
CHƯƠNG I
KHÁI QUÁT VỀ PHƯƠNG PHÁP THỐNG KÊ SAU MÔ HÌNH
CHO DỰ BÁO XÁC SUẤT ĐỊNH LƯỢNG MƯA
4
1.1 Khái quát về các nghiên cứu ứng dụng thống kê sau mô hình cho
dự báo xác suất định lượng mưa
4
1.1.1 Các cách tiếp cận cho bài toán thống kê sau mô hình 4
1.1.2 Khái quát về một số nghiên cứu sử dụng cách tiếp cận MOS cho dự
báo xác suất định lượng mưa
8
1.1.2.1 Trên thế giới 8
1.1.2.2 Giới thiệu mộ
t số hệ thống MOS nghiệp vụ trên thế giới 12
1.1.2.3 Tại Việt Nam 13
1.1.2.4 Nghiên cứu lựa chọn mô hình MOS phù hợp cho điều kiện Việt Nam 14
1.2 Giới thiệu một số phương pháp thống kê sau mô hình 14
1.2.1 Hồi quy tuyến tính đa biến 14
1.2.2 Hồi quy Logistic 15
1.2.3 Phân tích phân biệt 16
1.2.4 Mạng thần kinh nhân tạo 19
CHƯƠNG II
NGHIÊN CỨU THIẾT KẾ VÀ XÂY DỰNG CÁC MÔ HÌNH
MOS DỰ BÁO XÁC SUẤT ĐỊNH LƯỢNG MƯA
21
2.1 Thiết kế
và xây dựng các mô hình MOS dự báo xác suất định
3.2.1.2 Phương pháp FE-BPNN 65
3.2.2 Lự
a chọn số nút ẩn tối ưu cho phương pháp ANN 67
3.2.3 Kết quả đánh giá và so sánh kỹ năng dự báo 68
3.2.3.1 Kết quả đánh giá cho phương pháp MLR 68
3.2.3.2 Kết quả đánh giá cho phương pháp FE-BPNN 83
Kết luận chương III 86 CHƯƠNG IV
MỘT SỐ KẾT QUẢ THỬ NGHIỆM NGHIỆP VỤ
54
4.1 Lựa chọn mô hình MOS dự báo xác suất và định lượng mưa
nghiệp vụ
87
4.2 Một số kế
t quả đánh giá nghiệp vụ 88
4.2.1 Dự báo xác suất định lượng mưa 88
4.2.2 Dự báo định lượng mưa 93
4.2.3 Dự báo cho một số đợt mưa lớn mùa hè năm 2009 95 KẾT LUẬN VÀ KIẾN NGHỊ 102
TÀI LIỆU THAM KHẢO 105
PHỤ LỤC
I Thông tin về các trạm quan trắc, khu vực và lưu vực sông và tập nhân
tố dự báo từ các mô hình HRM và GSM
110
động lực trong dự báo nghiệp vụ. Hai phương pháp thống kê cơ bản không có và có
sử dụng sản phẩm của mô hình NWP là Dự báo hoàn hảo (PP - Perfect Prognosis)
và Thống kê sau mô hình (MOS - Model Ouput Statistics). Về cơ bản, cả hai cách
tiếp cận này đều sử dụng các phương trình hồi quy nhiều biến trong đó các nhân t
ố
được lựa chọn thông qua một sơ đồ tuyển chọn nhân tố.
Hiện nay, ở hầu hết các trung tâm dự báo trên thế giới, song song với việc đưa
ra các sản phẩm mô hình thường có các chỉ dẫn thống kê (guidance) để thêm giá trị
vào những sản phẩm trực tiếp của mô hình. Đây là phương thức hợp lý để diễn xuất
mô hình một cách khách quan nhằm loại bỏ những sai số của mô hình và dự
báo
định lượng cho địa điểm có tính đến các điều kiện khí hậu và địa phương cụ thể. Cơ
quan khí tượng Mỹ là nơi đã áp dụng MOS nhiều nhất đối với các mô hình khác
nhau để đưa ra các sản phẩm dự báo nghiệp vụ. Ngoài ra, Trung tâm Dự báo Hạn
vừa Châu Âu (ECMWF), Cơ quan khí tượng Úc (BoM), Cơ quan khí tượng Hồng
Kông (HKO), Cục khí tượng Trung Quốc (CMA), … cũng áp dụng phương pháp
MOS đối với mô hình nghiệ
p vụ để nâng cao chất lượng dự báo DMO.
Tuy nhiên, việc sử dụng các dự báo bằng PP hay MOS vẫn còn đang tiếp tục
được đánh giá và hoàn thiện hơn. Gần đây, cùng với sự phát triển của tốc độ tính
toán và xử lý của máy tính, một số kỹ thuật thống kê phi tuyến bắt đầu được quan
tâm chú ý và thử nghiệm trong các bài toán MOS cho dự báo định lượng mưa như
như phương pháp thống kê nhân tạo, mạng thần kinh nhân tạo, hồi quy logistic,
phân tích phân biệt, Ngoài ra, m
ột số biến thể cập nhập khác như như UMOS và
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
1
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia
khách quan để diễn giải đầu ra của mô hình hỗ trợ cho dự báo synốp truyền thống
nhằm nâng cao khả năng dự báo mưa một cách định lượng để phục vụ sự phát triển
kinh tế xã hội và phòng chống giảm nhẹ thiên tai. Dựa trên những mục tiêu và nội
dung công việc đã được đă
ng ký trong bản thuyết minh đề tài, nội dung của báo cáo
tổng kết đề tài sẽ được bố cục thành các phần sau:
Mở đầu
Chương I. Khái quát về phương pháp thống kê sau mô hình cho dự báo
xác suất định lượng mưa
Chương II. Nghiên cứu thiết kế và xây dựng các mô hình MOS dự báo xác
suất định lượng mưa
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
2
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Chương III. Nghiên cứu thiết kế và xây dựng các mô hình MOS dự báo
định lượng mưa
Chương IV. Một số kết quả thử nghiệm nghiệp vụ
Kết luận và kiến nghị
Tài liệu tham khảo
Các phụ lục kèm theo
Đề tài do các cán bộ nghiên cứu của Trung tâm Dự báo Khí tượng thủy văn
Trung ương thực hiện với sự cộng tác chặt chẽ của các đồng nghiệp trong và ngoài
đơn vị, và s
ự theo dõi, chỉ đạo kịp thời của Ban Giám đốc Trung tâm. Nhóm thực
hiện đề tài hy vọng những kết quả nghiên cứu mà đề tài đạt được sẽ có những đóng
góp cho công tác dự báo định lượng mưa nghiệp vụ cũng như nghiên cứu phát triển
phân làm 2 dạng: dự báo thống kê cổ điển và dự báo thống kê động lực (Wilks,
1995, 2006). Phương pháp dự báo thống kê cổ điển được nghiên cứu phát triển
trước khi có các sản phẩm dự báo thời tiết số (NWP) và chủ yếu được ứng dụng cho
dự báo khí hậu. Cùng v
ới sự phát triển của khoa học khí quyển và công nghệ tính
toán, các sản phẩm NWP được sử dụng rộng rãi và đưa đến sự ra đời của phương
pháp dự báo thống kê động lực do các thông tin dự báo trực tiếp từ mô hình NWP
(DMO - Direct Model Output) vẫn chưa thực sự chính xác. Về bản chất, cả hai
phương pháp này đều dựa trên một số phương pháp thống kê để thiết lập mố
i quan
hệ tuyến tính hoặc phi tuyến giữa yếu tố dự báo và một tập hợp các nhân tố dự báo.
Các phương trình dự báo được xây dựng dựa trên một tập số liệu trong quá khứ (gọi
là tập số liệu phụ thuộc) và áp dụng để dự báo cho tương lai. Cho đến nay, phương
pháp thống kê cổ điển ít khi được sử dụng cho bài toán dự báo thời tiết mà thay vào
đó là các phương pháp thống kê
động lực.
Mục đích chính của phương pháp dự báo thống kê động lực là sử dụng các
thông tin NWP kết hợp với các công cụ tính toán thống kê để tăng cường chất lượng
dự báo của DMO. Hiện tại, phương pháp này được sử dụng tại hầu hết các trung
tâm dự báo trên thế giới và đóng vai trò như là các hệ thống diễn giải (guidance) trợ
giúp cho các dự báo viên. Phương pháp này thực sự quan trọng trong vi
ệc cung cấp
các bản tin dự báo định lượng hoặc dự báo cho các điểm không thuộc lưới tính toán
của mô hình NWP. Việc áp dụng các phương pháp thống kê để cải thiện chất lượng
dự báo DMO là xuất phát từ các lý do như sau:
- Có một sự khác biệt lớn giữa khí quyển thực tế với khí quyển được mô
phỏng bên trong mô hình (xem hình 1.1.1). Cụ thể, khí quyển của mô hình NWP là
một bức tranh đã được đơn gi
ản hóa đi rất nhiều so với khí quyển thực;
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
hệ số hồi quy, phương pháp thống kê cổ điển có một độ trễ thời gian giữa yếu tố dự
báo và nhân tố dự báo trong khi cách tiếp cận PP sử dụng bộ số liệu đồng thời.
Trong pha dự báo, phương pháp thống kê cổ điển sử d
ụng các nhân tố dự báo được
quan trắc tại thời điểm hiện tại để dự báo cho yếu tố dự báo tương lai thì PP lại sử
dụng các nhân tố được dự báo trong tương lai để dự báo yếu tố trong tương lai với
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
5
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia cùng thời điểm. Hay nói cách khác, cách tiếp cận PP không tính toán đến độ trễ thời
gian trong cả pha luyện và pha dự báo mà ngụ ý rằng các nhân tố dự báo trong
tương lai chính là các giá trị quan trắc. Do đó, nếu các dự báo từ các mô hình NWP
là hoàn hảo, thì dự báo trong tương lai của PP cũng gần như hoàn hảo. Đây chính là
lý do tại sao cách tiếp cận này lại được gọi là PP. Hình 1.1.2: Sự khác biệt giữa cách tiếp cận thống kê cổ điển và PP
Cách tiếp cận MOS được đề xuất đầu tiên bởi Glahn và Lowry năm 1972
trong đó sử dụng các sản phẩm dự báo từ mô hình NWP để tạo ra các bản tin dự báo
thời tiết thống kê. Về cơ bản, cả MOS và PP đều sử dụng các thông tin dự báo từ
mô hình như là các nhân tố dự báo. Tuy nhiên, giữa hai cách tiếp cận này vẫn có
một số khác biệt cơ bản (xem hình 1.1.3) như sau:
- PP chỉ sử dụng thông tin từ mô hình NWP trong pha dự báo trong khi MOS
sử dụng cả trong pha luyện và pha dự báo;
- MOS có tính đến độ trễ thời gian thông qua dự báo của mô hình NWP còn
cách tiếp cận PP thì không;
- PP là độc lập với mô hình NWP còn MOS lại phụ thuộc vào mô hình NWP.
nhiên, giữa PP và MOS có thể được so sánh. Cụ thể, PP có ưu điểm hơn MOS trong
việc sử dụng tập số liệu phụ thuộc để tìm các hệ số hồi quy, đó là PP chỉ cần tập số
liệu khí hậu trong quá khứ mà không cần số liệu của mô hình. Do đ
ó, mỗi khi mô
hình NWP có sự thay đổi (dẫn đến thay đổi bản chất sai số) thì không nhất thiết
phải xây dựng lại các phương trình dự báo. Đặc biệt, PP có thể sử dụng với bất kỳ
mô hình NWP nào trong khi MOS lại phải xây dựng bộ phương trình dự báo cho
từng mô hình NWP khác nhau. Đây chính một lợi thế về mặt tính toán của PP so
với MOS. Ngược lại, MOS lại có ưu điểm vượt trội hơ
n hẳn PP ở trong việc đưa
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
7
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia được sai số dự báo của mô hình NWP vào tính toán xây dựng phương trình thống
kê dự báo. Đây chính là lợi thế giúp cho cách tiếp cận MOS thường được sử dụng
trong dự báo nghiệp vụ thời tiết thống kê.
Cho đến nay, mặc dù cả hai cách tiếp cận PP và MOS đã trải qua nhiều năm
phát triển với nhiều biến thể phức tạp, nhưng hai cách tiếp cận này vẫn còn những
hạn chế nhất định. Trong
đó, tất cả các biến thể của MOS và PP đều bị ảnh hưởng
bởi giới hạn của tập số liệu mẫu sử dụng để xây dựng phương trình dự báo. Kalnay
(2003) đã đề xuất một giải pháp để khắc phục vấn đề này đó là sử dụng số liệu tái
phân tích (reanalysis) để phát triển một sơ đồ hậu xử lý trong đó tích hợp được t
ất
cả các ưu điểm của MOS và PP nhưng lại khắc phục được vấn đề giới hạn của tập
số liệu phụ thuộc. Dựa trên đề xuất của Kalnay (2003), Marzban và nnk (2006) đã
giới thiệu một cách tiếp cận mới gọi là RAN (Re-Analysis). Theo Marzban và nnk
(2006), cách tiếp cận RAN là một sự kết hợp giữa PP và MOS trong đó số liệu tái
Regression) với yếu tố dự báo là xác suất xảy ra mưa thay vì lượng mưa hiểu theo
nghĩa thông thường. Cụ thể, lượng mưa quan trắc sẽ được quy về biến nhị phân
trong đó nhận giá trị 1 nếu có mưa xảy ra (xác suất 100%) và giá trị 0 nếu không có
mưa xảy ra (xác suất 0%). Glahn và Lowry (1972) gọi phương pháp thống kê này là
mô hình PoP (Probability of Precipatation). Quá trình tuyển chọn nhân tố cho mô
hình PoP được thực hiện dựa trên ph
ương pháp hồi quy từng bước với tiêu chuẩn
dừng tuyển chọn dựa trên chỉ số đánh giá Brier (Brier ,1950). Trong nghiên cứu
này, Glahn và Lowry (1972) không phát triển các phương trình MOS cho tất cả các
trạm mà dựa trên các đặc trưng khí hậu để nhóm các trạm vào trong các nhóm khác
nhau và phát triển các phương trình MOS cho từng nhóm trạm này.
Kế thừa những thành công trong nghiên cứu của Glahn và Lowry (1972), rất
nhiều nghiên cứu dựa trên cách tiếp cận MOS cho bài toán PQPF đã được thực hiện
như nghiên cứ
u của Wasserman (1972), Lowry và Glahn, (1976), Paegle (1974),
Bermowitz (1975), Bermowitz và Zurndorfer (1979), Arritt và Frank (1985) cho các
trạm thuộc nước Mỹ; Tapp và nnk (1986) cho Úc; Lemcke và Kruizinga (1988) cho
Hà Lan, Brunet và nnk (1988) cho Canađa, …. Hầu hết các nghiên cứu này dựa trên
ý tưởng về mô hình PoP của Glahn và Lowry (1972) nhưng đã được địa phương
hóa và có một số điểm khác biệt liên quan đến các tùy chọn về ngưỡng mưa, tập
nhân tố, dung lượng mẫu, mùa dự báo, tiêu chí tuyển chọn nhân tố, … Tuy nhiên,
có một kết quả chung mà tất cả các nghiên cứu nói trên chỉ ra đó là các kế
t quả dự
báo từ MOS đã cho thấy sự cải thiện đáng kể trong chất lượng dự báo so với DMO,
dự báo khí hậu quán tính và dự báo chủ quan của dự báo viên. Đặc biệt, cách tiếp
cận MOS còn được ứng dụng để phát triển các phương trình dự báo lượng mưa
trung bình lưu vực sông như trong các nghiên cứu của Krzysztofowitz và nnk
(1993), Knuepffer (1996), Sigrest và Krzysztofowitz (1998), Charba (1998) và
Antolik (2000), và Sokol (2003).
hết các nghiên cứu này đều cho thấy sự cải thiện trong chất lượng dự báo PQPF t
ừ
các mô hình MOS áp dụng phương pháp ANN. Ngoài ra, một kết quả quan trọng có
thể rút ra từ những nghiên cứu nói trên là về cấu trúc của mạng ANN phù hợp cho
bài toán PQPF, đó là một mạng gồm với 3 lớp: một lớp đầu vào, một lớp ẩn và một
lớp đầu ra; và các hàm truyền trong mạng ANN nói trên đều có dạng hàm sigma phi
tuyến giống như phương pháp hồi quy logistic. Tuy nhiên, có rất ít nghiên cứu chỉ
ra được số lượng nút ẩn tố
i ưu cho bài toán PQPF.
Ngoài các biến thể MOS sử dụng phương pháp LR và ANN để khắc phục vấn
đề quá khớp và đưa quan hệ phi tuyến vào trong quá trình thiết lập các phương trình
dự báo như đã trình bày ở trên, một dạng biến thể khác của MOS cũng khá phổ biến
và thường được sử dụng cho các biến dự báo đa cấp như lượng mưa, vân lượng
mây, … là các mô hình MOS dựa trên phương pháp phân tích phân biệt (DA -
Discriminant Analysis). Phương pháp DA bao g
ồm 2 dạng cơ bản là phân tích phân
biệt tuyến tính (LDA - Linear Discriminant Analysis) hay còn gọi là phân tích phân
biệt Fisher (FDA) và phân tích phân biệt đa nhóm (MDA - Multiple Discriminant
Analysis). LDA thường được sử dụng cho bài toán 2 nhóm trong khi MDA được
ứng dụng cho bài toán đa nhóm. Cho đến nay, việc nghiên cứu ứng dụng DA trong
dự báo định lượng mưa (QPF - Quantitative Precipitation Forecast) theo cấp đã
được thực hiện khá rộng rãi với một số nghiên cứu điển hình như c
ủa Miller (1962),
Suzuki (1964a, b, c), Klein (1978), Wilson (1982), Carter và Elsner (1997),
Mohanty và nnk (2001). Gần đây, Mohanty và Mohapatra (2007) đã nghiên cứu kết
hợp mô hình PoP và MDA để dự báo QPF theo cấp. Cụ thể, mô hình PoP được sử
dụng để dự báo sự xuất hiện của mưa và sau đó áp dụng mô hình MDA để dự báo
lượng mưa theo các cấp mưa cho trước. Hầu hết các nghiên cứu nói trên đều cho
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
10
Các ma trận này sẽ được cập nhập khi có dữ liệu mới; và 2) các phương trình dự
báo được phát triển bởi sự kết hợp (blending) có trọng s
ố giữa số liệu mới và cũ sao
cho nắm bắt được những thay đổi mới nhất mà vẫn đảm bảo được tính dịch chuyển
và ổn định của hệ thống từ số liệu cũ sang số liệu mới. Wilson và Vallée (2003) đã
đánh giá kỹ năng dự báo PoP của UMOS so với PP và DMO và chỉ ra rằng hệ thống
UMOS có kỹ năng dự báo tốt hơn hẳn PP và DMO. Ngoài ra, hệ th
ống UMOS cũng
rất nhạy với sự thay đổi của sai số hệ thống. Tuy nhiên, các nghiên cứu của Wilson
và Vallée (2003) cũng cho thấy sự cải thiện trong chất lượng dự báo của UMOS chỉ
bộc lộ rõ trong các hạn dự báo ngắn (<24h), còn đối với các hạn dự báo dài hơn sự
cải thiện là không đáng kể, đặc biệt là cho dự báo PoP.
Khác với nghiên cứu của Wilson và Vallée (2002, 2003), Yuval và Hsieh
(2003) đã phát triển một sơ
đồ MOS phi tuyến thích ứng (Adaptive Nonlinear
MOS) dựa trên phương pháp ANN để dự báo QPF. Cụ thể, tập số liệu phụ thuộc
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
11