BTNMT
TTKTTVQGBỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRUNG TÂM KHÍ TƯỢNG THỦY VĂN QUỐC GIA
Số 4 Đặng Thái Thân – Quận Hoàn Kiếm – Hà Nội
********
BÁO CÁO
TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ
ĐỀ TÀI:
NGHIÊN CỨU XÂY DỰNG HỆ THỐNG DỰ BÁO CÁC
YẾU TỐ KHÍ TƯỢNG BẰNG PHƯƠNG PHÁP THỐNG KÊ
TRÊN SẢN PHẨM MÔ HÌNH HRM
Chủ nhiệm: ThS. Đỗ Lệ Thủy
TRÊN SẢN PHẨM MÔ HÌNH HRM
Chỉ số đăng ký:
Chỉ số phân loại:
Chỉ số lưu trữ:
Cộng tác viên chính:
TS Lê Đức TSKH Phạm Kỳ Anh
ThS Võ Văn Hòa TS Phạm Thị Thanh Ngà
ThS Nguyễn Đăng Quang CN Nguyễn Thu Hằng
CN Vũ Duy Tiến CN Nguyễn Mạnh Linh
Hà Nội, ngày tháng 12 năm 2009 Hà Nội, ngày tháng 12 năm 2009
CHỦ NHIỆM ĐỀ TÀI Đỗ Lệ Thủy
CƠ QUAN THỰC HIỆN Bùi Minh Tăng
C
Ơ QUAN CHỦ TRÌ
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
i
DANH SÁCH CÁC CHỮ VIẾT TẮT
BCDG Phương pháp phân tích BCDG
(Bergthorssen-Doss-Cressman method for Grid)
BIAS Sai số hệ thống
BRK Loại mây (nhiều mây)
BRoKen
BS Chỉ số Brier
(Brier Score)
BSS Chỉ số kỹ năng Brier
(Brier Skill Score)
BoM Cơ quan khí tượng Ôxtrâylia
(Bureau of Meteorology, Australia)
CLR Quang mây
(CleaR)
CRF Chỉ số đánh giá
Cumulative
Relative Frequency
GMOS Thống kê sau mô hình trên lưới
(Gridded Model Ouput Statistics)
GSM Mô hình phổ toàn cầu của JMA
(Global Spectral Model)
JMA Cơ quan khí tượng Nhật bản
(Japan Meteorological Agency)
HSS Chỉ số kỹ năng Heidke
(Heidke Skill Score)
KF Phương pháp lọc Kalman
Kalman Filter
MAE Sai số tuyệt đối trung bình
(Mean Absolute Error)
ME Sai số trung bình
(Mean Error)
MLR Hồi quy tuyến tính đa biến
(Multiple Linear Regression)
MOS Thống kê sau mô hình
(Model Ouput Statistics)
NCEP Trung tâm dự báo môi trường quốc gia Mỹ
(National Centers for Environmental Prediction)
RV Chỉ số RV
(Reduction of Variance)
SCT Loại mây (ít mây)
SCaTtered
SSCP Ma trận phương sai hiệp biến
Sum of Squares and Cross Products
TS Chỉ số đánh giá TS
(Threat Score)
TTDBTƯ Trung tâm Dự báo Khí tượng Thủy văn Trung ương
UMOS Th
ống kê sau mô hình có cập nhật hệ số
(Updatable Model Ouput Statistics)
VCE Sự thay đổi theo độ cao
(Vertical Change Elevation)
5 3.1.3 Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo tmax, hạn 54 giờ theo dung lượng tập dữ liệu
mới với mô hình GSM vào mùa hè
56
6 3.1.4 Biến đổi của phương trình dự báo tmin và RV, hạn 66 giờ tại trạm
Láng theo dung lượng tập dữ liệu mới với mô hình HRM vào mùa
đông
57
7 3.1.5 Như bảng 3.1.4, nhưng cho trạm Tân Sơn Hòa 58
8 3.1.6 Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo tmin, hạn 66 giờ theo dung lượng tập dữ liệu
mới với mô hình HRM vào mùa đông
60
9 3.1.7 Biến đổi của phương trình dự báo t, td và RV, hạn 48 giờ tại trạm
Trường Sa theo dung lượng tập dữ liệu mới với mô hình GSM vào
mùa hè
60
10 3.1.8 Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo t và td, hạn 48 giờ theo dung lượng tập dữ liệu
mới với mô hình GSM vào mùa hè
62
11 3.1.9 Biến đổi của phương trình dự báo gió và RV, hạn 24 giờ tại trạm
Côn Đảo theo dung lượng tập dữ liệu mới với mô hình HRM vào
mùa đông
64
12 3.1.10 Như bảng 3.1.9, nhưng với mô hình GSM 65
13 3.1.11 Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo gió hạn 24 giờ theo dung lượng tập dữ liệu mới
với mô hình HRM vào mùa đông
66
74
24 3.1.22 Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo clr và có tần xuất >
10%
75
25 3.1.23 Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo ovc và có tần xuất >
10%
75
35
5 2.4.2 Tương tự hình 2.4.1 nhưng cho t hạn 24h (bên trái) và wind hạn
24h (bên phải)
36
6 2.5.1 Thuật toán dự báo hiện tượng từ dự báo xác suất 41
7 2.7.1 Meteogram dự báo cho Cam Ranh 46
8 2.7.2 Bản đồ dự báo nhiệt độ 2m (t
2m
, trái), nhiệt độ tối thấp 2m (tmin
2m,
giữa) và nhiệt độ tối cao 2m (tmax
2m,
phải) theo GMOS
47
9 2.7.3 Bản đồ dự báo nhiệt độ 2m (t
2m
,trái), nhiệt độ điểm sương 2m
(td
2m
,giữa) và độ ẩm tương đối 2m (rh
2m
, phải) theo GMOS
47
10 2.7.4 Bản đồ dự báo độ ẩm tương đối 2m (rh
2m,
trái), lượng mây (giữa)
và gió 10m (w
10m,
phải) theo GMOS
48
liệu đầu vào từ mô hình GSM
77
20 3.1.9 Tương tự như hình 3.1.8 nhưng cho phương trình dự báo t hạn 24h 78
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
vii
21 3.1.10 Tương tự như hình 3.1.8 nhưng cho chu kỳ dự báo 25/10/2007-
25/12/2007 với số liệu đầu vào từ mô hình HRM
78
22 3.1.11 Tương tự như hình 3.1.10 nhưng cho phương trình dự báo t hạn 24h 78
23 3.2.1 Bias dự báo của tmax vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
81
24 3.2.2 Bias dự báo của tmax vào mùa đông 2006 (trái), 2007 (giữa) và
2008 (phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba
phương pháp DMO, KF và UMOS
82
25 3.2.3 Như hình 3.2.1, nhưng với chỉ số RMSE 83
26 3.2.4 Như hình 3.2.2, nhưng với chỉ số RMSE 84
27 3.2.5 Bias dự báo của tmin vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
85
28 3.2.6 Bias dự báo của tmin vào mùa đông 2006 (trái), 2007 (giữa) và
2008 (phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba
phương pháp DMO, KF và UMOS
trắc cũng được hiển thị với mục đích so sánh.
101
42 3.2.20 Như hình 3.2.19, nhưng cho tmin 102
43 3.2.21 Như hình 3.2.19, nhưng cho t 103
44 3.2.22 Như hình 3.2.19, nhưng cho td 104
45 3.2.23 Dự báo rh hạn 54 giờ theo GMOS với các mô hình GSM, HRM
theo hai phương pháp UMOS và KF. Quan trắc cũng được hiển thị
với mục đích so sánh.
105
46 3.2.24 Bias dự báo của dd vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
107
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
viii
47 3.2.25 Bias dự báo của dd vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
108
48 3.2.26 Như hình 3.2.24, nhưng với chỉ số RMSE 109
49 3.2.27 Như hình 3.2.25, nhưng với chỉ số RMSE 110
50 3.2.28 Như hình 3.2.24, nhưng với chỉ số CRF 111
51 3.2.29 Như hình 3.2.25, nhưng với chỉ số CRF 112
52 3.2.30 Bias dự báo của ff vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương
pháp DMO, KF và UMOS
pháp DMO, UMOSreg và UMOS
129
66 3.2.44 Dự báo lượng mây hạn 12 giờ theo GMOS với các mô hình GSM,
HRM theo hai phương pháp UMOS và KF. Quan trắc cũng được
hiển thị với mục đích so sánh.
130
67 3.2.45 Dự báo lượng mây hạn 12 giờ theo GMOS với các mô hình GSM,
HRM theo hai phương pháp UMOS và UMOSreg. Quan trắc cũng
được hiển thị với mục đích so sánh.
131
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
ix
MỤC LỤC
2.4.1 Xây dựng các phương trình dự báo cho UMOS và KF 31
2.4.2 Thiết kế và xây dựng GMOS 36
2.5 Hậu xử lý 39
2.6 Phương pháp đánh giá 42
2.7 Sản phẩm
44
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
x
CHƯƠNG III. KẾT QUẢ VÀ ĐÁNH GIÁ 49
3.1 Khảo sát kết quả thực hiện 49
3.1.1 Khảo sát các phương trình dự báo theo UMOS 49
3.1.1.1 Phương trình dự báo các yếu tố nhiệt độ: tmax, tmin, t và td
49
3.1.1.2 Phương trình dự báo gió và lượng mây
62
3.1.2 Khảo sát các phương trình dự báo theo lọc Kalman 69
3.2 Đánh giá 79
3.2.1 Đánh giá dự báo nhiệt độ 80
3.2.2 Đánh giá dự báo gió 105
3.2.3 Đánh giá dự báo lượng mây 124
KẾT LUẬN VÀ KIẾN NGHỊ 133
TÀI LIỆU THAM KHẢO 135
PHỤ LỤC
đưa vào chạy dự báo tại Việt Nam, cho đến nay có nhiều mô hình khác nhau đang
được chạy nghiên cứu hay dự báo thử nghiệm tại một số Trung tâm tính toán của
Việt Nam như HRM, Eta tại Trung Tâm Dự báo Khí tượng Thủy văn Trung ương,
RAMS, HRM tại Khoa Khí tượng Thủy văn Hải dương học, Đại học Khoa học Tự
nhiên, MM5, WRF t
ại Viện Khoa học Khí tượng Thủy văn và Môi trường. Trước
đó, kết quả dự báo dưới dạng số từ Cơ quan khí tượng Nhật Bản (JMA) và Cơ quan
khí tượng Úc (BoM) cũng đã nhận được tại Trung Tâm Khí tượng Thủy văn Quốc
gia vào các năm 1997 và 2001. Tuy nhiên, một hệ thống diễn giải dự báo cho các
sản phẩm dự báo từ mô hình vẫn chưa được triển khai tại Việt Nam. T
ại những
trung tâm có sử dụng mô hình dự báo, sản phẩm dự báo cuối cùng vẫn là sản phẩm
dự báo trực tiếp từ mô hình, chưa có bất kỳ hiệu chỉnh nào.
Cho đến nay, tập số liệu bề mặt (địa hình, thảm phủ thực vật, sử dụng đất) sử
dụng trong tất cả các mô hình hiện có tại Việt Nam đều được lấy từ tập số liệ
u toàn
cầu của Mỹ. Tập số liệu này được xác định từ vệ tinh trong những năm 90. Tới thời
điểm hiện nay, với tốc độ phát triển kinh tế xã hội của Việt Nam, tập số liệu này đã
không còn mô tả tốt một số khu vực trên lãnh thổ Việt Nam khi có những biến động
lớn trong khu dân cư tại các đô thị, hay vấn đề sử dụng đấ
t. Ngoài ra, các mô hình
sử dụng đều có nguồn gốc từ các nước ngoại nhiệt đới nên khả năng mô phỏng
chính xác các quá trình nhiệt đới trên khu vực Việt Nam cũng cần được đặt ra. Do
đó, sai số hệ thống tồn tại trong sản phẩm dự báo của mô hình là không thể tránh
khỏi. Bởi vậy một dự báo thống kê như MOS trở nên rất cần thiết nhằm tăng cường
chất lượ
ng dự báo, loại bỏ các sai số hệ thống từ mô hình cũng như điều kiện ban
đầu. Bên cạnh đó, đòi hỏi ngày càng cao của xã hội trong chất lượng dự báo hạn
ngắn cũng thúc đẩy xây dựng dự báo sau mô hình.
Trong nỗ lực tăng cường chất lượng dự báo, đã có một nghiên cứu đầu tiên
Mở đầu
Chương I. Tổng quan về các phương pháp UMOS, lọc Kalman và GMOS
Chương II. Thiết kế các hệ thống dự báo UMOS, lọc Kalman và GMOS
Chương III. Kết quả và đánh giá
Kết luận
Kiến nghị
Tài liệu tham khảo
Phụ lục
Đề tài do các nghiên cứu viên Phòng Nghiên cứu ứng dụng, Trung tâm Dự báo
KTTV Trung
ương thực hiện với sự cộng tác chặt chẽ của các đồng nghiệp Đại học
Khoa học tự nhiên, Đại học Quốc gia Hà Nội và sự theo dõi, chỉ đạo kịp thời của
Ban Giám đốc Trung tâm. Nhóm thực hiện đề tài hy vọng những kết quả nghiên
cứu mà đề tài đạt được sẽ có những đóng góp cho công tác dự báo nghiệp vụ cũng
như nghiên cứu phát triển sau này tại Trung tâm Dự
báo KTTV Trung ương nói
riêng và Trung tâm KTTV Quốc gia nói chung. Nhân dip này, chủ nhiệm đề tài và
các cộng tác viên xin gửi lời cảm ơn chân thành đến Lãnh đạo Bộ Tài nguyên và
Môi trường, Lãnh đạo Trung tâm KTTV Quốc gia và đặc biệt là Ban Giám đốc
Trung tâm Dự báo KTTV Trung ương đã tạo mọi điều kiện cho chúng tôi hoàn
thành đề tài. Một lần nữa, xin trân trọng cảm ơn.
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
3
CHƯƠNG I
TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP UMOS, LỌC KALMAN
ở chỗ: khi xây dựng các phương trình hồi quy, tập số liệ
u mô hình dùng làm nhân tố
dự báo phải đồng nhất. Theo đánh giá của Jacks và nnk (1990) để có được một quan
hệ thống kê ổn định, cần ít nhất hai năm số liệu dự báo từ mô hình và thám sát. Sau
đó khi sử dụng MOS, các đặc trưng của mô hình dự báo như các sơ đồ tham số hóa,
độ phân giải, cần được giữ nguyên như khi sử dụng mô hình để thiết lập quan hệ
thống kê. Điều này rõ ràng là một hạ
n chế lớn của MOS, bởi ta biết rằng từ thập kỷ
90 với sự phát triển nhanh của tốc độ tính toán cũng như các hệ thống quan trắc, các
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
4
mô hình thường xuyên được cập nhật với độ phân giải ngày càng cao hơn, các sơ đồ
tham số hóa tinh tế hơn, trường phân tích chính xác hơn. Erikson và nnk (2002) cho
ta thấy sai số hệ thống sẽ xuất hiện khi sử dụng MOS với mô hình được cải tiến. Do
đó, khi mô hình có sự thay đổi ta phải đợi ít nhất hai năm mới có thể bắt đầu sử
dụng MOS trong dự báo hoặc dự báo lại với mô hình đã thay đổi cho hai nă
m trước
đó nhằm xác định lại các hệ số hồi quy. Với số phương trình hồi quy rất lớn (tại mỗi
trạm, cho mỗi biến và mỗi hạn dự báo có một phương trình hồi quy riêng biệt), chi
phí cho tái xây dựng hệ thống MOS khi mô hình thay đổi là khá lớn.
Có thể lấy thí dụ thông qua hệ thống MOS của Mỹ: Hệ thống MOS đầu tiên
được xây dựng cho mô hình LFM vào năm 1976. Đến năm 1990, hệ thống này đượ
c
thay thế bởi hệ thống MOS cho mô hình NGM (Jacks và nnk, 1990). Từ năm 1993,
mô hình Eta bắt đầu được đưa vào chạy nghiệp vụ tại NCEP thay thế cho mô hình
LFM. Do mô hình Eta thường xuyên được cải tiến, không có hệ thống MOS nào
Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
5
hình không có cải tiến nào đáng kể, UMOS sẽ trở thành phương pháp
MOS thông thường.
Ngoài ra, có một số tác giả đề xuất một số phương pháp mới thay thế cho
MOS với tập số liệu mẫu ngắn hơn (Mao và CS, 1999) hoặc phương pháp phi tuyến
thông qua mạng tế bào thần kinh có khả năng tự cập nhật (Yuval và Hsieh, 2003).
Cần chú ý rằng khi sử dụng các phương pháp phi tuyến thay thế cho phương pháp
hồi quy tuyến tính, v
ấn đề thay đổi của mô hình khi sử dụng MOS vẫn không được
giải quyết.
Cả hai phương pháp này cùng xuất hiện những năm đầu thập kỷ 90 và
nhanh chóng được các trung tâm dự báo trên thế giới triển khai ứng dụng, đặc biệt
là lọc Kalman. Được đề xuất bởi các tác giả Bắc Âu, lọc Kalman nhanh chóng được
triển khai thực hiện trước tiên tại các nước này như Đan Mạch (Simonsen, 1991),
Nauy (Homleid, 2004) hay Iceland (Crochet, 2004). Sau đó ph
ương pháp này dần
được các nước khác tại châu Âu sử dụng như Pháp (Météo France, 2002), Đức
(Haalman, 2003), Rumani (Diaconu, 2002), Hy Lạp (Golanis và Anadranistokis,
2002), Tại các nước Đông Á, lọc Kalman được ứng dụng rất nhiều trong hệ thống
diễn giải dự báo hạn ngắn tại Cơ quan khí tượng Nhật Bản (JMA) và Cơ quan khí
tượng Hàn quốc (KMA). Từ năm 1996, JMA chủ yếu sử dụng lọc Kalman trong
diễn giải kết quả dự báo từ mô hình cho mọ
i yếu tố khí tượng cơ bản: mưa, gió,
nhiệt độ (JMA, 2006). Tại Hàn Quốc, KMA dự báo cho nhiệt độ cho 40 điểm trạm
tại Hàn Quốc cùng 32 điểm khác tại CHDC ND Triều Tiên, Trung Quốc và Nhật
Bản theo phương pháp lọc Kalman và một biến thể của nó là DLM (Joo, 2006).
Riêng với phương pháp UMOS, dù được phát triển tại Mỹ nhưng lại được ứng dụng
tại Canada (Wilson và Vallée, 2002, 2003). Hiện tại, Mỹ v
mô hình đã được nghiên cứu trên thế giới vào bài toán cụ thể của mình, chưa có khả
năng đóng góp nghiên cứu về mặt phương pháp luận. Trước năm 1997, trong
nghiệp vụ dự báo hàng ngày, chủ yếu sử dụng phương pháp synop để dự báo hình
thế thời tiết. Một số các công cụ trên cơ sở phương pháp thống kê truy
ền thống
cũng được xây dựng, nhưng phần lớn là những phương trình hồi qui đơn giản áp
dụng cho một vài điểm, chỉ để dự báo một số nhân tố truyền thống như mưa, nhiệt
độ, vận tốc gió, và phần lớn là áp dụng cho những dự báo hạn vừa và dài (Nguyễn
Văn Tuyên, 1988, 1999).
Từ năm 1997 trở lại đây, trên cơ sở hợp tác song phươ
ng, Trung Tâm dự báo
KTTV Trung ương đã thu được một số sản phẩm dự báo của các mô hình số từ
JMA, cơ quan khí tượng Úc (BoM) và một vài Trung tâm khí tượng khác chủ yếu
dưới dạng bản đồ. Đến năm 2002, tại TTDDBTƯ bắt đầu chạy nghiệp vụ mô hình
số phân giải cao HRM. Trong các năm từ 2001 đến 2002 tại TTDBTƯ đã tiến hành
thực hiện đề tài “Nghiên cứu ứng dụng phương pháp d
ự báo lượng mưa dựa trên
sản phẩm mô hình dự báo số trị của Nhật”. Tuy nhiên, đây không phải là phương
pháp thống kê mà chỉ đơn thuần là một mô hình tính toán lượng mưa dẫn xuất dựa
trên các biến dự báo từ mô hình thông qua một vài phương trình vật lý (Đỗ Lệ Thủy
và nnk, 2002).
Sau những năm đặt trọng tâm phát triển mô hình dự báo từ năm 2000,
những năm gần đây, các nghiên cứu về
dự báo thống kê sau mô hình mới bắt đầu
được triển khai với công trình đầu tiên của Bùi Minh Tăng và nnk (2009). Các tác
giả này đã áp dụng một số kỹ thuật thống kê theo nghĩa MOS mở rộng (không đơn
thuần là hồi quy tuyến tính) vào dự báo yếu tố lượng mưa 24 giờ đầu từ mô hình số
trị. Các kết quả thu được là rất đáng khích lệ dù nghiên cứu có nhược điểm xem như
mô hình dự báo không thay
đổi theo thời gian. Nhược điểm này có thể không
X
1
+ … + a
p
X
p
(1.2.1)
từ tập số liệu quá khứ và áp dụng dự báo tương lai. Các hệ số a
i
sẽ được xác định
theo phương pháp bình phương tối thiểu dựa trên tập số liệu training dung lượng
mẫu n. Viết dưới dạng ma trận, công thức tính vector hệ số a
i
có dạng sau:
a = (X
T
X)
-1
X
T
y (1.2.2)
trong đó y là vector yếu tố dự báo kích thước n, X là ma trận nhân tố dự báo kích
thước (p+1)×n, với mỗi vector cột, tương ứng vector nhân tố dự báo kích thước n.
MOS không cố định trước tập p các nhân tố mà thực hiện hồi quy từng bước với p
tăng dần từ 1 cho đến một giá trị nào đó thỏa mãn tiêu chuẩn dừng. Tại mỗi bước,
bài toán hồi quy mà MOS thực hiện hoàn toàn đồng nhất v
ới mô tả toán học ở trên.
Nếu thực hiện như đã mô tả ở trên, khi muốn cập nhật phương trình dự báo
1.2.1 với tập số liệu training đã được mở rộng thêm từ n lên n+m (m là số ngày mới
tích lũy thêm dữ liệu), toàn bộ quá trình phải được thực hiện lại từ đầu với hồi quy
T
X kích thước (p+1)×(p+1) và vector X
T
y kích thước p+1. Mỗi phần tử M
ij
của
ma trận X
T
X chỉ đơn giản là tích vô hướng giữa hai vector nhân tố dự báo kích
thước n thứ i và j, trong khi mỗi phần tử V
i
của vector X
T
y là tích vô hướng giữa
vector nhân tố dự báo kích thước n thứ i với vector yếu tố dự báo kích thước n.
M
ij
=
∑
=
n
1k
kjik
XX
(1.2.3)
V
i
=
∑
=
tưởng cập nhật vào MOS. Điều này cũng đồng nghĩa quá trình hồi quy từng bước sẽ
không được thực hiện và các nhân tố d
ự báo phải cố định giống như trong phương
pháp lọc Kalman. Một quá trình sơ tuyển cần được thực hiện tuyển chọn trước các
nhân tố này. Thông thường p vào khoảng 10 và dung lượng lưu trữ được sử dụng
cập nhật phương trình dự báo cho một trạm sẽ rất nhỏ với 132 số thực (11×11+11).
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
9
Cách thức thực hiện này chính là UMOS dưới dạng đơn giản nhất và nếu so với
MOS truyền thống thì khối lượng tính toán của nó là không đáng kể.
Trong thực tế, khối lượng tính toán còn giảm hơn nữa do không cần thiết
phải giải hệ phương trình (1.2.2) từng ngày, do các phương trình dự báo MOS có
tính ổn định cao. Một thay đổi nhỏ trên thang thời gian ngày của ma trận X
T
X sẽ
không có tác động tới giá trị của tập hệ số a. Phương trình (1.2.2) chỉ cần giải trên
quy mô tuần hoặc quy mô tháng và công việc hàng ngày chỉ liên quan đến cập nhật
ma trận X
T
X và vector X
T
Y bằng cách cộng thêm một số hạng thích hợp vào mỗi
phần từ. Khối lượng tính toán chỉ tăng lên khi ta giải hệ phương (1.2.2) vào thời
gian đã định trước theo tháng hay tuần.
Hai ma trận X
T
một phương trình dự báo mới trong khi không thể sử dụng phương trình d
ự báo cũ.
Dự báo sau mô hình sẽ không thể thực hiện trong khoảng thời gian đợi này và cách
giải quyết duy nhất có thể là chạy lại mô hình mới với thời gian trước đây nhằm xây
dựng lại MOS. Tuy nhiên, khi thay đổi điểm nhìn sang ma trận SSCP, vấn đề sẽ
được giải quyết đơn giản hơn nếu xác định ma trận SSCP trong thời gian chuyển
đổi giả định một quan hệ tuyến tính chuyển d
ần từ ma trận SSCP cũ sang ma trận
SSCP mới và kết thúc khi mô hình mới đã có được một chuỗi dự báo đủ dài. Giả
thiết này không có cơ sở toán học (không tương đương với hồi quy tuyến tính đa
biến) nhưng có thể chấp nhận về mặt ứng dụng và hiệu quả có thể có được trong
giai đoạn chuyển đổi mô hình.
Như vậy, khi mô hình thay đổi, ma trận SSCP sẽ được tính thông qua m
ột
phương pháp lấy trọng số giữa ma trận SSCP cũ và mới.
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
10
SSCP = w
o
SSCP
o
+ w
n
SSCP
n
(1.2.5)
≤ N
max
(1.2.6)
w
n
=1, w
0
=0 với N
n
> N
max
trong đó w
n
là trọng số cho ma trận SSCP mới, w
o
: trọng số cho ma trận SSCP cũ,
N
n
: dung lượng mẫu từ tập số liệu mới, N
o
: dung lượng mẫu từ tập số liệu cũ, N
min
:
dung lượng mẫu tối thiểu mà khi vượt quá mô hình mới bắt đầu tác động tới ma trận
SSCP, N
max
: dung lượng mẫu tối đa mà khi vượt quá mô hình cũ được xem như
không còn tác động tới ma trận SSCP, w
max
: tham số điều khiển. Dạng hàm này
as
s
ba
s
SSCPwSSCPw
N
NN
wSSCP
00
),min(
+=
∑
=
(1.2.7)
với chỉ số s chạy từ a đến b tương ứng với hai mùa, w
s
là trọng số mùa cho mùa s,
w
os
và w
ns
: trọng số như trong (1.2.6), N
s
mà cụ thể hơn N
a
và N
b
là dung lượng
mẫu của mùa tương ứng.
Như mô tả ở trên, nếu UMOS thực hiện phân mùa với hai tập nhân tố khác
Tập con các nhân tố được tuyển chọn cho phương trình dự báo sẽ thay đổ
i khi
chuyển từ tuần sang tuần, tháng sang tháng, mùa sang mùa hoặc từ mô hình cũ sang
mô hình mới. Phương trình dự báo do đó sẽ biến đổi liên tục, “trơn” khi chuyển
mùa hay chuyển đổi mô hình.
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
12
Tuy nhiên, do thực hiện tuyển chọn nhân tố, cách thực hiện này đòi hỏi phải
có một tập dữ liệu training. Như vậy, để làm trơn quá trình chuyển mùa hay chuyển
đổi mô hình, bên cạnh khối lượng tính toán tăng thêm, dung lượng lưu trữ cũng tăng
thêm. Tất nhiên, nếu so với MOS truyền thống thì chi phí này vẫn nhỏ hơn. Với tập
dữ liệu training cần chú ý trong thời gian chuyển đổi mô hình, UMOS sẽ không
th
ực hiện lưu tập training với độ dài n tăng dần từng ngày như MOS truyền thống
mà cố định độ dài tập traning bằng N
max
trong công thức 1.2.6. Đây là dung lượng
mẫu tối đa để một phương trình dự báo khi xây dựng theo MOS truyền thống ổn
định.
1.2.2. Lọc Kalman
Phương pháp lọc Kalman (gọi tắt là KF - Kalman Filter), được đặt theo tên tác
giả của bộ lọc, ra đời năm 1960 trong công trình của R. E. Kalman mô tả một bộ lọc
đệ quy cho phép đánh giá trạng thái của một hệ động lực tuyến tính. Từ đó đến nay,
cùng với sự phát triển của tính toán số, KF đã trở thành một chủ đề nghiên cứu phát
triển rất nhanh với nhiều ứng dụ
ng trong các ngành kỹ thuật công nghệ như tự động
là vector trạng thái thời điểm hiện tại, x
k-1
là vector trạng thái thời điểm
trước đó, u
k-1
là vector điều khiển hệ thống tại thời điểm trước đó, w
k-1
là vector đặc
trưng cho độ bất định của hệ thống do quy luật tuyến tính mô tả thông qua ma trận
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê
trên sản phẩm mô hình HRM - Hà Nội 2009
13
A chỉ là gần đúng. Ma trận A kích thước N×N có tên gọi ma trận chuyển dịch trạng
thái mang thông tin về quy luật hoạt động của hệ thống. Ma trận B được đưa vào
phương trình trên đặc trưng cho các quá trình bên ngoài điều khiển hệ thống đang
xét tác động thông qua vector điều khiển u
k-1
. Các bài toán KF thông thường không
sử dụng B và u.
Vấn đề đặt ra là ta biết quy luật hoạt động của hệ thống qua ma trận A, nhưng
không thể xác định trực tiếp trạng thái x
k
từ các phép đo thích hợp (trạng thái bị ẩn)
mà chỉ có được các quan trắc gián tiếp z
k
kích thước M có quan hệ tuyến tính với
x
k
với z
k
đo được, lọc Kalman sẽ cực tiểu hóa hiệp phương sai của sai số đánh giá.
Như vậy, ở bước thứ k, sử dụng phương trình (1.2.8) ta dễ dàng thu được đánh
giá tiên nghiệm (đánh giá sơ bộ)
−
k
x
ˆ
của vector trạng thái x từ các thông số của bước
trước đó. Sau đó, khi có quan trắc z
k
, ta cần điều chỉnh lại đánh giá tiên nghiệm sao
cho đánh giá hiệu chỉnh thu được phù hợp với quan trắc hiện có. Đánh giá này có
tên gọi đánh giá hậu nghiệm và được ký hiệu bởi
k
x
ˆ
. Đánh giá tiên nghiệm và hậu
nghiệm sẽ có sai số:
kkk
kkk
x
ˆ
xe
x
ˆ
xe