1
ĐạI HọC QUốC GIA Hà NộI
TRƯờNG ĐạI HọC KHOA HọC Tự NHIÊN
TRầN quang năng
đánh giá sai số hệ thống dự báo ma của
mô hình hrm cho khu vực đông bắc bộ
LUậN VĂN THạC Sĩ KHOA HọC Hà NộI 2009 2
ĐạI HọC QUốC GIA Hà NộI
TRƯờNG ĐạI HọC KHOA HọC Tự NHIÊN
tâm dự báo KTTV Trung Ương 1
1.1.1. Khái quát về mô hình HRM 1
1.1.2. Chạy mô hình HRM với các số liệu ban đầu và số liệu biên từ ba mô hình
toàn cầu khác nhau 2
1.2. Khái quát về bài toán đánh giá chất lượng dự báo thời tiết 5
1.2.1 Mục đích và ý nghĩa của đánh giá dự báo 6
1.2.2 Mô hình đánh giá chung cho các yếu tố dự báo thời tiết 7
1.2.3 Các yếu tố dự báo 11
1.2.4 Các điểm số dùng trong đánh giá 12
1.3 Mô hình đánh giá sản phẩm dự báo số trị 14
1.4. Các đặc trưng đánh giá 17
1.4.1. Độ chính xác 17
1.4.2. Kỹ năng dự báo 18
1.4.3 Độ tin cậy 18
1.4.4. Độ phân giải 18
1.4.5. Độ biến động 19
1.5. Các phương pháp đánh giá sản phẩm dự báo số 19
1.5.1. Những nguyên nhân sai số dự báo bằng mô hình số 19
1.5.2. Một số định nghĩa 20
1.5.3. Phương pháp đánh giá với biến liên tục 22
1.5.4. Phương pháp đánh giá với dự báo pha 28 4
CHƯƠNG 2. SỐ LIỆU VÀ PHƯƠNG PHÁP ĐÁNH GIÁ DỰ BÁO BÁO MƯA
MÔ HÌNH HRM 34
2.1. Số liệu 34
2.1.1 . Số liệu mưa quan trắc và thực tế 34
2.1.2. Số liệu mưa dự báo của mô hình HRM 37
2.2. Phương pháp đánh giá dự báo mưa của mô hình HRM 38
phòng Nghiên cứu ứng dụng (Trung tâm dự báo Khí tượng Thủy văn Trung Ương), đặc
biệt là Thạc sĩ Vũ Anh Tuấn và Thạc sĩ Võ Văn Hòa đã tạo điều kiện, trao đổi chuyên
môn cũng như có những ý kiến quý báu giúp tôi hoàn thiện luận văn này.
Tôi cũng xin cảm ơn Phòng sau đại học, Trường Đại học Khoa học Tự nhiên đã
tạo điều kiện cho tôi có thời gian hoàn thành luận văn.
Cuối cùng, tôi xin gửi lời cảm ơn chân thành tới gia đình, người thân và bạn bè,
những người đã luôn ở bên cạnh cổ vũ, động viên và tạo mọi điều kiện tốt nhất cho tôi
trong suốt thời gian học tập tại trường.
Trần Quang Năng
6
MỞ ĐẦU
Mô hình HRM (High resolution Regional model) đã được tiến hành chạy nghiệp
vụ từ năm 2001 tại Trung tâm Dự báo Khí tượng Thủy văn Trung ương và các sản
phẩm của nó đã ngày càng trở nên quan trọng trong công tác dự báo nghiệp vụ hàng
ngày. Tuy nhiên, hiện nay việc đánh giá khả năng dự báo của mô hình HRM vẫn còn
hạn chế. Các dự báo viên vẫn thường xem xét sản phẩm dự báo số của mô hình theo
kinh nghiệm nên vẫn chưa có hiểu biết một cách hệ thống và đầy đủ về khả năng dự
báo của mô hình, đặc biệt là trong từng hình thế thời tiết cụ thể. Do đó việc sử dụng
sản phẩm của mô hình HRM còn chưa đem lại hiệu quả cao.
Mưa vừa là yếu tố khí tượng vừa là hiện tượng thời tiết được liệt vào hàng các
hiện tượng thời tiết khó dự báo nhất. Không những chỉ khó dự báo mà việc đánh giá dự
báo mưa cũng là một việc hết sức khó khăn và phức tạp. Trước hết khó khăn nằm ngay
trong bản chất trường yếu tố mưa là trường bất liên tục và không cố định cả theo thời
gian lẫn không gian; nhiều đặc trưng thống kê có tính quy luật ở những yếu tố khí
tượng khác, nhưng lại không có ở số liệu mưa, làm cho việc xử lý số liệu mưa cũng rất
phức tạp. Xong dự báo mưa lại có vai trò đặc biệt quan trọng trong phục vụ dự báo,
vụ ở Trung tâm dự báo Khí tượng Thủy văn Trung Ương từ tháng 5 năm 2002, dự báo
cho hai miền chính trong thời hạn 72 giờ. Miền lớn xác định trong khoảng từ 5
0
S –
35
0
N, 80
0
E – 130
0
E, 161x201 điểm lưới với độ phân giải ngang là 0.25
0
(28 km), 20
mực thẳng đứng và bước thời gian tích phân là 120s (HRM28). Miền nhỏ hơn xác định
trong khoảng 7.125
0
N – 27.125
0
N, 97.25
0
E – 117.25
0
E, 161x161 điểm lưới với độ
phân giải ngang là 0.125 (14 km), 31 mực thẳng đứng, bước thời gian tích phân là 90s
(HRM14); cả hai miền này đều sử dụng số liệu ban đầu và số liệu biên lấy từ mô hình
toàn cầu GME (DWD) 3 giờ một thông qua mạng internet. Trước ngày 27 tháng 9 năm
2004, độ phân giải ngang và thẳng đứng của GME theo thứ tự là 60 km và 31 mực.
Hiện tại, độ phân giải ngang của GME đã tăng lên thành 40 km và độ phân giải thẳng
đứng đã là 40 mực. Mực thấp nhất của GME là 10m.
Mô hình HRM được cung cấp bởi DWD với mã nguồn mở đã trở thành mô hình
liệu đầu vào của mô hình GSM, các trường ẩm hay các số liệu về ẩm trên đại dương
được tính toán từ ảnh các vệ tinh địa tĩnh (GMS-5 và MTSAT-1R). Những thông tin
này thu được từ vệ tinh không có nhiều giá trị cho tất cả những khu vực trên đại dương
nơi mà các quan trắc truyền thống như SYNOP, TEMP còn thưa thớt. Liên quan đến sơ 10
đồ phân tích khách quan, mô hình GSM có sơ đồ đồng hóa số liệu 4 chiều 4D-VAR
trong các mực của mô hình, trong khi mô hình GME sử dụng sơ đồ nội suy tối ưu
truyền thống và không phức tạp bằng 4D-VAR, nhưng có quá nhiều quan trắc bị “là
trơn”. Địa hình bề mặt cũng đóng một vai trò quan trọng trong một số mô hình sự báo
thời tiết số (NWP). Tuy nhiên, cả mô hình GSM và GME đều cùng sử dụng bộ số liệu
GTOPO30 từ USGS (NWP-hệ thống của DWD 2002).
1.1.2.1 Số liệu cần cho HRM
HRM cần 3 nhóm số liệu:
Nhóm 1: Các trường cố định: fis, gz0, fr_land, soiltyp, Plcov
Nhóm 2: Các trường mực đơn lẻ: ps, t_snow, t_s, t_g, t_m, t_cl, w_snow, w_i, w_gl,
w_g2, w_g3, w_cl, qv_s
Nhóm 3: Các trường đa mực: u, v, t, qv, qc, qi
1.1.2.2 Sử dụng kết hợp số liệu của GME và GSM làm số liệu ban đầu và số liệu
biên cho HRM
Tháng 9 năm 1997, theo hiệp định song phương giữa Trung tâm KTTV Quốc Gia
Việt Nam và Cơ quan khí tượng Nhật Bản, các sản phẩm dự báo và phân tích của mô
hình phổ toàn cầu GSM được cung cấp cho khu vực từ 20 – 60
0
N, 80 – 160
0
E với độ
phân giải ngang là 1.5
0
1.1.2.3 Số liệu cung cấp bởi JMA
Số liệu ở mực cao không có: mây ở dạng nước (qc), mây ở dạng băng (qi), địa
hình bề mặt và các tham số khác.
Độ phân giải ngang: 1.25x1.25
0
. Miền bao phủ: 60 – 160
0
E, 20
0
S – 60
0
N.
Các trường đa mực:
- (T – Td): 300, 400, 500, 600, 700, 850, 920, 1000hPa
- T, U, V, H: 0, 20, 30, 50, 70, 100, 150, 200, 250, 300, 400, 500, 700,
850, 920, 1000 hPA
Các trường đơn mực:
(T-Td), T: 2m (Nhiệt độ và nhiệt độ điểm sương tại độ cao 2m)
U, V : 10 m (thành phần gió tại độ cao 10m)
MSLP : Áp suất mực biển trung bình
Vì số liệu của GSM không đủ để chạy mô hình HRM nên Trung tâm dự báo Khí
tượng Thủy văn Trung Ương đã cải tiến và sử dụng cả bộ số liệu của mô hình GME và
GSM:
Số liệu GSM: MSLP, U, V, T, (T – Td) tại bề mặt và 16 mực áp suất, địa thế vị
tại mực 300 hPa 12
Số liệu GME: Các tham số mặt đất (địa hình, độ thô bề mặt, tham số đất, đất bao
phủ, núi…), mây dạng nước (qc), mây dạng băng (qi) tại 31 mực mô hình
đánh giá.
Theo Barbara Brown (2007), đánh giá chất lượng dự báo thời tiết bao gồm 3
mục đích chính sau đây:
a. Mục đích hành chính
Ban đầu, Cơ quan Khí tượng Canada (1871) sử dụng việc đánh giá để chứng tỏ
với Nghị viện những lợi ích mà công tác dự báo đem lạ1. Đồng thời, thông tin đánh giá
cũng có nhiều ứng dụng mang tính hành chính khác như: Yêu cầu tài trợ các trang thiết
bị như máy tính điện tử, hay quyết định khi nào và có nên thay đổi sản phẩm dự báo
bằng một sản phẩm khác hay một vài cách giải quyết khác. Điều này cũng phụ thuộc
vào sự phát triển của cộng đồng và sự phát triển của các trang thiết bị sử dụng trong
dịch vụ thời tiết. Các câu hỏi đặt ra cho việc đánh giá với những mục đích mang tính
hành chính là: “Liệu độ chính xác của bản dự báo sẽ được cải tiến?” hoặc “Các dự báo
khách quan về nhiệt độ tốt hơn so với dự báo chủ quan hay không?”. Đánh giá hành
chính được sử dụng để kiểm tra thường xuyên chất lượng tổng thể các bản dự báo và
theo dõi những thay đổi về chất lượng của chúng qua từng giai đoạn.
b. Mục đích khoa học
Mục đích khoa học của đánh giá chất lượng dự báo dùng để nhận biết chi tiết
những điểm mạnh và điểm yếu của một sản phẩm dự báo và từ đó có những hành động
tích cực nhằm cải thiện kết quả dự báo. Mặt khác, đánh giá khoa học cũng cung cấp
trực tiếp các thông tin cho hướng nghiên cứu và phát triển phương pháp dự báo
c. Mục đích kinh tế
Theo Brier và Allen (1951), mục đích kinh tế của đánh giá chất lượng dự báo
đóng một vai trò hết sức quan trọng, nó giúp đánh giá được lợi ích của việc dự báo
đúng, từ đó đưa ra được những quyết sách hợp lý trong các hoạt động có liên quan và 14
để thỏa mãn những yêu cầu từ người sử dụng sản phẩm dự báo cuối cùng. Ví dụ, khi có
một bản tin dự báo thời tiết chính xác sẽ giúp ích cho việc bảo vệ người dân trước các
thảm hiện tượng thời tiết nguy hiểm như bão hay lũ lụt hoặc cũng có thể giúp ích rất
ại
ngoại bộ
Phân lo
ại
nội bộ
Biến pha
Bi
ến
liên t
ục
B
ảng li
ên
hợp
Nguyên lý phát
hiện tín hiệu
Đồ thị điểm
Biến pha
Bi
ến
liên t
ục
Biến pha
Bi
ến
Đ
ộ giảm
phương sai
H
ệ số
Phân tán
Độ lệch 16
Hình 1.1 Sơ đồ chung cho đánh giá các yếu tố thời tiết
Theo tác giả Henry R. Stanski và các cộng sự (1989), việc đánh giá tổng quát
(chung) cho các yếu tố dự báo thời tiết được minh họa trên hình 1.1, đồng thời cũng
tóm tắt các kiểu quyết định được đưa ra trước khi một phương pháp đánh giá chuyên
dụng được chọn lựa. Đây chỉ là một mô hình đánh giá chung nhất và dĩ nhiên vẫn có
thể tồn tại nhiều mô hình tương tự khác. Tuy nhiên, mô hình này cho ta một bức tranh
nhất quán về mối quan hệ các đặc trưng của phép đánh giá các đại lượng đo và các giải
pháp khác nhau để có thể đem lại lựa chọn thích hợp.
Tất cả các phương pháp đánh giá đều được bắt đầu từ việc tập hợp các tập số
liệu quan trắc và dự báo (hình bình hành ở trên). Khi công việc trên đó hoàn thành thì
bước tiếp theo là việc xử lý số liệu. Việc này phụ thuộc vào các cách giải quyết khác
nhau (dạng hình thoi trong sơ đồ), tức là phụ thuộc vào mục đích đánh giá, đánh giá
hành chính hoặc đánh giá khoa học.
Một khi mục đích đánh giá đó được thiết lập, một tập mẫu có thể được phân loại
để đáp ứng mục đích đã định sẵn. Phân loại nghĩa là tách các phần tử trong tập mẫu
thành hai hay nhiều nhóm theo một nguyên tắc lựa chọn, sau đó, thực hiện đánh giá
cho từng nhóm riêng biệt. “Phân loại ngoại bộ ” nghĩa là đánh giá theo nguyên tắc lựa
phẩm.
Ngược lại, trong đánh giá hành chính, người ta ít quan tâm chi tiết đến việc biểu
diễn những biến theo các giá trị khác nhau trong dự báo. Quả thực, các câu hỏi đặt ra
đều mang tính chung chung và chỉ cần một câu trả lời tóm tắt nào đó. Vì vậy, phân loại
nội bộ có thể vẫn được thực hiện nhưng nó hiếm khi được dùng đến. Tuy nhiên, ưu
điểm lớn của đánh giá hành chính là biểu diễn chất lượng sản phẩm chỉ bằng vài con số
hoặc là việc so sánh hay hướng nhận dạng được thực hiện dễ dàng hơn. Ta có thể thấy
được, bản chất tóm tắt tổng kết của đánh giá hành chính qua mối liên hệ với các luật
cho điểm tổng kết được chỉ ra ở hình 1.1.
Đôi khi việc cố gắng tổng kết tất cả các thông tin về chất lượng sản phẩm vào
một điểm số để cung cấp cho ban quản lý là một việc hết sức khó khăn. Việc tóm tắt 18
thông tin đánh giá vào một con số gây ra một áp lực lớn cho việc thiết kế hệ thống
đánh giá để chắc chắn rằng:
A. Điểm số được lựa chọn là đáng tin cậy theo yêu cầu.
B. Các sự kiện cấu thành đều được xem xét công bằng như nhau trong các điểm
số.
Hạn chế chung của bản tổng kết đánh giá này là tất cả các sự kiện đó đều được
xem xét công bằng như nhau trong quá trình trung bình hóa. Điều này được thực hiện
cho thuận tiện (việc tính toán sẽ đơn giản hơn khi sử dụng đại lượng trung bình) nhưng
cũng vì thế rất khó có thể tìm ra được trọng số phản ánh các sự kiện thành phần quan
trọng cho mục đích nào đó mà không có bất kỳ trở ngại nào đối với các thuộc tính
mong muốn khác của đánh giá. Vấn đề chưa được giải quyết là làm thế nào để đưa ra
trọng số của các sự kiện thành phần trong đánh giá tổng hợp.
Trước đây, người ta đặt ra yêu cầu quá cao đối với các điểm số đánh giá. Vì thế
các dự báo viên đã biểu hiện sự thất vọng khi cố gắng sử dụng các điểm số này để trả
lời các vấn đề khoa học. Bản chất của việc đánh giá tổng kết đó hạn chế việc sử dụng
chúng trong mục đích khoa học do thiếu sự phân loại đánh giá bằng những điều kiện
cùng quan trọng đối với hàng không.
Dự báo xác suất được xem như dự báo theo pha tổng quát. Trong đó, mỗi pha
được gán bằng một xác suất xảy ra và tổng tất cả xác suất phải bằng một. Dự báo pha
là một dự báo xác suất thu hẹp, ở đây xác suất chỉ có hai trường hợp xảy ra là 0%
,100% và hiển nhiên là một trong hai trường hợp ấy chắc chắn sẽ xảy ra.
1.2.4 Các điểm số dùng trong đánh giá
Các điểm số dùng trong đánh giá được minh họa theo từng cặp ở phía dưới hình
1.1 cho ta thấy được mối quan hệ giữa chúng. Ví dụ, bảng liên hợp và đồ thị điểm là
hoàn toàn tương tự nhau, chúng cung cấp các dạng thông tin như nhau, bảng liên hợp
xuất phát từ yếu tố dự báo pha cùng đồ thị điểm xuất phát từ biến dự báo liên tục. Điểm
tổng kết luôn được phân loại theo cách này: Điểm Brier và điểm RP đều đo chính xác
các đặc tính của khả năng xảy ra hay biến pha, chúng tương tự sai số bình phương
trung bình của dự báo theo biến liên tục. Chú ý rằng dự báo pha không tương tự như
sai số trung bình tuyệt đố1. Có hai loại đại lượng đo được phân loại tương ứng theo dự 20
báo và quan trắc là “Bảng độ tin cậy” và “Nguyên lý phát hiện tín hiệu”. Trong khi đó
bảng liên hợp và đồ thị điểm lại tổng quát hơn, nó cho phép phân loại theo một trong
hai cách hoặc theo cả hai cách. Nguyên lý phát hiện tín hiệu là một ý tưởng mới mẻ và
hiện nay chưa được sử dụng rộng rãi.
Các điểm số liệt kê trên hình 1.1 và được trình bày trong chương 2 gồm 3 loại,
đó là: Các điểm số tuyến tính, các điểm số toàn phương (bậc hai) và điểm số kỹ năng.
Điểm số toàn phương đưa ra trọng lượng của sai số theo bình phương của chúng trong
khi đó điểm số tuyến tính cho sai số có giá trị bậc nhất. Vì vậy điểm số toàn phương
thường đưa ra trọng số sai số lớn hơn là điểm số tuyến tính và điểm số này rất phù hợp
trong các trường hợp sai số lớn thực sự nghiêm trọng hơn sai số nhỏ.
Điểm số kỹ năng được xây dựng để đánh giá mối quan hệ giữa dự báo và một
giá trị chuẩn nào đó. Giá trị chuẩn được chọn lựa để mô tả một dự báo không kỹ năng.
Ba tiêu chuẩn được sử dụng để so sánh là: sự may rủi (ngẫu nhiên), quán tính và khí
số liệu quan trắc và bộ số liệu này phải được thể hiện, sắp xếp đối xứng với nhau cả
theo không gian và thời gian. Theo quy mô không gian, số liệu quan trắc có thể sẽ
được phân tích về lưới của các số liệu dự báo hoặc là số liệu dự báo có thể được nội
suy theo không gian về các trạm quan trắc (điểm quan trắc). Tuy nhiên, cách thứ nhất ít
được làm thường xuyên hơn vì có những chỉ trích cho rằng khi số liệu quan trắc được
nội suy về điểm lưới thì nó đã không còn mang tính khách quan vốn có của nó như
trước khi nội suy nữa. Những chỉ trích này đã trở nên đặc biệt quan trọng đối với việc
đánh giá nếu việc phân tích là một trường sản phẩm thử nghiệm của mô hình và có thể
được kiểm tra lại. Trong trường hợp đó, sẽ có một độ lệch nào đó trong những kết quả
của mô hình. Do đó, điều quan trọng trong đánh giá mô hình là phải luôn luôn ghi nhớ
thủ tục kiểm tra lại số liệu quan trắc khi đánh giá kết quả.
Để đánh giá một sản phẩm mô hình số có hiệu quả, yêu cầu đặt ra là những vấn
đề quyết định cần phải giải quyết phải được làm cho mục đích đánh giá trước khi một
hệ thống đánh giá được thiết lập. “Đánh giá hành chính” trả lời câu hỏi về xu hướng
trong kỹ năng và độ chính xác của mô hình và nó thường được sử dụng để so sánh độ
chính xác của hai mô hình khác nhau. Tương tự như đánh giá các yếu tố thời tiết cho
những mục đích hành chính, có một khuynh hướng nhằm giảm bớt những kết quả có
các giá trị số nhỏ thông qua việc sử dụng các điểm số chung.
“Đánh giá khoa học” bao gồm các câu hỏi trả lời về sự thay đổi theo không gian
và thời gian trong sự biểu diễn của mô hình để cung cấp thông tin có thể phản hồi lại
cho các nhà phát triển mô hình cải tiến thêm mô hình hay cho các dự báo viên để thay
đổi xu hướng dự báo. Một ví dụ đơn giản là việc đánh giá các đặc trưng như khu vực 22
áp suất thấp hay fronts. Bộ số liệu đánh giá phải được sắp xếp cẩn thận theo các đặc
trưng đó, và điều này có thể được thực hiện theo một trong hai hướng đó là theo cơ sở
của các đặc trưng quan trắc hay theo cơ sở của các đặc trưng dự báo.
Độ lệch
Tương quan
dị thường
Đánh giá khách quan 24
Hình 1.2 Sơ đồ chung cho đánh giá mô hình dự báo thời tiết số (NWP)
Phân loại theo không gian có thể được làm vì mục đích quản lý hành chính hoặc
vì mục đích khoa học. Phân loại theo không gian được tiến hành theo mục đích hành
chính để thấy được sự khác biệt trong độ chính xác trên các vùng của mô hình tương
ứng với các vùng quản lý hành chính của đất nước. Khi phân loại theo không gian
được tiến hành theo mục đích khoa học, các khu vực có quy mô dưới lưới được ưu tiên
lựa chọn để phản ánh các chế độ khí hậu khác nhau như các khu vực có địa hình đồi
núi, các vùng núi khuất gió, bờ biển, …
“Phân loại ngoại bộ” ở đây có ý nghĩa là phân chia bộ số liệu đánh giá theo mùa
hoặc theo thời gian chạy mô hình hoặc theo các quy luật chọn lựa khác độc lập với các
tham số đang được đánh giá. Phân loại theo mùa là cách sử dụng phổ biến để phát hiện
sự khác nhau trong biểu hiện giữa các mùa.
1.4 Các đặc trưng đánh giá
Một quan điểm cuối cùng về phép đánh giá là: “Một đánh giá đơn lẻ sẽ không
thể cho ta biết được thông tin đầy đủ về chất lượng của sản phẩm”. Tất cả đều cung cấp
thông tin về một hoặc một số đặc tính (thuộc tính) của sản phẩm dự báo. Do đó một hệ
thống đánh giá sẽ phải bao gồm cả việc tính toán các đại lượng được chọn khác nhau
để mô tả các thuộc tính thích hợp phục vụ cho mục đích đánh giá. Các thuật ngữ liên
quan tới các điểm số đánh giá đều được liệt kê dưới đây.
1.4.1 Độ chính xác
Độ chính xác là thuật ngữ chung chỉ ra mức độ chính xác, phù hợp giữa thời tiết
dự báo và thời tiết thực được thể hiện qua các quan trắc. Sự khác nhau giữa một giá trị
1.4.4 Độ phân giải
Độ phân giải là khả năng mà dự báo có thể phân chia hoặc phân tích một tập
mẫu thành các phần nhỏ với phân bố tần suất khác nhau. Độ phân giải liên quan đến độ
lệch chuẩn hay phương sai của chuỗi số liệu quan trắc được phân nhóm theo dự báo.
Độ phân giải cũng phụ thuộc vào kinh nghiệm và trình độ của chính người làm dự báo.