TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
o0o PHẠM THỊ TUYẾT MÂY
ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ
LƢỢNG MƢA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO
THỜI TIẾT CHO KHU VỰC VIỆT NAM
LUẬN VĂN THẠC SỸ KHOA HỌC
LUẬN VĂN THẠC SỸ KHOA HỌC
NGƢỜI HƢỚNG DẪN KHOA HỌC:
TS. VŨ THANH HẰNG
HÀ NỘI, 2012
1
MỤC LỤC
MỤC LỤC 1
CHƢƠNG 1. TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG KHÍ
TƢỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ 6
1.1. Bài toán đánh giá dự báo trong khí tƣợng 6
1.1.1. Mục đích và ý nghĩa của bài toán đánh giá 6
1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết 7
1.1.3. Sơ lược về tiêu chuẩn đánh giá 10
1.1.4. Các loại yếu tố dự báo 11
1.1.5. Các thuộc tính của một dự báo tốt 12
1.2. Một số phƣơng pháp và chỉ số đánh giá phổ biến 14
1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số 14
1.2.2. Phương pháp đánh giá đối với biến liên tục 17
1.2.3. Phương pháp đánh giá đối với dự báo pha 21 2
DANH MỤC HÌNH VẼ
Hình 1.1. Sơ đồ chung cho đánh giá các yếu tố thời tiết 8
Hình 1.2. Sơ (NWP) 16
Hình 1.3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trƣờng hợp dự báo 00 giờ,
bên phải là trƣờng hợp dự báo 36 giờ (số liệu lấy từ trạm phao) 17
Hình 1.4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lƣợng dự báo mƣa 21
Hình 1.5. a. Miền quan trắc; b. Đánh giá truyền thống (phải tƣơng thích cả về không
gian và thời gian giữa dự báo và quan trắc); c. Đánh giá bằng phƣơng pháp fuzzy
(vùng dự báo tính đến cả miền lân cận quanh điểm quan trắc). 24
Hình 1.6. Cửa sổ quan trắc và dự báo của phƣơng pháp đánh giá fuzzy 25
Hình 2.1. Sơ đồ lồng ghép hai miền tính cho MM5 39
Hình 2.2. Các trạm quan trắc trong miền tính 43
Hình 3.1. Nhiệt độ trung bình trong các tháng mùa hè tại các trạm. a) HRM1; b) OBS
(128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 46
Hình 3.2. Nhiệt độ trung bình trong các tháng mùa đông tại các trạm. a) HRM1; b)
OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 47
Hình 3.3. Sai số ME của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông
(a) và mùa hè (b) 48
Hình 3.4. Sai số MAE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông
(a) và mùa hè (b) 49
Hình 3.5. Sai số RMSE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa
đông (a) và mùa hè (b) 50
Hình 3.6. Hệ số tƣơng quan nhiệt độ của các mô hình cho toàn Việt Nam (a) và các
khu vực (b, c, d) 51
Hình 3.25. Vùng mƣa thám sát (trái) và vùng mƣa dự báo 24h (phải) (mm/ngày) ngày
23/12/2007 (không khí lạnh) 75
Hình 3.26. Kết quả đánh giá bằng phƣơng pháp fuzzy cho hạn dự báo mƣa tích lũy 24
giờ ngày 23/12/2007 76 4
MỞ ĐẦU
Nhƣ chúng ta đã biết, khí hậu nói chung và thời tiết nói riêng ảnh hƣởng
5
khuôn khổ của luận văn tác giả tập trung vào việc đánh giá chất lƣợng dự báo
24h của nhiệt độ, lƣợng mƣa của hai mô hình dự báo thời tiết số đƣợc sử dụng
phổ biến hiện nay ở Việt Nam là mô hình HRM và mô hình MM5. Ngoài phần
Mở đầu, Kết luận và Tài liệu tham khảo, luận văn đƣợc bố cục cụ thể nhƣ sau:
Chƣơng 1. Tổng quan về bài toán đánh giá dự báo trong khí tƣợng và các
chỉ số đánh giá.
Chƣơng 2. Khái quát về các mô hình dự báo thời tiết số HRM, MM5 và
nguồn số liệu sử dụng.
Chƣơng 3. Kết quả đánh giá nhiệt độ và lƣợng mƣa của mô hình MM5 và
HRM cho khu vực Việt Nam.
cách chính xác những gì diễn ra trong thực tế. Hơn nữa, một vài phƣơng pháp
đánh giá còn đòi hỏi quan trắc tại một điểm cũng có thể đại diện một cách đầy
đủ và khách quan các hiện tƣợng thời tiết xảy ra trong một khu vực.
Chính tính cấp thiết trong các hoạt động đánh giá chất lƣợng dự báo thời
tiết cho thấy mục đích đánh giá phải đƣợc thiết lập trƣớc khi hệ thống đánh giá
7
đƣợc xác lập. Từ đây các hoạt động đánh giá trong khí tƣợng cũng nhƣ trong các
hoạt động dự báo thời tiết có thể đƣợc phân chia thành hai mục đích chính là
đánh giá hành chính và đánh giá khoa học.
Mục đích hành chính: Các thông tin đánh giá trong mục đích quản lý hành
chính nhằm cung cấp thông tin cho việc mua sắm các trang thiết bị chính nhƣ
các máy tính có cấu hình cao hơn, tốc độ xử lý nhanh hơn,… Xác định khi nào,
hoặc có nên thay thế một sản phẩm đang đƣợc sử dụng bằng một sản phẩm dự
báo mới hay không, và còn nhiều các quyết định khác để phát triển tối ƣu nguồn
lực về con ngƣời cũng nhƣ các nguồn trang thiết bị khác phục vụ cho công tác
phát hành một bản tin dự báo thời tiết.
Mục đích khoa học: Đánh giá với mục đích khoa học là xác định một cách
đầy đủ và chi tiết ƣu điểm cũng nhƣ nhƣợc điểm của một sản phẩm dự báo. Các
hoạt động này giúp tìm ra các biện pháp thích hợp để cải thiện chất lƣợng dự
báo phục vụ cũng nhƣ cung cấp các thông tin để hoạch định phƣơng hƣớng cho
việc nghiên cứu và phát triển tiếp theo.
Ngoài ra một số tác giả khác còn xét đến mục đích kinh tế nhƣng đó là
vấn đề rất phức tạp nên trong giới hạn luận văn này không đƣợc đề cập đến.
1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết
Hình 1.1 là một kiểu mô hình chung nhất để đánh giá dự báo các yếu tố
thời tiết, ngoài ra có thể có các mô hình đánh giá khác nữa. Tuy nhiên đây là mô
hình cho thấy bức tranh chi tiết nhất về quan hệ giữa đặc trƣng của phép đánh
giá các đại lƣợng đo và các giải pháp khác nhau để có thể lựa chọn. Sơ đồ này
sử dụng cho việc quyết định các bƣớc cần thiết phải đƣợc làm trƣớc khi lựa chọn
Hình 1.1. Sơ đồ chung cho đánh giá các yếu tố thời tiết
Mục đích
khoa học
Các tập số liệu
dùng để đánh giá
Quản lý
hành
chính
Phân loại
ngoại bộ
Phân loại
ngoại bộ
Phân loại
nội bộ theo
dự báo
Hệ số phân tán
Điểm Berier RPS
Điểm kỹ năng
Brier
Bảng độ tin cậy
9
Xuất phát từ các câu hỏi đặt ra đối với đánh giá khoa học thấy rằng, cần
có một nhu cầu phân loại cao hơn đối với tập mẫu. Chẳng hạn nhƣ, nếu ta quan
tâm đến dự báo cực trị thì tập mẫu sẽ phải đƣợc phân nhóm để tách các giá trị
cực trị đó ra từ chuỗi các sự kiện chung. Kiểu phân nhóm này đƣợc gọi là “phân
loại nội bộ” bởi vì nguyên tắc phân loại đƣợc quyết định bởi mục đích đánh giá
và sử dụng chính yếu tố đang đƣợc đánh giá. Có hai cách để thực hiện phân loại
nội bộ, trên Hình 1.1 cho thấy sự khác nhau trong kết quả đánh giá thu đƣợc từ
hai cách phân loại đó.
Phân loại theo quan trắc nghĩa là phân loại theo giá trị của các yếu tố khí
tƣợng quan trắc đƣợc. Sau đó, các tiêu chuẩn đánh giá có thể đƣợc tính toán cho
từng nhóm giá trị quan trắc và giá trị thống kê đƣợc tạo thành này gọi là giá trị
có điều kiện đối với quan trắc. Một ví dụ cho phân bố có điều kiện của dự báo là
một giá trị đặc biệt hay một phạm vi các giá trị quan trắc.
Phân loại theo dự báo nghĩa là phân loại theo giá trị của các yếu tố khí
tƣợng đƣợc dự báo. Cũng tƣơng tự nhƣ trên, các giá trị thống kê đƣợc tính toán
theo cách phân loại này đƣợc gọi là điều kiện dự báo. Việc lựa chọn kiểu phân
loại phụ thuộc vào mục đích đánh giá. Trong nhiều trƣờng hợp cần phải sử dụng
kết hợp cả hai cách phân loại trên để đƣa ra một kết quả hoàn chỉnh. Hơn nữa,
nhƣ đã thấy ở sơ đồ trên, những đại lƣợng đánh giá khác nhau (hình ô van bên
dưới) đặc trƣng cho một kiểu phân nhóm khác và đƣa ra nhiều thông tin khác
nhau về sản phẩm.
Một cách khác, trong đánh giá hành chính, ngƣời ta ít quan tâm chi tiết
đến việc biểu diễn những biến theo các giá trị khác nhau trong dự báo. Mà thay
vào đó, các câu hỏi đặt ra đều mang tính chung chung và chỉ cần một câu trả lời
ngắn gọn xúc tích nào đó. Vì vậy, phân loại nội bộ có thể vẫn đƣợc thực hiện
nhƣng nó hiếm khi đƣợc dùng đến. Tuy nhiên, ƣu điểm lớn của đánh giá hành
chính là biểu diễn chất lƣợng sản phẩm chỉ bằng vài con số hoặc việc so sánh
thuận tiện hay hƣớng xác minh dễ dàng. Bản chất chung của đánh giá hành
dƣới Hình 1.1 cho thấy mối quan hệ giữa chúng. Ví dụ, bảng liên hợp và đồ thị
điểm là hoàn toàn tƣơng tự nhau, chúng cung cấp các dạng thông tin nhƣ nhau,
bảng liên hợp xuất phát từ yếu tố dự báo pha cùng đồ thị điểm xuất phát từ biến
dự báo liên tục. Điểm tổng kết luôn đƣợc phân loại theo cách này: Điểm Brier
và điểm RP đều đo chính xác các đặc tính của khả năng xảy ra hay biến pha,
chúng tƣơng tự sai số bình phƣơng trung bình của dự báo theo biến liên tục. Chú
ý rằng dự báo pha không tƣơng tự nhƣ sai số trung bình tuyệt đối. Có hai loại
đại lƣợng đo đƣợc phân loại tƣơng ứng theo dự báo và quan trắc là “Bảng độ tin
cậy” và “Nguyên lý phát hiện tín hiệu”. Trong khi đó bảng liên hợp và đồ thị
điểm lại tổng quát hơn, cho phép phân loại theo một trong hai cách hoặc theo cả
hai cách. Nguyên lý phát hiện tín hiệu là một ý tƣởng mới mẻ và hiện nay chƣa
đƣợc sử dụng rộng rãi.
11
Các điểm số liệt kê trên Hình 1.1 gồm 3 loại, đó là: điểm số tuyến tính,
điểm số toàn phƣơng (bậc hai) và điểm số kỹ năng.
Điểm số toàn phƣơng đƣa ra trọng lƣợng của sai số theo bình phƣơng của
chúng trong khi điểm số tuyến tính cho sai số có giá trị bậc nhất. Vì vậy điểm số
toàn phƣơng thƣờng đƣa ra trọng số sai số lớn hơn là điểm số tuyến tính và điểm
số này rất phù hợp trong các trƣờng hợp sai số lớn thực sự nghiêm trọng hơn sai
số nhỏ.
Điểm số kỹ năng đƣợc xây dựng để đánh giá mối quan hệ giữa dự báo và
một giá trị chuẩn nào đó. Giá trị chuẩn đƣợc chọn lựa để mô tả một dự báo
không kỹ năng.
Ba tiêu chuẩn đƣợc sử dụng để so sánh là: chuẫn ngẫu nhiên, chuẩn quán
tính và chuẩn khí hậu. Tính ngẫu nhiên mô tả sự phỏng đoán thuần túy và không
yêu cầu hiểu biết tri thức, chuẩn quán tính là một dự báo xác định và yêu cầu các
hiểu biết về điều kiện thời tiết, còn chuẩn khí hậu là một dự báo trạng thái thời
tiết diễn ra trong khoảng thời gian dài và cần phải có sự hiểu biết về tiến trình
lịch sử của thời tiết. Điểm số kỹ năng đƣợc biểu diễn trong công thức sau:
báo mà cho kết quả biến thiên liên tục thì phải đƣợc đánh giá theo pha bởi vì tất
cả những thông tin đó rất cần thiết cho ngƣời sử dụng.
* Dự báo xác suất đƣợc xem nhƣ là dự báo pha nhƣng tổng quát hơn.
Trong đó, mỗi pha đƣợc gán bằng một xác suất xảy ra và tổng tất cả xác suất
phải bằng 1 (tức là một cái gì đó phải xảy ra). Dự báo pha là một dự báo xác
suất thu hẹp, ở đây xác suất chỉ có hai trƣờng hợp xảy ra hoặc là 0% hoặc là
100% và hiển nhiên là một trong hai trƣờng hợp ấy chắc chắn sẽ xảy ra.
1.1.5. Các thuộc tính của một dự báo tốt
Do tính chất phức tạp của bài toán đánh giá, việc lựa chọn, sử dụng những
chỉ số nào để phản ánh đƣợc tất cả các khía cạnh là vấn đề khó khăn. Chẳng hạn,
khi nói về đánh giá chất lƣợng dự báo (có thể là của một mô hình) Murphy
(1993) đã đƣa ra 3 khái niệm để chỉ mức độ “tốt” của một dự báo là:
1) Độ chắc chắn (Consistency) của dự báo là mức độ phù hợp giữa dự báo
và kiến thức hiểu biết của dự báo viên;
2) Chất lƣợng dự báo (Quality) là mức độ phù hợp giữa dự báo với thực tế
xảy ra;
3) Ý nghĩa (hay giá trị - Value) của dự báo là mức độ mà dự báo có thể
giúp cho ngƣời ra quyết định thấy rõ hoặc đạt đƣợc lợi ích nào đó về kinh tế
hoặc lợi ích khác.
Cũng theo Murphy (1993), đã đƣa ra 9 khái niệm đƣợc gọi là 9 thuộc tính
đóng góp cho độ chắc chắn của dự báo nhƣ sau:
- Độ lệch (Bias): Là mức độ phù hợp giữa trung bình quan trắc và trung
13
bình dự báo.
- Tính liên kết (Association): Là mức độ chặt chẽ về quan hệ tuyến tính
giữa dự báo và quan trắc(chẳng hạn, hệ số tƣơng quan là thƣớc đo mối quan hệ
tuyến tính này).
- Độ chính xác (Accuracy):
dự báo và thực tế ( )
các quan trắc thành những trƣờng hợp có tần suất dự báo cao hơn, tức là có khả
năng phân lớp.
- Độ biến động (hay tính không chắc chắn - Uncertainty): Là sự dao động
của các giá trị quan trắc trong tập mẫu đánh giá và không phụ thuộc vào giá trị
dự báo. Đối với các biến đƣợc dự báo theo pha thì độ biến động là 1 nếu sự kiện
xảy ra và 0 nếu sự kiện không xảy ra. Đại lƣợng này liên quan đến độ “khó
khăn” của dự báo. Độ biến động càng lớn có nghĩa là sẽ có những dao động lớn
với nhiều tần số khác nhau trong yếu tố dự báo đang đƣợc đánh giá và dĩ nhiên
việc dự báo sẽ khó khăn hơn. Độ biến động của từng tập số liệu sẽ rất khác nhau
và do đó, việc so sánh giữa các con số đánh giá thống kê của tập số liệu là hết
sức mạo hiểm vì chúng thƣờng rất nhạy với độ biến động.
Theo truyền thống thì đánh giá dự báo tập trung nhấn mạnh vào độ chính
xác và kỹ năng dự báo. Nhƣng cũng cần lƣu ý rằng các thuộc tính khác của dự
báo cũng ảnh hƣởng mạnh đến giá trị dự báo.
1.2. Một số phƣơng pháp và chỉ số đánh giá phổ biến
1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số
a. Những nguyên nhân gây sai số trong mô hình dự báo số
Để ứng dụng đƣợc một mô hình khu vực hạn chế vào trong nghiệp vụ dự
báo thời tiết đòi hỏi trƣớc hết là phải đánh giá đƣợc sai số dự báo của mô hình so
với thực tế. Các nguyên nhân có thể đƣa đến dự báo sai của mô hình số có thể
tóm tắt nhƣ sau:
- Các công thức toán học để mô tả các quá trình vật lý xảy ra trong khí
quyển là chƣa hoàn chỉnh;
- Ảnh hƣởng của địa hình đến kết quả dự báo (thƣờng không đƣợc mô
hình số mô tả hoàn chỉnh);
- Các quá trình vật lý và các sơ đồ tham số hóa chƣa thật sự hoàn thiện;
- Một số giả thiết không thực sự phù hợp đƣợc đƣa ra để có thể giải đƣợc
hệ phƣơng trình thủy nhiệt động lực học mô tả khí quyển thực.
- Điều kiện biên và điều kiện ban đầu của các biến khí tƣợng là chƣa hoàn
hiện theo một trong hai hƣớng đó là theo cơ sở của các đặc trƣng quan trắc hay
theo cơ sở của các đặc trƣng dự báo.
16
“Phân loại ngoại bộ” ở đây có ý nghĩa là phân chia bộ số liệu đánh giá
theo mùa hoặc theo thời gian chạy mô hình
.
. Khi phân loại theo
không gian đƣợc tiến hành theo mục đích khoa học, các khu vực có quy mô dƣới
lƣới đƣợc ƣu tiên lựa chọn để phản ánh các chế độ khí hậu khác nhau nhƣ các
khu vực có địa hình đồi núi, các vùng núi khuất gió, bờ biển,…
1.2.2. Phương pháp đánh giá đối với biến liên tục
1.2.2.1. Phương pháp toán đồ tụ điểm
Hình 1.3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trường hợp dự báo 00 giờ,
bên phải là trường hợp dự báo 36 giờ (số liệu lấy từ trạm phao)
Toán đồ tụ điểm là phƣơng pháp đơn giản nhất, chủ yếu phục vụ cho các
biến liên tục nhƣ nhiệt độ và gió, thƣờng gồm tất cả các điểm số ứng với mỗi
cặp dự báo – quan trắc tƣơng ứng trên cùng một đồ thị với tung độ và hoành độ
có tỷ lệ nhƣ nhau. Trƣờng hợp lý tƣởng là các điểm số nằm trên một đƣờng
thẳng đi qua gốc tọa độ và tạo với trục hoành một góc 45
0
(giá trị dự báo bằng
giá trị quan trắc). Đƣờng 45
0
này thƣờng đƣợc vẽ ra để thuận tiện cho việc nội
suy các điểm rời rạc.
Hình 1.3 là một ví dụ về toán đồ tụ điểm cho dự báo gió biển. Mỗi điểm
“x” đại diện cho ít nhất một lần xuất hiện của cặp dự báo – quan trắc riêng lẻ.
Trên mỗi đồ thị còn có một đƣờng thẳng thứ hai mà có thể không đi qua gốc tọa
độ, đó chính là đƣờng hồi quy bình phƣơng tối thiểu tƣơng ứng với tập số liệu
Hệ số tƣơng quan = 0.789
Tốc độ gió mô hình PPR (kts)
Tốc độ gió mô hình PPR (kts)
Hệ số tƣơng quan = 0.595
18
bỏ sót (dự báo dƣới ngƣỡng) trong khi đó nhiệt độ thấp xảy ra ở cả hai miền các
sự kiện dự báo sót và miền báo động sai.
Phân loại trên cơ sở quan trắc chỉ cho phép nhận dạng miền các sự kiện
dự báo sót (đƣờng ngang vẽ đậm ở các giá trị ngƣỡng). Phân loại trên cơ sở dự
báo chỉ cho phép nhận dạng đƣợc miền báo động sai (đƣờng đứng vẽ đậm ở các
giá trị ngƣỡng). Từ đây có thể thấy rằng điều quan trọng nhất là phải sử dụng cả
hai kiểu phân loại để nhận đƣợc thông tin đầy đủ và hoàn hảo về một sản phẩm
đang đƣợc đánh giá. Ví dụ những giá trị thấp nhất đã bị bỏ sót có thể lấy lại
đƣợc đơn giản bằng cách tƣởng tƣợng di chuyển tất cả các điểm trên đồ thị đến
bên trái giá trị ngƣỡng 10
0
C, nhƣng cái giá phải trả cho việc hiệu chỉnh này là sự
tăng lên đột ngột trong miền báo động sai. Điều này sẽ không nhìn thấy nếu
19
phân loại trên cơ sở của một mình quan trắc. Do vậy luôn luôn có thể hiệu đính
cho sự kiện cực trị đã bị bỏ sót.
Phân loại trên cơ sở dự báo có lẽ có ích hơn cho hiểu biết về ý nghĩa thực
của dự báo. Thông tin chi tiết về ý nghĩa của dự báo cho các nhiệt độ khác nhau
có thể nhận đƣợc từ một chuỗi phân bố có điều kiện cho mỗi nhiệt độ dự báo
hoặc cho phạm vi của nhiệt độ.
1.2.2.2 Các chỉ số đánh giá
Trong các công thức dƣới đây, F
i
và O
i
tƣơng ứng là giá trị mô hình và giá
trị quan trắc của một biến nào đó (nhiệt độ, lƣợng mƣa), i=1,2,…, N, N là dung
lƣợng mẫu.
a. Sai số trung bình (ME - Mean Error)
cùng với ME để đánh giá độ tin cậy. Chẳng hạn, nếu MAE của sản phẩm khác
biệt hẳn so với ME thì việc hiệu chỉnh là hết sức mạo hiểm. Trong trƣờng hợp
ngƣợc lại, khi mà MAE và ME tƣơng đối “sát” với nhau thì có thể dùng ME để
hiệu chỉnh sản phẩm dự báo một cách đáng tin cậy.
c. Sai số bình phƣơng trung bình MSE (Mean Square Error)
20
N
1i
2
ii
)OF(
N
1
MSE
(1. 3)
MSE là trung bình của tổng bình phƣơng của hiệu giữa các giá trị mô hình và
quan trắc, phản ánh mức độ dao động của sai số. Mô hình là “lí tƣởng” nếu
MSE=0.
d. Sai số bình phƣơng trung bình quân phƣơng (RMSE - Root mean square
Error)
N
1i
2
ii
)OF(
N
1
RMSE
))((
(1. 5)
Hệ số tƣơng quan (r) cho phép đánh giá mối quan hệ tuyến tính giữa tập
giá trị dự báo và tập giá trị quan trắc. Giá trị của nó biến thiên trong khoảng -1
đến 1, giá trị hoàn hảo bằng 1. Giá trị tuyệt đối của hệ số tƣơng quan càng lớn
thì mối quan hệ tuyến tính giữa hai biến càng chặt chẽ. Hệ số tƣơng quan dƣơng
phản ánh mối quan hệ cùng chiều (đồng biến), ngƣợc lại, hệ số tƣơng quan âm
biểu thị mối quan hệ ngƣợc chiều (nghịch biến) giữa dự báo và quan trắc. 21
1.2.3. Phương pháp đánh giá đối với dự báo pha
Đánh giá thống kê theo loại (categorical statistics) là loại tiêu chuẩn đánh
giá sự phù hợp giữa sự xảy ra hiện tƣợng dự báo và hiện tƣợng quan trắc tại nút
lƣới.
Các điểm số đánh giá đƣợc dựa vào bảng ngẫu nhiên sau (Damrath, 2002):
Hình 1.4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lượng dự báo mưa
Hits (H) = dự báo có + quan trắc có
Misses (M) = dự báo không + quan trắc có
False alarms (F) = dự báo có + quan trắc không
Correct negatives (CN) = dự báo không + quan trắc không
Dƣới đây là một vài điểm số thƣờng dùng trong đánh giá dự báo mƣa định
lƣợng ở trên thế giới:
a. Chỉ số FBI (BS hay FBI - Bias score): Đánh giá tỷ số giữa vùng dự báo và
vùng thám sát.
FBI < 1: vùng dự báo nhỏ hơn vùng thám sát
FBI > 1: vùng dự báo lớn hơn vùng thám sát
FBI = 1: vùng dự báo trùng với vùng thám sát (giá trị lý tƣởng)
c. Tỷ phần phát hiện sai (False Alarms Ratio - FAR)
FH
F
FAR
(1. 8)
FAR cho biết tỷ lệ mô phỏng/dự báo khống của mô hình (mô hình cho kết
quả có nhƣng thực tế hiện tƣợng không xảy ra). Giá trị của FAR biến đổi từ 0
cho đến 1. FAR=0 khi F=0, tức tỷ lệ khống của mô hình bằng 0. Giá trị của FAR
càng gần 0 thì mô hình càng tốt (tối ƣu). Ngƣợc lại, FAR càng tiệm cận tới 1
(tƣơng đƣơng với H tiến gần tới không) thì mô hình càng kém.
d. Điểm số thành công (Critical Success Index – CSI hay Threat Score – TS)
HFM
H
TSCSI
(1. 9)
TS phản ánh mối quan hệ giữa số lần mô hình cho kết quả hiện tƣợng có
xuất hiện và số lần quan trắc đƣợc hiện tƣợng có xuất hiện. Nó có thể đƣợc xem
nhƣ thƣớc đo độ chính xác của mô hình khi bỏ qua không xem xét những trƣờng
hợp hiện tƣợng không xuất hiện. Phạm vi biến thiên của TS từ 0 đến 1. TS=0
nghĩa là mô hình không có kỹ năng, TS=1 – mô hình là hoàn hảo. 23
e. Điểm số thành công hợp lý (Equitable Threat Score – ETS)
ETS có giá trị tốt nhất là 1.
random
random
HHFM
H
TSSHK
(1. 13)
TSS phản ánh mức độ tách biệt giữa những kết quả của mô hình đối với các sự
kiện có xảy ra và không xảy ra hiện tƣợng. Giá trị của TSS nằm trong khoảng -1
đến 1. TSS=0 là mô hình không có kỹ năng, TSS=1 thì mô hình là hoàn hảo.
h. Độ chính xác (Percentage Correct – PC hay Fraction Correct - FC)
total
CNH
PC
(1. 14)
FC phản ánh tỷ lệ trùng khớp giữa kết quả của mô hình và quan trắc trong
cả hai pha có và không xuất hiện hiện tƣợng. Giá trị của PC biến đổi trong
khoảng từ 0 đến 1. Nếu mô hình là hoàn hảo, tức kết quả mô hình trùng khớp
hoàn toàn với quan trắc thì PC bằng 1, ngƣợc lại, PC sẽ bằng 0 nếu tất cả mọi
trƣờng hợp kết quả của mô hình đều ngƣợc với quan trắc. PC càng lớn độ chính
xác mô phỏng, dự báo của mô hình càng cao.