Báo cáo nghiên cứu khoa học " Thử nghiệm dự báo lượng mưa ngày bằng phương pháp dùng mạng thần kinh nhân tạo hiệu chỉnh sản phẩm mô hình số " - Pdf 14

Tạp chí Khoa học đhqghn, KHTN & CN, T.xxII, Số 1PT., 2006

Thử nghiệm dự báo lợng ma ngày bằng phơng pháp
dùng mạng thần kinh nhân tạo hiệu chỉnh sản phẩm
mô hình số
Hồ Thị Minh Hà, Nguyễn Hớng Điền
Khoa Khí tợng-Thuỷ văn và Hải dơng học
Trờng Đại học Khoa học Tự nhiên, ĐHQG Hà Nội 1. Mở đầu
Trên thế giới có rất nhiều nhà khí tợng đã quan tâm tới mạng thần kinh nhân
tạo (MTKNT) vì nó có khả năng học và xử lý tính phi tuyến của các quá trình biến đổi
phức tạp mà các phơng pháp dự báo khác không thực hiện đợc. MTKNT đã đợc ứng
dụng trong rất nhiều lĩnh vực khoa học nh điều khiển tự động, nhận dạng dấu vân
tay, và cũng đợc các nhà khí tợng sử dụng trong dự báo thời tiết, khí hậu. Có thể
kể ra một số công trình nghiên cứu đã sử dụng MTKNT nh dự báo giáng thuỷ hạn dài
ở California, mô hình hoá ôzôn, dự báo ma đá nguy hiểm, dự báo giáng thủy hạn
ngắn, Tuy nhiên, trong nớc mới chỉ có rất ít các nghiên cứu về lĩnh vực này và cha
có công trình nào đợc áp dụng vào thực tiễn. ở đây chúng tôi sử dụng MTKNT để thử
nghiệm hiệu chỉnh sản phẩm của mô hình số, cụ thể là lợng ma của mô hình phân
giải cao HRM, theo số liệu quan trắc trong 3 tháng mùa ma (6, 7, 8) năm 2004 nhằm
nâng cao chất lợng của sản phẩm dự báo số. Trớc hết ta sẽ xem xét cấu trúc và hoạt
động của một mạng thần kinh đơn giản cũng nh phơng pháp học giảm gradient của
MTKNT, sau đó sẽ tiến hành hiệu chỉnh sản phẩm của mô hình số và đánh giá kết quả.

2. Khái niệm về MTKNT và phơng pháp học giảm gradient
2.1. Cấu trúc và hoạt động của MTKNT

Tổng có
trọn

i
ua xa
=
=+
ij

(1)
- Lớp ẩn bao gồm hàm truyền, có thể là hàm sigma, hàm tang-hypebol,Ngời ta
thờng sử dụng hàm sigma có dạng:

()
()
1
1exp
x
x
=
(2)
+

Thay giá trị của
u
vào hàm truyền sẽ đợc đầu ra của lớp ẩn, ký hiệu là y
j
j
(j=1, , H).
- Các giá trị đầu ra của lớp ẩn là đầu vào của kết xuất, thực hiện tơng tự nh đối
với lớp ẩn đợc giá trị kết xuất, ký hiệu là z
k
(k = 1, , K).

jk
b
ij
a

Hình 2. Quá trình lan truyền tiến
- Một quá trình đi từ đầu vào, qua lớp ẩn và đến kết xuất là một quá trình lan
truyền tiến (feed-forward) của mạng (Hình 2). Quá trình này cũng tơng tự nh quá
trình nhận, xử lý thông tin và truyền thông tin đến não bộ của một tế bào thần kinh
sinh học.

2.2. Phơng pháp học giảm gradient (giảm dốc nhất)
Bản chất của phơng pháp này là cực tiểu hoá hàm lỗi (sai số trung bình bình
phơng) giữa kết xuất z
k
và kết xuất đích t
k
. Hàm lỗi E là hàm của trọng số:

() ()

=
=
m
k
kk
ztE
1
2
2

Thử nghiệm dự báo lợng ma ngày bằng phơng pháp
3
Mục tiêu của mạng là tìm đợc điểm trũng nhất trên mặt lỗi, nơi đó z
k
và t
k
gần
nhau nhất. Ban đầu, khi chọn một cặp trọng số bất kỳ ta đợc một điểm trên mặt lỗi và
mạng phải đi theo một đờng nào đó để tìm đợc điểm trũng nhất. Hớng đi của mạng
qua từng bớc là hớng làm giảm sai số của bớc trớc nó.
Biểu diễn toán học của quá trình cực tiểu hoá sai số đợc trình bày dới dây.
Thiết kế một MTKNT gồm đầu vào bao gồm n mẫu, mỗi mẫu gồm các giá trị input x
i
(i=1 N), lớp ẩn gồm các nút y
j
(j=1 H) và kết xuất là các giá trị đích t
k
(k=1 K). Ký hiệu
lại hàm truyền sigma là g(x):

()
()
x
xg
+
=
exp1
1
(4)

1
y
2

y
H

b
0
b
11

b
21

b
1K
b
H1
b
2k

u
1

u
2

t
K

g(u
j
) g(v
k
)
Đầu vào

Lớp ẩn đầu ra đích

Hình 4: Các thành phần chủ yếu của một mẫu của MTKNT.
Đối với mỗi mẫu, trớc hết ta tính tổng trọng số các giá trị đầu vào:

(5)

=
+=
N
i
iijj
xaau
1
0
.
Hàm truyền sigma đợc áp dụng cho lớp ẩn:

(
k
kk
v
vgz
+
==
exp1
1
)(
(8)
Bớc (8) đợc thực hiện nếu nh giá trị đích là biến nhị phân. Nếu là các giá trị
thực thì z
k
đợc gán trực tiếp bằng v
k
tơng ứng.
Sai số tổng cộng của mỗi mẫu là:
Hồ Thị Minh Hà, Nguyễn Hớng Điền
4

=
=
K
k
kk
tzE
1

, (10)
trong đó
kk
k
tz
z
E
=

(11)

)1.(
kk
k
k
zz
v
z
=

(12)
và
j
jk
k
y

b
E
.=

(16)
Tiếp theo là đạo hàm theo trọng số của lớp ẩn:

ij
i
i
j
K
k
jk
k
k
k
kij
i
i
j
jij
a
u
u
y
b
v

=

=

=

1
(17)
Sử dụng phơng trình (16) ta đợc:

ij
i
i
j
K
k
jkk
ij
a
u
u
y
bp

(19)
và
i
ij
i
x
a
u
=

(20)
Vậy
ijj
K
k
jkk
ij
xyybp
a
E
).1.(.
1

=
1
(22)
với
/
E là đạo hàm riêng tổng cộng của E theo trọng số của mẫu thứ i, n là số lợng
mẫu. Hớng giảm dốc nhất là hớng ngợc lại của hớng d. Nh vậy, mỗi trọng số sau
một bớc sẽ đợc cập nhật mới:

+
=
+ kk 1
(23)
với:
d.

=

- Hai tập số liệu này đợc xử lý loại bỏ những ngày không đủ số liệu quan trắc
hoặc dự báo. Sau khi luyện mạng xong sẽ phục hồi các vị trí thiếu giá trị bằng 9999 và
đánh giá chất lợng dự báo theo các chỉ số, chủ yếu là lợng ma trung bình ngày, sai
số trung bình toàn phơng (RMSE), sai số hệ thống (BIAS) và độ lệch tuyệt đối trung
Hồ Thị Minh Hà, Nguyễn Hớng Điền
6
bình (MAE) cho từng trạm, từng vùng (Bắc Bộ, Trung Bộ, Nam Bộ) và toàn bộ Việt
Nam.
3.2. Chạy mô hình
Phần xử lý số liệu đầu vào, số liệu đầu ra đợc thực hiện bằng lập trình Fortran
trên hệ điều hành Linux. Phần luyện mạng, kiểm nghiệm và hiển thị đợc thực hiện
nhờ phần mềm Matlab.
a/ Phần luyện mạng: Số liệu đầu vào (input) của mạng là chuỗi giá trị lợng ma
ngày dự báo đã đợc nội suy về 314 trạm trên Việt Nam. Đích cần học là các giá trị
ma quan trắc trên các trạm tơng ứng. Mạng đợc thiết kế bao gồm 2 lớp ẩn và 1 lớp
xuất. Lớp ẩn thứ nhất có 3 nút ẩn, lớp thứ 2 có 5 nút ẩn, số thế hệ học là 300 thế hệ. Số
thế hệ này đợc chọn sau một vài lần luyện mạng. Các bộ trọng số tại 2 lớp ẩn và 1 lớp
xuất đợc lu lại để kiểm nghiệm.
b/ Phần tái tạo, kiểm nghiệm và đánh giá:
- Tái tạo: Nhân bộ trọng số với chính số liệu input đợc đa vào mạng học, kết
quả so sánh với đích học xem mức độ trùng khớp đợc bao nhiêu.
- Kiểm nghiệm: Nhân bộ trọng số ở trên với chuỗi dự báo của tập số liệu kiểm
nghiệm, kết quả so sánh với chuỗi quan trắc của tập số liệu kiểm nghiệm.
- Đánh giá: Hiển thị giá trị ma trung bình theo thời gian cho 314 trạm đối với
cặp số liệu input-tái tạo và input-kiểm nghiệm. Tính các chỉ số RMSE, BIAS, MAE đối
với quá trình luyện và quá trình kiểm nghiệm.
N
2
ii
i1

là dự báo thứ i, obs
i
là quan trắc thứ i tơng ứng.
4. Kết quả thử nghiệm
Sau đây là một số kết quả dự báo lợng ma ngày bằng phơng pháp dùng
MTKNT hiệu chỉnh sản phẩm của mô hình HRM. Số liệu luyện và dự báo bao gồm cả
314 trạm trên Việt Nam sau đó tách ra làm 3 chuỗi gồm 159 trạm trên Bắc Bộ (19.5-24
độ Bắc, 100-110 độ Đông), 95 trạm trên Trung Bộ (12-19.5 độ Bắc, 100-110 độ Đông) và
57 trạm trên Nam Bộ (7-12 độ Bắc, 100-110 độ Đông), loại ra 3 trạm nằm ngoài đảo và
trên nớc Lào.
Trên mỗi hình vẽ biểu diễn lợng ma ngày trung bình theo thời gian của các
trạm trên từng khu vực, đờng chấm chấm là số liệu dự báo 24h của HRM, đờng liền
Thử nghiệm dự báo lợng ma ngày bằng phơng pháp
7
nét có dấu hoa thị là số liệu đợc hiệu chỉnh bởi MTKNT và đờng liền nét là số liệu
quan trắc tơng ứng. Hình 5. Lợng ma ngày (mm/ngày) trung bình tháng 6 và tháng 7 của Bắc bộ, tập số liệu input và tái tạo

Hình 6. Lợng ma ngày (mm/ngày) trung bình tháng 8 của Bắc bộ, tập số liệu input và kiểm nghiệm

Hình 7. Lợng ma ngày (mm/ngày) trung bình tháng 6 và tháng 7 của Trung bộ, tập số liệu input và tái tạo
Hå ThÞ Minh Hµ, NguyÔn H−íng §iÒn
8
H×nh 8. L−îng m−a ngµy (mm/ngµy) trung b×nh th¸ng 8 cña Trung bé, tËp sè liÖu input vµ kiÓm nghiÖm

H×nh 9. L−îng m−a ngµy (mm/ngµy) trung b×nh th¸ng 6 vµ th¸ng 7 cña Nam bé, tËp sè liÖu input vµ t¸i t¹o

H×nh 10: L−îng m−a ngµy (mm/ngµy) trung b×nh th¸ng 8 cña Nam bé, tËp sè liÖu input vµ kiÓm nghiÖm
Luyện
(06-
07/2004)
Nam Bộ
MTKNT -0.341 2.912 3.666 6.090
6.432
HRM 6.179 7.663 9.884 13.898 Việt
Nam
MTKNT -0.499 3.007 4.058 7.220
7.719
HRM 10.306 10.704 12.677 20.265 Bắc Bộ
MTKNT -0.673 2.823 3.939 9.287
9.959
HRM 0.980 4.153 5.384 5.942 Trung
Bộ
MTKNT -0.518 3.454 4.462 4.444
4.961
HRM 3.469 5.249 6.355 9.730

Kiểm
nghiệm
(08/2004)
Nam Bộ
MTKNT -0.077 2.824 3.744 6.184
6.261
Từ hình 5 đến hình 10 và bảng 1 ta thấy MTKNT đã hiệu chỉnh sản phẩm của
HRM về gần với quan trắc hơn, sai số ở tập luyện nhỏ hơn sai số trên tập kiểm nghiệm.
Nhìn chung, tính trung bình cho cả chuỗi thời gian (2 tháng đối với tập luyện và 1

Prediction, Weather and Forecasting, Volume 16, 2000, p600-610.
2. David Silverman and John A. Dracup, Artificial Neural Networks and Long-Range
Precipitation Prediction in California, Monthly weather review, JANUARY 2000, p.57-66.
3. Narasimhan et al., Ozone Modeling Using Neural Networks, Monthly weather review,
MARCH 2000, p291-296.
4. Robert J. Kuligowski and Ana P. Barros, Experiments in Short-Term Pricipitation
Forecasting Using Artifical Neural Networks, Monthly weather review, 2000, Volume 126,
p.470-482.
5. Tom M. Mitchell, Machine Learning, Chapter 4, 1996, p81-127.

VNU. JOURNAL OF SCIENCE, Nat., Sci., & Tech., T.xXII, n
0
1AP., 2006

An Experiment in Daily Rainfall Forecasting Using
Artificial Neural Network to Adjust Numerical
Model Output
Ho Thi Minh Ha, Nguyen Huong Dien
Department of Hydro-Meteorology & Oceanography
College of Science, VNU

Artifical Neural Network (ANN) is one kind of Decision Support Systems. It has
the similar structure and behaviours to that of biological neuron. It can learn and
simulate the information as a brain through a learning course. The most common
learning method is folowing the gradient descent rule. In this paper its used for HRM
rainfall output adjustment. The input data is rainfall field predicted by HRM (with the
horizontal resolution14km and 31 vertical levels) and the observation data,
respectively in the period of time between 01th June 2004 and 31th August 2004 at 314
stations in Vietnam. Data is divided into 2 parts. One part is used for neural network
learning and the other one for prediction and test. The average rainfall, root mean

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Báo cáo nghiên cứu khoa học " Thử nghiệm dự báo lượng mưa ngày bằng phương pháp dùng mạng thần kinh nhân tạo hiệu chỉnh sản phẩm mô hình số " - Pdf 14

Tài liệu, ebook tham khảo khác

Học thêm