TạpchíKhoahọcĐạihọcQuốcgiaHàNội,KhoahọcTựnhiênvàCôngnghệ25,Số1S(2009)28‐34
28
_______
Mạng thần kinh nhân tạo truy hồi thời gian trễ
và ứng dụng dự báo nhiệt độ tối thấp cho khu vực
đồng bằng phía Bắc Việt Nam
Nguyễn Hướng Điền
1,
*, Hoàng Thanh Vân
1
, Hoàng Phúc Lâm
2
1
Khoa Khí tượng Thủy văn và Hải dương học, Trường Đại học Khoa học Tự nhiên, ĐHQGHN
2
Trung tâm Dự báo Khí tượng Thuỷ văn Trung ương
Ngày nhận 02 tháng 01 năm 2009
Tóm tắt. Cùng với những nghiên cứu trước đây sử dụng mạng thần kinh nhân tạo (TKNT) dự báo
nhiệt độ tối cao, chúng tôi đã thử nghiệm dự báo nhiệt độ tối thấp cho khu vực nghiên cứu bằng
việc sử dụng một loại mạng TKNT nữa - mạng truy hồi thời gian trễ. Kết quả đạt được với bài
toán dự báo là khả quan, hệ số
tương quan rất lớn (luôn >0,93) và sai số nằm trong ngưỡng cho
phép của dự báo nghiệp vụ (RMSE trong khoảng từ 1,49
0
C đến 1,59
0
C và MAE xấp xỉ 1,1
0
C).
Tuy nhiên chất lượng dự báo nhiệt độ tối thấp của mô hình mạng TKNT trong mùa đông và mùa
xuân chưa được cao lắm.
thức đa lớp và các cấu trúc bộ nhớ ngắn hạn
được gọi là mạng thời gian trễ (Time-Lagged
Network), các cấu trúc bộ nhớ thậm chí có thể
là truy hồi, nhưng chỉ là hồi tiếp địa phương (để
tính ổn định dễ đảm bảo hơn). Khi kết hợp
mạng truy hồi v
ới các cấu trúc bộ nhớ thì ta có
mạng truy hồi thời gian trễ (Time-Lagged
Recurrent Network). Thông thường, với một
mạng thời gian trễ tổng quát nhất, bộ nhớ sẽ
được đặt ở tất cả các thành phần của mạng, điều
∗
Tác giả liên hệ. ĐT: 84-4-38584943.
E-mail: [email protected]
N.H.Điềnvànnk./TạpchíKhoahọcĐHQGHN,KhoahọcTựNhiênvàCôngnghệ25,Số1S(2009)28‐34
29
đó sẽ tăng khả năng của mạng rất nhiều nhưng
cũng sẽ mất rất nhiều thời gian để luyện và số
liệu cũng cần nhiều để đảm bảo tính đặc trưng
của mạng. Một trong những thuật toán giúp đơn
giản hoá vấn đề này là thuật toán tập trung
(Focused), trong đó bộ nhớ ngắn hạn chỉ được
đặ
t ở lớp nhập. Chức năng của bộ nhớ ngắn hạn
trong mạng thời gian trễ tập trung là chứa các
thông tin, tín hiệu trong quá khứ của lớp nhập,
trong khi các phần tử hoạt động phi tuyến cung
cấp các ánh xạ tương tự như ở mạng nhận thức
đa lớp. Trong bài báo này, mạng truy hồi thời
gian trễ là lựa chọn số một cho bài toán phân
N.H.Điềnvànnk./TạpchíKhoahọcĐHQGHN,KhoahọcTựNhiênvàCôngnghệ25,Số1S(2009)28‐34
30
Ta có thể kết hợp ưu điểm của bộ nhớ hồi
tiếp và bộ nhớ trễ trong các hệ thống tuyến tính,
được gọi là chuỗi khuếch tán trễ (Dispersive
Delay Lines). Bộ nhớ được dùng nhiều nhất
thuộc loại này là bộ nhớ gamma (hình 4). Bộ
nhớ gamma có một tham số tự do là
µ
, dùng để
điều khiển độ dài bộ nhớ (là khoảng thời gian
giữa thời điểm xung trả lời đầu tiên và thời
điểm tác động cuối cùng K: D = K/
µ
) dựa trên
độ phân giải của bộ nhớ (số kết xuất trong một
đơn vị thời gian: R=
µ
). Tham số
µ
có thể được
điều chỉnh để đạt được sai số nhỏ nhất. Đây
chính là ưu điểm của bộ nhớ gamma so với bộ
nhớ hồi tiếp. Hình 4. Bộ nhớ gamma.
Ưu điểm của thuật toán tập trung là các
trọng số mạng nhận thức đa lớp vẫn có thể được
N.H.Điềnvànnk./TạpchíKhoahọcĐHQGHN,KhoahọcTựNhiênvàCôngnghệ25,Số1S(2009)28‐34
31
Bảng 1. Các chỉ số đánh giá dự báo nhiệt độ tối thấp
Láng Phủ Liễn Thanh Hóa Vinh
MAE (
0
C) 1.14 1.10 1.10 1.07
RMSE (
0
C) 1.59 1.55 1.49 1.56
E-max (
0
C) -3.07 -3.86 -3.05 -4.00
E+max (
0
C) 8.07 7.56 7.30 8.07
N
E<2
309 314 311 317
DP 9 17 11 16
AC 0.94 0.94 0.94 0.93
N 365 365 365 365
Ghi chú:
MAE: Sai số tuyệt đối trung bình,
RMSE: Sai số quân phương,
E-max: Sai số dự báo hụt nhiều nhất,
không thực sự tốt, sai số dự báo vượt cực đại
lên tới 7 - 8
0
C còn sai số dự báo hụt lớn nhất
cũng từ 3 đến 4
0
C. Để có đánh giá chi tiết hơn,
ta chia nhỏ giai đoạn đánh giá ra thành từng
mùa ba tháng một.
Bảng 2. Các chỉ số đánh giá dự báo nhiệt độ tối thấp theo 3 tháng
Láng Phủ Liễn
Chỉ số/Tháng
1-2-3 4-5-6 7-8-9 10-11-12 1-2-3 4-5-6 7-8-9 10-11-12
ME (
0
C) 0.06 -0.12 -0.20 0.16 0.09 -0.02 -0.26 0.07
RMSE (
0
C) 1.57 1.98 1.14 1.55 1.47 1.89 1.41 1.37
E-max (
0
C) -3.07 -2.88 -2.15 -2.63 -3.69 -2.75 -3.86 -3.36
E+max (
0
C) 6.17 8.07 3.08 7.74 6.46 7.56 4.47 7.38
Thanh Hóa Vinh
Chỉ số/Tháng
15.0
20.0
25.0
30.0
35.0
5.0 10.0 15.0 20.0 25.0 30.0 35.0
Quan trắc (độ C)
Dự báo (độ C)
Láng
Hình 5. Kết quả đánh giá trạm Láng.
5.0
10.0
15.0
20.0
25.0
30.0
35.0
5.0 10.0 15.0 20.0 25.0 30.0 35.0
Quan trắc (độ C)
Dự báo (độ C)
Phủ Liễn
Hình 6. Kết quả đánh giá trạm Phủ Liễn.
N.H.Điềnvànnk./TạpchíKhoahọcĐHQGHN,KhoahọcTựNhiênvàCôngnghệ25,Số1S(2009)28‐34
33
5.0
10.0
15.0
một loại mạng TKNT nữa - mạng truy hồi thời
gian trễ. Kết quả đạt được với bài toán dự báo
nhiệt độ
tối thấp là khả quan, hệ số tương quan
N.H.Điềnvànnk./TạpchíKhoahọcĐHQGHN,KhoahọcTựNhiênvàCôngnghệ25,Số1S(2009)28‐34
34
rất lớn và sai số nằm trong ngưỡng cho phép
của dự báo nghiệp vụ. Tuy nhiên vẫn còn
những tồn tại cần tiếp tục nghiên cứu giải
quyết, đó là chất lượng dự báo nhiệt độ tối thấp
của mô hình mạng TKNT trong mùa đông và
mùa xuân chưa được cao lắm.
Bài báo là một phần kết quả của đề tài
NCCB mã số 705306.
Tài liệu tham khảo
[1] J.C. Principe, Artificial Neural Network, CRC
Press LLC, 2000.
[2] S. Haykin, Neural Networks: A Comprehensive
Foundation, New York, 1994.
[3] Nguyễn Hướng Điền, Hoàng Phúc Lâm, Dự báo
tổng lượng bứcc xạ ngày cho khu vực đồng bằng
phía Bắc Việt Nam bằng phương pháp sử dụng
mạng thần kinh nhân tạo, Tạp chí Khoa học Đại
học Quốc gia Hà Nội, Chuyên san Khoa học Tự
nhiên và Công nghệ, tập 22, số 2B PT (2006) 9.
[4] Hoàng Phúc Lâm, Nghiên cứu ứng dụng mạng
TKNT dự báo m
ột số yếu tố khí tượng cho các
tỉnh đồng bằng phía Bắc Việt Nam, Luận văn
0.93. However, when we access the maximum over and under-estimated forecast, the model is still not
really good, the former one is about 7 - 8 degree and the later is around 3 - 4 degree. In order to get
more detail assessment, the test data set was divided into 4 parts and the season from July to September
often got the best verification results. These results support for the conclusions in the previous papers that
the neural network with suitable configuration always gives a reasonable assessment.