Xây dựng mô hình dự báo một số thông số khí tượng cho địa bàn tỉnh hải dương tt - Pdf 50

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

ĐỖ VĂN ĐỈNH

XÂY DỰNG MÔ HÌNH DỰ BÁO
MỘT SỐ THÔNG SỐ KHÍ TƯỢNG CHO ĐỊA BÀN
TỈNH HẢI DƯƠNG

Ngành

: Kỹ thuật điều khiển và tự động hóa

Mã số

: 9520216

TÓM TẮT LUẬN ÁN TIẾN SĨ
KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

Hà- Nội
1 - - 2018


Công trình được hoàn thành tại:
Trường Đại học Bách khoa Hà Nội

Người hướng dẫn khoa học:
1. PGS.TSKH. Trần Hoài Linh
2. TS. Đinh Văn Nhượng
Phản biện 1:…………………………………

− Các phần mềm của nước ngoài thường có yêu cầu phức
tạp về thông tin đầu vào (ảnh vệ tinh, hệ thống đo trên nhiều
tầng khí quyển,…), chi phí thu thập thông tin đầu vào cao, các
hệ thống tính toán cấu hình lớn (yêu cầu máy chủ mạnh hoặc
mạng nhiều máy tính chạy song song), sử dụng phức tạp;
− Không chủ động trong việc điều chỉnh các thông số, điều
chỉnh các yêu cầu của người sử dụng tại địa phương,...
Để khắc phục những tồn tại trên, Luận án đề xuất:
− Xây dựng giải pháp cho hai bài toán dự báo và ước lượng
thông số khí tượng phổ biến là: mô hình dự báo ngắn hạn thông
số khí tượng dựa vào kết quả đo trong quá khứ và mô hình ước
lượng thông số khí tượng dựa trên kết quả đo của các trạm
quan trắc lân cận;
− Các giải pháp đạt hướng đến mục tiêu: thông tin đầu vào
ít, dễ thu thập ở điều kiện Việt Nam nhưng vẫn đảm bảo được
độ chính xác phù hợp, chủ động trong thuật toán để thuận tiện
cho các việc điều chỉnh mô hình nhằm tối ưu hóa theo số liệu
địa phương.
-1-


2. Mục đích nghiên cứu
1. Xây dựng mô hình dự báo ngắn hạn thông số khí tượng
(thử nghiệm với hai thông số là nhiệt độ và độ ẩm) dựa trên các
kết quả đo quá khứ,
2. Xây dựng mô hình ước lượng thông số khí tượng dựa trên
các kết quả đo cùng thời điểm tại các điểm đo lân cận.
Các mô hình dự báo hướng tới mục tiêu và đạt yêu cầu:
− Dự báo được thông số khí tượng cho nhiều địa điểm;
− Thu thập số liệu không quá phức tạp;

bộ mẫu số liệu, lựa chọn mô hình có sai số kiểm tra nhỏ nhất.
5. Ý nghĩa khoa học và thực tiễn của đề tài
5.1. Ý nghĩa khoa học
Đề xuất phương pháp ứng dụng kỹ thuật SVM trong mô
hình lai để phân tích, xử lý và dự báo một số thông số khí
tượng điển hình là nhiệt độ và độ ẩm:
− Xây dựng mô hình dự báo nhiệt độ, độ ẩm lớn nhất và nhỏ
nhất dựa trên các kết quả đo trong quá khứ;
− Xây dựng mô hình ước lượng nhiệt độ, độ ẩm lớn nhất và
nhỏ nhất dựa trên các kết quả đo của các khu vực lân cận.
5.2. Ý nghĩa thực tiễn của đề tài
Góp phần bổ sung số lượng các giải pháp để tạo điều kiện
cho việc lựa chọn ứng dụng thực tế được dễ dàng hơn. Phương
pháp chỉ yêu cầu sử dụng số liệu đo quan trắc trong quá khứ
hoặc kết quả đo quan trắc ở các khu vực lân cận để dự báo, ước
lượng thông số khí tượng nên việc thu thập số liệu cũng khá đơn
giản, tính kinh tế cao.
6. Những đóng góp của Luận án
Luận án có đóng góp sau:
− Đã đề xuất mô hình lai gồm khối tuyến tính và SVM để áp
dụng cho các bài toán ước lượng phi tuyến. Mô hình lai này có
độ chính xác cao hơn mô hình SVM và một số mô hình phi
tuyến khác;
− Sử dụng mô hình lai đề xuất để xây dựng giải pháp có độ
chính xác cao cho bài toán dự báo thông số khí tượng dựa trên
kết quả đo trong quá khứ;
− Sử dụng mô hình lai đề xuất để xây dựng giải pháp có độ
chính xác cao cho bài toán ước lượng thông số khí tượng dựa
trên kết quả đo của các trạm quan trắc lân cận.
-3-

đang được ứng dụng trên thế giới, ở Việt Nam và một số đề
xuất nghiên cứu của Luận án.

-4-


1.2. Một số phương pháp dự báo thông số khí tượng
Với sự phát triển của khoa học kĩ thuật, rất nhiều mô hình dự
báo thông số khí tượng đã ra đời [12, 15, 16, 19, 24, 27] và được
đưa vào ứng dụng trong dự báo nghiệp vụ tại nhiều trung tâm dự
báo khí tượng trên thế giới. Hiện nay, trên thế giới có rất nhiều
nghiên cứu về phương pháp dự báo thông số khí tượng, các
nghiên cứu này được chia làm một số nhóm phương pháp chính
như sau: Phương pháp synopse [27]; Phương pháp thống kê
(Statistical methods) [22, 65, 79]; Phương pháp số trị
(Numerical methods) [10, 27, 36].
− Phương pháp dự báo phối kết hợp (Ensemble forecast
methods) [61, 83].
1.3. Các mô hình dự báo thông số khí tượng được ứng dụng
trên thế giới
Những nghiên cứu trên thế giới từ trước tới nay đã cho thấy
tính ưu việt của các mô hình số trị, các mô hình này được chia
thành bốn nhóm nhưng chủ yếu được chia làm hai loại cơ bản:
các mô hình số trị toàn cầu và các mô hình số trị khu vực. Sau
đây là một số mô hình số trị toàn cầu và khu vực đã được
nghiên cứu, phát triển ở trong và ngoài nước.
1.3.1. Một số mô hình số trị toàn cầu
Mô hình dự báo các trường số trị toàn cầu RHMC [95] do
cơ quan Khí tượng Thuỷ văn Liên bang Nga xây dựng và đưa
vào dự báo nghiệp vụ với các hạn dự báo cách nhau 6h một lần

tượng quốc tế Mỹ xây dựng và được áp dụng cho đối tượng đặc
biệt là khu vực có địa hình núi.
b. Mô hình RAMS (Regional Atmospheric Modeling System) [67]
Phiên bản đầu tiên của mô hình RAMS ra đời vào năm
1993, là kết quả kết hợp của hai mô hình có những tính chất
giống nhau: mô hình mây quy mô vừa của Tripoli và Cotton và
mô hình mây thuỷ tĩnh của Tremback.
c. Mô hình HRM (High Resolution Regional Model) [90]
HRM là một mô hình số thuỷ tĩnh cho dự báo thời tiết khu
vực hạn chế quy mô vừa, sử dụng hệ phương trình bao gồm
nhiều đối tượng vật lý như: bức xạ, mô hình đất, các quá trình
rối trong lớp biên, tạo mưa theo lưới, đối lưu nông/sâu,...
d. Mô hình WRF (Weather Research and Forecasting) [97]
Mô hình WRF được hình thành bởi Trung tâm quốc gia
Nghiên cứu Khí quyển Mỹ (National Center of Atmospheric
Research-NCAR) với đóng góp của nhiều cơ quan khí tượng và
đại học ở Hoa Kỳ cũng như trên thế giới.
-6-


e. Mô hình MM5 [94]
Mô hình khí tượng động lực quy mô vừa MM5 là một trong
những mô hình thế hệ mới của NCAR và Trường Đại học Tổng
hợp Pennsylvania Mỹ (PSU). MM5 đang được nhiều cơ quan
chính phủ (như Nha Khí Tượng Hoa Kỳ và NASA) cũng như
nhiều trường đại học danh tiếng ở Hoa Kỳ và các quốc gia khác
trên thế giới như tại Âu Châu, Hồng Kông và Đài Loan dùng
để làm dự báo thời tiết.
1.4. Các mô hình dự báo khí tượng được ứng dụng ở Việt
Nam

Đối với các giải pháp tổng hợp từ các bài báo khoa học, NCS
đã tìm hiểu và trình bày nhiều hơn về các mô hình toán học
cũng như một số thông số được các tác giả đưa ra. Tuy nhiên
khó khăn chung khi so sánh đó là mỗi mô hình được sử dụng
cho các địa điểm khác nhau, thông số đầu vào và đầu ra cũng
khác nhau. Vì vậy các so sánh mới dừng ở mức độ nhất định.
1.6. Đề xuất của Luận án
Hiện nay, việc áp dụng các mô hình dự báo thông số khí
tượng tiên tiến hiện nay không phù hợp với điều kiện ở Hải
Dương do:
− Kinh phí thu thập số liệu quá lớn.
− Hạ tầng máy tính và công nghệ thông tin không đáp ứng.
− Không chủ động về công nghệ nên khó điều chỉnh các
thông số của mô hình cho phù hợp với tỉnh Hải Dương.
Để khắc phục những tồn tại trên Luận án đề xuất giải pháp
thực hiện các nhiệm vụ sau:
− Dự báo thông số khí tượng cho nhiều địa điểm;
− Thu thập số liệu không quá phức tạp;
− Hạ tầng máy tính không cần quá cao;
− Xây dựng các mô hình ước lượng và dự báo phù hợp với
thực tế tại Hải Dương.
Chương 2: MÔ HÌNH LAI VÀ ỨNG DỤNG TRONG CÁC
VẤN ĐỀ MÔ HÌNH HÓA PHI TUYẾN
2.1. Giới thiệu chung
Đã có nhiều công trình nghiên cứu chứng minh rằng công cụ
mạng véc-tơ hỗ trợ SVM (Support Vector Machines) có khả
năng tốt hơn không chỉ trong các bài toán nhận dạng và phân
loại các mẫu rời rạc mà còn trong cả các bài toán ước lượng
các hàm phi tuyến [70, 76, 85]. Trong Luận án này NCS đề
-8-


(

)

trong đó x(d−1) là véc-tơ đầu vào các đại lượng đo ở ngày thứ
d −1, y(d ) là đại lượng cần dự báo ở ngày d, ( d − K ) − ngày
xa nhất sử dụng trong dự báo. Do đó một mẫu số liệu gồm cặp

x

( d −1)



, , x(d −K )  ; y(d ) và được lấy cho nhiều ngày d.
-9-


Đối với bài toán ước lượng, hàm truyền đạt phi tuyến tổng
quát có dạng: y(d ) = f x1(d ) , x2(d ) , , xN(d )
(2.3)

(

)

trong đó xi(d ) là đại lượng đo tại vị trí i ở ngày thứ d, y(d ) là
đại lượng cần ước lượng ở ngày thứ ( d ) ở vị trí khác các xi .


→ min

(2.4)

2.3.4. Xây dựng khối phi tuyến
Sau khi có mô hình tuyến tính, phần sai số còn lại sẽ được
xấp xỉ bởi mô hình phi tuyến sao cho:

E=

1 p
2
NonLinear (xi ) − (di − Linear (xi )) → min (2.5)

2 i=1

Trong Luận án, mô hình phi tuyến sẽ sử dụng mạng SVM.
2.4. Ưng dụng SVM xây dựng hàm truyền phi tuyến
2.4.1. Giới thiệu chung
Mục tiêu nghiên cứu là xây dựng mô hình dự báo và mô
- 10 -


hình ước lượng nội suy đều là dạng hàm biến thiên liên tục nên
Luận án sẽ sử dụng mô hình SVR. Nhiều ý tưởng của SVR
xuất phát từ các công thức gốc của SVM nên Luận án sẽ trình
bày tóm tắt về các công thức này trước khi giới thiệu về SVR.
2.4.2. Bài toán phân lớp nhị phân
Bài toán phân lớp nhị phân [85] này được phát biểu như sau:
Cho tập dữ liệu gồm p mẫu huấn luyện xi , di  , i = 1,2, , p,

Các thông số của mô hình được xác định bằng việc tối ưu
- 11 -


hóa hàm giá trị phạt:

1 T
1 p 2
(2.7)
Minimize : w  w +  ek
2
2 k =1
với ek = y ( xk ) − wT  ( xk ) + b , k = 1,2, , p là sai số và
 − thông số điều chỉnh. Bài toán ước lượng sẽ được chuyển
thành dạng phi tuyến khi sử dụng hàm nhân K ( x, xk ) như sau:
p

y ( x) = k  K ( x, xk ) + b

(2.8)

k =1

Hàm cơ sở xuyên tâm (RBF) trong LS-SVM được sử dụng
như hàm nhân với công thức như sau:

 ( xk − xl )  ( xk − xl )T 
K ( xk , xl ) = exp −
 , k = 1,..., p
2  2

lai cho phần ước lượng hàm truyền đạt phi tuyến.
3.2. Xây dựng mô hình lai cho bài toán dự báo
3.2.1. Lựa chọn đầu vào
Trích chọn đặc tính đầu vào là một bước rất quan trọng
trong quá trình nhận dạng, điều khiển tín hiệu hay dự báo…
sau khi được thu thập bằng cách loại bỏ những thông tin đặc
trưng có rất ít hoặc không có thông tin dự đoán.
3.2.2. Xác định các hệ số của khối tuyến tính
Từ phương trình (2.8), giả thiết ta có một tập hợp N thông
số T1, T2 , , TN  được đo trong một thời gian, mỗi thông số có



được p mẫu: Ti1, Ti 2 ,

, Tip



(i = 1,

, N ) . Các mô hình dự

báo sẽ được xây dựng độc lập cho từng thông số, mỗi mô hình
sẽ có một đầu ra tương ứng với giá trị của thông số của ngày
tiếp theo. Tuy nhiên các đầu vào được sử dụng cho từng mô
hình sẽ được xác định độc lập (và danh sách đầu vào cũng sẽ
khác nhau cho từng mô hình). Trước tiên thành phần quan hệ
tuyến tính giữa thông số Ti của ngày d với chính thông số Ti
đó của các ngày quá khứ được biểu diễn và xác định từ hệ


Ti ( d − p − K −1) aK  Ti (d − p + 1)

(3.1)
Trước tiên danh sách các đầu vào quá khứ sẽ được tìm kiếm
theo ý tưởng đã được trình bày ở Chương 2 trong một khoảng
thời gian đủ xa (Luận án chọn K=60 - tương đương 2 tháng
trong quá khứ) để thử nghiệm.
Ví dụ, nếu sử dụng phương pháp đánh giá theo hệ số khai
triển tuyến tính, ta sẽ xét với K đầu vào quá khứ với bộ số liệu
nhiều mẫu đã có, ta xác định véc-tơ a = a1,

, aK  của hàm
T

ước lượng tuyến tính Ti (d )   j =1 a j  Ti ( d − j ) bằng
phương pháp khai triển ma trận dùng SVD. Tiếp theo xác định
thành phần có giá trị tuyệt đối nhỏ nhất trong véc-tơ a. Thành
phần này sẽ tương ứng với ngày trong quá khứ có ảnh hưởng ít
nhất tới ngày dự báo tiếp theo. Ta loại bỏ ngày này khỏi bộ số
liệu trong quá khứ, giảm K=K-1, và quay lại bước 2 nếu K >
Kmin chọn trước. Quá trình lặp các bước 2-3 sẽ được tiếp tục
cho đến khi K giảm xuống một giá trị đủ nhỏ có thể chấp nhận
được để mô hình không quá phức tạp, khó sử dụng trong thực
tế. Cụ thể trong Luận án ta chọn Kmin
Sau khi đã xác định được các thông số mô hình tuyến tính,
ta tiến hành xây dựng mô hình phi tuyến để ước lượng thành
phần phi tuyến còn lại (phương trình 3.2).
3.3. Xây dựng mô hình lai cho bài toán ước lượng
3.3.1. Bài toán ước lượng thông số khí tượng
Giả thiết rằng ta có kết quả đo các thông số khí tượng dựa
kết quả đo quan trắc ở các điểm A1, A2,…, AN. Mục tiêu đặt ra
là ta cần ước lượng thông số khí tượng tại điểm B (vị trí không
có trạm quan trắc), khi đó ta cần xây dựng hàm quan hệ (thông
thường đây là quan hệ phi tuyến) giữa thông số khí tượng tại
điểm B và tại các điểm Ai có dạng tổng quát như sau:
(3.3)
T ( B, d ) = g (T ( A1, d ) ,T ( A2 , d ) , ,T ( AN , d ))
trong đó T - thông số khí tượng cần ước lượng, d – ngày đang
xét; hàm g() là phi tuyến (cần xây dựng). Hàm phi tuyến g() sẽ
được sử dụng mô hình lai để ước lượng. Mô hình (3.3) cũng có
thể được sử dụng để bù dữ liệu khuyết thiếu tại điểm B. Ngoài
ra, mô hình (3.3) có thể đực phát triển phát triển cho việc ước
lượng thông số T khác (ví dụ để ước lượng Tmax có thể dùng
RHmax của điểm lân cận,...).
Từ (3.3) ta ước lượng thông số khí tượng tại 02 địa điểm
(thành phố Hải Dương, thị xã Chí Linh) dựa trên kết quả đo
của 05 trạm quan trắc lân cận.
T HD,d

g T TB,d ,T BN,d ,T QN,d ,T HP,d ,T HY ,d

(3.4a)
- 15 -


tương quan, khai triển theo hệ số tuyến tính trên cùng bộ số
liệu đầu vào. Kết quả thực nghiệm phương pháp khai triển theo
hệ số tuyến tính cho sai số nhỏ nhất và được chọn để xác định
thành phần tuyến tính trong mô hình lai.
- 16 -


4.3. Kết quả dự báo, ước lượng thông số khí tượng theo
chuỗi thời gian
4.3.1. Kết quả xây dựng mô hình lai dự báo thông số khí tượng theo
chuỗi thời gian
a. Lựa chọn đặc tính đầu vào cho các mô hình dự báo và xác
định thành phần tuyến tính
Sử dụng phương pháp khai triển theo hệ số tuyến tính xác
định thành phần tuyến tính trong mô hình lai. Kết quả sau khi
trích chọn đặc tính ta có số liệu các ngày quá khứ ảnh hưởng
đến ngày dự báo d+1: Tmax (19 đầu vào), Tmin (18 đầu vào),
RHmax (22 đầu vào), RHmin (19 đầu vào).
b. Xác định thành phần phi tuyến
Sai số còn lại sau khi ước lượng thành phần tuyến tính chính
là giá trị đích cần đạt được của khối phi tuyến. Sử dụng các mô
hình mạng nơ-rôn khác nhau để huấn luyện mô hình mạng như:
MLP, MLR, RBF, Elman, BTree, SVM và đánh giá, so sánh
kết quả sai số. Kết quả SVM cho kết quả sai số tuyệt đối trung
bình nhỏ nhất và được chọn là mạng nơ-rôn để xác định thành
phần phi tuyến.
Hình 4.1 là sai số học và kiểm tra khi xác định thành phần
phi tuyến với Tmax cho sai số tuyệt đối trung bình
(MAE=1,38oC).


4.3.2. Kết quả xây dựng mô hình lai ước lượng thông số khí tượng
theo chuỗi thời gian
Tiến hành thử nghiệm ước lượng thông số khí tượng tại
thành phố Hải Dương, thị xã Chí Linh dựa trên kết quả đo của
trạm quan trắc của 05 địa điểm lân cận gồm tỉnh Bắc Ninh,
Thái Bình, Hưng Yên, Thành phố Hải Phòng, tỉnh Quảng Ninh.

Hình 4.5: Kết quả kiểm tra ước lượng Tmax tại thành phố Hải Dương
cho các tổ hợp đầu vào khác nhau

- 19 -


Thực hiện kiểm tra thử nghiệm với 25 trường hợp chia làm
03 nhóm theo số lượng tỉnh lân cận đầu vào từ 2 đến 4. Kết quả
cả TP. Hải Dương và TX. Chí Linh đều có thể sử dụng chung
một mô hình gồm 4 trạm lân cận là Bắc Ninh, Quảng Ninh, Hải
Phòng, Hưng Yên. Các hình 4.5÷4.8 là kết quả kiểm tra tại TP.
Hải Dương cho các tổ hợp đầu vào khác nhau khi ước lượng
Tmax (sai số MAE=0,48oC), Tmin (MAE=0,37oC), RHmax
(MAE=2,23%), RHmin (MAE=3,59%)

Hình 4.6: Kết quả kiểm tra ước lượng Tmin tại thành phố Hải Dương
cho các tổ hợp đầu vào khác nhau

Hình 4.7: Kết quả kiểm tra ước lượng RHmax tại thành phố Hải
Dương cho các tổ hợp đầu vào khác nhau

Hình 4.8: Kết quả kiểm tra ước lượng RHmin tại thành phố Hải
Dương cho các tổ hợp đầu vào khác nhau

từ 01/9 đến 30/11; Mùa đông từ 01/121 đến 328/02 (hoặc 29/02
nếu năm nhuận).
Với 2191 ngày dữ liệu (từ 01/01/2010 đến 31/12/2015) và
cách phân chia mùa trong năm theo [6, 96], ta có 04 bộ số liệu
theo mùa:
− Bộ số liệu mùa xuân (552 ngày số liệu);
− Bộ số liệu mùa hè (552 ngày số liệu);
− Bộ số liệu mùa thu (546 ngày số liệu);
− Bộ số liệu mùa đông (541 ngày số liệu).
4.4.1. Kết quả xây dựng mô hình dự báo thông số khí tượng
theo mùa
Sử dụng mô hình lai, kết quả thực nghiệm cho thấy dự báo
ngắn hạn theo mùa cho sai số trung bình cộng các mùa từ 1,41oC
đến 1,80oC (đối với nhiệt độ) và từ 4,63% đến 7,26% (đối với độ
ẩm). Qua kết quả này cho thấy dự báo theo mùa cho sai số nhỏ
hơn tuy nhiên phải sử dụng tới 4 mô hình. Sự chênh lệch sai số
giữa dự báo theo chuỗi thời gian và dự báo theo mùa không nhiều,
để sử dụng ít mô hình thì sử dụng mô hình dự báo theo chuỗi thời
gian sẽ hiệu quả hơn và đây cũng là đề xuất của Luận án.
- 22 -


4.4.2. Kết quả xây dựng mô hình ước lượng thông số khí
tượng theo mùa
Thực hiện ước lượng thông số khí tượng theo mùa tại thành
phố Hải Dương và thị xã Chí Linh dựa theo kết quả trạm quan
trắc lân cận gồm Hải Phòng, Hưng Yên, Thái Bình, Bắc Ninh
và Quảng Ninh.Kết quả sử dụng tổ hợp gồm 4 trạm quan trắc
lân cận: Bắc Ninh – Quảng Ninh – Hải Phòng và Hưng Yên
cho kết quả sai số nhỏ nhất,


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status