NGHIÊN CỨU ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO LƯỢNG MƯA VỤ ĐÔNG XUÂN Ở MỘT SỐ TỈNH VÙNG ĐỒNG BẰNG BẮC BỘ - Pdf 36

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------

Nguyễn Hữu Quyền

NGHIÊN CỨU ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO
LƢỢNG MƢA VỤ ĐÔNG XUÂN Ở MỘT SỐ TỈNH
VÙNG ĐỒNG BẰNG BẮC BỘ

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – 2013


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
--------------------Nguyễn Hữu Quyền

NGHIÊN CỨU ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO
LƢỢNG MƢA VỤ ĐÔNG XUÂN Ở MỘT SỐ TỈNH
VÙNG ĐỒNG BẰNG BẮC BỘ

Chuyên ngành: Khí tƣợng và khí hậu học
Mã số: 60.44.87

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS. TS. Dương Văn Khảm


Chƣơng 2. MÔ HÌNH ARIMA VÀ SỐ LIỆU SỬ DỤNG ...................................21
2.1. Giới thiệu cấu trúc của mô hình ARIMA ...................................................21
2.1.1. Mô hình tự hồi quy trung bình trượt ARIMA ...................................22
2.1.2. Mô hình động thái ARIMAX .............................................................23
2.2. Phương pháp áp dụng mô hình ARIMA và ARIMAX đối với bài toán dự
báo mưa mùa ......................................................................................................24
2.2.1. Xác định tính ổn định ngẫu nhiên của chuỗi thời gian ....................25
2.2.2. Nhận dạng cấu trúc của mô hình .....................................................28
2.2.3. Xác định các tham số của mô hình ...................................................32
2.2.4. Kiểm định mô hình ...........................................................................35
2.2.5. Phần mềm thống kê SAS đối với mô hình ARIMA và ARIMAX .......36
2.3. Các nguồn số liệu được sử dụng .................................................................36
2.3.1. Số liệu quan trắc mưa từ các trạm khí tượng ...................................37
2.3.2. Số liệu về các chỉ số khí hậu ............................................................37
2.3.3. Số liệu về số vết đen mặt trời (Sunspot Number) .............................38
2.3.4. Xử lý số liệu ......................................................................................38
Chƣơng 3. KẾT QUẢ VÀ NHẬN XÉT .................................................................41
3.1. Xây dựng mô hình dự báo mưa vụ đông xuân bằng mô hình ARIMA ......41
3.1.1. Xác định tính ổn định của chuỗi lượng mưa vụ Đông xuân.............41
3.1.2. Nhận dạng mô hình ARIMA .............................................................43
3.1.3. Xác định các thông và kiểm định mô hình ARIMA ..........................44
3.2. Xây dựng mô hình dự báo lượng mưa vụ đông xuân bằng mô hình động
thái ARIMAX ....................................................................................................46
3.2.1. Xác định tính ổn định của chuỗi nhân tố dự báo .............................46

iii


3.2.2. Khảo sát mối quan hệ giữa chỉ số lượng mưa và các biến tham ra dự
tuyển ...........................................................................................................49

Hình 3.1. Diễn biến lượng mưa vụ đông xuân tại 9 trạm .........................................42
vùng Đồng bằng Bắc Bộ. ..........................................................................................42
Hình 3.2. Hàm ACF (bên trái) và hàm PACF (bên phải) của chuỗi .........................44
lượng mưa vụ đông xuân trạm Hà Nội .....................................................................44
Hình 3.3. Hàm ACF (bên trái) và hàm PACF (bên phải) của ...................................45
chuỗi sai số trong mô hình ARIMA hanoi (0, 0, [4, 5]) ..............................................45
Hình. 3.4. Hàm tự tương quan của chuỗi nhân tố dự báo thuộc nhóm chỉ số ENSO
...................................................................................................................................48
Hình 3.5. Hàm tự tương quan của chỉ số vết đen Mặt Trời trước khi sai phân ........49
Hình 3.6 . Hàm tự tương quan của chỉ số vết đen Mặt Trời sau khi sai phân...........49
v


Hình 3.7. Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuân
trạm Hà Nội và dị thường nhiệt độ bề mặt nước biển ở các vùng NINO với thời gian
trễ từ 1 đến 120 tháng so với thời gian dự báo..........................................................51
Hình 3.8. Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuân
trạm Hải Dương và dị thường nhiệt độ bề mặt nước biển ở các vùng NINO với thời
gian trễ từ 1 đến 120 tháng so với thời gian dự báo ..................................................51
Hình 3.9. Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuân
trạm Hà Nội và chỉ số SOI, vết đen Mặt Trời với thời gian trễ từ 1 đến 120 tháng so
với thời gian dự báo ..................................................................................................52
Hình 3.10. Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuân
trạm Hải Dương và chỉ số SOI, vết đen Mặt Trời với thời gian trễ từ 1 đến 120
tháng so với thời gian dự báo ....................................................................................52
Hình 3.11. Hàm tự tương quan và tự tương quan riêng phần của chuỗi sai số dự báo
trong mô hình động thái ARIMAX ...........................................................................58
Hình 3.12. Mô phỏng lượng mưa vụ đông xuân theo các mô hình được xây dựng tại
một số trạm vùng đồng bằng Bắc Bộ ........................................................................62
Hình 3.12. Mô phỏng lượng mưa vụ đông xuân theo các mô hình được xây dựng tại

...................................................................................................................................57
Bảng 3.10. Các chỉ tiêu đánh giá khả năng mô phỏng của các mô hình đối với chuỗi
phụ thuộc ...................................................................................................................66
Bảng 3.11. Các chỉ tiêu đánh giá khả năng mô phỏng của các mô hình đối với chuỗi
độc lập .......................................................................................................................66

vii


DANH MỤC CÁC KÍ HIỆU VIẾT TẮT
Ký hiệu
AGCM
ACF
ANN
AOGCM
AOL-GCM
ARIMA
ARIMAX
CCF
DMI
ECMWF
ENSO
GCM
MAE
ME
MEI
MOS
MSSS
NCAR
NCEP

Multivariate ENSO Index
Thống kê sản phẩm đầu ra mô hình (Model Output Statistics)
Điểm kỹ năng của mô hình (Mean Square Skill Score)
Trung tâm Quốc gia về Nghiên cứu Khí quyển (Hoa Kỳ)
Trung tâm Quốc gia Dự báo Môi trường (Hoa Kỳ)
National Council for the Social Studies
Những người khác
Cơ quan Quản lý Khí quyển và Đại dương (Hoa Kỳ)
Mô hình hoàn lưu chung đại dương
Tự tương quan riềng phần (Part autocorrelation function)
Mô hình khí hậu khu vực
Mô hình khí hậu khu vực của NCAR
Sai số quân phương
Statistical Analysis System
Chỉ số dao động nam (Southern Oscillation Index)
Nhiệt độ mặt nước biển (Sea Surface Temperature)
Chuẩn sai nhiệt độ mặt nước biển (Sea Surface Temperature
Anomalies)
Vết đen Mặt Trời
Tổ chức Khí tượng Thế giới (World Meteorological
Organization)

viii


MỞ ĐẦU
Các thông tin dự báo khí hậu, đặc biệt là dự báo mưa mùa có ý nghĩa lớn đến
các hoạt động phát triển kinh tế xã hội như: kế hoạch sản xuất nông nghiệp, du
lịch, đánh bắt và nuôi trồng thủy sản, quản lý, khai thác có hiệu quả nguồn tài
nguyên nước... Mức độ tin cậy về dự báo mưa mùa thường thấp hơn so với các yếu

thống kê có đóng góp chính trong việc đưa ra bản tin dự báo tổng lượng mưa mùa.
Phương pháp mô hình động lực là hướng nghiên cứu đang rất được quan tâm phát
triển, nó có những ưu điểm vượt trội về khả năng cung cấp sản phẩm dự báo, tuy
nhiên, việc giải mô hình số rất phức tạp và tốn kém, cần phải có công cụ máy tính
cấu hình cao và hơn nữa kết quả dự báo mưa cũng chưa đạt được độ chính xác như
mong muốn.
Mô hình ARIMA là mô hình phân tích chuỗi thời gian, nó không chỉ xem xét
các chu kỳ tự vận động của chuỗi dữ liệu dự báo, các mối tương tác trong quá trình
tự vận động của các nhân tố ảnh hưởng khác mà nó còn đánh giá được các quy luật
sai số trong quá trình mô phỏng để nâng cao độ chính xác của dự báo. Mặc dù mô
hình này đã được áp dụng ở nhiều nước trên thế giới nhưng ở Việt Nam cho đến
nay vẫn còn rất ít các nghiên cứu áp dụng trong dự báo khí hậu mùa.
Xuất phát từ các nhận thức nêu trên và để góp phần đáp ứng nhu cầu thực
tiễn, chúng tôi chọn đề tài luận văn tốt nghiệp là: "Nghiên cứu ứng dụng mô hình
ARIMA để dự báo lƣợng mƣa vụ đông xuân ở một số tỉnh vùng đồng bằng Bắc
Bộ".
Các nôi dung chính của luận văn được trình bày trong 3 chương như sau:
Chương 1: Tổng quan
Chương 2: Mô hình ARIMA và số liệu sử dụng
Chương 3: Kết quả và thảo luận

2


Chƣơng 1
TỔNG QUAN
Trong chương này, sẽ trình bày cơ sở khoa học của dự báo khí hậu mùa và
tóm lược các công trình nghiên cứu tiêu biểu nhằm rút ra được những thông tin cần
khai thác, ứng dụng hoặc cải tiến trong việc thực hiện các nội dung của đề tài.
1.1. Cơ sở khoa học của dự báo khí hậu mùa

động xung quanh giá trị trung bình nhiều năm của một số yếu tố khí hậu chính như
nhiệt độ và lượng mưa. Ngoài ra các hiện tượng thời tiết đặc biệt như: bão, áp thấp
nhiệt đới, mưa lớn, nắng nóng, rét đậm, rét hại, khô hạn cũng đã được nghiên cứu
trong công tác dự báo mùa để nhằm giảm thiệt hại do thiên tai gây ra đối với phát
triển kinh tế - xã hội của mỗi quốc gia.
Mục tiêu của các mô hình dự báo thời tiết là nắm bắt chính xác trạng thái của
khí quyển trong khoảng thời gian dự báo. Mức độ chính xác của mô hình dự báo
thời tiết thường phụ thuộc vào hạn dự báo, khả năng giải các phương trình biến
động ngắn hạn của các đặc trưng khí quyển và độ chính xác của điều kiện ban đầu
và điều kiện biên. Nhưng đối với các mô hình dự báo hạn mùa, cần phải nắm bắt
được dị thường của khí hậu mùa, đây là một bài toán rất phức tạp mà sự thành công
của dự báo phụ thuộc vào mức độ hiểu biết về mối quan hệ tương tác giữa khí
quyển, lục địa và đại dương [41].
Theo [36], các hoạt động tự nhiên của hệ thống khí hậu làm gia tăng biến
động của khí hậu trên tất cả quy mô thời gian. Một số các quá trình xảy ra trong
khoảng thời gian ngắn như sự phát triển của hệ thống synop trong khí quyển là một
trong những nguyên nhân dẫn đến sai số dự báo mùa. Tuy nhiên, sự thay đổi chậm
của hệ thống khí hậu là nguồn gốc cơ bản cho phép dự báo khí hậu mùa. Nguyên
nhân của sự thay đổi này bao gồm sự thay đổi trong khoảng thời gian dài của đại
dương, hệ thống tương tác đại dương-khí quyển và các thành phần khác như băng
biển, điều kiện bề mặt đất, độ che phủ của tuyết…
El Nino và Dao động Nam (SO) được xem là nhân tố tác động lớn nhất đến
dị thường khí hậu, trong đó có lượng mưa. Walker (1924) đã phát hiện ra dao động
của khí áp quy mô lớn, từ năm này qua năm khác ở 2 phía Đông và Tây của khu
vực xích đạo Thái Bình Dương (Tahiti và Darwin) và được gọi là Dao động Nam.
Hơn 40 năm sau, trong công trình nghiên cứu của Jacob Bjerknes (1969) thừa nhận
có sự quan hệ chặt chẽ giữa Dao động Nam và sự thay đổi về nhiệt độ bề mặt nước
biển trên khu vực Xích Đạo đông Thái Bình Dương. Mối quan hệ này thể hiện sự
tương tác giữa đại dương và khí quyển mà biểu hiện của nó chính là hiện tượng


hoạt động dự báo mùa ở nhiều trung tâm thông thường phụ thuộc vào sự tổng hợp
các thông tin được cung cấp bởi các công cụ dự báo thống kê và mô hình động lực
[36].
Phương pháp thống kê thực nghiệm phụ thuộc vào mối quan hệ giữa yếu tố
dự báo với các nhân tố dự báo. Nhân tố dự báo có thể là các quan trắc hiện tại và
quá khứ hoặc các trường tái phân tích khí quyển, đại dương (SST, SOI, MEI ...),
hoặc cũng có thể là các trường dự báo của các mô hình khí hậu toàn cầu (hạ thấp
qui mô thống kê - Statistical Downscaling). Mối quan hệ giữa yếu tố dự báo với các
nhân tố dự báo được xây dựng dựa trên các tập số liệu lịch sử và giả thiết rằng mối
quan hệ đó vẫn duy trì trong tương lai. Các công cụ phân tích thống kê khác nhau
như: phân tích tương quan, hồi quy, xác suất có điều kiện, hàm phân biệt, phân tích
chuỗi thời gian …được sử dụng nhằm nắm bắt được tính chất vật lý và các quá trình
động lực trong hệ thống khí hậu. Ưu điểm của cách tiếp cận này đó là quá trình tính
toán trong các mô hình không cần công hiệu máy tính lớn, đơn giản, dễ áp dụng
trong thực tiễn, kết quả dự báo mang tính khách quan, tuân theo một quy tắc nhất
định. Ban đầu, hướng tiếp cận này không thực sự thành công, nhưng với sự gia
tăng hiểu biết về hiện tượng ENSO và các hình thế thời tiết khác đã giúp cho
phương pháp này đáng tin cậy hơn [ 36]. Tuy nhiên, cách tiếp cận này tồn tại một
số điểm như: chỉ đơn thuần dựa vào mối quan hệ tuyến tính, không biểu diễn
trực tiếp quan hệ vật lý giữa nhân tố dự báo và yếu tố dự báo, các điều kiện khí
hậu chưa từng xảy ra không được xét đến trong quá trình dự báo, và kết quả dự
báo phụ thuộc nhiều vào độ dài chuỗi số liệu.
Phương pháp động lực là hướng nghiên cứu mô phỏng khí hậu bằng mô hình
số. Để biểu diễn các quan hệ vật lý giữa các yếu tố, người ta xây dựng các mô hình
số dựa trên mối tương tác vật lý của sự chuyển động. Phát triển sớm nhất của loại
mô hình này là mô hình hoàn lưu chung khí quyển (AGCM), sau đó, do sự ảnh
hưởng quan trọng của đại dương đối với hệ thống khí hậu nên đã lồng ghép mô hình

6


7


1.2. Các nghiên cứu trên thế giới
Từ những điểm mạnh, điểm yếu của phương pháp thống kê và phương pháp
mô hình số như đã trình bày ở trên, đã có nhiều quan điểm cho rằng cách giải quyết
tối ưu trong trường hợp này là kết hợp cả hai phương pháp để tận dụng điểm mạnh
và hạn chế yếu điểm của mỗi phương pháp. Chính vì vậy, đã có nhiều nghiên cứu
dự báo mưa mùa theo hướng tiếp cận bằng phương pháp thống kê truyền thống
hoặc kết hợp cả động lực và thống kê nhằm tăng chất lượng dự báo.
Hướng tiếp cận kết hợp cả động lực và thống kê bao gồm: 1) Thống kê sau
mô hình (MOS): Dựa trên mối quan hệ thống kê giữa sản phẩm dự báo mưa
(hindcast) của các mô hình động lực và số liệu quan trắc lượng mưa, xem sản phẩm
dự báo của mô hình động lực như là các nhân tố dự báo. 2) Hạ thấp qui mô thống
kê (Statistical Downscaling): Dựa trên mối quan hệ thống kê giữa số liệu quan trắc
mưa và các trường tái phân tích, coi dự báo của GCM là hoàn hảo và sử dụng chúng
như là nhân tố dự báo để xác định yếu tố dự báo cho tương lai. 3) So sánh sản phẩm
dự báo mưa (hindcast) của cả 2 phương pháp thống kê và động lực để chọn mô hình
phù hợp nhất phục vụ công tác dự báo nghiệp vụ. Chi tiết về các phương pháp này
được trình bày trong các nghiên cứu của Pai và CS. 2006, Lim và CS. 2010,
Rajeevan và CS. 2007, Liew và CS. 2009. Sau đây khái quát một số nghiên cứu
điển hình theo hướng động lực và thống kê.
Năm 2011, trong nghiên cứu dự báo mưa mùa cho khu vực châu Phi, Anne
Rourke đã đánh giá kỹ năng mô phỏng lượng mưa mùa bằng cả 2 phương pháp
động lực và thống kê đối với từng vùng, từng mùa. Trên cơ sở đó đã chọn được mô
hình phù hợp nhất được áp dụng đối với từng mùa và từng khu vực nhỏ trong vùng
nghiên cứu [24].
Indira Kadel năm 2012 đã sử dụng phương pháp Downscaling thống kê để dự
báo mưa mùa cho khu vực Nepal của Ấn Độ, trong đó, nhân tố dự báo được chọn từ
bộ số liệu tái phân tích của NCEP/NCAR về tham số khí quyển đại, dương thời kỳ

Hình 1.2. Biến trình lượng mưa tháng theo quan trắc và theo mô phỏng

9


Từ hình 1.2 nhận thấy kết quả quan trắc và mô phỏng là khá tương đồng đối
với các tháng có lượng mưa không lớn, tuy nhiên do chỉ xét duy nhất quá trình tự
hồi quy của chuỗi lượng mưa nên mô hình không thể nắm bắt được những dị
thường về lượng mưa, đây là điểm hạn chế lớn nhất trong các nghiên cứu này.
Cũng trong năm 2006, V.K. Somvanshi và nnk đã sử dụng phương pháp
mạng thần kinh nhân tạo (ANN) và mô hình ARIMA để dự báo tổng lượng mưa
hàng năm cho khu vực Ấn Độ phục vụ công tác quản lý tài nguyên nước. Trong
nghiên cứu này, các tác giả đã sử dụng chuỗi tổng lượng mưa hàng năm của vùng
Hyderabad thuộc Ấn Độ có độ dài chuổi là 104 năm (1901 – 2003), trong đó 93
năm đầu được dùng để xây dựng mô hình, 10 năm còn lại được sử dụng để kiểm
định mô hình. Từ kết quả tính toán, các tác giả nhận thấy việc áp dụng phương pháp
ANN và mô hình ARIMA trong dự báo hạn dài ở khu vực Hyderabad là khá phù
hợp và có thể áp dụng để phát triển cho các vùng khác thuộc Ấn Độ. Kết quả mô
phỏng mưa từ phương pháp ANN và từ mô hình ARIMA được thể hiện ở hình 1.3
[35].

ARIMA trên chuỗi phụ thuộc

ARIMA trên chuỗi độc lập

ANN trên chuỗi phụ thuộc

ANN trên chuỗi độc lập

10

Mô hình động thái ARIMA đa biến (Multi-input Transfer Function models)

12


Trên cơ sở nhận dạng và xác định các tham số trong các mô hình được trình
bày ở bảng 1.2, các tác giả đã kiểm định các mô hình để chọn ra mô hình tốt nhất,
phù hợp cho mỗi vùng trong khu vực nghiên cứu. Kết quả được trình bày trong
bảng 1.3 [18].
Bảng 1.3. So sánh sai số quân phương (RMSE) từ các mô hình được tính toán trên
số liệu phụ thuộc (In-sample) và số liệu độc lập (Out-sample)[18]

Từ bảng 1.3 nhận thấy khi có sự tham gia của các biến về chỉ số ENSO ở các
vùng NINO vào mô hình động thái ARIMA thì sai số của mô hình đã giảm đáng kể
so với trường hợp chỉ xét riêng thành phần tự hồi quy và trung bình trượt trong mô
hình ARIMA.
1.3. Các nghiên cứu ở trong nƣớc
Ở Việt Nam hiện nay đang sử dụng các mô hình thống kê để dự báo mưa hạn
mùa, các thông tin dự báo được cập nhật hàng tháng trên trang Web của Viện Khoa
học Khí tượng Thủy Văn và Môi trường () và Trung tâm Khí
tượng

Thủy

văn

Trung

Ương


tượng Thủy Văn và Môi trường.
Cũng theo hướng tiếp cận này còn có một số công trình nghiên cứu khác
như: Lương Văn Việt, năm 2006, đã dự báo mưa, nhiệt và ẩm cho khu vực Nam Bộ
[16]; Lê Đức Cương, năm 2001, đã thử nghiệm dự báo số lượng xoáy thuận nhiệt
đới hoạt động trên biển Đông và dọc bờ biển Việt Nam [2]; Phan Thị Lê Hằng năm
2008 đã thử nghiệm khả năng dự báo số đợt nắng nóng, rét đậm, rét hại cho các
trạm đại diện trên lãnh thổ Việt Nam [4]. Hầu hết các nghiên cứu này các tác giả
đều đã sử dụng nhân tố dự báo là các chỉ số giám sát ENSO.
2) Nhóm công trình nghiên cứu theo phương pháp mô hình số

14


Việc nghiên cứu sử dụng các mô hình số trị trong dự báo khí hậu mùa ở nước
ta mới bắt đầu được thực hiện từ đầu những năm 2000, đến nay đã có nhiều công
trình nghiên cứu mô phỏng mùa các trường khí hậu bằng các mô hình số trị. Nội
dung của các công trình nghiên cứu này từng bước giải quyết một số vấn đề như:
tìm hiểu về cấu trúc của mô hình; nghiên cứu ảnh hưởng của kích thước, vị trí miền
tính và độ phân giải của mô hình, ảnh hưởng của các điều kiện biên và điều kiện
ban đầu, ảnh hưởng của việc tham số hóa quá trình vật lý ... đến khả năng mô phỏng
khí hậu mùa từ các mô hình khí hậu khu vực, từ đó, đánh giá khả năng ứng dụng
mô hình khí hậu khu vực vào điều kiện Việt Nam. Chi tiết về hướng nghiên cứu này
đã được Phan Văn Tân và CS trình bày trong Báo cáo tổng kết đề tài cấp Đại học
Quốc gia (QG.TĐ.06.05) [11]. Về nhóm các công trình nghiên cứu theo phương
pháp mô hình số ở Việt Nam đã được tổng quan khá chi tiết và đầy đủ trong luận
văn thạc sỹ của Nguyễn Đăng Mậu (2012).
3) Nhóm công trình nghiên cứu theo phương pháp hạ thấp qui mô thống kê
(Statistical Downscaling), đây là hướng nghiên cứu kết hợp của cả 2 phương pháp,
thống kê và mô hình số. Trong đó nhân tố dự báo là các trường dự báo của mô hình
GCM được tổng hợp, phân tích lại và giả thiết rằng dự báo này là hoàn hảo. Một



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status