Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của việt nam - Pdf 31

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

BÁO CÁO MÔN HỌC
PHƯƠNG PHÁP TOÁN TRONG TIN HỌC

ĐỀ TÀI
MÔ HÌNH PHÂN TÍCH CHUỖI THỜI GIAN ARMA VÀ
ỨNG DỤNG TRONG DỰ BÁO GDP CỦA VIỆT NAM
Giảng viên hướng dẫn: PGS.TS. Đỗ Văn Nhơn
MSHV: CH1002007
Lớp cao học khóa 5


Báo cáo môn học – Phương pháp toán trong tin học

Hà Nội, Tháng 12/2010

Mục lục

Lời cảm ơn
Em xin bày tỏ lòng biết ơn chân thành đối với PGS.TS.Trần Văn Nhơn, người
đã dạy chúng em chuyên đề “Phương pháp toán trong tin học”. Những kiến thức
Thầy truyền đạt cho chúng em đã giúp em có thể hiểu một cách đầy đủ về môn học,
có ý nghĩa thiết thực cho công tác chuyên môn, đồng thời tạo điều kiện cho chúng em
hoàn thành tốt chương trình học.
Vì điều kiện thời gian và khả năng có hạn nên tiểu luận không thể tránh khỏi
những thiếu sót. Em rất mong nhận được ý kiến đóng góp của thầy đề tiểu luận được
hoàn thiện.
Xin chúc Thầy cùng các Thầy cô trong Trường Đại học Công nghệ Thông
tin - Đại học Quốc gia Thành phố Hồ Chí Minh lời chúc sức khoẻ, hạnh phúc và


Báo cáo môn học – Phương pháp toán trong tin học

sử dụng số liệu về GDP của Việt Nam để kiểm chứng. Kết quả thu được rất khả quan.
Độ chính xác của dự báo là đáng tin cậy.
Tiểu luận ngoài phần mở đầu và kết luận, sẽ có 3 chương:
Chương 1: Các kiến thức cơ bản về chuỗi thời gian.
Chương 2: Giới thiệu sơ bộ về phần mềm EViews
Chương 3: Ứng dụng phân tích thời gian để dự báo GDP của Việt Nam

Chương 1: Các kiến thức cơ bản về chuỗi thời gian
1. Khái niệm và các thsi dụ về chuối thời gian.
Mục tiêu của các phân tích trong kinh tế, tài chính ứng dụng là chỉ ra các quy
luật, đưa ra các cảnh báo, dự báo để đưa ra các quyết định. Để dự báo được đòi hỏi
phái cố một số lượng các quan sát cho các đại lượng thích hợp để nghiên cứu mối liên
hệ giữa các đại lượng này. Các quan sát này có thể được tiến hành đều đặt qua từng
thời kỳ chặng hạn theo từng tháng, theo từng Quý hoặc hàng năm hoặc chỉ trong
những thời điểm đặc biệt như thời kỳ xẩy ra khủng hoảng kinh tế. Dãy các quan sát
này được gọi là chuỗi thời gian. Như vậy, chỗi thời gian là tập hợp các quan sát mà
mỗi quan sát ghi nhận tại thời điểm t với t Є T. Chuỗi thời gian được gọi là rời rạc nếu
như T là tập rời rạc (Thí dụ các quan sát được thực hiện cách nhau một khoảng thời
gian đều đặn như là doanh thu cước phí internet hàng tháng của một nhà cung cấp
dịch vụ internet từ tháng 12 năm 1997 đến tháng 12 năm 2010). Trái lại nếu T là một
khoảng thì chuỗi được gọi là liên tục. Biểu đồ ghi nhịp tim cảu một bệnh nhân trong 2
giờ là 1 ví dụ minh hoa cho chỗi thời gian liên tục với T = [0, 2].
2. Mục đích của việc phân tích chuỗi thời gian.
Tất cả các kỹ thuật dự báo chuỗi thời gian dựa trên giả định là có một mẫu hình
cơ bản tiềm ẩn trong các số liệu đang nghiên cứu cùng với các yếu tố ngẫu nghiên ảnh
hưởng lên hệ thống đang xét. Công việc chính của phân tích chuỗi thời gian là nghiên
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam


Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

5


Báo cáo môn học – Phương pháp toán trong tin học

3. Dự báo
Dự báo là ước lượng các giá trị tương lai y t+h với h ≥ 1 của một biến ngẫu nhiên
dự trên các quan sát và các giá trị quá khú của nó y 1, y2, y3, ,...yn . Dự báo yt+h thường
được ký hiệu là ŷt(h).
Chất lượng của dự báo phụ thuộc vào nhiều yếu tố. Trước hết nó phụ thuộc vào
xu hướng phát triển của chuỗi thời gian. nuếu chuỗi thời gian là hàm “đều đặn” theo
thời gian thì càng dễ dự báo. Ví dụ tiến trình phát triển kinh tế không có những biết
động đặc biệt như khủng hoảng kinh tế thì các dễ dự báo tổng sản phẩn quốc nội GDP
cho những năm sau. Cho đến nay, các phương pháp dự báo chuỗi thời gian chưa có
các nghiên cứu nào cho phép dự báo được giá trị đột biến. Tính chính xác của dự báo
chuỗi thời gian còn phụ thuộc xa gần của thời gian. Dự báo các giá trị càng gần hiện
tại càng chính xác. Như vậy việc ước lượng GDP cho năm sau, quý sau sẽ chính xác
hơn việc ước lượng GDP cho 10 năm sau.
Ngoài ra, phương pháp ước lượng, phần mềm hỗ trợ cũng đóng vai trò hết sức
quan trọng khi thực hiện công tác dự báo. Nếu chỉ có phương pháp và sử dụng công
cụ là giấy trắng và bút chì thì sự gian khó sẽ vô cùng khi chúng ta muốn làm dự báo
chuỗi thời gian, tuy nhiên bằng sự hỗ trợ của các phần mềm phân tích chuyên biệt
chẳng hạn như EVIEWS thì việc dự báo thực hiện khá dễ dàng.
Trong phần tiếp theo em xin trình bày những định nghĩa cơ bản nhất cần dùng
cho việc trình bày báo cáo. Để thuận tiện cho việc trình bày trong nội dung báo cáo
em xin bỏ qua các chứng minh phức tạp về các định lý, các mệnh đề liên quan.
4. Qúa trình dừng và phân tích hệ số tự tương quan

Định nghĩa 4.1.5: Chuỗi thời gian {Xt} là tuyến tính nếu nó có thể biểu diễn
dưới dạng:


Xt =



ψj Zt-j

j:= −∞

Với mọi t, trong đó Zt là dẫy số có phân phối nhiễu trắng (WN(0,σ2 )), còn ψi


là dãy các hằng số với



ψj < ∞.

j:= −∞

4.2 Hệ số tương quan và tự tương quan mẫu
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

7


Báo cáo môn học – Phương pháp toán trong tin học

;
∑i
∑ yi Là trung bình số học của các số đo xi, yi tương ứng và
n i =1
n i =1

1 n 2
1 n
1 n
x i ; Y 2 = ∑ y 2i ; XY = ∑ x i y

n i =1
n i =1
n i =1

i

4.2.2 Hệ số tự tương quan mẫu
Giả sử có quan sát {xt} của chuỗi thời gian {Xt}. Khi đó ước lượng của hệ số tự
hiệp phương sai γx(h) là hệ số tự hiệp phương sai mẫu ϒˆ x(h) cho bởi:
n− h
ˆϒ(h) = 1 ∑ x − X
n t =1 t + h

(

)(x −X)
t

Và hệ số tự tương quan mẫu là

n
n

(*)

Thì ρˆ (k ) được gọi là xấp xỉ 0
Nếu ρˆ (k ) không thoả mãn bất đẳng thức này, ta nói ρˆ (k ) khác 0 thực sự
Quy tắc 4.2.7.1 Nếu các hệ số tự tương quan ρˆ (k ) của một chuỗi thoả mãn bất
đẳng thức (*) ở định nghĩa 4.2.7 thì ta xem rằng dãy số liệu đã cho được phân bổ một
cách ngẫu nhiên. Ngược lại, dù chỉ một giá trị ρˆ (k ) không thoả mãn bất đẳng thức (*)
thì trong chuỗi đang xét nhất thiết phải có tồn tại một mối liên kết nào đó.
(Việt tính toán những hệ số tự tương quan này sẽ rất khó khăn, nếu chúng ta
không sử dụng phần mềm hỗ trợ, với sự trợ giúp của phần mềm Eviews chúng ta có
thể kiểm định khá dễ dàng bằng cách chạy lệnh và quan sát các giá trị ρˆ (k ) nằm
trong dài phân cách giởi hạn ở mức ý nghĩa 95%, như hình ảnh minh họa dưới đây)

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

9


Báo cáo môn học – Phương pháp toán trong tin học

Hình 1: “quan sát” Hệ số tự tương quan và Hệ số tương quan riêng của một
chuỗi số liệu theo thời gian
Chú ý: Nếu việc phân tích các hệ số tự tương quan chỉ ra rằng dãy số đang xét là
ngẫu nhiên, thì giữa các giá trị của số liệu không tồn tại một mối liên kết nào cả. Do
vậy có mô hình hoá để tìm xu thế tiềm ẩn trong nó cũgn vô ích và ta dừng việc phân
tích chuỗi thời gian.
4.2.3 Hệ số tự tương quan riêng

..........,Xn) là dự báo cho Xn+h có sai số bình phương trung bình nhỏ nhất. Ta ký hiệu
dự báo tốt nhất này là P nXn+h . Người ta chứng minh được rằng trong trường hợp {X t}
có phân phối chuẩn thì ta có thể chọn g là một tổ hợp tuyến tính theo cá biến x 1,
x2,..........xn.
Mặt khác, phần lớn các chuỗi thời gian trong thực tế đều có phân phối chuẩn
hoặc xấp xỉ chuẩn, hoặc chúng ta có thể biến đổi chúng trở thành chuỗi thời gian có
phân phối gần chuẩn, vì vậy lẽ tự nhiên ta giả thiết.
PnXn+h = a0 + a1Xn + ...........+ anX1
Vấn đề bây giờ là tìm các hệ số a0, a1.............. an
5.2 Quá trình tự hồi quy AR (Auto Regressive):
Qúa trình tự hội quy cấp p (ký hiệu tắt AR(p) ) là quá trình mà các số liệu của chuỗi
thời gian sẽ liên hệ với nhau theo biểu thức:
Xt = Φ1 Xt-1 + Φ2 Xt-2 + Φ3 Xt-3 + .....+ Φp Xt-p

+ Zt

Trong đó:
Φ1 , Φ2 , Φ3 ... Φp : là các hệ số của phương trình
Còn Zt là ồn trắng ( hay là nhiều trắng - white noise ), ký hiệu là WN(0,σ2), nghĩa
là chuỗi độc lập, cùng phân phối với trung bình zero và phương sai σ2. Ta gọi chuỗi
số liệu Xt là tự hồi quy vì giá trị hiện tại của nó được truy hồi từ các giá trị Xt-1 , Xt-2
....,

Xt-p đứng trước nó. Ồn trắng Zt biểu thị các yếu tố ngẫu nhiên tham gia vào mà

không thể giải thích được bằng mô hình.
Các giá trị Φ1 , Φ2 , Φ3 ... Φp là các hệ số bằng số mô ta mối quan hệ giữa các
giá trị thực tại với các giá trị trước nó.
Giá trị của p là cấp của quá trình tự hồi quy AR(p).
5.3 Quá trình trung bình trượt MA(q):

(và nếu có thì giá trị của q bậc bằng bao nhiêu) hay một quá trình ARMA (và nếu có
thì các giá trị của p và q bằng bao nhiêu). Phương pháp của hai nhà khoa học BoxJenkins sẽ giúp ta giải quyết vấn đề này.
Bước 1: Nhận dạng và ước lượng
-

Vẽ chuỗi số liệu lên mặt phẳng tọa độ và xét các đặc trưng chính của chúng,
trong đó phải chú ý đến xu thế, thành phần theo mùa, thời điểm thay đổi dáng
điệu lớn, các quan sát dị thường.

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

12


Báo cáo môn học – Phương pháp toán trong tin học

-

Vẽ đồ thị hàm tự tương quan và hàm tự tương quan riêng để, tìm các giá trị
thích hợp của p và q.

Bước 2: Kiểm tra: Sau khi đã lựa chọn được mô hình ARIMA và ước lượng được
các tham số p, q ở bước 1, ta phải kiểm tra xem mô hình đó có phù hợp với dữ liệu
quan sát được hay không bởi rất có thể có một mô hình ARIMA khác cũng phù
hợp với các dự liệu quan sát. Cách kiểm tra là xem sai số bình phương (R bình
phương). Cuối cùng ta sẽ lựa chọn mô hình nào có sai số bình phương nhỏ nhất.
Việc kiểm tra nhận dạng mô hình ở bước này nhiều khi mang tính “nghệ thuật”,
phải mày mò và tốn nhiều công sức mặc dù có những nguyên tắc nhất định.
Bước 3: Dự báo: Một trong số các lý do về tính phổ biến của phương pháp lập mô
hình ARIMA là sự khá chính xác của nó khi dự báo. Tính chính xác của dự báo

14


Báo cáo môn học – Phương pháp toán trong tin học



Dự báo doanh số



Phân tích chi phí và dự báo



Dự báo các chỉ tiêu kinh tế lượng



Mô phỏng



Phân tích và đánh giá số liệu khoa học



Phân tích tài chính, phân tích chuỗi thời gian và dữ liệu dạng bảng.

Eviews chạy trong môi trường Window được phát triển bởi công ty QMS

các mô hình phân tích thông qua Menu và các câu lệnh thân thiện với người sử
dụng Window như: New, Open, save, save as … .
• Tính toán dữ liệu (Data Computing). Eview có thể cung cấp công thức tính
toán tương đối phức tạp, người sử dụng phải có những am hiểu nhất định về
mắt ý nghĩa thống kê của công thức này.
• Phân tích thống kê (Satatistical Analysis): Eviews có thể thực hiện được
các kỹ thuật liệt kê ở trên.
Các thuộc tính quan trọng của chương trình Eviews
Đối tượng: Đối tượng trong Eview là các chuỗi số liệu ( series), các biểu thức toán
học, mô hình, ma trận, biến số, bảng biểu, đồ thị.v.v. Mỗi một đối tượng được sử
dụng tương ứng thông qua các chức năng của menu trên của sổ chương trình.
Cửa số chính: Xuất hiện ngay sau khi khởi động Eviews, gồm một thanh tiêu đề, một
menu chính, cửa sổ lệnh, dòng trạng thái và vùng làm việc. Vùng làm việc sẽ xuất
hiện ở chính giữa cửa sổ chính và hiển thị khi các đối tượng được tạo ra.
Cửa sổ lệnh: Xuật hiện phía dưới thanh Menu trong cửa sổ chính, được dùng để tiến
hành những câu lệnh đơn giản.
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

16


Báo cáo môn học – Phương pháp toán trong tin học

Cửa sổ tập tin làm việc (workfile window): Cửa sổ xuất hiện khi tại của sổ chính ta
click chuột vào Menu File/New/Workfile. Khi đưa các mô hình vào chạy trên Eviews
chúng ta cần thiết lập dữ liệu cho mô hình bằng cách nhập dữ liệu vào từ cửa số
Workfile. Cửa sổ này chính là bước đầu tiên để người dùng bắt đầu với Eviews.
Cửa số Group (Group window): Cửa sổ xuất hiện khi chọn cùng lúc nhiều biến số (2
biến trở lên) trên cửa sổ Workfile. Sau đó chọn Open/ as Group. Trong cửa sổ này dữ
liệu liệu xuất hiện trên các bảng tính khác nhau, và chúng ta có thể quan sát chúng

Quick Options; Window Help
Nhấp chuột vào mỗi một trong những lựa chọn này và kiểm tra các Menu con xuất
hiện ở phía dưới.
Khi mở EViews lần đầu tiên, cửa sổ chính còn trống vì chưa xác định tập tin làm việc
nào (workfile) để sử dụng .

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

18


Báo cáo môn học – Phương pháp toán trong tin học

Mở tập tin làm việc (Workfile) đã lưu giữ từ trước: Từ File/Open/Eviews
Workfile; một màn hình mở ra, trên đó liệt kê các tập tin trong thư mục mặc định
(default folder). Nếu thư mục mặc định không phải là thư mục mà người sử dụng
mong muốn, thì có thể tìm trong các thư mục cho tới khi tìm ra thư mục mà người sử
dụng muốn dùng

Để chỉ ra các workfile trên EViews, dòng "Files of type" cần xác định Workfile
(*.wf1).
Vì người sử dụng dự định sẽ làm việc với thư mục này thường xuyên thì nhấp chuột
để đánh dấu vào ô vuông giúp cập nhật thư mục mặc định ở góc trái-phiá dưới cừa sổ
Open như trên đây. Lần sau, khi khởi động EViews, khi thực hiện thao tác
File/Open/Eviews Workfile sẽ tự động chỉ tới thư mục này.

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

19



Nhập dữ liệu từ các phần mềm khác

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

21


Báo cáo môn học – Phương pháp toán trong tin học

Dữ liệu có thể được nhập vào từ các tập tin Lotus, Excel, SPSS, MINITAB hoặc
ASCII. Trong mỗi trường hợp đều dùng phương pháp như nhau. Dữ liệu này nằm
trong một tập tin Excel có tên DEMO.xls.
Người sử dụng cần kiểm tra lại tập tin này bằng cách mở file nay ra để xác định
- Tập tin này có bao nhiêu biến,
- Có phải các tên của biến xuất hiện ở phiá trên của tập tin không ,
- Khảng cách giữa các cột dữ liệu
- Có bao nhiêu quan sát (bao nhiêu hàng dữ liệu).
Sau đó đóng tập tin này lại.

Trở lại với menu chính : nhấn File/New/Workfile. Bằng việc nhấp New trong chuỗi
này chúng ta báo cho EViews rằng chúng ta có ý định phát triển một workfile mới.
Việc này làm cho EViews mở ra một hộp thoại để chúng ta xác định các thuộc tính
nhất định của dữ liệu, nhấp vào ô Workfile structure type "unstructured/ undated,"
và chúng ta đánh máy 27 vào ô "observation.". Tại ô Names (optional) nếu ta gõ tên
Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

22



Xem và kiểm tra dữ liệu: xừ dụng phím Ctrl và nhấp chuột vào các biến gdp, M1,
obs, pr, rp sau đó nhấp đúp vào vùng đánh dấu bảng dữ liệu sẽ được hiện ra như sau:

Mô hình phân tích chuỗi thời gian ARMA và ứng dụng trong dự báo GDP của Việt Nam

25



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status