ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-------------------
NGUYỄN ĐỨC TRƯỜNG
MÔ HÌNH TUYẾN TÍNH VÀ PHI TUYẾN
ĐỂ DỰ BÁO DẢI RỘNG CỦA HOÁN ĐỔI TỈ GIÁ
LUẬN VĂN THẠC SĨ TOÁN HỌC
Hà Nội, Năm 2014
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-------------------
NGUYỄN ĐỨC TRƯỜNG
MÔ HÌNH TUYẾN TÍNH VÀ PHI TUYẾN
ĐỂ DỰ BÁO DẢI RỘNG CỦA HOÁN ĐỔI TỈ GIÁ
Chuyên ngành : Lý thuyết xác suất và thống kê toán học
Mã số : 60460106
LUẬN VĂN THẠC SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
GS .TS. NGUYỄN HỮU DƯ
1.3
Mô hình NN (Nearest-Neighbours) . . . . . . . . . . .
10
1.4
Kiểm định Diebold - Mariano . . . . . . . . . . . . . .
11
2 Mô hình vector tự hồi quy chuyển đổi trơn STVAR
14
2.1
Mô hình STVAR lý thuyết . . . . . . . . . . . . . . . .
14
2.2
Kiểm tra tính tuyến tính của mô hình STVAR . . . . .
15
2.2.1
Thuật toán ước lượng mô hình STVAR . . . . .
21
3.2.2
Thực hành ước lượng . . . . . . . . . . . . . . .
22
3
4 Một số vấn đề dự báo
4.1
4.2
25
Dự báo . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
4.1.1
Dự báo bằng mô hình STVAR . . . . . . . . . .
25
Thầy, người đã chỉ dạy tác giả những kiến thức, kinh nghiệm trong
học tập, nghiên cứu khoa học và các bài học trong cuộc sống.
Tác giả xin gửi lời cảm ơn chân thành tới Ban chủ nhiệm khoa
Toán - Cơ - Tin, Phòng sau đại học, trường Đại học Khoa học Tự
nhiên - Đại học Quốc Gia Hà Nội. Tác giả xin gửi lời cảm ơn chân
thành tới các Thầy, Cô giáo trong Bộ môn Lý thuyết xác suất và thống
kê toán, khoa Toán - Cơ - Tin đã nhiệt tình giảng dạy trong suốt quá
trình học tập và xin gửi lời cảm ơn chân thành tới gia đình, bạn bè đã
góp ý, ủng hộ và động viên tác giả trong quá trình học tập và hoàn
thành luận văn.
Mặc dù đã có nhiều cố gắng nhưng vì năng lực còn hạn chế nên
luận văn chắc chắn không thể tránh khỏi nhưng thiếu sót. Tác giả rất
mong nhận được những lời chỉ bảo quý báu của các thầy cô giáo và
góp ý của bạn đọc để khóa luận được hoàn thiên hơn.
Hà nội, tháng 7 năm 2014.
5
Mở đầu
Đề tài này nghiên cứu về các mô hình tuyến tính và phi tuyến tính
sử dụng để dự báo tình trạng biến đổi tỷ giá lãi suất của US và UK.
Chúng ta tìm cách loại bỏ yếu tố tuyến tính cho sự biến đổi tỷ giá của
US và UK bằng cách tạo ra một cơ chế ưu tiên, với sự chuyển đổi từ
cơ chế này sang cơ chế kia được quy định bởi một yếu tố đại diện, là
một biến nào đó có trong mô hình. Khi đó chúng ta thu được một mô
hình "Véc tơ tự hồi quy chuyển đổi trơn" (STVAR).
Cùng một lúc, ta sử dụng các mô hình khác như mô hình "NearestNeighbours" (NN Model), VAR (mô hình véc tơ tự hồi quy), AR (mô
hiệu quả dự báo sẽ suy giảm nhanh chóng đối với trục hoành tăng lên.
Tại trục hoành dài hơn, mô hình STVAR cung cấp những dự báo tốt
nhất, còn mô hình NN thì xếp hạng sau cùng.
Để xây dựng và đánh giá khả năng dự báo đó của mô hình STVAR,
tác giả đã sử dụng các hệ thống kiểm định Lagrange - Multiplier, kiểm
định Deibold - Mariano... và các thuật toán ước lượng mô hình hồi
quy có chế độ chuyển đổi của Terasvirta, ngoài ra còn có sự hỗ trợ
của phần mềm Eviews, Excel... Luận văn được chia thành 5 chương:
Chương 1 trình bày kiến thức chuẩn bị, bao gồm các mô hình kinh tế
lượng đơn giản như AR, VAR, NN và phép kiểm định Diebold-Mariano
để so sánh khả năng dự báo của hai mô hình hồi quy bất kỳ. Chương
7
2 trình bày mô hình STVAR lý thuyết và phép kiểm tra tuyến tính để
làm cơ sở lựa chọn biến chuyển đổi st . Chương 3 trình bày thuật toán
ước lượng mô hình STVAR và ước lượng thử một mô hình STVAR
cho 200 quan sát đầu tiên của Phụ lục 1. Chương 4 bao gồm các dự
báo cho 30 quan sát tiếp theo (từ quan sát 201 đến 230) của cả 4 mô
hình STVAR, VAR, AR, NN và đưa ra kết quả so sánh khả năng dự
báo của các mô hình trên với nhau. Chương 5 là phần kết luận.
8
Chương 1
Kiến thức chuẩn bị
Trong chương này tác giả sẽ đưa ra một số mô hình kinh tế lượng và
pháp xây dựng một mô hình phương trình đồng thời, ở đó các biến
nội sinh sẽ được xem xét cùng với nhau. Từng biến nội sinh sẽ được
giải thích qua các trễ của chính nó và các biến nội sinh còn lại.
Mô hình VAR trên cơ sở đó được xây dựng như sau:
p
Yt = β +
Φi .Yt−i + εt ,
i=1
ở đó, Yt , β là vector (k × 1), ma trận Φi là ma trận (k × k) còn εt là sai
số ngẫu nhiên của thời điểm t. Mô hình VAR có thể ước lượng bằng
phần mềm kinh tế lượng Eview. Một ví dụ về ước lượng của mô hình
VAR cho 2 biến phụ thuộc X và Y với bộ số liệu 200 quan sát cho ở
phụ lục 1. Ta đã ước lượng được mô hình với trễ bằng 2 như sau:
Xt = 1.06532×Xt−1 −0.10987×Xt−2 +0.00985×Yt−1 −0.01549×Yt−2 +0.36316,
Yt = 0.01598×Xt−1 −0.00335×Xt−2 +0.85498×Yt−1 +0.09312×Yt−2 +0.29919.
Ngoài cách ước lượng đồng thời cho cả mô hình, ta còn có thể ước
lượng riêng từng biến X và Y giống như ước lượng mô hình AR. Kết
quả thu được hoàn toàn tương tự.
1.3
Mô hình NN (Nearest-Neighbours)
Mô hình này sử dụng thông tin từ các số liệu của lân cận gần nhất
để tính toán một bình quân có trọng số của bước kế tiếp. Đầu tiên, ta
10
Kiểm định này cho phép ta kiểm tra hai mô hình hồi quy có dự
báo tương đương hay không.
Với t là một thời điểm nào đó trong tương lai, và giả sử cả hai mô
hình cần so sánh đã dự báo đến thời điểm t. Bước đầu tiên ta định
nghĩa dt = [g(eit|t−h ) − g(ejt|t−h )], gọi là hiệu số của các giá trị tổn thất
tại thời điểm t, trong đó g là một hàm của sai số (ví dụ MSPE hoặc là
MAPE). Giả thuyết rằng độ chính xác của hai mô hình là như nhau,
thì E[g(eit|t−h )] = E[g(ejt|t−h )] hoặc tương đương điều kiện của hiệu
số các giá trị tổn thất E[dt ] = 0. (h ở đây là số bước nhẩy lên phía
11
trước, h có thể bằng 1,2 ...). Cho:
1
d=
P
R+P +h−1
dt ,
t=R+h
biểu thị cho trung bình hiệu số các giá trị tổn thất qua các quan sát
ứng với t = R + h, R + h + P − 1 , Ở đây có P điểm ngoài mẫu được
dự báo và R quan sát được sử dụng cho ước lượng ra mô hình. Phép
kiểm định Diebold - Mariano sau đây tiệm cận phân bố chuẩn hóa:
DM =
Gần đây Van Dijk và Franses (2003) lập luận rằng sử dụng kiểm
định DM và DM ∗ có thể không đạt yêu cầu cho một số trường hợp
mà số quan sát là rất lớn. Ví dụ trong dự báo hoán đổi tỉ giá, số lượng
quan sát lớn đã tạo ra tín hiệu thời gian trong việc dự báo. Van Dijk
và Franses (2003) thay đổi thống kê DM bằng thống kê có trọng số
cho các mẫu quan sát lớn. Trọng số theo nghĩa hiệu số các tổn thất
được cho bởi:
1
dw =
P
R+P +h−1
w (ωt )dt ,
t=R+h
12
ở đây (ωt ) là thông tin có sẵn ở thời điểm t. Cho Yt là biến để dự báo,
Van Dijk và Franses (2003)đã nghiên cứu hai phần riêng của wLT (ωt )
là:
wLT (ωt ) = 1 − Φ(Yt ),
trong đó Φ(Yt ) là hàm phân bố xác suất tập trung về bên trái của Yt ,
và wRT (ωt ) = Φ(yt ) là hàm phân bố xác suất tập trung vào bên phải
của Yt .
Để thỏa mãn thống kê kiểm định sẽ tiệm cận chuẩn nếu giả thuyết
là đúng, hàm trọng số w(ωt ) phải có đạo hàm bậc hai liên tục trên
khoảng thời gian [0, 1]. Thống kê DM có trọng số được tính xác định
như sau:
13
Chương 2
Mô hình vector tự hồi quy chuyển
đổi trơn STVAR
Chương này ta sẽ đưa ra mô hình STVAR lý thuyết, cách kiểm
tra sự tuyến tính của mô hình STVAR dựa trên một số kiểm định
Lagrange - Multiplier, kiểm định bề rộng hệ thống...
2.1
Mô hình STVAR lý thuyết
Ta định nghĩa một vector biến trạng thái Yt = [Y1,t , Y2,t , Y3,t , ..., Yk,t ]T .
Khi đó mô hình STVAR sẽ được cho bởi:
p
Yt =
β1 +
p
Φ1,i .Yt−i
i=1
× (1 − G(st ))+ β2 +
giữa hai chế độ với ý nghĩa rằng G(st ) thay đổi đơn điệu từ 0 đến
1 cùng với sự tăng lên của st , và đạt giá trị G(st ) = 0, 5 với st = c.
Tham số γ xác định sự trơn của hàm logistic trên, hay nó xác định
tốc độ thay đổi từ chế độ này sang chế độ khác. Khi γ → 0, hàm logic
bằng một hằng số, và khi γ → ∞, thì sự thay đổi của G(st ) = 0 đến
G(st ) = 1 là tức thời tại st = c.
2.2
Kiểm tra tính tuyến tính của mô hình STVAR
2.2.1
Thuật toán
Kiểm tra sự tuyến tính trong mô hình STVAR (2.1) sử dụng mô
hình biến đổi “logistic” là tương đương với kiểm định giả thuyết: H0 :
γ = 0 và đối thiết H1 : γ > 0. Để làm được điều này, định nghĩa:
wt = (Y1,t−1 ; . . . ; Y1,t−p ; Y2,t−1 ; ....; Y2,t−p ; ....; Yk,t−1 ; ...; Yk,t−p ) ,
và giả sử rằng biến thay đổi st là đã biết. Sau Luukkonen (1988),
phương trình kiểm tra tính tuyến tính là phương trình dựa trên xấp
xỷ Taylor đầu tiên của hàm biến đổi xung quanh γ = 0, đầu tiên ta
ước tính:
pk
Yit = βi0 +
βij wjt + εit ,
j=1
Sẽ là đơn giản hơn khi sử dụng kiểm định F của thống kê LM, được
cho bởi:
F = [(SSR0 − SSR1 )/pk]/[SSR1 /(T − (2pk + 1))].
Rõ ràng là bỏ qua hiệp phương sai thì có thể dẫn đến bác bỏ giả
thuyết tuyến tính. Do đó để giải quyết vấn đề này, ta sử dụng kiểm
định về hiệp phương sai mạnh của Wooldridge (1990-1991). Phép kiểm
định này có thể sử dụng không cần có xác định chính xác của hiệp
phương sai (xem Granger và Terasvirta, 1993). Để tính toán một hiệp
phương sai mạnh của thống kê kiểm định LM, ta làm như sau: Trước
hết ta ước lượng:
pk
Yit = βi0 +
βij .wjt + εit ,
j=1
và lưu phần dư là eit . Sau đó ta lùi lại biến hồi quy phụ st wjt trên wjt
và lưu phần dư là rjt . Cuối cùng, ta trở lại 1 bước trên eit rjt . Tổng
16
bình phương của lần quay lại cuối cùng chính là hiệp phương sai mạnh
của thống kê kiểm định LM.
Cả χ2 và F của thống kê kiểm định LM là tương đương trong việc
kiểm tra giả thuyết tuyến tính. Để kiểm tra giả thuyết H0 : γ = 0
trong tất cả các phương trình đồng thời, ta cần một hệ thống kiểm
tra rộng hơn. Tiếp theo, Weise (1999), định nghĩa Ω0 =
Ω1 =
Thống kê F-LM
1.097307
0.321303 1.049083
P-Values của F-LM
0.364703
0.984865 0.406060
Nhìn vào bảng giá trị mức xác suất p − values ta có thể thấy đối
với biến Xt−1 giả sử được chọn làm biến đại diện cho st thì giả thiết
17
tuyến tính, tức γ = 0 có thể bác bỏ khi xét hàm của X hay Z nhưng
tương đối khó bác bỏ khi xét hàm của Y.
Bằng cách này chúng ta có thể so sánh xem biến nào trong các trễ
của X, Y, Z có thể làm đại diện tốt nhất để quyết định tính phi tuyến
của mô hình STVAR.
18
Chương 3
Thực nghiệm ước lượng mô hình
STVAR
5.400000 6.000000 7.000000
Std. Dev.
0.781073 1.424269 2.841982
Skewness
0.987879 0.873866 0.970578
Kurtosis
4.421059 2.522931 3.769923
Jarque-Bera
49.35857 27.35137 36.34054
Probability
0.000000 0.000001 0.000000
Sum
1464.800 1570.000 2298.300
Sum Sq. Dev. 121.4048 403.6800 1607.296
Observations
Xt−1
0.364703 0.984865 0.406060
Yt−1
0.982434 0.669035 0.045154
Zt−1
0.415966 0.999335 0.000365
Xt−2
0.404355 0.998416 0.360811
Yt−2
0.957494 0.557124 0.023891
Zt−2
0.565095 0.999481 0.018520
Nhìn vào bảng giá trị p − values cho thống kê F của kiểm định
LM, ta có thể lựa chọn Zt−1 làm đại diện tốt nhất cho biến st vì xuất
hiện p − values = 0.000365 khi hồi quy hàm Z cho các yếu tố còn lại.
3.2
3.2.1
Kết quả từng bước ước lượng được lưu trong Phụ lục 2, tài liệu
đính kèm.
Ở đó, tác giả đã ước lượng được một bộ (γ, c) cho 200 quan sát,
cụ thể giá trị như sau:
γ = 1.0032810422 còn c = 11.4710999174.
Khi đó hàm:
G(Zt−1 ) = 1/(1+EXP (−1.003281×(Zt−1 −11.4710999)/2.84198206)).
Đồ thị của hàm G(Zt−1 ):
22
Hình 3.2: Đồ thị 2: G(Zt−1 )
Mô hình STVAR thu được:
X
1.022 0.130 0.001
1.345
X
t−1
t
2.841
1+e
1.531
0.978 −0.147 −0.163
Xt−1
+ 0.603 + −0.187 0.752 −0.025 × Yt−1
1.234
0.326 −0.002 0.094
Zt−1
0.077 Xt−2
báo tác giả ở chương 4 và của Lekkos và Milas, được trình bày trong
Phụ lục 4.
24
Chương 4
Một số vấn đề dự báo
Chương này tác giả sẽ tiến hành dự báo đồng thời cho các biến
bằng 4 mô hình STVAR, VAR, AR, và mô hình NN. Sau khi tiến hành
dự báo, ta sẽ so sánh hiệu quả dự báo của các mô hình với nhau, từ
đó thấy được đặc thù của mỗi mô hình trong các trường hợp riêng, cụ
thể, tại trục hoành ngắn, mô hình NN tỏ ra năng động hơn, bám sát
kết quả thực tế hơn, còn tại trục hoành dài thì các mô hình STVAR,
VAR, AR là hiệu quả hơn hẳn. Đặc biệt, tại trục hoành rất dài, mô
hình STVAR cho giá trị dự báo tốt nhất.
Phương pháp đánh giá hiệu quả dự báo của hai mô hình ở đây là
phương pháp sử dụng thống kê Diebold - Mariano DM , và thống kê
Diebold - Mariano điều chỉnh DM ∗ .
4.1
4.1.1
Dự báo
Dự báo bằng mô hình STVAR
Với bảng số liệu gồm 250 quan sát cho ở Phụ lục 2, tác giả đã
ước lượng mô hình STVAR cho 200 quan sát đầu tiên (đã trình bày ở
chương 3), bây giờ ta tiến hành tính toán các giá trị của X, Y, Z khi