Tìm hiểu về phân tích chuỗi thời gian - Pdf 28

Mục lục
1 Các yếu tố của phân tích chuỗi thời gian thăm dò 1
1.1 Mô hình cộng tính của chuỗi thời gian . . . . . . . . . . . . . . . . . . 2
1.1.1 Mô hình với xu hướng không tuyến tính . . . . . . . . . . . . . 3
1.1.2 Hàm Logistic . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.3 Hàm Mitscherlich . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.4 Đường cong Gompertz . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.5 Hàm tương quan sinh trưởng (the Allometric Function) . . . . . 6
1.2 Bộ lọc tuyến tính của chuỗi thời gian . . . . . . . . . . . . . . . . . . . 9
1.2.1 Các bộ lọc tuyến tính . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.2 Điều chỉnh theo mùa . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.3 Chương trình điều tra dân số X - 11 . . . . . . . . . . . . . . . 11
1.2.4 Đa thức địa phương phù hợp nhất . . . . . . . . . . . . . . . . . 13
1.2.5 Bộ lọc sai phân . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.6 Làm trơn hàm mũ . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3 Tự hiệp phương sai và tự tương quan . . . . . . . . . . . . . . . . . . . 18
2 Mô hình chuỗi thời gian 20
2.1 Bộ lọc tuyến tính và quá trình ngẫu nhiên . . . . . . . . . . . . . . . . 20
2.1.1 Quá trình dừng . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.2 Sự tồn tại của quá trình tuyến tính tổng quát . . . . . . . . . . 22
2.1.3 Hàm sinh hiệp phương sai (The Covariance Generating Function) 28
2.1.4 Đa thức đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.1.5 Bộ lọc ngược . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.1.6 Bộ lọc nguyên nhân (Causal Filters) . . . . . . . . . . . . . . . 31
2.2 Trung bình trượt và quá trình tự hồi quy . . . . . . . . . . . . . . . . . 33
2.2.1 Quá trình khả nghịch . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2.2 Quá trình tự hồi quy . . . . . . . . . . . . . . . . . . . . . . . . 36
2.2.3 Điều kiện dừng của quá trình tự hồi quy . . . . . . . . . . . . . 36
2.2.4 Phương trình Yule - Walker . . . . . . . . . . . . . . . . . . . . 38
2.2.5 Hệ số tự tương quan riêng . . . . . . . . . . . . . . . . . . . . . 39
2.2.6 Quá trình - ARMA . . . . . . . . . . . . . . . . . . . . . . . . . 41

cần có là sự hội tụ trong phân phối, hội tụ ngẫu nhiên, ước lượng hợp lý
cực đại cũng như kiến thức cơ bản của lý thuyết kiểm định.
Luận văn gồm ba chương:
Chương 1 đưa ra các yếu tố của việc phân tích chuỗi thời gian thăm dò
bao gồm các mô hình phù hợp (Logistic, Mitscherlich, đường cong Gom-
pertz) cho một chuỗi các dữ liệu, bộ lọc tuyến tính cho điều chỉnh theo
mùa và xu hướng điều chỉnh (bộ lọc sai phân, chương trình điều tra dân
số X – 11) và bộ lọc mũ cho theo dõi hệ thống. Tự hiệp phương sai và tự
tương quan sẽ được giới thiệu trong chương này.
Chương 2 cung cấp phép toán của các mô hình toán học về dãy ổn định
của biến ngẫu nhiên (ồn trắng, trung bình trượt, quá trình tự hồi quy, mô
hình ARIMA) cùng với các kiến thức cơ sở (sự tồn tại của quá trình dừng,
hàm sinh hiệp phương sai, bộ lọc ngược và bộ lọc nguyên nhân, điều kiện
dừng, phương trình Yule – Walker, tự tương quan riêng). Chương trình
Box – Jenkins cho mô hình ARMA sẽ được nghiên cứu một cách cụ thể
iii
(tiêu chuẩn thông tin AIC, BIC và HQ). Quá trình Gaussian và ước lượng
hợp lý cực đại trong mô hình Gaussian được giới thiệu cũng như ước lượng
bình phương tối thiểu như là một khả năng loại trừ không có tham số. Kết
quả được kiểm tra bằng Box – Ljung.
Chương 3 giới thiệu mô hình chuỗi thời gian được nhúng trong mô hình
không gian trạng thái. Bộ lọc Kalman là một phương pháp dự đoán thống
nhất gần với các phân tích của chuỗi thời gian trong miền thời gian.
Bản luận văn này được hoàn thành dưới sự hướng dẫn nghiêm khắc và
chỉ bảo tận tình của PGS.TS Phan Viết Thư. Thầy đã dành nhiều thời
gian hướng dẫn cũng như giải đáp các thắc mắc của tôi trong suốt quá
trình làm luận văn. Tôi muốn bày tỏ lòng biết ơn sâu sắc đến người thầy
của mình.
Qua đây, tôi xin gửi tới các thầy cô Khoa Toán - Cơ - Tin học, Trường Đại
học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, cũng như các thầy cô

có các thành phần chu kỳ. Do đó, các quá trình thống kê mà người ta giả
sử dữ liệu có tính độc lập và cùng phân phối, sẽ loại trừ khỏi phân tích
của chuỗi thời gian. Điều này đòi hỏi những phương pháp thích hợp được
tập hợp lại dưới cái tên Phân tích chuỗi thời gian.
1
1.1 Mô hình cộng tính của chuỗi thời gian
Mô hình cộng tính đối với một chuỗi thời gian y
1
, y
2
, . . . , y
n
là giả thiết
rằng những dữ liệu trên là phép thể hiện của các biến ngẫu nhiên Y
t
sao
cho Y
t
là tổng của bốn thành phần
Y
t
= T
t
+ Z
t
+ S
t
+ R
t
, t = 1, , n, (1.1)

t
+ Z
t
, (1.2)
G
t
mô tả diễn biến dài hạn của chuỗi thời gian. Chúng ta sẽ giả thiết rằng
kỳ vọng E (R
t
) = 0 của biến sai số tồn tại và bằng 0, điều đó phản ánh
giả thiết độ lệch ngẫu nhiên trên hoặc dưới mô hình không ngẫu nhiên
cân bằng lẫn nhau về trung bình. Chú ý rằng E (R
t
) = 0 có thể luôn đạt
được bằng cách thay đổi thích hợp một hoặc nhiều thành phần không ngẫu
nhiên.
Biểu đồ dưới đây của dữ liệu thất nghiệp 1 chỉ ra một thành phần theo
mùa và một xu hướng giảm. Chu kỳ từ tháng 7 năm 1975 tới tháng 9 năm
1979 có thể hơi ngắn để cho biết về chu kỳ kinh doanh dài hạn.
2
Biểu đồ 1.1.1: Dữ liệu thất nghiệp 1.
1.1.1 Mô hình với xu hướng không tuyến tính
Trong mô hình cộng tính Y
t
= T
t
+ R
t
, ở đó chỉ có thành phần không
ngẫu nhiên là xu hướng T

. Cách tiếp
cận thông thường là sử dụng phương pháp ước lượng bình phương tối
thiểu
ˆ
β
1
, ,
ˆ
β
p
thỏa mãn

t

y
t
− f

t;
ˆ
β
1
, ,
ˆ
β
p

2
= min
β

. Hiệu y
t
−ˆy
t
được gọi là phần dư. Chúng chứa các thông tin về sự phù hợp của mô
hình với dữ liệu.
Sau đây ta sẽ liệt kê một số ví dụ thông dụng của hàm xu hướng.
3
1.1.2 Hàm Logistic
Hàm số
f
log
(t) = f
log
(t; β
1
, β
2
, β
3
) =
β
3
1 + β
2
exp (−β
1
t)
, t ∈ R, (1.5)
với β

(t)
=
1 + β
2
exp (−β
1
t)
β
3
=
1 − exp (−β
1
)
β
3
+ exp (−β
1
)
1 + β
2
exp (−β
1
(t − 1))
β
3
=
1 − exp (−β
1
)
β

4
Ví dụ 1.1.1 (Dữ liệu dân số 1) Bảng 1.1.1 đưa ra số dân (tính theo đơn
vị hàng triệu) của bang NRW các bước chu kỳ 5 năm, từ năm 1935 đến
năm 1980 và đưa ra giá trị dự báo của ˆy
t
, xác định bằng phương pháp ước
lượng bình phương tối thiểu như mô tả (1.4) cho mô hình Logistic.
Năm t Số dân y
t
Giá trị dự báo ˆy
t
(triệu người) (triệu người)
1935 1 11.772 10.930
1940 2 12.059 11.827
1945 3 11.200 12.709
1950 4 12.926 13.565
1955 5 14.442 14.384
1960 6 15.694 15.158
1965 7 16.661 15.881
1970 8 16.914 16.548
1975 9 17.176 17.158
1980 10 17.044 17.710
Bảng 1.1.1: Dữ liệu dân số 1.
Như một dự báo số dân ở thời gian t, ta nhận được trong mô hình
Logistic
ˆy
t
=
ˆ
β

, β
2
, β
3
) = β
1
+ β
2
exp (β
3
t) , t ≥ 0, (1.7)
trong đó β
1
, β
2
∈ R và β
3
< 0. Vì β
3
là số âm nên ta có dáng điệu tiệm
cận lim
t→∞
f
M
(t) = β
1
và do đó tham số β
1
là giá trị bão hoà của hệ thống.
Giá trị (khởi tạo) của hệ thống tại thời gian t = 0 là f

, t ≥ 0, (1.8)
trong đó β
1
, β
2
∈ R và β
3
∈ (0, 1). Hiển nhiên ta có
log (f
G
(t)) = β
1
+ β
2
β
t
3
= β
1
+ β
2
exp (log (β
3
) t) ,
và do đó log (f
G
) là hàm Mitscherlich với tham số β
1
, β
2

ra phụ thuộc đầu vào. Vì
log (f
a
(t)) = log (β
2
) + β
1
log (t) , t > 0,
6
là một hàm tuyến tính của log (t) với hệ số góc β
1
và điểm cắt với trục
tung là log (β
2
) nên ta có thể giả thiết một mô hình hồi quy tuyến tính
cho dữ liệu loga log (y
t
)
log (y
t
) = log (β
2
) + β
1
log (t) + ε
t
, t ≥ 1,
trong đó ε
t
là các biến sai số.

1
log (t) + ε
t
. (1.10)
Ước lượng bình phương tối thiểu của β
1
và log (β
2
) trong mô hình hồi quy
tuyến tính trên là
ˆ
β
1
=
10

t=1

log (t) − log (t)

log (y
t
) − log (y)

10

t=1

log (t) − log (t)


ˆ
β
2
= exp (−0, 7549) = 0.4700.
Vậy giá trị dự đoán ˆy
t
tương ứng với thời gian t
ˆy
t
= 0.47t
1.019
. (1.11)
t y
t
− ˆy
t
1 0,0159
2 0,0201
3 -0,1176
4 -0,0646
5 0,1430
6 0,1017
7 -0,1583
8 -0,2526
9 -0,0942
10 0,5662
Bảng 1.1.3: Phần thặng dư của dữ liệu thu nhập.
Bảng 1.1.3 liệt kê phần dư y
t
−ˆy


t=1
y
t
là trung bình của các quan sát y
t
. Trong mô hình hồi
quy tuyến tính với ˆy
t
dựa trên ước lượng bình phương tối thiểu của các
tham số, R
2
nằm giữa 0 và 1 suy ra R
2
= 1 nếu và chỉ nếu
n

t=1
(y
t
− ˆy
t
)
2
= 0.
Một giá trị R
2
gần tới 1 là thuận lợi cho mô hình. Mô hình (1.10) có
R
2

= ˆy
t
+ 5.178 = 0.47t
1.019
+ 5.178.
Chú ý rằng giá trị thặng dư ˜y
t
−
ˆ
˜y
t
= y
t
− ˆy
t
không bị ảnh hưởng bởi hằng
số cộng 5.178 vào y
t
. Mô hình ở trên có thể giúp đánh giá tình trạng người
đóng thuế trung bình từ năm 1960 đến năm 1970 và dự đoán họ ở tương
lai. Rõ ràng từ giá trị thặng dư trong bảng 1.1.3 cho thấy thu nhập ròng
y
t
gần như là bội số hoàn hảo của t với t nằm giữa 1 và 9 trong khi năm
1970, y
10
tăng mạnh nhất dường như là giá trị ngoại lai. Thật vậy, trong
năm 1969 chính phủ Đức đã có sự thay đổi và trong năm 1970 có một cuộc
đình công lớn ở Đức là nguyên nhân cho việc thu nhập của công chức tăng
mạnh.

t
của các hàm không ngẫu nhiên T
t
và S
t
và loại bỏ chúng ra khỏi chuỗi thời gian bằng cách xét y
t
−
ˆ
T
t
hoặc
y
t
−
ˆ
S
t
thay vào đó. Chuỗi nhận được sau khi loại bỏ xu hướng theo mùa
trong chuỗi thời gian gọi là "chuỗi được điều chỉnh theo mùa".
1.2.1 Các bộ lọc tuyến tính
Lấy a
−r
, a
−r+1
, . . . , a
s
là các số thực bất kỳ, trong đó r, s ≥ 0, r+s+1 ≤
n. Phép biến đổi tuyến tính
Y

−r
, . . . , a
s
)
T
là một lọc (tuyến tính).
Một lọc (a
u
) mà các trọng số có tổng bằng 1,
s

u=−r
a
u
= 1 gọi là trung
bình trượt. Trường hợp riêng a
u
=
1
2s + 1
, u = −s, . . . , s với một số lẻ
trọng số bằng nhau, hoặc a
u
=
1
2s
, u = −s + 1, . . . , s − 1, a
−s
= a
s

Lọc này là ví dụ riêng cho lọc thông thấp, bảo toàn thành phần xu hướng
biến đổi chậm của chuỗi và loại khỏi nó thành phần biến động nhanh hoặc
tần số cao. Do đó, có một sự thoả hiệp giữa hai yêu cầu trên là những biến
đổi bất thường nên được giảm bởi một bộ lọc, ví dụ chọn nhiều s trong
trung bình trượt đơn giản, và do đó sự biến động dài hạn trong dữ liệu
sẽ không bị bóp méo bởi làm trơn quá mức, tức là có quá nhiều lựa chọn
s. Ví dụ, nếu ta giả sử rằng chuỗi thời gian Y
t
= T
t
+ R
t
không có thành
phần theo mùa, trung bình trượt đơn giản bậc 2s + 1 dẫn tới
Y
∗
t
=
1
2s + 1
s

u=−s
Y
t−u
=
1
2s + 1
s


. Tuy nhiên, nếu chọn s nhỏ, ta thấy hiện
tượng R
∗
t
không còn gần với kỳ vọng của nó.
1.2.2 Điều chỉnh theo mùa
Trung bình trượt đơn giản của chuỗi thời gian Y
t
= T
t
+ S
t
+ R
t
phân
tích thành
Y
∗
t
= T
∗
t
+ S
∗
t
+ R
∗
t
,
trong đó S

t
= Y
t
−Y
∗
t
∼ S
t
+ R
t
. Để ước lượng S
t
ta tính trung bình hiệu này
với độ trễ p (chú ý rằng chúng dao động xung quanh S
t
)
¯
D
t
=
1
n
t
n
t
−1

j=0
D
t+jp

j=1
¯
D
j
∼ S
t
−
1
p
p

j=1
S
j
= S
t
(1.14)
là một ước lượng của S
t
= S
t+p
= S
t+2p
= . . . thoả mãn
1
p
p−1

j=0
ˆ

t
+ R
t
giống như (1.13) với thành phần theo mùa S
t
chu kỳ p = 12.
Ta đưa ra một bản tóm tắt chương trình bởi Wallis (1974), đó là kết quả
của trung bình trượt với trọng số đối xứng. Phương pháp điều tra dân
số được trình bày trong Shiskin và Eisenpress (1957); một mô tả đầy đủ
được đưa ra bởi Shiskin et al (1967). Chứng minh lý thuyết được dựa trên
mô hình ngẫu nhiên được cung cấp bởi Cleveland và Tiao (1976). Chương
trình X - 11 thực chất làm việc như điều chỉnh theo mùa được mô tả ở
trên, nhưng chương trình này có thêm các phép lặp và nhiều trung bình
trượt khác nhau.
Những bước khác nhau trong chương trình này là:
(i) Tính trung bình trượt đơn giản Y
∗
t
bậc 12 để loại bỏ về cơ bản một
xu hướng Y
∗
t
∼ T
t
.
(ii) Hiệu D
t
= Y
t
− Y

t
+ 2
¯
D
(1)
t+12
+
¯
D
(1)
t+24

∼ S
t
.
Công thức trên cho ước lượng của các thành phần theo mùa S
t
. Chú ý
rằng trung bình trượt với trọng số (1, 2, 3, 2, 1) /9 là trung bình trượt
đơn giản có độ dài bằng 3.
(iv)
¯
D
(1)
t
được điều chỉnh bằng cộng xấp xỉ dần về 0 trên bất kỳ chu kỳ
12 tháng bằng cách đặt
ˆ
S
(1)

D
(1)
t+6

.
(v) Hiệu Y
(1)
t
= Y
t
−
ˆ
S
(1)
t
∼ T
t
+ R
t
là chuỗi điều chỉnh theo mùa sơ bộ,
giống như trước đó.
(vi) Dữ liệu điều chỉnh Y
(1)
t
sẽ được làm trơn hơn bởi trung bình trượt
Henderson Y
∗∗
t
bậc 9,13 hoặc 23.
12

trong đó trọng số a
u
lấy từ trung bình trượt đơn giản bậc 3 áp dụng
cho trung bình trượt đơn giản bậc 5 của dữ liệu gốc tức là véctơ trọng
số là (1, 2, 3, 3, 3, 2, 1) /15 . Đây chính là ước lượng thứ hai của thành
phần theo mùa S
t
.
(ix) Bước (iv) được lặp đi lặp lại cho ra ước lượng xấp xỉ trung tâm
ˆ
S
(2)
t
của thành phần theo mùa.
(x) Hiệu Y
(2)
t
= Y
t
−
ˆ
S
(2)
t
cho ta chuỗi điều chỉnh theo mùa.
Tùy thuộc độ dài của trung bình trượt Henderson được sử dụng trong bước
(vi), Y
(2)
t
là trung bình trượt có độ dài 165, 169 hoặc 179 của dữ liệu gốc.

0
− β
1
u − . . . − β
p
u
p
)
2
= min. (1.15)
13
Nếu ta lấy đạo hàm vế trái tương ứng với mỗi β
j
và đặt các đạo hàm đó
bằng 0, ta thấy các cực tiểu thoả mãn p + 1 phương trình tuyến tính
β
0
k

u=−k
u
j
+ β
1
k

u=−k
u
j+1
+ . . . + β

2
. . . (−k)
p
1 −k + 1 (−k + 1)
2
. . . (−k + 1)
p
.
.
.
.
.
.
.
.
.
1 k k
2
. . . k
p




(1.17)
là ma trận thiết kế, β
β
β = (β
0
, . . . , β

Dự báo tuyến tính của y
t+u
dựa trên u, u
2
, . . . , u
p
là
ˆy
t+u
=

1, u, u
2
, . . . , u
p

β
β
β =
p

j=0
β
j
u
j
.
Trường hợp riêng, chọn u = 0 ta có β
0
= ˆy

t+u
14
với c
u
∈ R không phụ thuộc giá trị y
u
của chuỗi thời gian và do đó
(c
u
) là một lọc tuyến tính. Ta tiếp tục chứng minh rằng
k

u=−k
c
u
= 1. Chọn
y
t+u
= 1 với u = −k, . . . , k. Do đó β
0
= 1, β
1
= . . . = β
p
= 0 là nghiệm
tầm thường của bài toán cực tiểu hoá (1.15). Do nghiệm là duy nhất nên
ta có
1 = β
0
=

.
Ví dụ 1.2.2 Phù hợp đa thức địa phương bậc 2 cho 5 điểm dữ liệu liên
tục dẫn đến trung bình trượt
(c
u
) =
1
35
(−3, 12, 17, 12, −3)
T
.
1.2.5 Bộ lọc sai phân
Ta đã thấy là ta có thể loại bỏ thành phần theo chu kỳ mùa ra khỏi
chuỗi thời gian bằng cách sử dụng một bộ lọc tuyến tính thích hợp. Ta
cũng sẽ chỉ ra rằng một hàm xu hướng đa thức có thể được loại bỏ bởi
một bộ lọc tuyến tính phù hợp.
Bổ đề 1.2.3 Cho đa thức f (t) = c
0
+ c
1
t + . . . + c
p
t
p
bậc p, sai phân
∆f (t) = f (t) − f (t − 1)
là đa thức bậc cao nhất p − 1.
Chứng minh. Khẳng định là hệ quả trực tiếp của khai triển nhị thức
(t − 1)
p

q−1
f (t)

, 1 ≤ q ≤ p,
là đa thức bậc không quá p −q. Hàm ∆
p
f (t) là một hằng số. Bộ lọc tuyến
tính
∆Y
t
= Y
t
− Y
t−1
với trọng số a
0
= 1, a
1
= −1 là bộ lọc sai phân bậc một. Bộ lọc được
định nghĩa đệ quy
∆
p
Y
t
= ∆

∆
p−1
Y
t

+ Y
t+2
.
Nếu chuỗi thời gian Y
t
có một đa thức xu hướng T
t
=
p

k=0
c
k
t
k
với c
k
là
các hằng số thì bộ lọc sai phân ∆
p
Y
t
bậc p loại bỏ xu hướng tới hằng số.
Chuỗi thời gian trong kinh tế thường có một hàm xu hướng bị loại bỏ bởi
bộ lọc sai phân cấp 1 hoặc cấp 2.
1.2.6 Làm trơn hàm mũ
Cho Y
0
, . . . , Y
n

t
Y
0
, t = 1, 2, . . . , n.
16
Chứng minh. Khẳng định sau xuất phát từ phép quy nạp
Với t = 1 thì Y
∗
1
= αY
1
+ (1 − α) Y
0
.
Giả sử khẳng định trên đúng với t, ta thu được với t + 1
Y
∗
t+1
= αY
t+1
+ (1 − α) Y
∗
t
= αY
t+1
+ (1 − α)

α
t−1


t
. Mặt khác, α gần tới 0 làm giảm ảnh
hưởng của Y
t
và đặt hầu hết trọng số cho các quan sát trong quá khứ,
cho ra một chuỗi trơn Y
∗
t
. Làm trơn hàm mũ là loại thường được sử dụng
để giám sát hệ thống. Ví dụ, ô tô có đồng hồ đo vận tốc bằng tay. Nó sẽ
thuận tiện hơn cho lái xe nếu chuyển động của tay cầm trơn, điều này có
thể đạt được khi α gần tới 0. Mặt khác, khi thay đổi vận tốc, lái xe cần
một khoảng thời gian nhất định mới đọc được tốc độ.
Hệ quả 1.2.5 (i) Giả sử biến ngẫu nhiên Y
0
, . . . , Y
n
có cùng kỳ vọng µ
và phương sai σ
2
> 0. Khi đó với biến làm trơn hàm mũ, với tham
số làm trơn α ∈ [0; 1], ta có:
E (Y
∗
t
) = α
t−1

j=0
(1 − α)

σ
2
+ (1 − α)
2t
σ
2
= σ
2
α
2
1 − (1 − α)
2t
1 − (1 − α)
2
+ (1 − α)
2t
σ
2
t→∞
−→
σ
2
α
2 − α
< σ
2
.
(1.20)
17
(ii) Giả sử các biến ngẫu nhiên Y

t−N+1

+
µ

(1 − α)
t−N+1

1 − (1 − α)
N−1

+ (1 − α)
t

t→∞
−→ λ.
(1.21)
Kết quả này đánh giá ảnh hưởng của tham số α lên kỳ vọng và phương sai
tức là sự trơn của chuỗi đã lọc Y
∗
t
; trong đó ta giả thiết với mục đích tính
toán đơn giản của phương sai là Y
t
không tương quan. Nếu các biến Y
t
có
cùng kỳ vọng µ thì các kỳ vọng Y
∗
t

thoả mãn phương
trình Y
∗
t+1
= αe
t+1
+ Y
∗
t
. Sự trình bày của phương pháp làm trơn hàm mũ
cũng có thể thông qua phương pháp bình phương tối thiểu.
1.3 Tự hiệp phương sai và tự tương quan
Tự hiệp phương sai và tự tương quan là thước đo sự phụ thuộc giữa các
biến trong chuỗi thời gian. Giả sử Y
1
, . . . , Y
n
là các biến ngẫu nhiên bình
phương khả tích với tính chất hiệp phương sai
Cov (Y
t+k
, Y
t
) = E ((Y
t+k
− E (Y
t+k
)) (Y
t
− E (Y

1
n
n−k

t=1
(y
t+k
− ¯y) (y
t
− ¯y) với ¯y =
1
n
n

t=1
y
t
và tự tương quan thực nghiệm được xác định bởi
r (k) =
c (k)
c (0)
=
n−k

t=1
(y
t+k
− ¯y) (y
t
− ¯y)

≤ V ar(Y
t+k
)
1
2
V ar(Y
t
)
1
2
= γ (0) với k ≥ 0.
Do đó với hàm tự tương quan ta có bất đẳng thức
|ρ (k)| ≤ 1 = ρ (0) .
19
Chương 2
Mô hình chuỗi thời gian
Mỗi một chuỗi thời gian Y
1
, . . . , Y
n
có thể được xem như là một hình
thức cắt từ một dãy các biến ngẫu nhiên . . . , Y
−2
, Y
−1
, Y
0
, Y
1
, Y

Y
(1)

+ iE

Y
(2)

∈ C.
Kỳ vọng này có tính đơn điệu và có tính chất quen thuộc sau
E (aY + bZ) = aE (Y ) + bE (Z) ,
ở đây a và b là các số phức và Z là biến ngẫu nhiên nhận giá trị phức khả
tích. Thêm vào đó, ta có
E (Y ) = E

¯
Y

trong đó ¯a = u − iv là số phức
liên hợp của a = u + iv. Vì |a|
2
= u
2
+ v
2
= a¯a = ¯aa ta xác định phương
sai của Y bởi
Var (Y ) = E

(Y − E (Y ))



Y
(1)


+ E



Y
(2)



.
Chứng minh. Ta viết E (Y ) trong tọa độ cực E (Y ) = re
iϑ
, trong đó
r = |E (Y )| và ϑ ∈ [0; 2π). Chú ý rằng:
Re

e
−iϑ
Y

= Re

(cos (ϑ) − isin (ϑ))


bằng cách áp dụng bất đẳng thức Cauchy – Schwarz cho số thực. Do đó
ta có:
|E (Y )| = r = E

e
−iϑ
Y

= E

Re

e
−iϑ
Y

≤ E (|Y |) .
Bất đẳng thức thứ hai suy từ |Y | =

Y
2
(1)
+ Y
2
(2)

1
2
≤


1
2
.
21

Trích đoạn Quá trình ARIMA

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Tìm hiểu về phân tích chuỗi thời gian - Pdf 28

Tài liệu, ebook tham khảo khác

Học thêm