1. BẢN CHẤT HIỆN TƯỢNG TỰ TƯƠNG QUAN
1.1. Định nghĩa
Thuật ngữ tự tương quan có thể hiểu là sự tương quan giữa các thành
phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số
liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo).
Trong phạm vi hồi quy, mô hình tuyến tính cổ điển giả thiết rằng không
có sự tương quan giữa các nhiễu U
i
nghĩa là:
Cov(U
i
, U
j
) = 0 (i
≠
j) (7.1)
Nói một cách khác, mô hình cổ điển giả thiết rằng thành phần nhiễu gắn
với một quan sát nào đó không bị ảnh hưởng bởi thành phần nhiễu gắn với
một quan sát khác.
Tuy nhiên trong thực tế có thể xảy ra hiện tượng mà thành phần nhiễu
của các quan sát lại có thể phụ thuộc lẫn nhau nghĩa là:
Cov(U
i
, U
j
)
≠
0 (i
≠
j) (7.2)
1.2. Nguyên nhân của tự tương quan
người nông dân có thể sẽ quyết định sản xuất lạc ít hơn thời kỳ t. Điều này sẽ
dẫn đến mô hình mạng nhện.
- Trễ:
Chẳng hạn khi nghiên cứu mối quan hệ giữa tiêu dùng và thu nhập,
chúng ta thấy rằng tiêu dùng ở thời kỳ hiện tại chẳng những phụ thuộc vào
thu nhập hiện tại mà còn phụ thuộc vào tiêu dùng ở thời kỳ trước đó, nghĩa
là:
Y
t
=
1
β
+
2
β
X
t
+
3
β
Y
t – 1
+ U
t
(7.4)
Trong đó: Y
t
: Tiêu dùng ở thời kỳ t.
X
t
ra hiện tượng tự tương quan:
Một là: không đưa đủ các biến vào trong mô hình
Hai là: dạng hàm sai có thể gây ra hiện tượng tự tương quan.
1.3. Ước lượng bình phương nhỏ nhất khi có tự tương quan
Ta xét mô hình:
Y
t
=
1
β
+
2
β
X
t
+ U
t
(7.5)
Trong đó: t ký hiệu quan sát ở thời điểm t (giả thiết ta đang nghiên cứu
số liệu dạng chuỗi thời gian).
Với giả thiết tổng quát cov(U
t
, U
t + s
)
≠
0 (s
≠
0). Ta có thể giả thiết
nhiễu sản sinh ra theo cách sau:
t
stt
t
s
E
(7.7)
Lược đồ (7.7) gọi là lược đồ tự hồi quy bậc nhất Markov. Chúng ta ký
hiệu lược đồ đó là AR(1). Nếu U
t
có dạng:
U
t
=
1
ρ
U
t – 1
+
2
ρ
U
t – 2
+
t
ε
Là lược đồ tự hồi quy bậc 2 và ký hiệu AR(2).
Bằng phương pháp bình phương nhỏ nhất ta tính được:
∑
∑
yyxx
n
t
tt
n
t
tttt
G
+
−
−−
=
∑
∑
=
−
=
−
2
2
1
2
1
2
)(
))((
ρ
ρρ
β
(7.8)
- Phương sai ước lượng được của các ước lượng bình phương nhỏ nhất
thông thường là chệch và thông thường là thấp hơn giá trị thực của phương
sai, do đó giá trị của thống kê T được phóng đại lên nhiều lần.
- Các kiểm định t và F nói chung không đáng tin cậy.
-
2
2
2
ˆ
)(
ˆ
σ
σ
σ
kn
−
=
cho ước lượng chệch của
2
σ
thực, và trong một số trường
hợp, nó dường như ước lượng thấp
2
σ
.
- R
2
có thể là độ đo không đáng tin cậy cho R
2
thực.
Một cách khác là vẽ đồ thị của phần dư chuẩn hoá theo thời gian.
2.2. Phương pháp kiểm định số lượng
2.2.1. Kiểm định các đoạn mạch
Kiểm định các đoạn mạch là một phép kiểm định thống kê giúp ta xác
định xem có thể coi một dãy các ký hiệu, các khoản mục hoặc các số liệu có
phải là kết quả của một quá trình mang tính ngẫu nhiên hay không.
2.2.2. Kiểm định
2
χ
về tính độc lập của các phần dư
Để kiểm định
2
χ
về tính độc lập của các phần dư ta sử dụng bảng liên
tiếp. Bảng liên tiếp mà chúng ta sử dụng ở đây gồm một số dòng và một số
cột, cụ thể là bảng liên tiếp 2 dòng và 2 cột.
2.2.3. Kiểm định d.Durbin – Watson
Là kiểm định dựa vào giá trị tính toán, thống kê d được định nghĩa như
sau:
d =
∑
∑
=
=
−
−
n
t
t
n
e
ee
1
2
2
1
ˆ
ρ
(7.12)
Vì -1
≤
≤
ρ
1 nên 0
≤≤
d
4.
Nếu
ρ
= -1 thì d =4: tự tương quan ngược chiều
Nếu
ρ
= 0 thì d = 2: không có tự tương quan
Nếu
ρ
= 1 thì d = 0: tồn tại tự tương quan thuận chiều
(1) (2) (3) (4) (5)
0 d
UX
++
21
ββ
Trong đó: U
t
=
tptptt
UUU
ερρρ
++++
−−−
...
2211
,
t
ε
thoả mãn các giả thiết
của OLS.
Giả thiết: H
0
:
0...
21
====
p
ρρρ
Kiểm định như sau:
Bước 1: Ước lượng mô hình ban đầu bằng phương pháp OLS. Từ đó thu
được các phần dư e
quan một bậc nào đó. Trong trường hợp ngược lại không tồn tại tự tương
quan.
2.2.5. Kiểm định Durbin h