1
C3. Phương sai của sai số thay đổi
(Heteroscedasticity)
•
Bản chất của hiện tượng phương sai của sai
số thay đổi
•
Hậu quả của phương sai sai số thay đổi
•
Cách phát hiện phương sai sai số thay đổi
•
Cách khắc phục phương sai sai số thay đổi
2
Bản chất hiện tượng PSSS thay đổi
•
Xét ví dụ mô hình hồi qui 2 biến trong đó biến
phụ thuộc Y là chi tiêu của hộ gia đình và
biến giải thích X là thu nhập khả dụng của
hộ gia đình
3
Bản chất hiện tượng PSSS thay đổi
X
1
X
2
X
n
X
Y
0
(a)
)
f(u
i
)
5
•
Hình 3.1a chỉ ra rằng khi thu nhập khả dụng tăng
lên, giá trị trung bình của chi tiêu cũng tăng lên
nhưng phương sai của sai số quanh giá trị trung
bình của nó không thay đổi tại mọi mức thu nhập
khả dụng.
•
Đây là trường hợp của phương sai sai số không đổi,
hay phương sai bằng nhau.
E(u
i
2
) = σ
2
•
Hình 3.1b, mặc dù giá trị trung bình của chi tiêu
cũng tăng lên nhưng phương sai của sai số không
bằng nhau tại mỗi mức thu nhập khả dụng –
phương sai tăng lên với thu nhập khả dụng.
E(u
i
2
) = σ
i
Ví dụ: số lỗi đánh máy của một thư ký có thể giảm dần
theo thời gian làm việc.
•
Do có sự hiện diện của các “quan sát dị biệt”
(outlier);
•
Do định dạng sai mô hình.
Hiện tượng này thường gặp phải đối với “số liệu
theo không gian” (cross-section data).
8
Quan sát dị biệt
x
x
x
x
x
x
x
x
x
x
x
x x
x
x
x
x
x
X
Y
stt Y X (thu nhập) stt Y X (thu nhập)
1 19,9 20,3 11 8,0 8,1
2 31,2 32,3 12 33,1 34,5
3 31,8 33,6 13 33,5 38,0
4 12,1 12,1 14 13,1 14,1
5 40,7 42,3 15 14,8 16,4
6 6,1 6,2 16 21,6 24,1
7 38,6 44,7 17 29,3 30,1
8 25,5 26,1 18 25,0 28,3
9 10,3 10,3 19 17,9 18,2
10 38,8 40,2 20 19,8 20,1
13
Kết quả hồi quy…
. reg Y X
Source | SS df MS Number of obs = 20
+ F( 1, 18) = 1501.41
Model | 2184.59892 1 2184.59892 Prob > F = 0.0000
Residual | 26.1904894 18 1.45502719 R-squared = 0.9882
+ Adj R-squared = 0.9875
Total | 2210.78941 19 116.357337 Root MSE = 1.2062
Y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
+
X | .9078664 .02343 38.75 0.000 .8586419 .957091
_cons | .8583391 .644867 1.33 0.200 4964761 2.213154
Có nhận xét gì về kết quả này? Liệu có tồn tại hiện tượng
phương sai sai số thay đổi?
14
1. Xem xét đồ thị của sai số
2
ln|X
i
|+ v
i
trong đó v
i
là
phần sai số.
•
Park đã đề nghị chúng ta có thể sử dụng e
i
thay cho u
i
và chạy mô hình hồi qui sau:
lne
i
2
= B
1
+ B
2
ln|X
i
|+ v
i
(*)
17
2. Kiểm định Park
không có phương sai của sai số thay đổi.
Nếu giả thuyết H
0
bị bác bỏ, mối quan hệ
giữa lne
i
2
và lnX có ý nghĩa thống kê, có
phương sai của sai số thay đổi.
5) Nếu giả thuyết H
0
được chấp nhận, B
1
trong
mô hình (*) có thể được xem là giá trị chung
của phương sai của sai số không đổi,
σ
2
.
19
Cách 2: Kiểm định Park
Source | SS df MS Number of obs = 20
+ F( 1, 18) = 32.43
Model | 32.7929497 1 32.7929497 Prob > F = 0.0000
Residual | 18.204119 18 1.01133994 R-squared = 0.6430
+ Adj R-squared = 0.6232
Total | 50.9970687 19 2.68405625 Root MSE = 1.0057
lne_sq | Coef. Std. Err. t P>|t| [95% Conf. Interval]
+
iii
vXBBe ++=
21
i
i
i
v
X
BBe +
1
+=
21
21
3. Kiểm định Glejser
•
Giả thuyết H
0
trong mỗi hàm số trên là
phương sai của sai số không đổi, nghĩa là,
H
0
: B
2
= 0. Nếu giả thuyết này bị bác bỏ thì có
thể có hiện tượng phương sai sai số không
đồng đều.
i
i
i
v
4. Kiểm định tương quan hạng của Spearman
•
Hệ số tương quan hạng của Spearman, r
S
,
được xác định như sau:
trong đó d
i
là hiệu của các hạng được gán cho
2 đặc trưng khác nhau của cùng một phần tử
thứ i và n là số các phần tử được xếp hạng.
−
−=
∑
)n(n
d
r
i
S
1
61
2
i
| - hạng X
i
,
sau đó tính hệ số tương quan hạng
Spearman.
25
4. Kiểm định tương quan hạng (tt)
3. Giả sử hệ số tương quan hạng của tổng
thể là ρ = 0 và n > 8 thì ý nghĩa của hệ số
tương quan hạng mẫu r
S
có thể được kiểm
định bằng tiêu chuẩn t sau:
2
S
S
r1
2nr
t
−
−
=
Nếu giá trị t tính được lớn hơn giá trị tra bảng t với mức
ý nghĩa đã cho thì chúng ta có thể chấp nhận giả thuyết
phương sai sai số thay đổi; ngược lại chúng ta bác bỏ
giả thuyết này.
với bậc tự do
df = n – 2.