Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1 1
LỜI MỞ ĐẦU
Trong mô hình phân tích hồi quy bội, chúng ta giả thiết giữa các biến
giải thích X
i
của mô hình độc lập tuyến tính với nhau, tức là các hệ số hồi
quy đối với một biến cụ thể là số đo tác động riêng phần của biến tương
ứng
Khi tất cả các biến khác trong mô hình được giữ cố định. Tuy nhiên
khi giả thiết đó bị vi phạm tức là các biến giải thích có tương quan thì
chúng ta không thể tách biệt sự ảnh hưởng riêng biệt của một biến nào đó.
Hiện tượng trên được gọi là đa công tuyến.Vậy để đa cộng tuyến là
gì, hậu quả của hiện tượng này như thế nào, làm thế nào để phát hiện và
biện pháp khắc phục nó. Để trả lời được những câu hỏi trên, sau đây
chúng ta cùng đi thảo luận về đề tài “ Hiện tượng đa cộng tuyến”.
Thảo luận Kinh tế lượng – Nhóm 1
k
Y
1
= β
1
+ β
2
X
2i
+ β
3
X
3i
+ U
i
,
),1( ni
Các biến X
2
, X
3
, , X
k
gọi là các đa cộng tuyến hoàn hảo hay còn
gọi là đa cộng tuyến chính xác nếu tồn tại λ
2
, , λ
k
không đồng thời bằng
2
X
2
+ λ
3
X
3
+ + λ
k
X
k
+ V
i
= 0 (1.1)
trong đó V
i
là sai số ngẫu nhiên.
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1 3
Trong (1.1) giả sử
λ
i
≠ 0 khi đó ta biểu diễn:
X
i
=
32 2
2 3
),1( ni
(1.3)
n
i
i
Y
n
Y
1
1
;
n
i
i
X
n
X
1
1
(1.4)
thì mô hình hồi quy 3 biến có thể viết lại dưới dạng:
iiii
iii
iiiii
xxx
xyxxy
(1.6)
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1 4
2
32
2
2
2
3
2
2
2
22
2
2
2
2
22
2
22
2
thay đổi 1 đơn vị còn
3
X
không đổi. Nhưng khi
ii
XX
23
thì điều đó có nghĩa là không thể tách ảnh hưởng của
2
X
và
3
X
khỏi mẫu đã cho. Trong kinh tế lượng thì điều này phá hủy toàn bộ
ý định tách ảnh hưởng riêng của từng biến lên biến phụ thuộc.
Thí dụ:
ii
XX
23
thay điều kiện này vào (1.5) ta được:
iiiiiiii
exexexxy
22322322
Thảo luận Kinh tế lượng – Nhóm 1 5
Như vậy dù
được ước lượng một cách duy nhất thì cũng không thể
xác định được
2
và
3
từ một phương trình 2 ẩn.
Như vậy trong trường hợp đa cộng tuyến hoàn hảo, chúng ta không
thể nhận được lời giải duy nhất cho các hệ số hồi quy riêng, nhưng trong
khi đó ta lại có thể nhận được lời giải duy nhất cho tổ hợp tuyến tính của
các hệ số này. Chú ý rằng trong trường hợp đa cộng tuyến hoàn hảo thì
phương sai và các sai số tiêu chuẩn của các ước lượng
2
và
3
là vô
hạn.
* Ước lượng trong trường hợp có đa cộng tuyến không hoàn hảo
Đa cộng tuyến hoàn hảo chỉ là 1 trương hợp đặc biệt hiếm xảy ra.
Trong trường hợp này theo phương pháp bình phương nhỏ nhất ta dễ
dàng thu được các ước lượng
2
và
3
.
Chẳng hạn:
2
2
2
2
2
222
2
2
2
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1 6
2. Nguyên nhân
Các nguyên nhân gây ra hiện tượng đa cộng tuyến ở đây có thể là do các
nguyên nhân sau :
Do bản chất kinh tế xã hội các biến ít nhiều có quan hệ tuyến
tính với nhau
Do mẫu lấy không ngẫu nhiên
Do quá trình xử lý tính toán số liệu
Một số nguyên nhân khác
3. Hậu quả
Hậu quả sau đây :
Phương sai và hiệp phương sai của các ước lượng OLS lớn
Khoảng tin cậy rộng hơn
Tỷ số t mất ý nghĩa cao nhưng tỷ số t ít ý nghĩa
Dấu của các ước lượng có thể sai
Các ước lượng và sai số chuẩn rất nhạy với sự thay đổi trong số
liệu
Thay đổi các ước lượng của mô hình khi thêm bớt các biến cộng
tuyến II. CÁC CÁCH PHÁT HIỆN HIỆN TƯỢNG ĐA CỘNG TUYẾN
1. R
2
cao nhưng tỉ số t thấp
3
= (1,1,1,1,1, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0)
Rõ ràng X
3
= X
2
+ X
1
nghĩa là ta có đa cộng tuyến hoàn hảo, tuy
nhiên tương quan cặp là:
r
12
= -1/3 ; r
13
= r
23
=0,59
Như vậy đa cộng tuyến xảy ra mà không có sự bảo trước cuả tương quan
cặp những dẫu sao nó cũng cung cấp cho ta những kiểm tra tiên nghiệm
có ích.
3. Xem xét tương quan riêng
Vì vấn đề được đề cập đến dựa vào tương quan bậc không. Farrar và
Glauber đã đề nghị sử dụng hệ số tương quan riêng. Trong hồi quy của Y
đối với các biến X
2
, X
3
,X
4
Một cách có thể tin cậy được để đánh giá mức độ của đa cộng tuyến
là hồi quy phụ. Hồi quy phụ là hồi quy mỗi một biến giải thích X
i
theo
các biến giải thích còn lại. R
2
được tính từ hồi quy này ta ký hiện R
2
i
Mối liên hệ giữa F
i
và R
2
i
:
F=
)1/()1(
)2/(
2
2
knR
kR
i
i
F
i
i
).
VIF(X
i
) được thiết lập trên cơ sở của hệ số xác định R
2
i
trong hồi quy
của biến X
i
với các biến khác nhau như sau:
VIF(X
i
) =
R1
1
2
i
(5.15)
Nhìn vào công thức (5.15) có thể giải thích VIF(X
i
) bằng tỷ số chung
của phương sai thực của β
1
trong hồi quy gốc của Y đối với các biến X
và phương sai của ước lượng β
1
trong hồi quy mà ở đó X
i
10
50
100
V IF
0,9 1
0
1
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1
10
6. Độ đo Theil
Khía cạnh chủ yếu của VIF chỉ xem xét đến tương quan qua lại giữa các
biến giải thích. Một độ đo mà xem xét tương quan của biến giải thích với
biến được giải thích là độ đo Theil. Độ đo Theil được định nghĩa như
sau:
m = R
2
-
k
i 2
( R
2
- R
R
2
i
là hệ số xác định bội trong mô hình hồi quy của biến Y đối với các
biên X
2
, X
3
, … ,X
1i
, X
1i
, … ,X
k
Đại lượng R
2
- R
2
i
được gọi là “đóng góp tăng thêm vào” vào hệ số xác
định bội. Nếu X
2
, X
3
… X
k
không tương quan với nhau thì m = 0 vì
những đóng góp tăng thêm đó cộng lại bằng R
2
R
2
= r
2
12
+ (1- r
2
12
) r
2
2,13
R
2
= r
2
13
+ (1- r
2
13
) r
2
3,12
Thay 2 công thức này vào biểu thức xác định m ta được:
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1
11
2
12
) r
2
2,13
+ (1- r
2
13
) r
2
3,12
)
Đặt 1- r
2
12
= w
2
; 1- r
2
13
= w
3
và gọi là các trọng số. Công thức (5.16)
được viết lại dưới dạng
m = R
2
- (w
2
r
2
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1
12
Ta được Q*t = A* + L*t + βK*t + Ut (5.18)
Giả sử L|K và L có tương quan rất cao dĩ nhiên điều này sẽ dẫn đến
phương sai của các ước lượng của các hệ số co giãn của hàm sản xuất lớn
.
Giả sử từ 1 nguồn thông tin có lới theo quy mô nào đó mà ta biết
được rằng ngành công nghiệp này thuộc ngành cso lợi tức theo quy mô
không đổi nghĩa là + β =1 .Với thông tin này ,cách xử lý của chúng ta
sẽ là thay β = 1 - vào (5.18) và thu được :
Q*t = A* + L*t + ( 1 - )K*t + Ut (5.19)
Từ đó ta được Q*t – K*t = A* + (L*t – K*t ) + Ut
Đặt Q*t – K*t = Y*t và L*t – K*t = Z*t ta được
Y*t = A* + Z*t + Ut
Thông tin tiên nghiệm đã giúp chúng ta giảm số biến độc lập trong mô
hình xuống còn 1 biến Z*t
Sau khi thu được ước lượng
của thì
tính được từ điều kiện
= 1 –
và không có 1 trong 2 biến chúng ta có thể quyết định nên bỏ biến nào
trong biến X2 và X3 khỏi mô hình .
Thí dụ R
2
đối với hồi quy của Y đối với tất cả các biến X1X2X3 …Xk
là 0.94; R
2
khi loại biến X2 là 0.87 và R
2
khi loại biến X3 là 0.92 ;như
vậy trong trường hợp này ta loại X3
Chúng ta lưu ý 1 hạn chế của biện pháp này là trong các mô hình kinh tế
có những trường hợp đòi hỏi nhất định phải có biến này hoặc biến khác ở
trong mô hình .Trong trường hợp như vậy việc loại bỏ 1 biến phải được
cân nhắc cẩn thận giữa sai lệch khi bỏ 1 biến cộng tuyến với việc tăng
phương sai của các ước lượng hệ số khi biến đó ở trong mô hình .
4. Sử dụng sai phân cấp 1
Thủ tục được trình bày trong chương 7 – tự tương quan .Mặc dù biện
pháp này có thể giảm tương quan qua lại giữa các biến nhưng chúng cũng
có thể được sử dụng như 1 giải pháp cho vấn đề đa cộng tuyến .
Thí dụ Chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa các biến Y
và các biến phụ thuộc X2 và X3 theo mô hình sau :
Yt = β
1
+ β
2
X
2t
+ β
= β
2
(X
2t
- X
2t-1
) + β
3
(X
3t
- X
3t-1
) + U
t
- U
t-1
(5.22)
Đặt y
t
= Y
t
– Y
t-1
x
2t
= X
2t
- X
2t-1
như số hạng sai số Vt trong (5.23) có thể không thỏa mãn giả thiết của
mô hình hồi quy tuyến tính cổ điển là các nhiễu không tương quan .Vậy
thì biện pháp sửa chữa này có thể lại còn tồi tệ hơn căn bệnh .
5.Giảm tương quan trong hồi quy đa thức
Nét khác nhau của hồi quy đa thức là các biến giải thích xuất hiện với
lũy thừa khác nhau trong mô hình hồi quy .Trong thực hành để giảm
tương quan trong hồi quy đa thức người ta thường sử dụng dạng độ lệch
.Nếu việc sử dụng dạng độ lệch mà vẫn không giảm đa cộng tuyến thù
người ta có thể phải xem xét đến kỹ thuật “ đa thức trực giao “.
6. Thay đổi dạng mô hình
Mô hình kinh tế lượng có nhiều dạng hàm khác nhau. Thay đổi
dạng mô hình cũng có nghĩa là tái cấu trúc mô hình.
7. Một số biện pháp khác
Ngoài các biện pháp đã kể trên người ta còn sử dụng 1 số biện pháp
khác nữa để cứu chữa căn bệnh này như sau :
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1
15
Bỏ qua đa cộng tuyến nếu t > 2
Bỏ qua đa cộng tuyến nếu R
2
của mô hình cao hơn R
2
của mô hình
hồi quy phụ.
Bỏ qua đa cộng tuyến nếu hồi quy mô hình được dùng để dự báo chứ
không phải kiểm định.
Hồi quy thành phần chính
khắc phục hiện tượng đa cộng tuyến như thế nào?
Theo một cuộc điều tra về mức sống của các nhân viên ở công ty
TNHH sản xuất nước uống tinh khiết VITHAI , người ta tiến hành thu
thập số liệu trên 1 mẫu tiêu biểu với các biến như sau:
Ta có bảng số liệu thu thập được : Y 70 65 90 95 110 115 120 140 155 150
X
2
80 100 120 140 160 180 200 220 240 260
X
3
810 1009
1273
1425
1633
1876
2052
2201
2435
2686
i
Mô hình ước lượng của hàm hồi quy:
1 2 2 3 3
ˆ ˆ ˆ
ˆ
i i i
Y X X
Từ bảng số liệu, sử dụng phần mềm eviews ta được kết quả sau:
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1
17
Dependent Variable: Y
Method: Least Squares
Date: 05/24/11 Time: 15:08
Sample: 1 10
Included observations: 10
0.822898
1.144172
0.2902
X3 -0.042435
0.080664
-0.526062
0.6151 R-squared 0.963504
Mean dependent var 111.0000
Adjusted R-squared 0.953077
3
B2. Phát hiện ra sự tồn tại của hiện tượng đa cộng tuyến
1. R
2
cao nhưng tỷ số t thấp
Từ bảng kết quả eviews ta có:
R
2
= 0,963504
t
1
= 3,668972
t
2
= 1,144172
t
3
= - 0,526062
Ta thấy rằng hệ số xác định bội R
2
của mô hình là rất gần 1, điều
này chứng tỏ mô hình đưa ra là rất phù hợp. Trong khi đó thống kê t
3
lại
có giá trị rất gần 0 tương ứng với sác xuất ý nghĩa bằng 0.6151 là khá
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1
18
Variable Coefficient
Std. Error
t-Statistic
Prob. C -0.386271
2.897956
-0.133291
0.8973
X3 0.097923
0.001578
Log likelihood -23.80673
F-statistic 3849.020
Durbin-Watson stat 2.068509
Prob(F-statistic) 0.000000
Bảng 2
Ta kiểm định cặp giả thuyết
2
2
2
1 2
: 0
: 0
o
19
Ta có miền bác bỏ
2, 1
W :
k n k
tn tn
f f f
Từ bảng eviews ta có f
tn
= 3849,02
Với n = 10, k = 3,
= 0,05 ta có f
0,05
(1,8)
= 5,32
f
tn
> 5,32
f
Theo lý thuyêt nếu VIF
10 thì có hiện tượng đa cộng tuyến giữa
hai biến độc lập trong mô hình.
Vậy mô hình có xảy ra hiện tượng đa cộng tuyến.
4. Đo độ Theil ( để xem xét mức độ tương quan giữa các biến )
*) Xét mô hình hồi quy Y theo X
2
ta được kết quả:
Dependent Variable: Y
Method: Least Squares
Date: 05/24/11 Time: 15:09
Sample: 1 10
Included observations: 10
Variable Coefficient
Std. Error
t-Statistic
R-squared 0.962062
Mean dependent var 111.0000
Adjusted R-squared 0.957319
S.D. dependent var 31.42893
S.E. of regression 6.493003
Akaike info criterion 6.756184
Sum squared resid 337.2727
Schwarz criterion 6.816701
Log likelihood -31.78092
F-statistic 202.8679
Durbin-Watson stat 2.680127
Std. Error
t-Statistic
Prob. C 24.41104
6.874097
3.551164
0.0075
X3 0.049764
0.003744
13.29166
F-statistic 176.6681
Durbin-Watson stat 2.417419
Prob(F-statistic) 0.000001
Bảng 4
Từ 2 bảng hồi quy trên ta thu được kết quả:
r
12
2
= 0,962062
r
13
2
= 0,956679
80 100 120 140 160 180 200 220 240 260
X
3
810 1009
1273
1425
1633
1876
2052
2201
2435
2686
Y 162 110 145 150 130
X
2
270 230 290 250 215
X
3
2670
2450
t-Statistic
Prob. C 32.56119
8.151850
3.994331
0.0018
X2 1.683093
0.539251
3.121167
0.0088
Sum squared resid 1092.048
Schwarz criterion 7.667247
Log likelihood -53.44228
F-statistic 66.44587
Durbin-Watson stat 2.131191
Prob(F-statistic) 0.000000
Bảng 5
Thảo luận Kinh tế lượng – Nhóm 1
Thảo luận Kinh tế lượng – Nhóm 1
22
thích như sau:
*) Khi bỏ biến X
3
ta có mô hình hồi quy:
Y = 24,45455 + 0,509091X
2
r
12
2
= 0,962062
t
1
= 3,812791
t
2
= 1424317
*) Khi bỏ biến X
2
ta có mô hình hồi quy:
Y = 24,41104 + 0,049764X
3
r
13
2
= 0,956679
t
1
’
= 3,551164