Tài liệu Giáo trình kinh tế lượng (Chương 4) doc - Pdf 91

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi

1CHƯƠNG 5Đa cộng tuyến

Các biến giải thích được xác đònh trong một mô hình kinh tế lượng thường xuất phát từ lý
thuyết hoặc hiểu biết căn bản về hành vi chúng ta đang cố gắng thiết kế mô hình, cũng như
từ kinh nghiệm quá khứ. Dữ liệu về các biến này đặc biệt xuất phát từ những thực nghiệm
không kiểm soát và thường tương quan với nhau. Điều này đặc biệt đúng đối với các biến
chuỗi thời gian thường có những xu hướng tiềm ẩn thông thường. Ví dụ, dân số và tổng sản
phẩm quốc nội là hai chuỗi dữ liệu tương quan chặt lẫn nhau. Trong chương trước, chúng ta
phát biểu là hệ số hồi qui đối với một biến cụ thể là số đo tác động riêng phần của biến này,
nghóa là tác động của nó khi tất cả các biến khác trong mô hình được giữ ở những mức cố
đònh và chỉ có giá trò của biến này thay đổi. Tuy nhiên, khi hai biến giải thích cùng tương
quan chặt; chúng ta không thể chỉ đơn giản giữ một biến không đổi và thay đổi biến còn lại
vì khi biến sau thay đổi thì biến đầu thay đổi. Trong trường hợp này, thật khó tách biệt ảnh

= α
1
+ α
2
INTRATE
t
+ α
3
POP
t
+ u
1t

Mô hình B: HOUSING
t
= β
1
+ β
2
INTRATE
t
+ β
3
GNP
t
+ u
2t

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004


Chúng ta kỳ vọng số căn hộ sẽ bò ảnh hưởng bởi cả kích thước dân số lẫn mức thu
nhập. Vậy mà trong Mô hình C, có cả hai biến này, các trò thống kê t thấp và không có ý
nghóa. Tuy nhiên, khi chỉ có POP hoặc GNP được đưa vào, các hệ số tương ứng rất có ý
nghóa. Một kiểm đònh Wald về việc loại bỏ POP và GNP khỏi Mô hình C cho kết quả một
trò thống kê F bằng 6,42, có ý nghóa ở mức 1 phần trăm, cho thấy là các biến này có ý nghóa
một cách liên kết mặc dù các biến riêng rẽ lại không có ý nghóa. Vì vậy, phần kết luận có
vẻ như vô lý. Kết quả thứ hai là, các hệ số của POP và GNP trong Mô hình C hoàn toàn
khác trong các hệ số trong Mô hình A và B. Tuy nhiên, hệ số của INTRATE ít biến động
hơn. Mặc dù trước đây chúng ta nghó rằng cả dân số và thu nhập đều có trong mô hình, các
kết quả lại cho thấy là khi các biến này có mặt đồng thời trong mô hình sẽ xuất hiện những
thay đổi nghiêm trọng. Điều này là do dân số, tổng sản phẩm quốc và lãi suất có tương
quan rất cao. Các hệ số tương quan từng cặp của GNP, POP và INTRATE là

r(GNP, POP) = 0,99 r(GNP, INTRATE) = 0,88 r(POP, INTRATE) = 0,91

} Bảng 5.1 Các Ước Lượng Của Các Quan Hệ Nhà Ở

Biến Mô hình A Mô hình B Mô hình C
Hằng số − 3812,93
(−2,40)
687,90
(1,80)
– 1315,75
(–0,27)
INTRATE -198,40
(–3,87)
–169,66
(–3,87)
–184,75


Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi

3
} VÍ DỤ 5.2
Đặt E
t
là chi tiêu tích lũy tại thời điểm t cho việc bảo trì (không tính xăng dầu) một chiếc
xe hơi cho trước, MILES, là số dặm chiếc xe đã chạy, tính bằng hàng ngàn dặm, và AGE,
là tuổi của chiếc xe tính bằng tuần kể từ khi mua lần đầu. Xem xét ba mô hình sau:

Mô hình A: E
t
= α
1
+ α
2
AGE
t
+ u

càng cũ chi phí bảo trì càng nhiều. Cũng như vậy đối với hai chiếc xe cùng tuổi thì chiếc
nào chạy nhiều hơn sẽ có thể cần nhiều chi phí bảo trì hơn. Vì vậy, chúng ta kỳ vọng là α
2
,
β
2
, γ
2
và γ
3
sẽ dương. Bảng 5.2 trình bày các hệ số ước lượng và các trò thống kê t (trong
ngoặc) của ba mô hình, dựa trên dữ liệu thực của một trạm xe Toyota. Dữ liệu trong tập tin
DATA3-7 mô tả trong Phụ lục D (xem Bài thực hành máy tính Phần 5.2 để chứng minh các
kết quả này).
Thật lý thú khi thấy là mặc dù hệ số của MILES có giá trò dương trong Mô hình B, hệ
số này lại âm một cách có ý nghóa trong Mô hình C. Vì vậy, có một sự đổi ngược nghiêm
trọng về dấu. Hệ số của AGE cũng có sự thay đổi quan trọng như vậy. Thứ hai, các trò
thống kê t của AGE và MILES trong Mô hình C thấp hơn rất nhiều. Ở đây cũng vậy,
nguyên nhân của sự thay đổi có ý nghóa trong kết quả là sự tương quan cao giữa hai biến
giải thích, trong trường hợp này làAGE và MILES, hệ số tương quan giữa chúng là 0,996.

} Bảng 5.2 Các mô hình chi tiêu cho xe hơi
Biến Mô hình A Mô hình B Mô hình C
Hằng số − 626,24
(−5,98)
−796,07
(−5,91)
7,29
(0,06)
AGE 7,35

Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi

4

5.2 Đa Cộng Tuyến Chính Xác

Nếu hai hoặc nhiều hơn hai biến độc lập có quan hệ tuyến tính giữa hai biến hoặc giữa
nhiều biến, chúng ta có đa cộng tuyến chính xác (hoặc hoàn hảo). Trong trường hợp này,
không có một lời giải duy nhất cho các phương trình chuẩn rút ra từ nguyên tắc bình
phương tối thiểu. Điều này được minh họa với một mô hình có hai biến độc lập, X
2
và X
3
,
cộng một hằng số. Mô hình như sau
y
t
= β
2
x
t2
+ β
3
x

x
3
+ β
^
3
∑x
3
2
= ∑yx
3
(5.3)

Trước hết chúng ta hãy xem xét trường hợp đơn giản nhất của đa cộng tuyến chính
xác, với x
3
= 2x
2
. Mặc dù một người có thể thắc mắc tại sao một nhà nghiên cứu lại đưa
biến x
3
vào mô hình, nếu như vậy, như chúng ta sẽ thấy trong chương tiếp theo, tình huống
này sẽ có thể xuất hiện một cách thiếu cân nhắc. Thay x
3
ở Phương trình (5.3), chúng ta có

β
^
2
∑x
2

hoàn toàn đa cộng tuyến với tương quan tuyến tính
x
3
= ax
2
+ b. Khi đó Phương trình (5.3) có thể được viết lại như sau
β
^
2
∑x
2
x
3
+ β
^
3
∑x
3
x
3
= ∑yx
3

hoặc
β
^
2
∑x
2
(ax

2
x
3
+ bβ
^
3
∑x
3
= a∑yx
2
+ b∑y
vì x
2
, x
3
và y được tính từ các giá trò trung bình của chúng, chúng ta có, từ Tính chất 2.A.4,
∑x
2
= ∑x
3
= ∑y = 0. Do đó, phương trình trên rút gọn (sau khi đơn giản a) thành
β
^
2
∑x
2
2

+ β
^


5.3 Gần Đa Cộng Tuyến

Khi các biến giải thích tương quan gần như tuyến tính, các phương trình chuẩn có thể
thường được giải để có những ước lượng duy nhất. Các câu hỏi đặt ra trong trường hợp này
là (1) các hệ quả của việc bỏ qua tính đa cộng tuyến là gì, (2) chúng ta xác đònh sự tồn tại
của đa cộng tuyến như thế nào, và (3) các biện pháp nào sẵn có để nhà nghiên cứu có thể
sử dụng nhằm tránh vấn đề này? Bây giờ chúng ta lần lượt xem xét các vấn đề này.

Các Hệ Quả Của Việc Bỏ Qua Tính Đa Cộng Tuyến

K
HÔNG
T
HIÊN
L
ỆCH
V
À
C
ÁC
T
ÍNH
C
HẤT
K
HÁC

Một câu hỏi tự nhiên xuất hiện là đa
cộng tuyến có làm mất hiệu lực đònh lý Gauss−Markov, đònh lý cho rằng OLS tạo ra các

5.2. Thật thú vò là Mô hình C có các hệ số của MILES ngược với các hệ số trong Mô hình
B, hoạt động tốt hơn xét về khía cạnh MSE và MAPE so với hai mô hình còn lại. Vì vậy,
trong trường hợp này, sự hiện diện của đa cộng tuyến thực sự có lợi cho việc dự báo.

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi

6

NH
H
ƯỞNG
Đ
ẾN
S
AI
S

C
HUẨN
Từ thảo luận này rõ ràng là đa cộng tuyến không gây

σ
2
S
33
(1 − r
2
)
(5.5)
Cov(β
^
2
, β
^
3
) =
− σ
2
r

S
22
S
33
(1 − r
2
)
(5.6)
Giả sử r
2
rất gần 1; nghóa là, r gần ±1 (gần đa cộng tuyến). Rõ ràng từ Phương trình

Các kết quả của phần thảo luận trên được tóm tắt trong Tính chất 5.1

Tính chất 5.1
Các hệ quả của việc bỏ qua tính đa cộng tuyến như sau:
a. Nếu hai hoặc nhiều hơn các biến giải thích trong một mô hình hồi qui bội có quan hệ
tuyến tính một cách chính xác, thì mô hình đó không thể ước lượng được.
b. Nếu một số biến giải thích có quan hệ gần tuyến tính, thì các tham số ước lượng OLS
(và do đó dự báo căn cứ vào chúng) vẫn là BLUE và MLE và do đó không bò thiên
lệch, có hiệu quả, và nhất quán.
c. Tác động của tính chất gần đa cộng tuyến giữa các biến giải thích là làm gia tăng các
sai số chuẩn của các hệ số hồi qui và làm giảm trò thống kê t, vì vậy sẽ làm cho các hệ
số kém ý nghóa hơn (và thậm chí có thể mất ý nghóa). Tuy nhiên, các kiểm đònh giả
thuyết vẫn có hiệu lực.
d. Đồng phương sai giữa các hệ số hồi qui của một cặp các biến có tương quan cao sẽ rất
cao, về giá trò tuyệt đối, vì vậy khó có thể diễn dòch các hệ số riêng lẻ được.
e. Tính đa cộng tuyến có thể không có ảnh hưởng đến việc thực hiện dự báo của một mô
hình và thậm chí có thể cải thiện dự báo.
Trong một mô hình với một vài biến, các cơ hội xuất hiện tính đa cộng tuyến lớn hơn
và do đó việc diễn dòch các kết quả có thể khó khăn hơn. Tính đa cộng tuyến có thể gây ra
việc làm mất đi mức ý nghóa của nhiều hệ số, trong khi sự phù hợp của một trong số các hệ
số đó thôi lại có thể tạo ra một hệ số có ý nghóa.
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyến


Đó là bằng chứng cho thấy khi S
23
= 0, giá trò
của β
^
2
, có được từ việc có cả X
2
và X
3
trong mô hình, đồng nhất với giá trò có được khi Y
được hồi qui theo số hạng không đổi và chỉ có X
2
. Một kết quả tương tự đối với β
^
3
. Đồng
phương sai giữa hai hệ số hồi qui, có giá trò bằng không, cho thấy rằng tác động riêng phần
là hoàn toàn do biến được đưa vào và không phải do bất kỳ tác động gián tiếp nào từ những
biến đã có khác. Một cách lý tưởng, chúng ta thích r phải tiến tới không, nhưng trong thực
tế điều này thường không xảy ra như vậy.

Nhận dạng Tính chất Đa cộng tuyến
Trong một tình huống thực tế, tính đa cộng tuyến thường xuất hiện dưới một số dạng.

G

T
RỊ
R

N
HỮNG
G
IÁ TRỊ CAO CHO CÁC
H
Ệ SỐ
T
ƯƠNG QUAN
Các tương quan từng mỗi cặp giữa các
biến giải thích có thể cao, giống như trong Ví dụ 5.1 và 5.2. Nói chung đây là một thực
hành tốt để đạt được các tương quan giữa mỗi cặp biến trong một mô hình hồi qui và kiểm
tra những giá trò cao giữa các biến giải thích. Xin lưu ý rằng một hệ số tương quan cao giữa
biến phụ thuộc và một biến độc lập không phải là một dấu hiệu của tính đa cộng tuyến.
Thực ra một tương quan như vậy rất được mong muốn.

C
ÁC
H
Ệ SỐ
H
ỒI QUI NHẠY VỚI
Đ
ẶC TRƯNG
Mặc dù một sự tương quan cao giữa các cặp biến
độc lập là một điều kiện đủ cho tính đa cộng tuyến, điều kiện đảo lại không cần thiết phải
đúng. Nói cách khác, tính đa cộng tuyến có thể hiện diện mặc dù sự tương quan giữa hai
biến giải thích thể hiện không cao. Điều này là do ba hay nhiều hơn các biến có thể gần
tuyến tính. Tuy vậy, những tương quan cặp có thể không cao. Kmenta (1986, trang 434) đã
đưa ra một ví dụ trong đó ba biến có liên hệ tuyến tính một cách chính xác, nhưng những


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status