Tài liệu HUA Nhập môn kinh tế lượng_ Chương 5 - Pdf 97

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
1

CHƯƠNG 5

Đa cộng tuyến

Các biến giải thích được xác đònh trong một mô hình kinh tế lượng thường xuất phát từ lý
thuyết hoặc hiểu biết căn bản về hành vi chúng ta đang cố gắng thiết kế mô hình, cũng như
từ kinh nghiệm quá khứ. Dữ liệu về các biến này đặc biệt xuất phát từ những thực nghiệm
không kiểm soát và thường tương quan với nhau. Điều này đặc biệt đúng đối với các biến
chuỗi thời gian thường có những xu hướng tiềm ẩn thông thường. Ví dụ, dân số và tổng sản
phẩm quốc nội là hai chuỗi dữ liệu tương quan chặt lẫn nhau. Trong chương trước, chúng ta
phát biểu là hệ số hồi qui đối với một biến cụ thể là số đo tác động riêng phần của biến này,
nghóa là tác động của nó khi tất cả các biến khác trong mô hình được giữ ở những mức cố
đònh và chỉ có giá trò của biến này thay đổi. Tuy nhiên, khi hai biến giải thích cùng tương
quan chặt; chúng ta không thể chỉ đơn giản giữ một biến không đổi và thay đổi biến còn lại
vì khi biến sau thay đổi thì biến đầu thay đổi. Trong trường hợp này, thật khó tách biệt ảnh
hưởng riêng phần của một biến đơn. Cũng vậy, thay đổi mô hình bằng cách loại bỏ hoặc
thêm vào một biến có thể làm thay đổi kết quả một cách nghiêm trọng, khiến cho việc diễn
dòch các ước lượng sẽ khó khăn hơn. Đây chính là vấn đề đa cộng tuyến, vấn đề xuất hiện

2
INTRATE
t
+ α
3
POP
t
+ u
1t

Mô hình B: HOUSING
t
= β
1
+ β
2
INTRATE
t
+ β
3
GNP
t
+ u
2t

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

nghóa. Một kiểm đònh Wald về việc loại bỏ POP và GNP khỏi Mô hình C cho kết quả một
trò thống kê F bằng 6,42, có ý nghóa ở mức 1 phần trăm, cho thấy là các biến này có ý nghóa
một cách liên kết mặc dù các biến riêng rẽ lại không có ý nghóa. Vì vậy, phần kết luận có
vẻ như vô lý. Kết quả thứ hai là, các hệ số của POP và GNP trong Mô hình C hoàn toàn
khác trong các hệ số trong Mô hình A và B. Tuy nhiên, hệ số của INTRATE ít biến động
hơn. Mặc dù trước đây chúng ta nghó rằng cả dân số và thu nhập đều có trong mô hình, các
kết quả lại cho thấy là khi các biến này có mặt đồng thời trong mô hình sẽ xuất hiện những
thay đổi nghiêm trọng. Điều này là do dân số, tổng sản phẩm quốc và lãi suất có tương
quan rất cao. Các hệ số tương quan từng cặp của GNP, POP và INTRATE là

r(GNP, POP) = 0,99 r(GNP, INTRATE) = 0,88 r(POP, INTRATE) = 0,91

} Bảng 5.1 Các Ước Lượng Của Các Quan Hệ Nhà Ở

Biến Mô hình A Mô hình B Mô hình C
Hằng số − 3812,93
(−2,40)
687,90
(1,80)
– 1315,75
(–0,27)
INTRATE -198,40
(–3,87)
–169,66
(–3,87)
–184,75
(-3,18)
POP 33,82
(3,61)
14,90

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
3
} VÍ DỤ 5.2
Đặt E
t
là chi tiêu tích lũy tại thời điểm t cho việc bảo trì (không tính xăng dầu) một chiếc
xe hơi cho trước, MILES, là số dặm chiếc xe đã chạy, tính bằng hàng ngàn dặm, và AGE,
là tuổi của chiếc xe tính bằng tuần kể từ khi mua lần đầu. Xem xét ba mô hình sau:

Mô hình A: E
t
= α
1
+ α
2
AGE
t
+ u
1t

Mô hình B: E
t
= β

2
, γ
2
và γ
3
sẽ dương. Bảng 5.2 trình bày các hệ số ước lượng và các trò thống kê t (trong
ngoặc) của ba mô hình, dựa trên dữ liệu thực của một trạm xe Toyota. Dữ liệu trong tập tin
DATA3-7 mô tả trong Phụ lục D (xem Bài thực hành máy tính Phần 5.2 để chứng minh các
kết quả này).
Thật lý thú khi thấy là mặc dù hệ số của MILES có giá trò dương trong Mô hình B, hệ
số này lại âm một cách có ý nghóa trong Mô hình C. Vì vậy, có một sự đổi ngược nghiêm
trọng về dấu. Hệ số của AGE cũng có sự thay đổi quan trọng như vậy. Thứ hai, các trò
thống kê t của AGE và MILES trong Mô hình C thấp hơn rất nhiều. Ở đây cũng vậy,
nguyên nhân của sự thay đổi có ý nghóa trong kết quả là sự tương quan cao giữa hai biến
giải thích, trong trường hợp này làAGE và MILES, hệ số tương quan giữa chúng là 0,996.

} Bảng 5.2 Các mô hình chi tiêu cho xe hơi
Biến Mô hình A Mô hình B Mô hình C
Hằng số − 626,24
(−5,98)
−796,07
(−5,91)
7,29
(0,06)
AGE 7,35
(22,16)
27,58
(9,58)
MILES 53,45
(18,27)


Ramu Ramanathan Thuc Doan/Hao Thi
4

5.2 Đa Cộng Tuyến Chính Xác

Nếu hai hoặc nhiều hơn hai biến độc lập có quan hệ tuyến tính giữa hai biến hoặc giữa
nhiều biến, chúng ta có đa cộng tuyến chính xác (hoặc hoàn hảo). Trong trường hợp này,
không có một lời giải duy nhất cho các phương trình chuẩn rút ra từ nguyên tắc bình
phương tối thiểu. Điều này được minh họa với một mô hình có hai biến độc lập, X
2
và X
3
,
cộng một hằng số. Mô hình như sau
y
t
= β
2
x
t2
+ β
3
x
t3
+ v
t
(5.1)

trong đó số hạng không đổi bò loại khỏi bằng cách diễn tả mỗi biến như một sai biệt so với

3
2
= ∑yx
3
(5.3)

Trước hết chúng ta hãy xem xét trường hợp đơn giản nhất của đa cộng tuyến chính
xác, với x
3
= 2x
2
. Mặc dù một người có thể thắc mắc tại sao một nhà nghiên cứu lại đưa
biến x
3
vào mô hình, nếu như vậy, như chúng ta sẽ thấy trong chương tiếp theo, tình huống
này sẽ có thể xuất hiện một cách thiếu cân nhắc. Thay x
3
ở Phương trình (5.3), chúng ta có

β
^
2
∑x
2
(2x
2
)

+ β
^

β
^
2
∑x
2
x
3
+ β
^
3
∑x
3
x
3
= ∑yx
3

hoặc
β
^
2
∑x
2
(ax
2
+ b)

+ β
^
3

∑x
3
= a∑yx
2
+ b∑y
vì x
2
, x
3
và y được tính từ các giá trò trung bình của chúng, chúng ta có, từ Tính chất 2.A.4,
∑x
2
= ∑x
3
= ∑y = 0. Do đó, phương trình trên rút gọn (sau khi đơn giản a) thành
β
^
2
∑x
2
2

+ β
^
3
∑x
2
x
3
= ∑yx

sử dụng nhằm tránh vấn đề này? Bây giờ chúng ta lần lượt xem xét các vấn đề này.

Các Hệ Quả Của Việc Bỏ Qua Tính Đa Cộng Tuyến

KHÔNG THIÊN LỆCH VÀ CÁC TÍNH CHẤT KHÁC Một câu hỏi tự nhiên xuất hiện là đa
cộng tuyến có làm mất hiệu lực đònh lý Gauss−Markov, đònh lý cho rằng OLS tạo ra các
ước lượng không thiên lệch, tuyến tính tốt nhất (BLUE). Chúng ta thấy từ phát biểu của
đònh lý Gauss−Markov (xem Phần 3.3) là cần có các Giả đònh 3.2 đến 3.7 để chứng minh
đònh lý. Một tương quan chặt giữa các biến giải thích không vi phạm bất kỳ giả đònh nào.
Do đó, các ước lượng OLS vẫn BLUE; nghóa là, chúng không thiên lệch, nhất quán và
hiệụ quả. Cũng như vậy, cộng tuyến cao không có tác động gì đến giả thiết 3.8. Do đó,
phân phối của trò thống kê t cũng không bò ảnh hưởng. Tiếp tục như chúng ta đã làm trong
Phần 3.A.5, chúng ta có thể thấy là các ước lượng OLS vẫn có vẻ thích hợp nhiều nhất và
vì vậy vẫn nhất quán. Các dự báo vẫn không thiên lệch và các khoảng tin cậy vẫn có hiệu
lực. Do đó không có kết quả nào trong những kết quả trước đây bò ảnh hưởng bởi đa cộng
tuyến. Mặc dù các sai số chuẩn và các trò thống kê t của các hệ số hồi qui bò ảnh hưởng về
mặt trò số, các kiểm đònh dựa trên những giá trò này vẫn có hiệu lực.

ẢNH HƯỞNG ĐẾN DỰ BÁO Mặc dù đa cộng tuyến ảnh hưởng các hệ số hồi qui riêng lẻ,
tác động của nó đến các dự báo thường ít nghiêm trọng hơn và ngay cả có thể lại là những
tác động có lợi.
Ví dụ, trong Bảng 5.1, sai số bình phương trung bình (MSE) thời đoạn của mẫu của các giá
trò dự báo cũng như sai số phần trăm tuyệt đối trung bình (MAPE) hiện diện trong mỗi mô
hình. Lưu ý rằng, trong khi các hệ số thay đổi rất lớn giữa các mô hình, MSE không có
những thay đổi lớn như vậy. Các giá trò MSE và MAPE cũng được trình bày trong Bảng
5.2. Thật thú vò là Mô hình C có các hệ số của MILES ngược với các hệ số trong Mô hình
B, hoạt động tốt hơn xét về khía cạnh MSE và MAPE so với hai mô hình còn lại. Vì vậy,
trong trường hợp này, sự hiện diện của đa cộng tuyến thực sự có lợi cho việc dự báo.

Chương trình Giảng dạy Kinh tế Fulbright

2
S
22
(1 − r
2
)

(5.4)
Var(β
^
3
) =
σ
2
S
33
(1 − r
2
)
(5.5)
Cov(β
^
2
, β
^
3
) =
− σ
2
r

3
đến Y. Nói cách khác, chúng ta
không thể giữ X
3
không đổi và chỉ tăng X
2
, bởi vì X
3
do có tương quan với X
2
, nên kết quả
là cũng sẽ thay đổi.
Các kết quả của phần thảo luận trên được tóm tắt trong Tính chất 5.1

Tính chất 5.1
Các hệ quả của việc bỏ qua tính đa cộng tuyến như sau:
a. Nếu hai hoặc nhiều hơn các biến giải thích trong một mô hình hồi qui bội có quan hệ
tuyến tính một cách chính xác, thì mô hình đó không thể ước lượng được.
b. Nếu một số biến giải thích có quan hệ gần tuyến tính, thì các tham số ước lượng OLS
(và do đó dự báo căn cứ vào chúng) vẫn là BLUE và MLE và do đó không bò thiên
lệch, có hiệu quả, và nhất quán.
c. Tác động của tính chất gần đa cộng tuyến giữa các biến giải thích là làm gia tăng các
sai số chuẩn của các hệ số hồi qui và làm giảm trò thống kê t, vì vậy sẽ làm cho các hệ
số kém ý nghóa hơn (và thậm chí có thể mất ý nghóa). Tuy nhiên, các kiểm đònh giả
thuyết vẫn có hiệu lực.
d. Đồng phương sai giữa các hệ số hồi qui của một cặp các biến có tương quan cao sẽ rất
cao, về giá trò tuyệt đối, vì vậy khó có thể diễn dòch các hệ số riêng lẻ được.
e. Tính đa cộng tuyến có thể không có ảnh hưởng đến việc thực hiện dự báo của một mô
hình và thậm chí có thể cải thiện dự báo.
Trong một mô hình với một vài biến, các cơ hội xuất hiện tính đa cộng tuyến lớn hơn

23
= 0 và do đó hai công thức thông thường trở thành như sau (xem Phụ lục 5.A)


Xin lưu ý rằng các công thức này giống như các công thức thông thường khi Y được
hồi qui một cách riêng biệt theo X
2
và X
3.
Đó là bằng chứng cho thấy khi S
23
= 0, giá trò
của β
^
2
, có được từ việc có cả X
2
và X
3
trong mô hình, đồng nhất với giá trò có được khi Y
được hồi qui theo số hạng không đổi và chỉ có X
2
. Một kết quả tương tự đối với β
^
3
. Đồng
phương sai giữa hai hệ số hồi qui, có giá trò bằng không, cho thấy rằng tác động riêng phần
là hoàn toàn do biến được đưa vào và không phải do bất kỳ tác động gián tiếp nào từ những
biến đã có khác. Một cách lý tưởng, chúng ta thích r phải tiến tới không, nhưng trong thực
tế điều này thường không xảy ra như vậy.

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
8
tương quan giữa bất kỳ cặp nào cũng không cao hơn 0,5. Trong trường hợp như vậy, bằng
chứng thật sự của tính đa cộng tuyến là sự quan sát cho thấy rằng các hệ số hồi qui bò thay
đổi đáng kể (ngay cả các dấu có thể đảo ngược lại, như trong Ví dụ 5.2) khi các biến được
thêm vào hoặc bỏ ra.

C
ÁC KIỂM ĐỊNH THÔNG THƯỜNG ĐỐI VỚI TÍNH ĐA CỘNG TUYẾN Mặc dù các kiểm đònh đã
được đề nghò, những thủ tục này đều được đề cập thoáng qua bởi vì chúng còn gây khá
nhiều tranh cãi. Do tính đa cộng tuyến là một vấn đề đối với dữ liệu hơn là đối với tự thân
một mô hình, nhiều nhà kinh tế lượng lý luận rằng các kiểm đònh thông thường nếu không
vô nghóa thì cũng chẳng thu thập được gì (xem Maddala, 1977, trang 186).
Farrar và Glauber (1967) đã đề nghò một nhóm các kiểm đònh để nhận dạng sự tính
nghiêm trọng của tính chất đa cộng tuyến. Các kiểm đònh này bao gồm một kiểm đònh Chi
bình phương, một kiểm đònh F, và một kiểm đònh t. Kiểm đònh chi bình phương là để xác
đònh xem tính đa cộng tuyến nói chung có hiện diện hay không. Sau đó sẽ là kiểm đònh F,
để tìm xem có những biến nào đang gây ra tính đa cộng tuyến, và cuối cùng là kiểm đònh t
để phát hiện bản chất của tính đa cộng tuyến. Những kiểm đònh này được thiết lập dưới
dạng các khái niệm có liên quan đến kiến thức về đại số tuyến tính. Những độc giả có quan
tâm với một kiến thức cơ bản về đại số ma trận có thể muốn đọc các bài báo của các tác
giả này.
Belsley, Kuh, và Welsch (1980, chương 3) đã đề nghò một thủ tục gồm hai bước để

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
9
LOẠI BỎ CÁC BIẾN Vì tính đa cộng tuyến là do những mối quan hệ chặt chẽ giữa các biến
giải thích, cách chắc chắn nhất để loại bỏ hoặc giảm bớt các tác động của tính đa cộng
tuyến là bỏ một hoặc nhiều biến ra khỏi mô hình. Như chúng tôi đã lưu ý trong nhiều ví dụ
trước, thủ tục này thường làm cải thiện sai số chuẩn của các hệ số còn lại và có thể làm cho
các biến không ý nghóa trước đó trở thành có ý nghóa, vì việc loại bỏ một biến sẽ làm giảm
bất kỳ tính đa cộng tuyến nào do biến đó gây ra. Mô hình B của Bảng 5.1 chứng tỏ điểm
này. Việc loại bỏ POP, biến có trò thống kê t thấp nhất (không kể số hạng không đổi mà nó
không bao giờ bò loại bỏ vì nó nắm giữ các tác động quân bình của các biến bò loại bỏ), làm
cho GNP trở nên có ý nghóa và làm tăng các giá trò t của hai hệ số khác. Thủ tục đơn giản
hóa mô hình dựa trên cơ sở dữ liệu, đã được đề cập ở chương trước, là một cách hiệu quả để
giảm thiểu tính đa cộng tuyến.
Các nhà khảo sát thường hay gộp quá nhiều biến vào một mô hình vì sợ rằng nếu
không thì sẽ gặp phải thiên lệch do biến bò loại bỏ đã được mô tả trong Phần 4.5. trong
trường hợp như vậy, việc loại bỏ các biến có trò thống kê t thấp nói chung sẽ làm cải thiện
mức ý nghóa của các biến còn lại. Điều quan trọng xảy ra trong tình huống này là các biến
còn lại có khả năng nắm giữ những tác động của các biến bò loại bỏ có liên quan chặt chẽ
với chúng. Người ta sẽ nhận thấy rằng sự đơn giản hóa mô hình dựa trên dữ liệu là cốt lõi
của phương pháp mô hình hóa Hendry/LSE từ tổng quát-đến-đơn giản. Tuy nhiên, có một
điểm nguy hiểm trong việc loại bỏ quá nhiều biến khỏi đặc trưng mô hình, bởi vì việc này
sẽ dẫn đến thiên lệch trong các ước lượng. Nói chung đây là một thực tế thích hợp để xem
xét tầm quan trọng về mặt lý thuyết của việc duy trì một biến không ý nghóa nếu trò số
thống kê của nó ít nhất là 1 về giá trò tuyệt đối hoặc giá trò p nhỏ hơn 0,25. Các trò số thống
kê lựa chọn mô hình đã được thảo luận trong Chương 4 nên là những hướng dẫn hữu ích
trong công việc này. Tuy nhiên, xin nhớ rằng khi hai biến giải thích có tương quan chặt chẽ

− 0,698 INTRATE
(0,62) (2,55) (- 3,75)
R

2
= 0,377 d.f. = 20 r(GNP/POP, INTRATE) = 0,843
Mặc dù R
2
có hiệu chỉnh ở đây hơi cao hơn trong Ví dụ 5.1, hai giá trò không thể so sánh
được với nhau vì các biến phụ thuộc khác nhau. Tính đa cộng tuyến cũng không bò loại bỏ
mà chỉ được làm giảm đi.
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
10
Do các biến chuỗi thời gian có nhấn mạnh vào các xu hướng một cách đặc trưng,
người ta sẽ kỳ vọng tính cộng tuyến cao giữa chúng. Một cách phổ biến để tránh điều này
là hình thành mô hình đối với những khác biệt đầu tiên, nghóa là sử dụng các biến như là
những thay đổi từ một thời đoạn này sang thời đoạn khác. Chẳng hạn, thay vì hình thành
một hàm tiêu thụ như
C
t

α
1
+
α
2
(Y
t


Y
t-1
) + v
t

Nên chú ý rằng hai cách trình bày này không tương đương nhau và, cụ thể là cách
trình bày thứ nhất giải thích mức độ tiêu thụ trong khi cách thứ hai diễn tả những thay đổi
trong tiêu thụ. Người ta có thể dùng lý thuyết để quyết đònh một sự ưu tiên xem biến nào
phù hợp. Nếu mục tiêu là để dự báo chi phí cho tiêu dùng, một so sánh dự báo có thể được
thực hiện sau khi sử dụng mô hình thứ hai để phát ra một dự báo của mức độ tiêu dùng cho
từng thời đoạn. Tất cả các bước này đòi hỏi suy nghó và cân nhắc kỹ lưỡng.
Đôi khi các mô hình được tái thiết lập với sự kết hợp tuyến tính của các biến tương
quan được sử dụng thay vì từøng biến một như là một biến riêng biệt. Một vấn đề xuất hiện
đối với việc quyết đònh trọng số cho sự kết hợp tuyến tính này. Phân tích thành phần cơ sở
là một cách để thể hiện vấn đề này (xem Judge et al., 1985).

S
Ử DỤNG THÔNG TIN BÊN NGOÀI Phương pháp sử dụng thông tin bên ngoài thường được áp
dụng trong các nghiên cứu về sự ước lượng các hàm nhu cầu. Dữ liệu chuỗi thời gian về thu
nhập và giá của một mặt hàng thường thể hiện một tương quan cao, mà nó làm cho việc
ước lượng các độ co giãn về giá và thu nhập trở nên khó khăn. Một giải pháp cho vấn đề

Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
11

C
ÁC BIỆN PHÁP KHÁC Một số phương pháp đã được đưa ra trong cơ sở lý thuyết, hầu hết
chúng đều không theo thể thức, và không được sự nhất trí cho lắm giữa các nhà kinh tế
lượng về mức độ hữu ích của các phương pháp này. Hai trong số những kỹ thuật này là hồi
qui ngọn sóng và phân tích thành phần chính. Các kỹ thuật không được thảo luận ở đây vì
chúng đòi hỏi kiến thức đại số tuyến tính và thống kê toán học vượt quá phạm vi của cuốn
sách này. Đối với những độc giả có được nền tảng kiến thức như trên, có thể tìm thấy một
phương cách xử lý tính đa cộng tuyến khá hay trong sách của Judge, Griffiths, Hill, và Lee
(1985). Còn có những bài đọc tham khảo khác cũng hữu ích được liệt kê trong phần tài liệu
tham khảo, nhưng một số tài liệu đòi hỏi phải nắm vững kiến thức đại số ma trận hoặc các
phương pháp được trình bày ở Chương11.

} 5.4 Các ứng dụng
Chi phí bảo trì trong ngành ô-tô
Người ta đã thấy rằng một trong những tác động của tính đa cộng tuyến là làm thay đổi các
hệ số hồi qui một cách đáng kể. Tuy nhiên, nếu mối quan hệ gần tuyến tính giữa các biến
độc lập được đưa vào xem xét, thì những khác biệt hầu như không lớn lắm. Chẳng hạn như,
trong ví dụ của Toyota, nếu biến MILES được hồi qui theo một hằng số và biến AGE,

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
12
famsize = Số người trong một hộ gia đình
unemp = Tỷ lệ phần trăm thất nghiệp
highschl = Phần trăm dân số (25 tuổi trở lên) có trình độ học vấn bậc trung học
college = Phần trăm dân số (25 tuổi trở lên) đã hoàn tất chương trình cao đẳng
hoặc đại học trở lên
medinc = Giá trò trung vò của thu nhập gia đình tính theo đơn vò ngàn đô-la
Bảng 5.3 có phần in ra từ máy tính có kèm chú thích để nghiên cứu.

} Bảng 5.3 Phần in ra từ máy tính có chú thích cho Ứng dụng ở Phần 5.4

[Ma trận của các hệ số tương quan theo từng cặp được trình bày ở đây. Cột cuối cùng chỉ số
biến. Vì vậy, sự tương quan giữa biến #5 (highschl) và biến #4 (unemp) là - 0,109. Các giá
trò trên đường chéo đều bằng 1,000 bởi vì sự tương quan giữa một biến và chính nó là 1.
Xin lưu ý rằng các hệ số tương quan cho thấy một vài giá trò cao. Như chúng ta đã kỳ vọng,
tỷ lệ trình độ bậc cao đẳng đại học có tương quan dương với trung vò thu nhập và tương
quan âm với tỷ lệ thất nghiệp. Chúng ta có thể kỳ vọng rằng những tương quan này cho
thấy sự xuất hiện của tính đa cộng tuyến giữa các biến này và có tác động đến các kết quả
hồi qui.]

Mean of dep. var. 9.903 S.D. of dep. variable 3.955
Error Sum of Sq (ESS) 146.0911 Std Err of Resid. (sgmahat) 1.6925
Unadjusted R-squared 0.836 Adjusted R-squared 0.817
F-statistic (6. 51) 43.3875 p-value for F() 0.000000
Durbin-Watson stat. 1.904 First-order autocorr. coeff 0.040
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
13

MODEL SELECTION STATISTICS

SGMASQ 2.86453 AIC 3.20646 FPE 3.21025
HQ 3.53259 SCHWARZ 4.11172 SHIBATA 3.1268
GCV 3.2577 RICE 3.32025

Excluding the constant. p-value was highest for variable 4 (uemp).

} Bảng 5.3 (tiếp theo)

[Ta lưu ý rằng biến urb và unemp có giá trò p cao hơn bất cứ mức chấp nhận hợp lý nào và
do đó sẽ là những biến bò loại ra khỏi mô hình. đặc biệt bởi vì về lý thuyết không có lý do


Excluding the constant. p-value was highest for variable 2 (urb).
Of the 8 model selection statistics. 8 have improved.

[Không có sự thay đổi trong các hệ số ước lượng và độ lệch chuẩn. Urb vẫn không có ý
nghóa và sẽ được loại bỏ tiếp theo.]

MODEL 3: OLS estimates using the 58 observations 1-58
Dependent variable: povrate

VARIABLE COEFFICIENT STDERROR T STAT 2Prob(t > |T|)

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
14
0) const 19.1721 7.8263 2.450 0.017634 **
3) famsize 5.4140 1.7581 3.079 0.003283 ***
5) highschl -0.1388 0.0627 -2.214 0.031161 **
6) college 0.1953 0.0897 2.178 0.033882 **
7) medinc -0.5523 0.0667 -8.274 0.000000 ***



0) const 53.2862 9.9879 5.335 0.000002 ***
3) famsize -3.9594 2.0194 -1.961 0.055081 *
5) highschl -0.4137 0.0798 -5.182 0.000003 ***
6) college -0.4744 0.0582 -8.151 0.000000 *** Error Sum of Sq (ESS) 346.1406 Std Err of Resid. (sgmahat) 2.5318
Unadjusted R-squared 0.612 Adjusted R-squared 0.590
F-statistic (3. 54) 28.3753 p-value for F() 0.000000

MODEL SELECTION STATISTICS

SGMASQ 6.41001 AIC 6.85058 FPE 6.85208
HQ 7.24045 SCHWARZ 7.8966 SHIBATA 6.79111
GCV 6.88483 RICE 6.92281

[Một điều đáng quan tâm là giờ đây biến college có dấu âm như kỳ vọng và có ý nghóa. Sự
thay đổi xảy ra có thể do sự đa cộng tuyến tồn tại giữa biến medinc và vài hoặc tất cả các
biến giải thích khác. Tuy nhiên, có sự giảm đáng kể trong giá trò
2
R từ 0,818 xuống 0,590.
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyến


MODEL SELECTION STATISTICS

SGMASQ 11.1249 AIC 12.0788 FPE 12.084
HQ 12.9441 SCHWARZ 14.4266 SHIBATA 11.9186
GCV 12.1744 RICE 12.2838

[Tất cả các hệ số đều rất ý nghóa và có dấu như kỳ vọng. Ngoài ra, bình phương R có hiệu
chỉnh có giá trò cao, như vậy khẳng đònh rằng đa cộng tuyến hẳn phải là lý do về dấu dương
không như kỳ vọng của biến college trong mô hình tỷ lệ nghèo.] Tóm tắt
Nếu một mối quan hệ tuyến tính đúng đắn tồn tại giữa hai hay nhiều biến giải thích, các
biến đó được gọi là đa cộng tuyến một cách chính xác. Trong tình huống như vậy, các hệ số
hồi qui tương ứng với các biến độc lập này không thể ước lượng một cách duy nhất.
Nếu vài biến giải thích là gần đa cộng tuyến, các ước lượng OLS vẫn không thiên lệch,
nhất quán, và là ước lượng không thiên lệch tuyến tính tốt nhất (BLUE). Do đó, các dự báo
cũng không thiên lệch và là nhất quán. Hơn nữa, tất cả các kiểm đònh của các giả thuyết
đều hiệu lực.
Hiệu ứng của gần đa cộng tuyến là tăng độ lệch chuẩn của các hệ số hồi qui và giảm
các trò thống kê t của chúng. Điều này có khuynh hướng làm cho các hệ số kém ý nghóa hơn
nếu không có sự đa cộng tuyến. Do đó, nên chú ý khi rút ra suy luận và không đưa ra kết
luận rằng mọi biến không có ý nghóa nên bò loại bỏ.
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc



Absence of multicollinearity Sự vắng mặt của đa cộng tuyến
Exact multicollinearity Đa cộng tuyến chính xác
First differences Sai phân bậc nhất
Multicollinearity Đa cộng tuyến
Near multicollinearity Gần đa cộng tuyến
Perfect multicollinearity Đa cộng tuyến hoàn hảo
Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
17
5.A PHỤ LỤC
Chứng Minh các Phương Trình (5.4) đến (5.6)

Dùng các ký hiệu của Phần 4.A.1. các Phương trình chuẩn (5.2) và (5.3) có thể được
giải cho các hệ số β như sau (xem Phương trình 4.A.6 đến 4.A.15). ∆
β
233y332y
2

S
22
+ β
3
S
23
(5.A.4)

E(S
y3
) = β
2
S
23
+ β
3
S
33
(5.A.5)

Ta có
S
y2
= ∑yx
2
= ∑x
2

2
x

22
+ β
3
S
23
, vậy phương trình (5.A.4) được
chứng minh. Chứng minh phương trình (5.A.5) tương tự. Tiếp theo ta chứng minh
rằng ∆
σ
β
33
2
2
S
=Var
)
ˆ
(
(5.A.7) ∆
σ
β
22
2
3

2
2
Var(v) = σ
2
∑x
2
2

= σ
2
S
22

Chương trình Giảng dạy Kinh tế Fulbright
Niên khóa 2003-2004

Phương pháp phân tích
Bài đọc

Nhập môn kinh tế lượng với các ứng dụng
Chương 5: Đa cộng tuyếnRamu Ramanathan Thuc Doan/Hao Thi
18

Var (S
y3
) = ∑x
3

ˆ
3y2y23333y
2
232y
2
33
2
2
SSCovS2S-SVarS+SVarS
1
=Var(

β ][
23233333
2
2322
2
33
2
2
SS2S-SS+SS=

σ


và X
3
(xem Phương trình 2.11). Theo đònh
nghóa,
)/(
3322
2
23
2
SSS=r
. Do đó.

∆ = S
22
S
33
(1 – r
2
)

Dùng kết quả này vào Phương trình (5.A.7). (5.A.8), và (5.A.9), ta được Phương
trình (5.4). (5.5), và (5.6).


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status