Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 1
Mô hình hồi qui tuyến tính bội:
Lựa chọn mô hình và kiểm định giả thiết
1) Giới thiệu dạng hàm Logarit kép
Trong bài giảng này chúng ta tiếp tục thảo luận mô hình hồi qui và tập trung vào những
dạng hàm nào có thể là phù hợp với biến phụ thuộc và các biến hồi qui. Điều này rất quan
trọng vì dạng hàm phù hợp cũng là một trong các giả định OLS của mô hình hồi qui bội.
Khiá cạnh quan trọng trong đó mô hình hồi qui tuyến tính là nó là tuyến tính trong các
tham số. Nó không cần là tuyến tính trong các biến. Các mô hình là tuyến tính trong các
tham số dễ ước lượng bởi phương pháp OLS, nhưng phần mềm của máy vi tính hiện đại
cũng tạo điều kiện cho chúng ta ước lượng các mô hình phi tuyến trong các tham số .
Mô hình Logarit kép
Mô hình logarit kép là một mô hình trong đó biến phụ thuộc và các biến độc lập ở dạng
logarit. Mô hình này có nhiều công dụng khác nhau trong kinh tế học : các mô hình cầu
có hệ số co giãn không đổi, hay các hàm sản xuất Cobb-Douglas.
Trong khi chúng ta thường dùng các đường thẳng để thể hiện các đường cầu khi giới thiệu
các nguyên tắc kinh tế vi mô, thì chúng có thể không đại diện tốt cho dữ liệu thực tế.
Thường là, mối quan hệ giữa giá và lượng cầu được mô tốt bằng mô hình logarit kép. Hai
đồ thị dưới đây chỉ ra liên hệ giữa mối quan hệ tuyến tính dưới dạng logarit của các biến
và mối quan hệ tương ứng giữa chính những biến này :
∂
log(X) X
log(Y)
Y
2
β
i
1i
Xβ Y
−
=
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 2
Nếu chúng ta ước lượng một hàm hồi qui tuyến tính, thì chúng ta có một hàm ước lượng
cho độ dốc của Y theo X. Tuy nhiên, nếu chúng ta ước lượng mô hình logarit kép, thì
chúng ta có kết quả sau: ()
Y
X
XY
Y
X
1
LKY =
Đây là một dạng mô hình không thể ước lượng trực tiếp bởi OLS. Tuy nhiên, nếu chúng ta
lấy logarit cả hai vế , chúng ta tìm ra ()
(
)
(
)
ε
β
β
β
log log log )log(
321
+
+
+= LKY
dạng này thì tuyến tính trong các tham số, nên nó có thể được ước lượng bằng OLS. Một
dạng hàm sản xuất Cobb-Douglas mô tả lợi thế kinh tế theo qui mô (RTS) là tổng các hệ
số của hai biến log(K) và log(L), vì vậy khi ước lượng được các hệ số hồi qui thì chúng ta
cũng sẽ ước lượng RTS.
2) Lựa chọn mô hình
2.1 Hệ số xác định và hệ số xác định điều chỉnh
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 3
Lý do là TSS không phụ thuộc vào số biến giải thích nhưng ESS lại phụ thuộc vào số biến
giải thích. ESS khi tăng lên thêm biến giải thích (ví dụ X
k+1
) nếu đạt được một một ESS
lớn hơn thì tốt hơn là cho ước lượng
0
1
=
+
∧
K
β
và chúng ta vẫn dùng mô hình chỉ có K
biến giải thích. Điều này kéo theo cách làm thông thường rằng khi tăng thêm biến giải
thích thường là làm giảm ESS và làm tăng R
2
hoặc ít ra là không giảm nó cho dù biến mới
này có phù hợp trong việc giải thích biến phụ thuộc hay không. Như vậy khi so sánh hai
mô hình hồi qui bội có số biến giải thích khác nhau chúng ta cũng không thể sừ dụng hệ số
xác định này.
Các nhà nghiên cứu nên nhớ rằng việc bổ sung thêm một biến hồi qui cũng làm tăng thêm
một hệ số ước lượng, điều này tăng thêm "công việc" mà dữ liệu phải làm. Nói cách khác,
với một lượng thông tin đã cho chúng ta phải phân phối chúng cho số lượng hệ số lớn hơn.
(
)
()
()
22
n - K
1
1 - 1 - 1 - R
TSS n - 1
ESS
n
R
nK
−
==
−
Trong công thức của hệ số xác định có điều chỉnh chúng ta thấy rằng khi tăng K thì mẫu số
giảm nên có thể làm tăng hệ số xác định, nhưng ngược lại (1 – R
2
) cũng có thể giảm xuống
giảm xuống do R
2
có thể tăng khi tăng biến giải thích. Điều này có thể dẫn đến là khi tăng
thêm biến giải thích thì hệ số xác định điều chỉnh có thể được cải thiện, cũng có thể không
thay đổi hoặc thậm chí có thể giảm đi. Hệ số xác định có thể sừ dụng để so sánh hai mô
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 5
Bước hai hồi qui log(va) theo log(k) và log(l) Bước ba: tính hệ số xác định thực tế cho hàm log kép
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 6
Kết quả chúng ta được ở bảng sau cho hệ số xác định của hàm log kép
2.1 Các tiêu chuẩn lựa chọn khác
Sách Ramanathan, in lần thứ năm, liệt kê 8 tiêu chuẩn khác để lựa chọn mô hình. Các tiêu
chuẩn này có thể hiện khác nhau và các nhà nghiên cứu khác nhau có thể lựa chọn các tiêu
chuẩn khác nhau phù hợp với các ứng dụng cụ thể. Nêu một ví dụ trong chương 4 bảng
4.2
Hai tiêu chuẩn phổ biến mà EViews cho chúng ta biết làø Tiêu chuẩn Thông tin Akaike
(AIC) và Tiêu chuẩn Schwarz:
()
Cần lưu ý là R
2
,
2
R , và các tiêu chuẩn AIC và Schwarz khác nhau như thế nào.
Nguyên tắc chung
là hệ số xác định điều chỉnh càng lớn càng tốt. Còn các tiêu chuẩn lựa
chọn khác (8 tiêu chuẩn) thì càng nhỏ càng tốt. Tuy nhiên trong các tiêu chuẩn khác này lại
có những ưu tiên khác nhau cho các mô hình khác nhau. Ví dụ tiêu chuẩn Schwarz có tác
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 7
dụng so sánh các mô hình đơn giản nhưng sẽ gặp khó khăn khi so sánh các mô hình phức
tạp. AIC thì thích hợp trong phân tích chuỗi thời gian.
3) Kiểm định giả thiết
Hồi qui tuyến tính bội cũng có các tính chất gần giống như hồi qui tuyến tính đơn nhưng
bậc tự do đã thay đổi.
Các hệ số ước lượng tuân theo phân phối chuẩn
2
K
ˆ
(, )
2
∑
=
ε
s
Thực tế là:
[
]
22
εε
σ
=sE
Nếu các sai số ngẫu nhiên tuân theo phân phối chuẩn thì chúng ta cũng có ()
()
2
K -n
2
2
~
K -n
χ
σ
ε
ε
t-stat ~ t
s
kk
kk
s
ε
ββ
ββ ββ
σσ
÷= =
()
K -n
ˆ
k
t~stat - t
s
-
ˆ
=
k
k
β
ββ
α và bậc tự do tìm ra giá trị
()
*
n - K,
c
t t
α
〉Tính
0
ˆ
ˆ
-
s
k
k
c
t
β
β
β
=
Luật quyết định:
()
,
c
ttn K
b) Kiểm định hai đuôi
Cách làm tương tự như trên nhưng có những thay đổi là:
Giả thiết
00
10
:
:
K
K
H
H
β
β
β
β
=
≠
Luật quyết định:
(
)
,/2
c
ttnK
α
〉−
bác bỏ gỉa thiết không
Chúng ta có thể sừ dụng giá trị p-value trong EViews. Nếu p.value tính được nhỏ hơn
mức ý nghĩa thì chúng ta bác bỏ giả thiết không.
c) Kiểm định ý nghĩa thống kê của các hệ số hồi qui
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 10
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 11
Chúng ta chỉ nhìn vào bảng kết quả và bình tĩnh phân tích:
tc = t-Statistic và p-value = Prob
Chắc chắn chúng ta sẽ có thể cho ra nhận xét về ảnh hưởng của K và L lên VA như thế
nào.
3.2 Kiểm định mức độ ý nghĩa chung của mô hình (trường hợp đặc biệt của KIỂM
ĐỊNH WALD)
Trong mô hình hồi qui bội, giả thiết “không” cho rằng mô hình không có sức mạnh giải
thích được hiểu là tất cả các hệ số hồi qui riêng (các tham số độ dốc) đều bằng không: khong bang thoidong so thamcac ca tat phai Khong :
0 :
1
K320
H
()
K - 1 , n - K,
F
c
F
α
〉
Hoặc gía trị p-value của thống kê F nhỏ hơn mức ý nghĩa cho trước
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 12
Hãy xem ví dụ ở bảng sau:
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 13
()
K - 1 , n - K,
=14186 F 3.4
0
c
F
H
β
β
== =LTrị thống kê kiểm định đối với giả thiết này là : []
(
)
()
R
U
ESS
ESS n - K
U
c
ESS K m
F
−−
=
Nguyên tắc ra quyết định: Bác bỏ giả thiết không khi
()
một biến giải thích và kiểm tra xem biến tăng thêm này có làm tăng mức ý nghĩa của mô
hình. Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 15 Sau đó chúng ta áp dụng công thức
[]
(
)
()
[
]
(
)
()
R
U
ESS 1.66 0.85 3 2
= =22.87
ESS n - K 0.85 27 - 3
U
c
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 17 Rất thú vị là thống kê F ở đây tính được cũng giống như chúng ta đã tính cho trường hồi
qui hai lần. Hãy nhìn vào kết quả trong bảng trên. P-value =0.000071 nhỏ hơn mức ý nghĩa
do đó chúng ta có cơ sở từ chối giả thiết không và điều này cũng có nghĩa là khi chúng ta
tăng thêm biến log(l) vào mô hình thì mô hình cũng gia tăng mức ý nghĩa.
Ví dụ cho trường hợp b
: Ở đây chúng ta sừ dụng một dữ liệu khác trong ví dụ của chương
4 sách Ramanathan về giá nhà ở PRICE phụ thuộc vào các biến giải thích như diện tích
nhà ở SQFT, số phòng ngủ BEDRMS, số phòng tắm BATHS. Sau đó kiểm định xem khi
gia tăng cùng một lúc hai biến giải thích sau cùng thì mô hình có tăng sức giải thích không.
Dĩ nhiên mô hình đầu tiên chỉ có một biến giải thích là SQFT (mô hình này còn gọi là mô
hình giới hạn) và mô hình sau cùng bao gồm cả ba biến giải thích (được gọi là mô hình
không giới hạn). Chúng ta làm cả hai cách như sau:
Bước một: Chúng ta hồi qui PRICE cho một biến giải thích SQRT
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 18 Bước hai: Chúng ta hồi qui PRICE cho tất cả các biến giải thích
−− −−
=
()
2, 10,0.05
=0.471 F 4.1
c
F 〈=
Như vậy chúng ta không thể bác bỏ giả thiết là hai biến sau cùng (BEDRMS và BATHS)
không có ý nghĩa thống kê và chúng ta phải chấp nhận mô hình giới hạn chỉ có một biến
giải thích ban đầu là SQFT.
Tuy nhiên chúng ta không phải hồi qui hai bước giống như trên mà chúng ta chỉ hồi qui mô
hình không giới hạn sau đó lại sừ dụng Wald.
Và chúng ta có kết quả kiểm định này trong EViews như sau:
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 20 Điều tuyệt diệu là thống kê F giống hệt như cách tính ở trên và giá trị p-value lớn hơn mức
ý nghĩa vì vậy chúng ta cũng không thể bác bỏ giả thiết đã nêu ra từ đầu.
3.5 Ứng dụng kiểm định Wald vào lý thuyết kinh tế
Nguyễn Trọng Hoài 21 Chúng ta phải mở dữ liệu này trước để xác định dạng dữ liệu: bao nhiêu biến, tên biến, số
quan sát, tần suất quan sát để đưa vào EViews
Vì dữ liệu này theo năm nên chúng ta chọn Annual khi tạo một Workfile mới
Sau đó lại sừ dụng lệnh Proc/import trong EViews, các anh chị đã biết điều này trong phần
hướng dẫn EViews.
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
chọn mô hình và kiểm định giả thiết
Nguyễn Trọng Hoài 22 Chúng ta phải điền vào hộp thọai những nội dung cần thiết, hãy kiểm tra có gì khác biết so
với hướng dẫn trước đây.
Sau đó nhấp OK và tiến hành kiểm tra dữ liệu đã nhập đúng chưa
Chương Trình Giảng Dạy Kinh Tế Fulbright
Niên Khóa 2007 - 2008
Các phương pháp phân tích Mô hình hồi qui tuyến tính bội : Lựa
Hãy kiểm tra Fc = 3.77 có đúng hay không và chúng được tính như thế nào? Sau đó tra
bảng tìm F(1,17, 0.05) = 4.45. Chúng ta cũng có thể tìm trực tiếp giá trị này trong EViews.
Như vậy chúng ta không thể bác bỏ giả thiết không.
Cách làm tương tự trong EViews sẽ được lập lại rất đơn giản
Kết quả thống kê F và p-value cũng cho ra nhận xét tương tự Hãy suy nghĩ ý nghĩa kinh tế của trường hợp này. Máy tính sẽ không giúp được gì nến
chúng ta không biết sừ dụng chúng một cách khôn ngoan.
4 Cách tìm giá trị thống kê t và giá trị thống kê F và t trong Excel và trong EViews
a) Tra bảng thống kê tương ứng để kiểm tra