Kinh tÕ l−îng n©ng cao
BÀI 1
HỒI QUY VỚI BIẾN GIẢ
1. ĐẶT VẤN ĐỀ
Trong nhiều tình huống, cùng với các biến định lượng còn có những biến định tính . Ví dụ khi
nghiên cứu tiêu dùng của hộ dân cư, các biến thu nhập, giá cả, số nhân khẩu, có thể định lượng
được, nhưng giới tính của chủ hộ, cấu trúc thế hệ của hộ, tôn giáo - tín ngưỡng, một chính sách
của chính phủ là các biến không định lượng được.
Trong nhiều trường hợp, chính mức giá trị của các biến định lượng cũng làm thay đổi quan hệ
của chúng một cách cơ bản. Có thể dễ dàng nhận ra rằng, khi tiền lương tăng đến một mức nào đó
thì lượng cung lao động không còn tăng mà có thể giảm, điều này đã được mô tả trong nhiều
nghiên cứu về thị trường lao động. Cũng như vậy, thu nhập ở những mức khác nhau có thể tương
ứng với những tỷ lệ tiết kiệm khác nhau.
Nói tóm lại, trong hầu hết các quan hệ định lượng có sự can thiệp của các biến không định
lượng mà ở đây ta gọi là các biến định tính. Cần có một kỹ thuật đưa các biến như vậy vào trong
các mô hình, không chỉ với tư cách các biến giải thích mà còn với tư cách là các biến phụ thuộc.
2. KỸ THUẬT BIẾN GIẢ
2.1. Hồi quy với biến giải thích là biến định tính (mô hình ANOVA)
a. Biến định tính có hai phạm trù.
Lúc đó dùng một biến giả để thay thế cho nó.
VD: Thu nhập có phụ thuộc giới tính ?
Y
i
: thu nhập
D
i
=
⎩
β
1
Nếu
β
2
≠ 0 thì TN trung bình có phụ thuộc giới tính
Biến D dùng như trên gọi là biến giả (Dummy variable). Bμi 1: håi quy víi biÕn gi¶
Ví dụ: Bảng sau cho 10 quan sát về lương giáo viên phổ thông ở mức khởi điểm.
ST
T
Lương (Y:
nghìn $)
GiớiD
1 22 m 1
2 19 f 0
3 18 f 0
4 21,7 m 1
5 18,5 f 0
6 21 m 1
7 20,5 m 1
8 17 f 0
9 17,5 f 0
10 21,2 m 1
Biến giới: m = nam; f = nữ.
Y
i
: Chi phí cho văn hoá phẩm.
D
2i
=
⎩
⎨
⎧
khacdotrinhconeu
hoctieudotrinhconeu
0
1
Kinh tÕ l−îng n©ng cao
D
3i
=
⎩
⎨
⎧
khacdotrinhconeu
hoctrungdotrinhconeu
0
1
D
4i
=
⎩
i
c. Mô hình có hai biến định tính
VD : Thu nhập trung bình có khác nhau giữa thành thị và nông thôn, gữa nam và nữ ?
D
2
=
⎩
⎨
⎧
0
1
Nếu là nam
Nếu là nữ
D
3
=
⎩
⎨
⎧
0
1
Nếu làm việc ở thành thị
Nếu làm việc ở nông thôn
E(Y/D
2i
, D
3i
) =
• Các hệ số góc riêng phần được gọi là các hệ số chênh lệch.
• Việc đưa thêm các biến giải thích là định lượng vào mô hình được làm như thông lệ.
•
2.2. Sự tương tác giữa các biến giả
Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng. Để tính đến
điều đó ta thêm vào mô hình biến tương tác.
Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc?
Mô hình 1:
Y
i
=
β
1
+
β
2
D
2i
+
β
3
D
3i
+
β
5
X
i
5
X
i
+ u
i
Bμi 1: håi quy víi biÕn gi¶
Kiểm định H
0
:
β
4
= 0 (không có tương tác)
H
1
:
β
4
≠ 0 (có tương tác)
Lúc đó mức độ tương tác bằng
β
4
.
2.3. Đánh giá sự tác động đối với biến định lượng
i
, D
i
) =
β
1
+
β
2
D
i
+
β
3
X
i
b. Biến định tính tác động đến hệ số góc
E(Y/X
i
, D
i
) =
β
1
+
β
2
X
4
D
i
X
i
Như vậy việc sử dụng biến giả có thể cho phép đánh giá chính sách. Ví dụ: Tệp số liệu ch4bt1 chứa các số liệu mức tiêu dùng thực tế theo đầu người(CS) và
thu nhập thực tế theo đầu người của Mỹ(Y) giai đoạn 1929-1970.
Trong giai đoạn này đã xảy ra thế chiến II(1941-1946) và từ 1960 Mỹ đã tham chiến tại
Việt nam. Vậy chiến tranh có ảnh hưởng đến tiêu dùng của người Mỹ hay không?
Kinh tÕ l−îng n©ng cao Hồi quy CS theo Y cho kết quả sau:
Dependent Variable: CS
Method: Least Squares
Date: 11/21/08 Time: 09:13
Sample: 1929 1970
Included observations: 42
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 58.09624 49.97286 1.162556 0.2519
Y 0.872195 0.029209 29.86016 0.0000
R-squared 0.957064 Mean dependent
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 101.5147 25.45745 3.987621 0.0003
D1 -
204.9233
18.78558 -10.90854 0.0000
Y 0.863631 0.014718 58.67883 0.0000
R-squared 0.989402 Mean dependent
var
1498.54
8
Bμi 1: håi quy víi biÕn gi¶
Adjusted R-
squared
0.988858 S.D. dependent var 403.024
3
S.E. of regression 42.54105 Akaike info
criterion
10.4075
7
Sum squared resid 70579.89 Schwarz criterion 10.5316
8
Log likelihood -
215.5589
F-statistic 1820.42
4
Durbin-Watson
stat
Sum squared resid 50497.74 Schwarz criterion 10.2858
6
Log likelihood -
208.5277
F-statistic 1657.79
6
Durbin-Watson
stat
1.267117 Prob(F-statistic) 0.00000
0
Thêm biến D2=1trong thời kỳ từ 1960 trở đi và hồi quy cho kết quả sau:
Kinh tÕ l−îng n©ng cao Dependent Variable: CS
Method: Least Squares
Date: 11/21/08 Time: 09:29
Sample: 1929 1970
Included observations: 42
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 132.3042 33.32473 3.970151 0.0003
D1 -
196.3546
19.52647 -10.05581 0.0000
D2 33.54774 23.83096 1.407737 0.1673
Y 0.838927 0.022787 36.81532 0.0000
R-squared 0.989927 Mean dependent
==
0:H
0:H
2
4
2
31
430
ββ
ββ
a. Kiểm định Chow
Kiểm định về sự đồng nhất của hàm hồi quy
Toàn bộ tổng thể Y
i
=
β
1
+
β
2
X
i
+ u
i
Trong A
1
: Y
i
:H
:H
1
0
[
α
1
=
γ
1
=
β
1
] và [
α
2
=
γ
2
=
β
2
]
[
α
1
≠
2
Với mẫu W = W
1
∪ W
2
kích thước n
1
+ n
2
, hồi qui thu được RSS
Tính
RSS
= RSS
1
+ RSS
2
.
F
qs
=
k
knn
RSS
RSSRSS
2
21
−+
×
−
1
+
β
2
D
i
+
β
3
X
i
+
β
4
D
i
X
i
+ u
i
Và kiểm định thu hẹp hàm hồi quy với giả thuyết
H
0
:
β
2
=
β
4
= 0.
9.757442
Probability
0.007607
Dùng biến giả thu được kết quả sau:
Dependent Variable: TK
Method: Least Squares
Date: 11/21/08 Time: 09:51
Sample: 1946 1963
Included observations: 18
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C -
1.750172
0.331888 -5.273377 0.0001
D1 1.483923 0.470362 3.154852 0.0070
TN 0.150450 0.016286 9.238172 0.0000
D1*TN -
0.103422
0.033260 -3.109471 0.0077
R-squared 0.952626 Mean dependent
var
0.77333
3
Adjusted R-
squared
0.942475 S.D. dependent var 0.64280
6
Probability 0.00649
3
VÍ DỤ: XU HƯỚNG DÀI HẠN TRONG TỶ GIÁ MẬU DỊCH
Một trong những vấn đề được nhiều người quan tâm trong các tài liệu về kinh tế của các
nước đang phát triển là vấn đề tỷ giá mậu dịch giữa các nước sản xuất nguyên liệu và các nước
sản xuất hàng hoá công nghiệp. Hầu như phổ biến các nước bán sản phẩm thô hay nguyên liệu là
các nước nghèo hay kém phát triển còn những nước bán hàng hoá là sản phẩm chế biến là các
nước giàu. Một trong các quan điểm kinh tế phổ biến là tỷ giá mậu dịch có khả năng dịch chuyển
liên tục ngược lại đối với các nước bán sản phẩm thô. Quan điểm này dựa trên lý thuyết về sự phụ
thuộc theo đó, người ta gọi các nước sản xuất công nghiệp là các trung tâm còn các nước khác là
các nước ngoại vi. Hay theo quan điểm của trường phái tân cổ điển thì có một sự khác biệt rất lớn
về tính co giãn của cung và cầu trong hai loại hàng hoá như vậy.
Để trả lời cho câu hỏi có hay không sự chuyển dịch ngược của tỷ giá mậu dịch trước tiên, ta nhắc
lại một vài khái niệm liên quan giữa khối lượng trao đổi mậu dịch NBTT (hàng đổi hàng) với giá
xuất khẩu P
x
và giá nhập khẩu P
M
.
Ta có :
M
X
P
P
NBTT =
Biểu thức trên đo lường khối lượng xuất khẩu đảm bảo tài chính cho khối lượng nhập khẩu. Tỷ số
này tăng cho thấy một xu hướng tốt; tỷ lệ này giảm cho thấy một tác động (sự di chuyển) ngược
đối với quốc gia tương ứng. Thu nhập từ trao đổi mậu dịch của một quốc gia (YTT) đo bằng tỷ lệ
Đây là một mô hình nửa logarit và b
2
thể hiện sự thay đổi của NBTT theo thời gian.
Spaor đã dùng một số hồi quy với các dãy số liệu theo thời gian và thời kỳ khác nhau. Chúng ta
có thể nghiên cứu hai kết quả hồi quy trên cơ sở số liệu của những năm 1900 - 1938 và 1900 -
1970 như sau:
Thời kỳ 1900 - 1938:
lnNBTT
t
= 4.572 - 0,00725 T R
2
= 0.37
Se (0,00188)
T (3,86)
Thời kỳ 1900 - 1970:
lnNBTT
t
= 4.438 - 0.00134T R
2
= 0.33
Se (0.00096)
T (1.39)
Theo kết quả trên, có thể kết luận rằng, thời kỳ 1900 - 1938 có sự suy giảm của NBTT (mỗi
năm khoảng - 0.7%) và hệ số b
2
khác không có ý nghĩa. Tuy nhiên, nếu xét trong cả thời kỳ
dài 1900 - 1970 thì b
2
khác không không có ý nghĩa hay không có sự suy giảm tỷ giá mậu dịch
trong thời kỳ dài.
F =
+
+−
=
Tra bảng F(2,49) mức 5% ta có giá trị xấp xỉ 3.2. Vì giá trị quan sát của F lớn hơn giá trị tới hạn
mức 5%, ta kết luận rằng có sự suy giảm của tỷ giá mậu dịch qua hai thời kỳ.
Nếu sử dụng biến giả D để kiểm tra giả thiết nói trên, ta có thể xét hồi quy sau:
lnNBTT
t
= b
1
+ b
2
T + b
3
D
t
,
Với D=1 từ 1950 về sau và D=0 ở các năm khác.
Ước lượng nhận được là:
lnNBTT
t
= 4,594 - 0,00836T + 0,5003D
t
R
2
= 0,56
Se (độ lệch tiêu chuẩn) (0,00142) (0,0649)
Kết luận gì từ kết quả này?
3
=
⎩
⎨
⎧
khacquylaneu
quylaneu
0
3 1
D
4
=
⎩
⎨
⎧
khacquylaneu
quylaneu
0
4 1
Ta có mô hình:
Y
t
=
β
1
+
β
2
D
1966-3 12213 137828
1966-4 12820 145465
1967-1 11349 136989
1967-2 12615 145126
1967-3 11014 141536
1967-4 12730 151776
1968-1 12539 148862
1968-2 14849 158913
1968-3 13203 155727
1968-4 14947 168409
1969-1 14151 162781
1969-2 15949 176057
1969-3 14024 172419
1969-4 14315 183327
1970-1 12381 170415
1970-2 13991 181313
1970-3 12174 176712
1970-4 10985 180370
a. Hãy hồi quy lợi nhuận với doanh số và cho nhận xét.
b. Vẽ đồ thị của lợi nhuận và doanh số theo thời gian và cho nhận xét.
c. Từ đó hãy tìm cách hoàn thiện mô hình. Hồi quy lợi nhuận theo doanh số:
Dependent Variable: LN
Method: Least Squares
Date: 11/21/08 Time: 22:28
Sample: 1965:1 1970:4
Included observations: 24
7
Thêm các biến mùa vụ D2, D3, D4 thu được kết quả:
Dependent Variable: LN
Method: Least Squares
Date: 11/21/08 Time: 10:23
Sample(adjusted): 1965:3 1970:4
Included observations: 22 after adjusting endpoints
Variable Coefficie
nt
Std. Error t-Statistic Prob.
C 7450.805 2091.104 3.563097 0.0024
D4 1734.704 688.4851 2.519595 0.0220
D3 325.9880 676.4989 0.481875 0.6360
D2 461.8268 656.8974 0.703043 0.4915
DS 0.031752 0.013520 2.348538 0.0312
R-squared 0.480284 Mean dependent
var
12978.6
4
Adjusted R-
squared
0.357998 S.D. dependent var 1393.95
2
S.E. of regression 1116.904 Akaike info
criterion
17.0712
2
Sum squared resid 2120706
0
Schwarz criterion 17.3191
t
, D
t
) =
β
1
+
β
2
X
t
+
β
3
( X
t
– X
t0
)D
t
Nếu có nhiều hơn một điểm gấp khúc thì cũng tiến hành tương tự. 2.7. CÁC GIẢ THIẾT CỦA OLS TRONG HỒI QUY VỚI BIẾN GIẢ
a. Phương sai của các sai số U
i
không đồng đều
Chẳng hạn trong ví dụ về tiết kiệm ở Anh Quốc. Nếu hồi quy không có biến giả thì mọi thủ
tục phát hiện, khắc phục hiện tượng vi phạm giả thiết này đã được trình bày ở các bài trước. Vấn
đề chỉ đặt ra khi phương sai của các sai số ở hai thời kỳ khác nhau. Những kiểm định chỉ áp đặt
1. Với biến D, các giá trị trong thời kỳ đầu (1946-1954) nhận giá trị 0; giá trị ứng với quan sát
đầu tiên của thời kỳ sau (1955-1963) nhận giá trị 1/(1- ρ), các giá trị ứng với các quan sát sau
đó nhận giá trị 1.
Bμi 1: håi quy víi biÕn gi¶
2. Các giá trị quan sát của biến Y
t
biến đổi theo công thức (Y
t
-ρY
t-1
).
3. Các giá trị D
t
Y
t
nhận giá trị 0 trong các quan sát ở thời kỳ đầu; giá trị đầu tiên trong thời kỳ
sau D
t
Y
t
=Y
t
còn các giá trị quan sát sau đó (D
t
Y
t
-D
t-1
Y