1
Ch
ương 4: Mô hình hồi quy với
biến giả
I. Bản chất của biến giả - Mô hình có biến giả
1. Khái niệm:
• Biến chất lượng:
Là biến mà nhận những giá trị thuộc tính (phạm trù)
nhất định. Một biến chất lượng có thể nhận 2, 3 hoặc
nhiều hơn các thuộc tính.
• Biến giả:
Là biến chỉ nhận 2 giá trị với mục đích để lượng hoá
các biến chất nhằm đưa các biến chất vào mô hình
khi phân tích một hiện tượng kinh tế xã hội.
• Ví dụ:
Một loại hàng được sản xuất trong nước hoặc là được
nhập khẩu.
D = 1 khi là hàng sản xuất trong nước,
= 0 khi không phải được sản xuất trong nước (nhập
khẩu)
2. Biến chất có 2 thuộc tính:
Ví dụ: Giả sử một công ty sử dụng 2 quá trình sản xuất
A và B để sản xuất ra một loại sản phẩm.
• Phương trình HQ: Y
i
= β
1
+β
2
D
i
i
= 1 nếu sản lượng sản phẩm thu được từ A
= 0 nếu sản lượng sản phẩm thu được từ B
• Mô hình cho biết sản lượng trung bình giữa A và B có
khác nhau không.
• Hệ số chặn β
1
cho biết sản lượng trung
bình gắn với B
E(Y
i
/D
i
=0) = β
1
• Hệ số góc β
2
cho biết sự khác nhau về
sản lượng trung bình của A so với B
E(Y
i
/D
i
=1) = β
1
+ β
2
• Kiểm định GT: H
0
: β
3. Biến chất có 3 thuộc tính trở lên
Ví dụ: Giả sử có 3 quá trình sản xuất A, B, C
Đưa vào 2 biến giả D
1
và D
2
Xét mô hình:
Y
i
= β
1
+ β
2
D
1i
+ β
3
D
2i
+ U
i
Trong đó:
D
1
= 1 nếu sản lượng sản phẩm thu được từ A
D
1
= 0 nếu sản lượng sản phẩm thu được từ quá
trình khác
D
/D
1
=0;D
2
=0)=β
1
Hệ số chặn cho biết sản lượng trung bình của C
Hệ số góc β
2
cho biết sự thay đổi trung bình của sản
lượng khi chuyển từ C sang A
Hệ số góc β
3
cho biết sự thay đổi trung bình của sản
lượng khi chuyển từ C sang B
Quá trình sản xuất D
1
D
2
A 1 0
B 0 1
C 0 0
• Kiểm định giả thiết:
H
0
: β
2
= 0 cho biết không có sự khác nhau giữa
sản lượng trung bình của A và C
H
=0,D
2
=1),
C (D
1
=0,D
2
=0).
D
1
D
2
Y D
1
D
2
Y
1 0 22 0 0 17,1
0 1 19 1 0 20,5
0 0 18,5 0 1 17
1 0 21 0 0 16
0 1 18 1 0 21,2
0 0 16 0 1 17,5
1 0 21 0 0 16,2
0 1 18,5
II. Mô hình hồi quy một biến lượng và một biến chất
1. Trường hợp biến chất chỉ có 2 thuộc tính
• Xét mô hình: Y
i
= β
, D
i
=0) = β
1
+ β
3
X
i
Tiền lương trung bình của công nhân cơ khí trong khu
vực tư nhân:
E(Y
i
/X
i
, D
i
=1) = (β
1
+ β
2
) + β
3
X
i
• Kiểm định H
0
: β
2
= 0
Cho biết liệu có sự khác nhau về mức lương
4
2. Trường hợp biến chất có nhiều hơn 2 thuộc tính
Ví dụ: Hồi quy thu nhập hàng năm của cán bộ giảng
dạy với tuổi nghề giảng dạy và khu vực giảng dạy
(Bắc, Trung, Nam).
• Mô hình:
Y
i
= β
1
+ β
2
D
1i
+ β
3
D
2i
+ β
4
X
i
+ U
i
Trong đó:
Y: thu nhập hàng năm của giảng viên
X: tuổi nghề của giảng viên
D
1
= 1 nếu thuộc một trường miền Bắc
i
/D
1
=1, D
2
=0, X
i
) = (β
1
+ β
2
) + β
4
X
i
Thu nhập trung bình của giảng viên ở miền
Nam:
E(Y
i
/D
1
=0, D
2
=1, X
i
) = (β
1
+ β
3
) + β
i
+U
i
Trong đó:
Y
i
là thu nhập hàng năm của giảng viên
X
i
là tuổi nghề của giảng viên
D
1i
=1 nếu giảng viên thuộc miền Bắc
=0 nếu giảng viên không thuộc miền Bắc
D
2i
=1 nếu giảng viên thuộc miền Nam
=0 nếu giảng viên không thuộc miền Nam
D
3i
=1 nếu giảng viên là nam
=0 nếu giảng viên là nữ
Phạm trù cơ sở là giảng viên thuộc miền
Trung
5
Thu nhập trung bình của một giảng viên nữ ở miền
Trung: E(Y
i
/D
1
i
Thu nhập trung bình của một giảng viên nữ ở miền
Bắc: E(Y
i
/D
1
=1,D
2
=0,D
3
=0,X
i
)=β
1
+β
2
+β
5
X
i
Thu nhập trung bình của một giảng viên nam ở miền
Bắc: E(Y
i
/D
1
=1,D
2
=0,D
3
=1,X
Thu nhập trung bình của một giảng viên nam ở miền
Nam: E(Y
i
/D
1
=0,D
2
=1,D
3
=1,X
i
)=β
1
+β
3
+β
4
+β
5
X
i
IV. Kết hợp hai hồi quy
Ví dụ:
Có hồi quy của tiết kiệm và thu nhập trước và
sau mốc chuyển đổi kinh tế của một quốc gia
Thời kỳ trước cải tổ: Y
i
=β
1
+β
1
và α
2
= β
2
: 2 hồi quy có cùng hệ số góc
+ α
1
= β
1
và α
2
≠ β
2
: 2 hồi quy có cùng hệ số chặn
+ α
1
≠ β
1
và α
2
≠ β
2
: 2 hồi quy hoàn toàn khác nhau
Dùng biến giả để kết hợp 2 hồi quy:
Gộp tất cả n và m quan sát
Ước lượng hồi quy: Y
i
=β
1
i
)= β
1
+β
3
X
i
E(Y
i
/D
i
=1,X
i
)= (β
1
+β
2
)+(β
3
+β
4
)X
i
Ví du: Số liệu tiết kiệm và thu nhập cá nhân ở nước Anh từ nằm 1946
và 1963 (Triệu pound). Chia làm hai giai đoạn 1946 – 1954 (thời kỳ
sau chiến tranh thế giới thứ II: thời kỳ tái thiết) và 1955-1963 (thời kỳ
hậu tái thiết). Hãy đánh giá xem mối quan hệ giữa tiết kiệm Y và thu
nhập X có thay đổi giữa hai thời kỳ hay không?
TKI Y X TKII Y X
1946 0,36 8,8 1955 0,59 15,5
là chi tiêu hàng năm về quần áo
X
i
là thu nhập
D
2
= 1 nếu là nữ; = 0 nếu là nam
D
3
= 1 nếu là sinh viên; = 0 nếu là công nhân viên
Chi tiêu quần áo trung bình:
D
2i
D
3i
Phân loại E(Y)
1 1 Nữ sinh viên β
1
+β
2
+β
3
+β
4
X
i
0 0 Nam công nhân viên β
1
+β
4
Y
i
=β
1
+β
2
D
2i
+β
3
D
3i
+β
4
(D
2i
D
3i
) + β
5
X
i
+U
i
Chi tiêu trung bình về quần áo của nữ sinh viên:
E(Y/D
2
=1,D
3
=1,X
D
2i
+β
3
D
3i
+β
4
D
4i
+β
5
X
i
+U
i
Trong đó: Y
i
: chi tiêu; X
i
: thu nhập;
D
1
= 1 nếu quan sát nằm ở quý 2
= 0 nếu quan sát nằm ở quý khác
D
2
= 1 nếu quan sát nằm ở quý 3
= 0 nếu quan sát nằm ở quý khác
D
i
)= (β
1
+β
2
)+ β
5
X
i
7
Chi tiêu trung bình trong quý 3 là:
E(Y
i
/D
2
=0,D
3
=1,D
4
=0,X
i
)= (β
1
+β
3
)+ β
5
X
i
Chi tiêu trung bình trong quý 4 là:
1
+β
2
D
2i
+β
3
D
3i
+β
4
D
4i
+β
5
X
i
+ β
6
(D
2i
X
i
) +
β
7
(D
3i
X
i
+ β
7
D
3i
+β
8
D
4i
)X
i
+U
i
7. Hồi quy tuyến tính từng khúc
Là mô hình có dạng đồ thị thay đổi độ dốc
nhưng vẫn đảm bảo tính liên tục.
Xét mối quan hệ phụ thuộc của tiêu dùng Y
và thu nhập X của nước ta trong 2 thời kỳ
trước và sau chuyển đổi.
Gọi năm chuyển đổi là t
0
Mô hình: Y
t
=β
1
+β
2
X
t
+β
3
E(Y
t
/D
t
=1,X
t
)= β
1
- β
3
X
t0
+(β
2
+β
3
)X
t
β
2
cho độ dốc của đường hồi quy trước khi chuyển
đổi
(β
2
+β
3
) cho độ dốc của đường hồi quy sau khi
chuyển đổi
Không có sự gián đoạn trên đồ thị vì:
E(Y
Y
t
=β
1
+β
2
X
t
+β
3
(X
t
– X
t0
)D
1t
+ β
4
(X
t
– X
t1
)D
2t
+U
t
Trong đó:
D
1
= 1 nếu t > t
nếu t
0
< t ≤ t
1
= β
1
- β
3
X
t0
– β
4
X
t1
+(β
2
+β
3
+ β
4
)X
t
nếu t > t
1
8
Ví dụ: Cho bảng số liệu tương ứng với hai giai đoạn I và II
a) Hãy thiết lập mô hình tuyến tính đơn cho 2 giai đoạn
riêng biệt.
b) Lập mô hình: Y
t