HỒI QUY VỚI
BIẾN GIẢ
Chương 4
Các biến độc lập X
i
trong các mô hình đã nghiên
cứu thông thường là những biến định lượng, giá trị
quan sát là những con số
Tuy nhiên có những trường hợp các biến độc lập
này là những biến định tính.
Ví dụ : Thu nhập, chi tiêu, chi phí, doanh thu .v.v
Ví dụ : tốt – xấu, cao – thấp, nhanh – chậm…
I. BẢN CHẤT CỦA BIẾN GIẢ
I. BẢN CHẤT CỦA BIẾN GIẢ
Biến định tính thường biểu thị có hay không có một tính
chất hoặc là các mức độ khác nhau của một tiêu thức
thuộc tính nào đó
Ví dụ : giới tính (nam hay nữ), tôn giáo, dân tộc, nơi
sinh, hình thức sở hữu, ngành nghề kinh doanh .v.v…
Để lượng hoá các biến định tính, trong phân tích hồi quy
người ta dùng biến giả (dummy variables)
Ví dụ, giữa hai ngôi nhà có cùng các đặc trưng, một có
hồ bơi trong khi ngôi nhà còn lại không có.
1. Trường hợp các biến định tính chỉ có hai lựa
chọn
Tương tự, giữa hai nhân viên của một công ty có
cùng tuổi, học vấn, kinh nghiệm, một người là nam
và người kia là nữ…
II.
II.
II.
II.
Hồi qui với biến độc lập đều là
Hồi qui với biến độc lập đều là
biến định tính.
biến định tính.
II.
II.
Hồi qui với biến độc lập đều là
Hồi qui với biến độc lập đều là
biến định tính.
biến định tính.
1. Trường hợp các biến định tính chỉ có hai lựa chọn
iii
UDY ++=
21
ββ
Đối với nam:
1 2
Y
β β
⇒ = +
Tạm thời bỏ qua sai số U
i
Đối với nữ:
1
Y
β
⇒ =
1D
1
:β
2
≠ 0.
(Dùng kiểm định t với bậc tự do n-2).
II.
II.
Hồi qui với biến độc lập đều là
Hồi qui với biến độc lập đều là
biến định tính.
biến định tính.
1. Trường hợp các biến định tính chỉ có hai lựa chọn
II.
II.
Hồi qui với biến độc lập đều là
Hồi qui với biến độc lập đều là
biến định tính.
biến định tính.
2. Trường hợp các biến định tính có nhiều hơn
hai lựa chọn
Số các lựa chọn có thể có của một biến định
tính có thể nhiều hơn hai.
Ví dụ
Gọi Y
i
là tiền tiết kiệm của một hộ gia đình thứ i.
Chúng ta kỳ vọng rằng các hộ gia đình thuộc các
nhóm tuổi khác nhau sẽ có mức tiết kiệm khác
nhau.
Chú ý: số các biến giả luôn luôn ít hơn một
=
0
1
2i
D
Nếu chủ hộ từ 25 đến 55 tuổi
Nếu chủ hộ thuộc nhóm tuổi khác
=
0
1
3i
D
Nếu chủ hộ trên 55 tuổi
Nếu chủ hộ thuộc nhóm tuổi khác
II.
II.
Hồi qui với biến độc lập đều
Hồi qui với biến độc lập đều
là biến định tính.
là biến định tính.
2. Trường hợp các biến định tính có nhiều hơn
hai lựa chọn
Một mô hình đơn giản mô tả quan hệ giữa tiền tiết
kiệm và nhóm tuổi như sau:
D D= =
2 3
1, 0
i i
D D= =
2 3
0, 1
i i
D D
= =
II.
II.
Hồi qui với biến độc lập đều
Hồi qui với biến độc lập đều
là biến định tính.
là biến định tính.
2. Trường hợp các biến định tính có nhiều hơn
hai lựa chọn
Như vậy, β
1
cho chúng ta biết tiền tiết kiệm trung bình
một tháng của một hộ gia đình mà chủ hộ dưới 25 tuổi.
β
2
biểu thị chênh lệch về tiền tiết kiệm trung bình một
tháng của một hộ gia đình mà chủ hộ thuộc nhóm tuổi từ 25
đến 55 tuổi so với nhóm tuổi dưới 25
β
3
biểu thị chênh lệch về tiền tiết kiệm trung bình một
ββ
Lúc này, câu hỏi đặt ra là :"Giữa hai nhân viên có
cùng kinh nghiệm, có sự khác biệt trong tiền lương
tháng do giới tính không?"
1. Trường hợp có một biến định tính với 2 lựa chọn:
Khi đó, nếu tính đến biến giả , mô hình sẽ trở thành
iiii
UXDY
+++=
321
βββ
II. Hồi qui với biến độc lập định
lượng và định tính.
II. Hồi qui với các biến độc lập định
lượng và các biến định tính.
1. Trường hợp có một biến định tính với 2 lựa chọn:
Đối với
Nữ
1 3i i
Y X
β β
= +
Đối với Nam
1 2 3
( )
i i
Y X
β β β
= + +
Một giả thiết tự nhiên cần kiểm định là "không có sự
i
i
n n
=
= −
∑
Trong đó: n - là số biến giả cần thiết
đưa vào mô hình
k - là số biến định tính
n
i
- là số lựa chọn của biến
định tính thứ i
Ví dụ minh hoạ
Bảng dưới đây là số liệu giả thiết về mức lương giáo sư
đại học (Y), số năm kinh nghiệm giảng dạy (X) và giới
tính (D
i
=1:nam; D
i
=0:nữ)
Y
i
X
i
D
i
23,0 11 1
19,5 9 0
24,0 10 1
ˆ
i i i
Y X D
β β β
= + +