5.1 KHÁI NIỆM
CHƯƠNG 5
• Biến định lượng: các giá trị quan sát được thể
hệ bằng con số
• Biến định tính: thể hiện một số tính chất nào
đó
• Để đưa những thuộc tính của biến định tính
vào mô hình hồi quy, cần lượng hóa chúng =>
sử dụng biến giả (dummy variables)
BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY
4
1
4
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI
THÍCH ĐỀU LÀ BIẾN GiẢ
BIẾN GIẢ
1.
MỤC
TIÊU
Biết
A
A
B
Yi 28 32 35 27 25 37 29 34 33 30
Trong đó Yi : năng suất
Zi: công nghệ tương ứng
5
2
2
5
NỘI DUNG
1
Khái niệm biến giả
2
Sử dụng biến giả trong mô hình hồi quy
3
Kỹ thuật sử dụng biến giả
3
6
1
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
MỘT BIẾN ĐỊNH TÍNH
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI
THÍCH ĐỀU LÀ BIẾN GiẢ
Sử dụng mô hình hồi quy
Yi = β1 + β2Di + Ui (hãy tìm hàm hồi quy mẫu ?)
•Như vậy β1 + β2 biểu hiện năng suất trung bình
của công nghệ A
•β2 phản ánh chênh lệch năng suất trung bình
giữa công nghệ B và công nghệ A
•β2 = 0 chính là giả thiết cho rằng giũa công nghệ
A và công nghệ B không có sự khác biệt
• Ví dụ: khảo sát lượng hàng bán được ở một cửa
hàng, người ta thu được các số liệu cho ở bảng sau:
Yi
20
19
11
xi
2
3
3
4
4
3
4
4
5
5
5
6
6
1
1
0
1
0
1
0
1
0
1
0
1
Di
Trong đó Yi : Lượng hàng bán được (tấn/tháng)
Xi: giá bán
Di: Khu vực khảo sát: Di = 0 nếu khu vực khảo sát ở
nông thôn, Di = 1 nếu khu vực khảo sát ở thành phố
8
11
11
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI
THÍCH ĐỀU LÀ BIẾN GiẢ
Chú ý: để phân biệt m mức độ người ta dùng
m-1 biến giả để tránh hiện tượng đa cộng tuyến.
f
9
9
12
12
2
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
MỘT BIẾN ĐỊNH TÍNH
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
HAI BIẾN ĐỊNH TÍNH
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
MỘT BIẾN ĐỊNH TÍNH
Như vậy
Lượng bán trung bình của một cửa hàng ở miền núi là
phạm trù cơ sở (D1i = D2i = 0) ta có
Yi = β1 + β2Xi + Ui
Lượng bán trung bình của một cửa hàng ở nông thôn là
(D1i= ?; D2i= ?) ta có
Yi = β1 + β2Xi + β3 + Ui
Lượng bán trung bình của một cửa hàng ở thành phố là
(D1i= ?; D2i= ?) ta có
Yi = β1 + β2Xi + β4 + Ui
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
HAI BIẾN ĐỊNH TÍNH
Mô hình hồi quy tổng quát như sau:
Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + Ui
Thu nhập của nữ có trình độ dưới đại học:
E(Y/X, D1i = 0, D2i = 0, D3i = 0) = β1 + β2Xi + Ui
Thu nhập của nam có trình độ dưới đại học: ?
E(Y/X, D1i = 0, D2i = 0, D3i = 1) = β1 + β2Xi + β5 + Ui
Thu nhập của nữ có trình độ đại học:
E(Y/X, D1i = 1, D2i = 0, D3i = 0) = β1 + β2Xi + β3+ Ui
14
14
17
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ
HAI BIẾN ĐỊNH TÍNH
5.6. BIẾN GiẢ VỚI TUNG ĐỘ GỐC VÀ HỆ SỐ
GÓC KHÁC NHAU
Từ mô hình trên ta có thể so sánh mức thu nhập với nhiều
trường hợp khác nhau
-Giữa nhân viên nữ có bằng đại học với nhân viên nữ
không có bằng đại học.
-Giữa nhân viên nữ có bằng đại học với nhân viên nữ có
bằng trên đại học.
-Giữa nhân viên nữ có bằng đại học với nhân viên nam có
bằng đại học.
-Giữa nhân viên nam có bằng đại học với nhân viên nam
không có bằng đại học…
Tiếp tục với ví dụ trên.
Giả sử lương khới điểm của nhân viên nữ (chưa có thâm
niên hay X = 0); là β1;
Lương khởi điểm của nhân viên nam (chưa có thâm niên
hay X = 0) khác lương khởi điểm của nhân viên nữ một
khoản là α1 tức lương khởi điểm của nhân viên nam là (β1
+ α1 )
Mô hình tổng quát trở thành:
Yi = (β1 + α1Di )+ (β2 + α2 Di )Xi + Ui
(Hay: Yi = β1 + α1Di + β2 Xi + α2 Di Xi + Ui)
19
Yi = β1 + β2Xi + Ui
Thu nhập của nhân viên nam: Yi = β1 + (β2 + α2) Xi + Ui
Nếu đặt Di là biến giới tính với Di = 1 nếu là nam, Di = 0
nếu là nữ,
Mô hình tổng quát trở thành:
Yi = β1 + (β2 + α2 Di )Xi + Ui
(Hay: Yi = β1 + β2 Xi + α2 Di Xi + Ui)
α2 > 0 tốc độ tăng thu nhập của nhân viên nam nhanh
hơn nhân viên nữ, α2 < 0 tốc độ tăng thu nhập của nhân
viên nam chậm hơn nhân viên nữ.
Quy Chi tiêu của Trình độ văn Tuổi của Giới tính
Mã hộ mô hộ
hộ
hóa của chủ hộ chủ hộ
chủ hộ
Yi
38820
4
10097.37
3
48
Nam
38818
6
14695.2
8
42
Nữ
38817
3
13680.91
0
77
Nữ
11209
3
27651.65
13
32
Nữ
11208
4
32102.67
8
47
Nữ
11207
2
11464.6
7
38
Nam
11206
4
17199.63
5
93
Nam
hóa của chủ hộ chủ hộ
chủ hộ
X1i
Yi
X2i
X3i
D1i
38820
4
10097.37
3
48
1
38818
6
14695.2
8
42
0
38817
8
11733.34
4
37
0
38816
3
7087.489
0
21
0
11208
4
32102.67
8
47
0
11207
2
11464.6
7
38
1
11206
4
17199.63
5
93
1
5.9. HỒI QUY TUYẾN TÍNH TỪNG KHÚC
Nơi sinh
sống
D2i
0
0
0
0
0
27
27
30
30
5
Chi tiêu của hộ = α + β1* quy mô hộ + β2*trình độ văn hóa của
chủ hộ+ β3* tuổi của chủ hộ + β4* giới tính của chủ hộ β5* nơi
sinh sống của hộ
Mã hộ
38820
38818
38817
38816
38815
38813
11212
11211
11209
11208
11207
11206
Quy
của chủ
hộ
3
8
4
0
6
2
9
0
13
8
7
5
Tuổi
của
chủ
hộ
48
42
37
21
48
76
42
77
32
47
38
Thành thị
Ví dụ
Mã hộ
Quy mô hộ
38820
38818
38817
38816
38815
38813
11212
11211
11209
11208
11207
11206
4
6
8
3
9
4
7
3
3
4
2
4
48
42
37
21
48
76
42
77
32
47
38
93
Nghề nghiệp
chủ hộ
Bác sĩ
Giáo viên
Nông dân
Bác sĩ
Giáo viên
Nông dân
Bác sĩ
Giáo viên
Nông dân
Bác sĩ
Giáo viên
Nông dân
31
32
35
35
Dữ liệu đã mã hóa
Mã hộ Quy mô hộ
38820
4
38818
6
38817
8
38816
3
38815
9
38813
4
11212
7
11211
3
11209
3
11208
4
11207
2
48
0
0
9554.563
2
76
0
0
69258.09
9
42
0
1
13680.91
0
77
0
1
27651.65
13
32
0
1
32102.67
8
47
0
1
11464.6
7
4
###
2
###
4
33
33
Chi Trình độ
tiêu văn hóa
Nghề
của của chủ Tuổi của nghiệp chủ
hộ
hộ
chủ hộ
hộ
Giáo viên
###
3
48
Bác sĩ 0
###
8
42 Giáo viên 1
###
4
37 Nông dân 0
###
Nông
dân
0
0
1
0
0
36
36
6
5.2 Sử dụng biến giả trong mô hình hồi quy
Câu hỏi
• Nếu có thêm nghề kế toán thì sao?
Y (thu nhập)
X (số năm)
4
3
D (nơi làm
việc)
40
40
5.2 Sử dụng biến giả trong mô hình hồi quy
HỒI QUY VỚI BiẾN ĐỊNH TÍNH
Quy tắc: Nếu biến định tính có m biểu hiện thì
sử dụng m-1 biến.
Ví dụ: Tổng chi tiêu của hộ phụ thuộc vào
(1) Giới tính của chủ hộ
(2) Số thành viên trong hộ
(3) Vùng nơi hộ sinh sống (có 8 vùng)
Biến định tính là biến nào?
E(Y/X,D) = 1 + 2Xi + 3Di
(5.1)
E(Y/X,D=0) = 1 + 2Xi
(5.2)
E(Y/X,D=1) = 1 + 2Xi + 3
(5.3)
(5.2): tiền lương trung bình của công nhân làm
việc trong khu vực quốc doanh với bậc thợ là X
(5.3): tiền lương trung bình của công nhân làm
X
Bậc thợ
(Giả thiết của mô hình: tốc độ tăng lương theo
D=1 nếu công nhân làm trong khu vực tư nhân
bậc thợ ở hai khu vực giống nhau)
D=0 nếu công nhân làm trong khu vực nhà nước
D được gọi là biến giả trong mô hình
39
39
42
42
7
5.2 Sử dụng biến giả trong mô hình hồi quy
E(Y/X,Z) = 1 + 2Xi + 3Di
E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i
E(Y/X,Z1=0,Z2=0) = 1 + 2Xi
E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3
5.2 Sử dụng biến giả trong mô hình hồi quy
5.2 Sử dụng biến giả trong mô hình hồi quy
Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y)
(triệu đồng/tháng) vào thời gian công tác (X)
(năm) và nơi làm việc của người lao động
(DNNN, DNTN và DNLD)
Dùng 2 biến giả Z1 và Z2 với
Z1i =1
nơi làm việc tại DNNN
Z1i =0
nơi làm việc tại nơi khác
Z2i =1
nơi làm việc tại DNTN
Z2i =0
nơi làm việc tại nơi khác
Z1i = 0 và Z2i = 0
Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ
người lao động (từ đại học trở lên, cao đẳng và
khác)
1: nếu trình độ từ đại học trở lên
0: trường hợp khác
1: nếu trình độ cao đẳng
D2i =
0: trường hợp khác
Một chỉ tiêu chất lượng có n phạm trù (thuộc
tính) khác nhau thì dùng n-1 biến giả
Z2
0
TH1: Y= 1 + 2Z + 3X + U
5
5
DNTN
0
1
TH2: Y= 1 + 2X + 3(ZX) + U
3
3
DNLD
0
0
6
4
5.2 Sử dụng biến giả trong mô hình hồi quy
5.2 Sử dụng biến giả trong mô hình hồi quy
VD 5.4: Khảo sát lương của nhân viên theo
số năm kinh nghiệm và giới tính
Y
Yˆ ˆ 1 ˆ 2 ˆ 3 X
TH1: Y= 1 + 2Z + 3X + U
Yˆ ˆ 1 ˆ 3 X
TH2: Y= 1 + 2X + 3(ZX) + U
ˆ 1 ˆ 2
TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U
Trong đó
Y
lương
X
số năm kinh nghiệm
Z
giới tính với Z=1: nam; Z=0: nữ
ˆ 1 , ˆ 2 , ˆ 3 0
ˆ
Với ZX gọi là biến tương tác
Hàm SRF ứng với nữ (Z=0) :
Yˆ ˆ 1 ˆ 2 X
TH3: Lương khởi điểm và tốc độ tăng
lương khác nhau
Hàm SRF ứng với nam (Z=1) :
Yˆ ˆ 1 ˆ 2 X ˆ 3 X ˆ 1 ( ˆ 2 ˆ 3 ) X
50
50
53
53
5.2 Sử dụng biến giả trong mô hình hồi quy
5.2 Sử dụng biến giả trong mô hình hồi quy
TH1: Lương khởi điểm của nv nam và nữ
khác nhau nhưng tốc độ tăng lương theo số
năm kinh nghiệm như nhau
Y
Yˆ ˆ 1 ( ˆ 2 ˆ 3 ) X
5.3 Ứng dụng sử dụng biến giả
5.2 Sử dụng biến giả trong mô hình hồi quy
5.3.1 Sử dụng biến giả trong phân tích mùa
Y
chi tiêu cho tiêu dùng
X
thu nhập
Z = 1 nếu quan sát trong mùa (tháng 1-6)
Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12)
TH3: Lương khởi điểm và tốc độ tăng lương
khác nhau
Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U
Hàm SRF ứng với nữ (Z=0) :
TH1: Nếu yếu tố mùa chỉ
ảnh hưởng đến hệ số
chặn
Yˆ ˆ 1 ˆ 3 X
Hàm SRF ứng với nam (Z=1) :
Yˆ ˆ1 ˆ2 ˆ3 X ˆ4 X ( ˆ1 ˆ2 ) ( ˆ3 ˆ4 ) X
Yˆi ˆ1 ˆ2 Xi ˆ3Zi
1970
1970
1971
1971
1971
Yˆ ˆ 1 ˆ 3 X
ˆ 1 ˆ 2
ˆ 1 , ˆ 2 , ˆ 3 , ˆ 4 0
ˆ 1
0
X
Quý
1
2
3
4
1
2
3
Doanh số
992.7
1077.6
1185.9
1326.4
1434.2
Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau
56
56
59
59
Ví dụ
Năm
1970
1970
1970
1970
1971
1971
1971
1971
1972
1972
1972
1972
1973
1973
57
57
Quý
D2
0
1
0
0
0
1
0
0
0
1
0
0
0
1
D3
0
0
1
0
0
0
1
0
0
0
1
0
Yi 1 2 Xi U2i
B2: Ước lượng (5.3.1) và (5.3.2) và thu được
RSS1 có df = n1-k, RSS2 có df = n2-k. Đặt
RSS*=RSS1+RSS2
B3: Tính
RSS RSS* / k
F
*
RSS /(n1 n2 2k)
B4: Nếu F > Fα(k, n1+n2-2k): bác bỏ H0
Viết mô hình hồi quy mẫu và ý nghĩa các hệ số
61
61
64
64
5.3 Ứng dụng sử dụng biến giả
5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy
0.2
10.6
1958
0.82
18.6
0.1
11
1959
1.04
19.7
0.12
11.9
1960
1.53
21.1
0.41
12.7
1961
1.94
22.8
0.5
13.5
1962
1.75
23.9
0.43
14.3
1963
1.99
25.2
2 2
1 1
2 2
66
63
63
66
11
5.3 Ứng dụng sử dụng biến giả
Kết quả hồi quy theo mô hình như sau
Yi 1,75 0,15045X i 1,4839Z i 0,1034X i Zi ei
t = (-5,27) (9,238)
p = (0,000) (0,000)
(3,155)
(0,007)
(-3,109)
(0,008)
Nhận xét
B3. Kiểm định giả thiết H0: 4=0
Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình
Thời kỳ hậu tái thiết: Z = 0
Yˆi 1,75 0,15045 X i
71
68
68
71
5.3 Ứng dụng sử dụng biến giả
Tiết kiệm
Thời kỳ hậu tái thiết
Yˆi 1,75 0,15045X i
Yˆi 0,2661 0,0475X i
Thời kỳ tái thiết
Thu nhập
-0.27
-1.75
Hình 5.6 Mô hình hồi quy cho 2 thời kỳ
Giá trị ngưỡng sản lượng
=1 nếu Xi > X*
=0 nếu Xi ≤ X*
CP
SL
CP
SL
256
1000
1839
6000
414
2000
2081
7000
634
3000
2423
8000
778
4000
2734
9000
1003
X
*
Hình 5.7 Hàm tuyến tính từng khúc
•Kiểm định giả thiết H0: 3=0
Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc
74
74
5.3 Ứng dụng sử dụng biến giả
Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng
sẽ khác với khi sản lượng trên X*.
Hàm hồi quy sẽ có dạng:
Yi 1 2 X i 3 ( X i X * ) Z i u i
Y: Chi phí; X: sản lượng;
X*=5.500 tấn: giá trị ngưỡng sản lượng
1 : X i X *
Z 1i
0 : X i X *
75
75
13