TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG CƠ SỞ II – TPHCM.
NGÀNH TÀI CHÍNH NGÂN HÀNG - CHUYÊN NGÀNH TÀI CHÍNH QUỐC TẾ.
KINH TẾ LƯỢNG
ĐỀ TÀI:
CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN
THU NHẬP CỦA NGƯỜI DÂN
TP.HỒ CHÍ MINH.
GVHD: Cô Trần Thị Tuấn Anh.
Nhóm thực hiện: Nhóm 3 - K49B,C – Ca 2.
1. Phan Lê Chí
2. Lê Tấn Đạt
3. Nguyễn Thị Thanh Hà
4. Trần Thị Hồng Lam
5. Huỳnh Diệp Mỹ Ngọc
6. Huỳnh Thanh Sang
7. Nguyễn Thị Tâm
8. Hồ Thị Như Thủy
9. Hàn Thị Hạ Thư
10. Nguyễn Thị Cẩm Vân
030
042
048
101
133
175
183
211
527
260
TP.HCM, Ngày 05/12/2011.
hết sức nghiêm túc trong quá trình khảo sát.
3.Ý nghĩa đề tài:
Là những sinh viên đang sống và học tập tại thành phố Hồ Chí Minh, vấn đề thu nhập
của người dân thành phố không những là mối quan tâm của nhiều người mà còn là mối
3
Chọn đề tài
Xác định các tham số
Thu thập số liệu
Xây dựng mô hình
Kiểm định, sửa chữa
Nhận xét, kết luận
quan tâm của đại bộ phận sinh viên chúng tôi. Cũng có thể nói đó là một trong những mối
quan tâm hàng đầu của các cấp chính quyền địa phương. Thu nhập của người dân thành
phố Hồ Chí Minh như thế nào? Nó có những điểm gì khác biệt và nổi bật hơn so với các
thành phố và địa phương khác trong cả nước và nó bị chi phối, chịu ảnh hưởng bởi những
yếu tố nào? Nhóm 3 hy vọng qua bài báo cáo này, mọi người sẽ có một cái nhìn tổng
quan nhất về thu nhập của người dân thành phố Hồ Chí Minh. Qua bài báo cáo này, mọi
người cũng sẽ biết được những yếu tố nào thực sự ảnh hưởng đến thu nhập của người dân
thành phố Hồ Chí Minh và nó đã ảnh hưởng và tác động như thế nào?
Từ bài nghiên cứu, nhóm chúng tôi cũng đưa ra một số hướng khắc phục và một số
giải pháp mà nhóm chúng tôi cho là có thể góp phần nâng cao thu nhập của người dân
thành phố Hồ Chí Minh để có thể rút ngắn khoảng cách giàu nghèo và tạo điều kiện cho
mọi người dân đều có một cuộc sống đầy đủ, ấm no và hạnh phúc.
4.Quy trình thực hiện, công cụ hỗ trợ:
• Các bước thực hiện
• Công cụ hỗ trợ:
Để tiến hành xây dựng mô hình, nhóm đã đi điều tra bằng phiếu khảo sát. Sau quá
trình khảo sát của nhóm và các nhóm bạn đã thu được 727 mẫu quan sát hợp lệ
4
Phiếu hợp lệ là phiếu điền đầy đủ thông
C(8)*D6 + C(9)*D7 + C(10)*D8 + C(11)*D9 + C(12)*D10 + C(13)*D11 +
C(14)*D12 + C(15)*D13 + C(16)*D14 + C(17)*D15
2.Ý nghĩa các biến trong mô hình.
Biến phụ thuộc
Tên
biến
Diễn giải Giá trị Đơn vị tính
Y Thu nhập
410 1000
000
Nghìn đồng/tháng
Biến độc lập – định lượng
Tên
biến
Diễn giải
Đơn vị
tính
Giá trị
Dấu kì
vọng
Ghi chú
X1 Tuổi Năm
19 70
+
Tuổi càng cao thì
thu nhập càng tăng.
Biến độc lập – định tính
Tên
biến
Diễn giải
Lĩnh vực
khác
D5 Luật
Lĩnh vực
khác
D6
Nghệ
thuật
Lĩnh vực
khác
D7
Nông/lâm
/Ngư
nghiệp
Lĩnh vực
khác
D8
Kinh
doanh
Lĩnh vực
khác
D9 Quân đội
Lĩnh vực
khác
D10
Mức độ thông
thạo ngoại ngữ
Thành
thạo
Không
sự chênh lệch
D15 Sức khỏe Tốt Không tốt + Sức khỏe tốt góp
7
phần cải thiện thu
nhập
III.MÔ HÌNH HỒI QUY – KIỂM ĐỊNH VÀ SỬA CHỮA MÔ HÌNH.
A.MÔ HÌNH HỒI QUY
1.Mô hình hồi quy gốc:
1.1. Phương trình hồi quy gốc:
Estimation Command:
=====================
LS Y C X1 D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11 D12 D13 D14 D15
Estimation Equation:
=====================
Y = C(1) + C(2)*X1 + C(3)*D1 + C(4)*D2 + C(5)*D3 + C(6)*D4 + C(7)*D5 + C(8)*D6
+ C(9)*D7 + C(10)*D8 + C(11)*D9 + C(12)*D10 + C(13)*D11 + C(14)*D12 +
C(15)*D13 + C(16)*D14 + C(17)*D15
Substituted Coefficients:
=====================
Y = -4271.544 + 123.5550*X1 + 4024.775*D1 + 279.8236*D2 + 1265.943*D3 +
2196.124*D4 + 6599.651*D5 + 3621.184*D6 – 697.8300*D7 + 1522.957*D8 –
2733.346*D9 + 4845.598*D10 + 5682.831*D11 + 4219.735*D12 + 3280.677*D13 +
17.26477*D14 + 708.1200*D15
1.2. Mô hình 1:
Dependent Variable: Y
Method: Least Squares
Date: 12/01/11 Time: 20:15
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
Log likelihood
ratio 29.16063 Prob. Chi-Square(2) 0.0000
9
Test Equation:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:35
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
C -2347.900 4825.795 -0.486531 0.6267
X1 108.4009 89.68444 1.208693 0.2272
D1 2257.047 3198.833 0.705584 0.4807
D2 657.7420 1302.216 0.505094 0.6136
D3 1518.140 1709.561 0.888030 0.3748
D4 2079.335 1998.006 1.040705 0.2984
D5 1884.890 5579.307 0.337836 0.7356
D6 4113.287 4282.827 0.960414 0.3372
D7 -557.5245 1834.530 -0.303906 0.7613
D8 1658.333 1278.079 1.297520 0.1949
D9 -2067.366 2849.377 -0.725550 0.4684
D10 3289.324 3760.638 0.874672 0.3820
D11 3758.016 4477.976 0.839222 0.4016
D12 3878.503 3031.585 1.279365 0.2012
D13 2951.121 2476.466 1.191667 0.2338
D14 -199.9990 659.8742 -0.303087 0.7619
D15 1017.755 1170.139 0.869772 0.3847
FITTED^2 -5.42E-05 7.82E-05 -0.692650 0.4888
FITTED^3 4.03E-09 2.43E-09 1.661979 0.0970
R-squared 0.258517 Mean dependent var 8192.597
Restrictions are linear in coefficients.
P-value > 0.05 do đó chấp nhận Ho, các biến trên đều là biến thừa.
Vậy loại bỏ các biến D2, D3, D4, D6, D7, D8, D9, D14, D15 ra khỏi mô hình.
Như vậy, các yếu tố lĩnh vực chuyên môn (Giáo dục đào tạo, Công nghệ thông tin,
Kiến trúc/Xây dựng, Luật, Nghệ thuật, Nông/Lâm/Ngư nghiệp, Kinh doanh, Quân đội),
giới tính và sức khỏe đều không ảnh hưởng đến thu nhập của người dân Thành phố Hồ
Chí Minh.
2. Mô hình sau khi loại bỏ các biến không cần thiết:
2.1. Phương trình hồi quy:
Estimation Command:
=====================
LS Y C X1 D1 D5 D10 D11 D12 D13
Estimation Equation:
=====================
Y = C(1) + C(2)*X1 + C(3)*D1 + C(4)*D5 + C(5)*D10 + C(6)*D11 + C(7)*D12 +
C(8)*D13
Substituted Coefficients:
=====================
Y = -2673.387 + 112.4161*X1 + 3171.415*D1 + 5602.597*D5 + 4963.202*D10 +
5972.162*D11 + 4459.695*D12 + 3334.765*D13
2.2. Mô hình 2:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:24
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
12
C -2673.387 1896.861 -1.409374 0.1592
X1 112.4161 32.41639 3.467878 0.0006
C(4) 5602.597 3167.038
Restrictions are linear in coefficients.
Dễ thấy P_value > 0.05 vậy D5 là biến thừa trong mô hình.
3.Mô hình sau khi loại bỏ biến thừa:
3.1. Phương trình hồi quy:
Estimation Command:
=====================
LS Y C X1 D1 D10 D11 D12 D13
Estimation Equation:
=====================
Y = C(1) + C(2)*X1 + C(3)*D1 + C(4)*D10 + C(5)*D11 + C(6)*D12 + C(7)*D13
Substituted Coefficients:
=====================
Y = -2703.616 + 113.1395*X1 + 3078.102*D1 + 5021.531*D10 + 5962.938*D11 +
4542.664*D12 + 3337.625*D13
3.2. Mô hình 3:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:29
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
C -2703.616 1899.587 -1.423266 0.1551
X1 113.1395 32.46171 3.485321 0.0005
D1 3078.102 1283.998 2.397279 0.0168
D10 5021.531 761.4847 6.594395 0.0000
14
D11 5962.938 728.9891 8.179735 0.0000
D12 4542.664 1397.941 3.249540 0.0012
D13 3337.625 1394.471 2.393470 0.0169
15
thạc sĩ, đại học, cao đẳng có thu nhập nhiều hơn một người chưa tốt nghiệp THCS là
4542.664 nghìn đồng/tháng.
- THPT và THCS : C7=3337.625 >0, tác động cùng chiều với thu nhập. Trong điều kiện
các yếu tố khác không đổi, trung bình một người tốt nghiệp THPT hoặc THCS có thu
nhập nhiều hơn một người chưa tốt nghiệp THCS là 3337.625 nghìn đồng/tháng.
B.KIỂM ĐỊNH VÀ KHẮC PHỤC
1.Kiểm định đa cộng tuyến
1.1. Kiểm định đa cộng tuyến
Lập ma trận hệ số tương quan:
X1 D1 D10 D12 D13
X1 1.000000 0.068272 -0.131910 -0.227085 0.103652
D1 0.068272 1.000000 0.044623 0.183848 -0.169152
D10 -0.131910 0.044623 1.000000 0.364085 -0.314173
D12 -0.227085 0.183848 0.364085 1.000000 -0.875559
D13 0.103652 -0.169152 -0.314173 -0.875559 1.000000
Vì |r
D12D13
| = 0.875559 > 0.8 nên cặp biến độc lập D12 và D13 bị đa cộng tuyến.
1.2.Khắc phục đa cộng tuyến.
Kiểm định sự cần thiết của các biến bị đa cộng tuyến với mô hình:
a. Hồi quy mô hình với D12:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:48
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
C 676.6432 1274.546 0.530890 0.5957
X1 97.93633 31.93841 3.066412 0.0022
D13 -568.2864 711.6168 -0.798585 0.4248
R-squared 0.202560 Mean dependent var 8192.597
Adjusted R-squared 0.197030 S.D. dependent var 9335.781
S.E. of regression 8365.661 Akaike info criterion 20.90988
Sum squared resid 5.05E+10 Schwarz criterion 20.94775
Log likelihood -7594.740 Hannan-Quinn criter. 20.92449
F-statistic 36.62875 Durbin-Watson stat 1.570505
Prob(F-statistic) 0.000000
R
2
=20.256%
Nhận xét: R
2
của D12 > R
2
của D13(0.20783>0.20256), do đó D12 ảnh hưởng đến Y
nhiều hơn D13 nên ta sẽ bỏ biến D13 để khắc phục hiện tượng đa cộng tuyến.
Ta có phương trình hồi quy sau khi bỏ biến D13 :
Y= 676.6432 + 97.93633*X1+ 3097.041*D1+ 5020.628*D10 + 5961.429*D11+
1658.582*D12.
2.Kiểm định tự tương quan.
2.1. Phát hiện tự tương quan.
a. Kiểm định Durbin-watson:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:48
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
C 676.6432 1274.546 0.530890 0.5957
X1 -1.535167 31.22057 -0.049172 0.9608
D1 191.8293 1259.603 0.152293 0.8790
D10 -192.9495 747.5009 -0.258126 0.7964
D11 12.28604 714.9154 0.017185 0.9863
D12 157.6574 695.5366 0.226670 0.8207
RESID(-1) 0.214504 0.036472 5.881242 0.0000
R-squared 0.045838 Mean dependent var -1.84E-13
Adjusted R-squared 0.037887 S.D. dependent var 8309.194
S.E. of regression 8150.270 Akaike info criterion 20.85907
Sum squared resid 4.78E+10 Schwarz criterion 20.90326
Log likelihood -7575.273 Hannan-Quinn criter. 20.87612
F-statistic 5.764834 Durbin-Watson stat 2.009860
Prob(F-statistic) 0.000007
Vì p_value < 0.05 nên có sự tự tương quan trong mô hình.
2.2. Khắc phục tự tương quan.
Bước 1: Sử dụng phần dư e
i
để hồi quy dạng hàm:
Đặt e=resid, nhập hàm e c e(-1) ta được:
Dependent Variable: E
Method: Least Squares
Date: 12/02/11 Time: 10:16
Sample (adjusted): 2 727
Included observations: 726 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C -1.739389 301.6724 -0.005766 0.9954
E(-1) 0.213705 0.036307 5.886096 0.0000
R-squared 0.045668 Mean dependent var -1.276226
Adjusted R-squared 0.044350 S.D. dependent var 8314.851
S.E. of regression 8128.378 Akaike info criterion 20.84686
quan.
Bước 3: Kiểm định lại sự tự tương quan bằng BG test.
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 0.006760 Prob. F(1,719) 0.9345
Obs*R-squared 0.006826 Prob. Chi-Square(1) 0.9342
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/02/11 Time: 10:24
Sample: 2 727
Included observations: 726
Presample missing value lagged residuals set to zero.
Variable Coefficient Std. Error t-Statistic Prob.
C 0.474314 987.0556 0.000481 0.9996
X1-R0*X1(-1) 0.011743 31.10710 0.000377 0.9997
D1-R0*D1(-1) -2.015504 1247.719 -0.001615 0.9987
D10-R0*D10(-1) 2.204263 756.7465 0.002913 0.9977
D11-R0*D11(-1) -0.244130 716.6488 -0.000341 0.9997
D12-R0*D12(-1) -2.244417 690.5596 -0.003250 0.9974
RESID(-1) -0.003071 0.037350 -0.082219 0.9345
R-squared 0.000009 Mean dependent var 2.07E-12
Adjusted R-squared -0.008335 S.D. dependent var 8120.909
S.E. of regression 8154.685 Akaike info criterion 20.86017
Sum squared resid 4.78E+10 Schwarz criterion 20.90440
Log likelihood -7565.241 Hannan-Quinn criter. 20.87724
22
F-statistic 0.001127 Durbin-Watson stat 1.999711
Prob(F-statistic) 1.000000
Ta thấy p_value > 0.05 => Mô hình hết bị tự tương quan.
3.Kiểm định phương sai thay đổi.
100, 000
100 200 300 400 500 600 700
RESID
3.2.Kiểm định White:
Heteroskedasticity Test: White
F-statistic 2.069368 Prob. F(20,705) 0.0040
Obs*R-squared 40.25687 Prob. Chi-Square(20) 0.0046
Scaled explained SS 695.1153 Prob. Chi-Square(20) 0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/03/11 Time: 14:18
Sample: 2 727
Included observations: 726
Variable Coefficient Std. Error t-Statistic Prob.
C -1.79E+08 1.21E+08 -1.479583 0.1394
X1-R0*X1(-1) 14556753 7822489. 1.860885 0.0632
(X1-R0*X1(-1))^2 -198375.4 119429.8 -1.661022 0.0972
(X1-R0*X1(-1))*(D1-
R0*D1(-1)) 319700.7 5949829. 0.053733 0.9572
24
(X1-R0*X1(-1))*(D10-
R0*D10(-1)) 4472725. 3984204. 1.122615 0.2620
(X1-R0*X1(-1))*(D11-
R0*D11(-1)) 5490283. 3627532. 1.513504 0.1306
(X1-R0*X1(-1))*(D12-
R0*D12(-1)) -3989271. 3407303. -1.170800 0.2421
D1-R0*D1(-1) 2.08E+08 2.98E+08 0.698160 0.4853
(D1-R0*D1(-1))^2 52968950 2.57E+08 0.206341 0.8366
(D1-R0*D1(-1))*(D10-