ĐẠI HỌC QUỐC GIA HÀ NÔI
TRƯỜNG ĐẠI HỌC KINH TẾ
BÀI TẬP NHÓM MÔN KINH TẾ LƯỢNG
ĐỀ TÀI: XÂY DỰNG MÔ HÌNH NGHIÊN CỨU
CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN KẾT QUẢ
HỌC TẬP CỦA SINH VIÊN KHOA KINH TẾ
PHÁT TRIỂN TRƯỜNG ĐH KINH TẾ - ĐHQG.
Giảng viên hướng dẫn:
Nhóm thực hiện:
GV. Nguyễn Thanh Hằng
Nhóm 9
Hà Nội, tháng 11 năm 2018
DANH SÁCH THÀNH VIÊN VÀ PHÂN CÔNG NHIỆM VỤ
STT
1
HỌ VÀ TÊN
Phạm Thị Phương
MÃ SINH VIÊN
16050272
2
Trần Thu Xuân
Chạy mô hình hồi quy
và trình bày word
Kiểm tra khuyết tật của
mô hình và khắc phục
Diễn giải ý nghĩa các hệ
số và dự báo
GHI CHÚ
Điểm trung bình tích lũy của mỗi sinh viên phần nào đã phản đánh được kết quả
học tập của sinh viên trong kì học. Khi nghiên cứu vấn đề này, tìm hiểu và trao đổi
với 1 số sinh viên nhóm đã rút ra được một số yếu tố ảnh hưởng đến việc làm thêm
của sinh viên như sau:
- Yi: trung bình tích lũy hệ số 4 học kì II năm 2017- 2018
- Xi: số h tự học ở nhà
- Zi : số giờ tham gia hoạt động ngoại khóa
- Ti: số giờ lên mạng xã hội
LT: làm thêm
Nếu LT= 0 : sinh viên không đi làm thêm
Nếu LT = 1 : sinh viên có đi làm thêm
2.
Mô hình hồi quy dự kiến:
Y=β1+β2*X +β3*Z+ β4*T+ β5*LT+ β6*X*LT + β7*Z*LT+ β8*T*LT+ Ui
3.
Số liệu:
a)
Phạm vi thu thập số liệu:
Số liệu sơ cấp được điều tra từ các bạn sinh viên khoa kinh tế trường đại học Kinh
Z
T
LT
X*LT
Z*LT
T*LT
2.127150
0.183572
0.008858
-0.099038
-0.490890
0.128672
0.033947
0.068984
0.189485
0.036586
0.044939
0.030048
0.235363
0.052291
0.055163
0.038310
11.22596
5.017520
0.197107
-3.296023
-2.085669
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
2.286167
0.495656
0.408785
0.688031
0.518013
1.725460
Từ đó ta thu được mô hình sau:
Y=2.127150+0.183572*X
+0.008858*Z-
0.099038*T-
0.490890*LT+
0,128672*X*LT + 0.033947*Z*LT+ 0.068984*T*LT
Từ bảng trên ta thấy được giá trị xác suất của biến Z là lớn nhất và lớn hơn
0,4 (P(Z)=0,8445> 0,4) , nên ta sẽ bỏ biến giải thích Z đi và chạy lại mô hình.
Sau khi bỏ biến Z và chạy lại mô hình thì ta được bảng sau:
Dependent Variable: Y
Method: Least Squares
-3.324211
-2.202075
0.0000
0.0000
0.0016
0.0320
X*LT
Z*LT
T*LT
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.127304
0.042805
0.068914
0.720418
0.688767
0.276518
4.052495
-4.285956
22.76142
0.000000
Không có cơ sở bác bỏ Ho
Nên bỏ biến Z*LT ra khỏi mô hình.
Ta tiếp tục chạy lại mô hình sau khi bỏ biến Z*LT
Dependent Variable: Y
Method: Least Squares
Date: 12/01/18 Time: 08:11
Sample (adjusted): 1 60
Included observations: 60 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
2.137324
0.182030
11.74158
-1.981685
2.463357
1.861188
0.710799
Mean dependent var
0.684021
S.D. dependent var
0.278618
Akaike info criterion
4.191919
Schwarz criterion
-5.300734
Hannan-Quinn criter.
26.54424
Durbin-Watson stat
0.000000
0.0000
0.0017
0.0526
0.0170
0.0682
2.286167
0.495656
0.376691
0.586126
0.458612
1.550679
X*LT
1.914222
0.204361
-0.055138
-0.126356
0.112766
0.140024
0.035074
0.018994
0.148878
0.052273
13.67064
5.826658
-2.902946
-0.848723
2.157268
0.0000
0.0000
0.0053
0.3997
0.0354
R-squared
0.692247
Sau khi bỏ biến thì ta thu được mô hình cuối cùng là:
Y= 1.914222+0.204361*X-0.055138*T-0.126356*LT+0.112766*X*LT
II. KIỂM TRA KHUYẾT TẬT
Mô hình cuối cùng mà ta thu được:
Y= 1.914222+0.204361*X-0.055138*T-0.126356*LT+0.112766*X*LT
1. Kiểm định phương sai sai số thay đổi
Ta sẽ kiểm tra xem mô hình này có mắc phải khuyết tật nào không.
KiỂM định dựa trên phương pháp đồ thị:
-Phác họa đồ thị mối quan hệ giữa X và phần dư E
.8
.6
.4
E
.2
.0
-.2
-.4
-.6
-.8
0
1
2
3
3
4
5
6
7
X
-Phác họa đồ thị mối quan hệ giữa X và trị tuyệt đối phần dư (ABS(E))
.8
.7
.6
ABS(E)
.5
.4
.3
.2
.1
.0
0
1
2
2
4
6
8
10
12
T
-Phác họa đồ thị mối quan hệ giữa T và bình phương phần dư (E2)
.6
.5
E^2
.4
.3
.2
.1
.0
0
2
4
6
8
10
12
T
Từ phương pháp đồ thị ta thấy không có mối quan hệ nào giữa biến giải
thích và phần dư, bình phương phần dư, trị tuyệt đối phần dư
Bằng phương pháp đồ thị thì ta thấy mô hình sau khi bỏ biến không có
khuyết tật PSSSTĐ
Kiểm định Harvey:
Heteroskedasticity Test: Harvey
F-statistic
Obs*R-squared
Scaled explained SS
1.972723
LT
X*LT
-2.336876
-0.424033
-0.203253
-1.045819
0.731889
0.952411
0.238562
0.129191
1.012634
0.355547
-2.453641
-1.777455
-1.573276
-1.032771
2.058488
0.0173
0.0810
0.1214
0.3062
0.0443
R-squared
Adjusted R-squared
S.E. of regression
của kiểm định Obs*R-squared= 0.1105 đều lớn hơn giá trị α=5%
Không có cơ sở bác bỏ Ho
Kiểm định Harvey cho ta thấy rằng không có khuyết tật PSSSTĐ trong
mô hình
-Kiểm định White:
Heteroskedasticity Test: White
F-statistic
Obs*R-squared
Scaled explained SS
0.605238
6.596318
5.355720
Prob. F(10,49)
Prob. Chi-Square(10)
Prob. Chi-Square(10)
0.8017
0.7629
0.8662
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/01/18 Time: 08:31
Sample: 1 60
Included observations: 60
-0.035318
0.014591
0.020740
0.221287
0.194434
0.008075
0.011832
0.103401
0.012469
0.079832
0.003079
0.037537
0.014874
0.048729
0.203013
0.042873
-0.683346
-0.385279
-1.169433
0.874812
0.542931
-0.701971
-0.940880
0.980988
0.425623
1.090017
0.9660
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
0.074347
0.104226
-1.451120
-1.067157
-1.300931
2.038337
Giả thuyết: Ho: mô hình không có khuyết tật PSSSTĐ
H1: Mô hình có khuyết tật PSSSTĐ
Ta thấy được giá trị xác xuất của kiểm định F-statistic = 0.8017 và xác suất
của kiểm định Obs*R-squared= 0.7629 đều lớn hơn giá trị α=5%
Không có cơ sở bác bỏ Ho
Kiểm định White cho ta thấy rằng không có khuyết tật PSSSTĐ trong
mô hình
Kiểm định Glejser:
Heteroskedasticity Test: Glejser
F-statistic
Obs*R-squared
Scaled explained SS
1.141558
4.599484
X*LT
0.331260
-0.020532
-0.019964
-0.050926
0.033880
0.079670
0.019956
0.010807
0.084708
0.029742
4.157909
-1.028894
-1.847350
-0.601194
1.139155
0.0001
0.3080
0.0701
0.5502
0.2596
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Không có cơ sở bác bỏ Ho
Kiểm định Glejser cho ta thấy rằng không có khuyết tật PSSSTĐ trong
mô hình
Kiểm định B-P-G
Heteroskedasticity Test: Breusch-Pagan-Godfrey
F-statistic
Obs*R-squared
Scaled explained SS
0.799146
3.295640
2.675814
Prob. F(4,55)
Prob. Chi-Square(4)
Prob. Chi-Square(4)
0.5309
0.5096
0.6135
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/01/18 Time: 08:32
Sample: 1 60
Included observations: 60
Variable
-0.165834
0.473735
0.0110
0.4991
0.0958
0.8689
0.6376
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.054927
-0.013805
0.104943
0.605714
52.73445
0.799146
0.530950
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
.4
E(-1)
.2
.0
-.2
-.4
-.6
-.8
-.8
-.6
-.4
-.2
.0
.2
.4
.6
.8
E
.4
.6
.8
E
Sau khi phác họa đồ thị thì ta nghi ngờ rằng mô hình có khuyết tật Tự tương
quan.
Kiểm định Durbin- Waston
Từ mô hình hồi quy ta thấy d=1.499312
Mô hình hồi quy đã chạy có số quan sát là 60, số biến giải thích là 2, và giả
định với mức ý nghĩa = 5%
Tra bảng ta được giá trị dL= 1,514; giá trị dU=1,652
D=1.499312 < dl=1.514
Có hiện tượng tự tương quan
Kiểm định Breusch- Godfrey
Kiểm định tự tương quan bậc 1
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
Obs*R-squared
3.505391
Prob. F(1,54)
3.657456
Prob. Chi-Square(1)
0.003386
0.049239
-0.012099
0.253095
0.139129
0.034625
0.018663
0.147955
0.051528
0.135181
-0.330787
0.255440
0.181434
0.332795
-0.234796
1.872269
0.7421
0.7994
0.8567
0.7406
0.8153
0.0666
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
- Kiểm định Breusch- Godfrey cho ta thấy rằng không có khuyết tật
tự tương quan bậc 1trong mô hình
Kiểm định tự tương quan bậc 2
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
Obs*R-squared
4.895834
Prob. F(2,53)
9.356338
Prob. Chi-Square(2)
0.0112
0.0093
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/05/18 Time: 09:49
Sample: 1 60
Included observations: 60
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
0.592663
0.437200
-0.268908
1.404583
2.442138
0.4636
0.6070
0.5559
0.6637
0.7890
0.1660
0.0180
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.155939
Mean dependent var
0.060385
S.D. dependent var
0.266536
Akaike info criterion
3.765208
Schwarz criterion
Prob. Chi-Square(3)
0.0135
0.0114
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/01/18 Time: 09:51
Sample: 1 60
Included observations: 60
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
X
T
LT
X*LT
RESID(-1)
RESID(-2)
RESID(-3)
0.6418
0.5644
0.7246
0.0810
0.0105
0.1848
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.184267
Mean dependent var
0.074456
S.D. dependent var
0.264533
Akaike info criterion
3.638844
Schwarz criterion
-1.055953
Hannan-Quinn criter.
1.678045
Durbin-Watson stat
0.134986
-9.85E-17
Prob. F(4,51)
Prob. Chi-Square(4)
0.0312
0.0256
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/01/18 Time: 09:52
Sample: 1 60
Included observations: 60
Presample missing value lagged residuals set to zero.
Ta
giá
của
Variable
Coefficient
Std. Error
t-Statistic
Prob.
Giả thuyết:
Ho: mô hình
0.049557
-0.341874
0.7339 0.0312 và
RESID(-1)
0.252092
0.142593
1.767917
0.0831
xác
RESID(-2)
0.351260
0.144096
2.437676
0.0183 suất của
RESID(-3)
-0.199551
0.149475
-1.335007
0.1878 định Obs*Rkiểm
RESID(-4)
0.026624
0.145092
0.183497
0.8551
squared= 0.0
0.184805 Mean dependent var
-9.85E-17 đều nhỏ hơn
256 R-squared
Adjusted R-squared
0.056931 S.D. dependent var
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
Obs*R-squared
2.281578
11.14634
Prob. F(5,50)
Prob. Chi-Square(5)
0.0605
0.0486
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/01/18 Time: 09:52
Sample: 1 60
Included observations: 60
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
0.148044
0.155947
0.150531
0.148358
-0.855083
0.772689
0.373986
0.553353
-0.306089
1.759380
2.327192
-1.217933
0.233249
-0.243761
0.3966
0.4433
0.7100
0.5825
0.7608
0.0846
0.0240
0.2290
0.8165
0.8084
R-squared
Adjusted R-squared
S.E. of regression
nhưngxác suất của kiểm định Obs*R-squared= 0,0486< α=5%
không có cơ sở bác bỏ Ho
Kiểm định Breusch- Godfrey cho ta thấy rằng không có khuyết
tật tự tương quan bậc 5 trong mô hình
Tuy nhiên, giá trị xác suất của E(-3),giá trị xác suất của E(-4), và giá trị xác
suất E(-5) lại > α=5% nên giá trị E(-3) Và giá trị E(-4) không có ý nghĩa
thống kê
Tuy rằng kiểm định cho thấy có tự tương quan bậc 5 nhưng thực
chất là nó tồn tại ở dạng bậc 2
KHẮC PHỤC:
-khắc phục dựa trên phương pháp sử dụng vòng lặp:
Dependent Variable: Y
Method: ARMA Conditional Least Squares (Gauss-Newton / Marquardt
steps)
Date: 12/01/18 Time: 13:08
Sample (adjusted): 3 60
Included observations: 58 after adjustments
Convergence achieved after 7 iterations
Coefficient covariance computed using outer product of gradients
Variable
Coefficient
Std. Error
t-Statistic
Prob.
1.228170
2.892869
0.0000
0.0000
0.0417
0.8848
0.0901
0.2250
0.0056
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.746339
0.716496
0.266066
3.610336
-1.775811
25.00923
0.000000
Inverted AR Roots
.70
Y
T
LT
0.78026050303 0.14031140362 0.27881297271 0.15435486339
1
23299
49235
90864
55141
0.78026050303
0.09273505989 0.12183146077 0.00388141030
23299
1
655102
3017
2712915
0.14031140362 0.09273505989
0.01938106281 0.03130410964
49235
655102
1
209677
508951
0.27881297271 0.12183146077 0.01938106281
0.00351967391
90864
3017
209677
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
T
LT
X*LT
2.979797
-0.129949
-2.513674
1.022469
0.355049
0.070252
0.457074
0.144900
8.392645
-1.849759
-5.499488
7.056356
2.466667
1.463878
3.065483
3.205106
3.120097
2.353213
H1:
Ta nhận thấy giá trị P-value của thống kê F là 0.00000< 5%
Bác bỏ Ho
tức là mô hình có hiện tượng đa cộng tuyến.
b. hồi quy T theo các biến khác:
Dependent Variable: T
Method: Least Squares
Date: 12/01/18 Time: 13:35
Sample (adjusted): 1 60
Included observations: 60 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
Prob(F-statistic)
0.064216
0.014085
2.003649
224.8181
-124.7647
1.280964
0.289811
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
4.008333
2.017911
4.292158
4.431781
4.346772
1.628437
K iểm định giả thiết: H0 :
H1 :
Ta nhận thấy giá trị P-value của thống kê F là 0.289811 > 5%, vậy chấp nhận
H0, bác bỏ H1, tức là mô hình không có hiện tượng đa cộng tuyến.
MÔ HÌNH CÓ HIỆN TƯỢNG ĐA CỘNG TUYẾN.