ThS Đàm Đình Mạnh Cho mức ý nghĩa
5%
1
Hồi quy đơn
Bài 1: Cho bộ số liệu sau đây:
STT
Lượng cầu tiêu dùng bia
(đv:100000đ) Y
Thu nhập
(đv:100000đ)
X
2
Y
2
X
XY
0.12695
9 20 48 400 2304 960 20.3585
0.128522
10 20 50 400 2500 1000 21.5017
2.255103
Tổng
155 395 2547 16011 6356 11.0306
TB 15.5 39.5 254.7 1601.1
635.6
2
( )
4.01
1
i
Y
Y Y
SD
n
a. Cho biết mô hình hồi quy là :
2
Bài 2 : Cho một bảng số liệu quan sát ngẫu nhiên 10 người trong một tuần về thu nhập và mức
tiêu dùng trong tuần.
Thu nhập X (USD) 31 50 47 45 39 50 35 40 45 50
Tiêu dùng Y (USD) 29 42 38 30 29 41 23 36 42 48
a. Ước lượng hàm hồi quy dạng tuyến tính
1 2
i i i
Y X u
b. Nêu ý nghĩa kinh tế của các ước lượng nhận được, các giá trị đó có phù hợp với lý
thuyết kinh tế không?
c. Tìm R
2
. Giải thích ý nghĩa của nó.
d. Có ý kiến cho rằng thu nhập không ảnh hưởng tới chi tiêu. Hãy nhận xét.
e. Tìm khoảng tin cậy đối xứng cho hệ số góc.
f. Trong các thời kỳ trước người ta vẫn dùng 80% thu nhập cho chi tiêu, có thể kết
luận là thời kỳ này tỷ lệ đó đã giảm không?
Bài 3 : Có số liệu về giảng viên một trường đại học như sau: tiền lương Y (triệu đồng), số năm
công tác X (năm).
Y 3 2.7 4 4.5 4 4.2 5 6 7 6
Variable Coefficient
Std. Error
t-Statistic
Prob. C -7.078335
2.324705
-3.044832
Akaike info criterion 3.335965
Sum squared resid 11.03060
Schwarz criterion 3.396482
Log likelihood -14.67983
Hannan-Quinn criter. 3.269578
F-statistic 96.79938
Durbin-Watson stat 0.866047
Prob(F-statistic) 0.000010
Prob. C 43746.70
19361.78
2.259436
0.0365
K 11342.06
2888.403
3.926759
0.0010
Durbin-Watson stat 2.107725
Prob(F-statistic) 0.000989
a. Viết hàm hồi quy tổng thể và hàm hồi quy mẫu?
b. Các kết quả thu được có phù hợp với lý thuyết kinh tế hay không?
c. Có thể nói rằng khi vốn thay đổi thì GDP thay đổi hay không?
d. Mô hình đưa ra có phù hợp không? Hệ số xác định cho biết điều gì?
e. Tìm khoảng tin cậy cho hệ số chặn và hệ số góc.
f. Khi vốn tăng thêm một triệu đôla thì GDP tăng tối thiểu bao nhiêu?
g. Có phải khi vốn tăng 1 triệu thì GDP tăng 1000 triệu hay không?
h. Vốn giảm 1 triệu thì GDP giảm nhiều hơn 100 triệu không?
i. Hãy dự báo GDP khi vốn là 100 đơn vị?
Variable Coefficient
Std. Error
t-Statistic
Prob. C 2.243000
2.668876
0.840429
0.4064
Adjusted R-squared 0.418002
S.D. dependent var 5.624341
S.E. of regression 4.290742
Akaike info criterion 5.826453
Sum squared resid 644.3664
Schwarz criterion 5.955736
Log likelihood -107.7026
Hannan-Quinn criter. 5.872451
F-statistic 14.28704
Durbin-Watson stat 2.139543
Prob(F-statistic) 0.000029
5
Bài 2: Cho các số liệu sau: Y – GDP; K – vốn ; L – ngày lao động; đơn vị tính: triệu đôla Đài
Loan (Y, K tính theo giá cố định). Hồi quy thu được kết quả dưới đây.
Dependent Variable: Y
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficient
Std. Error
t-Statistic
Prob.
4.965061
0.0001 R-squared
Mean dependent var 109468.7
Adjusted R-squared 0.681997
S.D. dependent var 57734.42
S.E. of regression 32557.46
Akaike info criterion 23.75688
Sum squared resid 1.80E+10
Schwarz criterion 23.90624
2
= 0.461391
h. Khi vốn không đổi, giảm đi một ngày lao động thì GDP giảm ít hơn 100 đơn vị phải
không?
Bài 3 : Cho các số liệu sau: Y – GDP; K – vốn ; L – ngày lao động; đơn vị tính: triệu đôla Đài
Loan (Y, K tính theo giá cố định). LY, LL, LK là logarit cơ số tự nhiên của các biến tương ứng.
Dependent Variable: LY
Method: Least Squares
Sample: 1 20
Included observations: 20
Variable Coefficient
Std. Error
t-Statistic
Prob.
0.0000 R-squared 0.781422
Mean dependent var 11.45945
Adjusted R-squared 0.755707
S.D. dependent var 0.570617
S.E. of regression 0.282033
Akaike info criterion 0.443897
Sum squared resid 1.352226
Schwarz criterion 0.593257
Log likelihood -1.438970
c. Kiểm định sự phù hợp của hàm hồi quy
d. Khi lao động tăng 1% thì GDP thay đổi khoảng bao nhiêu?
e. Vốn giảm 1% thì GDP giảm tối đa bao nhiêu %?
f. Nguồn vốn tăng lên 1,3 lần so với trước thì GDP có tăng tương ứng là 1,3 lần hay không?
ThS Đàm Đình Mạnh Cho mức ý nghĩa
5%
7
Hồi quy với biến giả
Bài 1: Cho bộ số liệu sau, với các biến Beer là mức tiêu dùng bia/người/năm; Y là mức thu
nhập/người/năm; D là giới tính (1 là nam, 0 là nữ). Hồi quy được kết quả sau đây:
Dependent Variable: BEER
Method: Least Squares
Sample: 1 40
Included observations: 40
0.0000
Y 0.001299
0.000509
2.549002
0.0151
D -156.3140
39.59615
-3.947708
0.0003 R-squared 0.391681
a. Viết hàm hồi quy mẫu và hàm hồi quy tổng thể cho nam và nữ
b. Cho biết ý nghĩa của các hệ số góc
c. Giới tính có thực sự ảnh hưởng tới mức tiêu dùng bia không?
d. Hãy ước lượng mức tiêu dùng bia khi thu nhập tăng một đơn vị
e. Hàm hồi quy có phù hợp không?
Bài 2 : Cũng với bộ số liệu trên, tuy nhiên có thêm yếu tố tương tác giữa giới tính và thu nhập
(thông thường thu nhập của nam và nữ khác nhau), tức là có thêm biến DY (=D*Y)
Dependent Variable: BEER
Method: Least Squares
Sample: 1 40
Included observations: 40
1.606762
0.1168
D -146.6845
62.79076
-2.336084
0.0252
DY -0.000219
0.001098
-0.199363
0.8431 ThS Đàm Đình Mạnh Cho mức ý nghĩa
5%
8
a. Viết hàm hồi quy cho các trường hợp với nam và nữ.
b. Tìm ước lượng điểm mức chênh lệch của hệ số chặn trong hai trường hợp
c. Cho biết khi mức thu nhập là 300 thì mức tiêu dùng bia của nam là bao nhiêu, nữ là
bao nhiêu và giữa nam và nữ khác nhau bao nhiêu.
d. Vẽ đồ thị của hàm hồi quy mẫu trong hai trường hợp
e. Các hệ số có ý nghĩa thống kê hay không? Hệ số chặn của hai trường hợp có thực sự
khác nhau không?
f. Khi thu nhập cùng tăng một đơn vị thì mức tiêu dùng bia chênh lệch trong khoảng
nào? ThS Đàm Đình Mạnh Cho mức ý nghĩa
5%
Std. Error
t-Statistic
Prob. X2 1.053033
0.164935
6.384550
0.0000
X3 - 0.264098
0.309092
-0.854431
Mean dependent var 75.87273
Adjusted R-squared 0.954863
S.D. dependent var 21.25673
S.E. of regression 4.516116
Sum squared resid 367.1155 a. Hãy tìm điểm không hợp lý về mặt kinh tế của mô hình trên.
b. Trong mô hình trên có dấu hiệu của hiện tượng đa cộng tuyến (các thống kê T ứng
với X3 và X4 nhỏ mà R
2X3 1.466698
0.267619
5.480537
0.0000
X4 5.473395
0.666555
8.211467
0.0000
C -2.393212
4.816857
-0.496841
0.6250
trọt và D = 0 nếu là trang trại chăn nuôi) thì giữa D và DX4 có mối quan hệ đa cộng
tuyến hay không?
f. Hãy sử dụng phương trình sai phân cấp một để khắc phục hiện tượng đa cộng
tuyến của mô hình trên.
ThS Đàm Đình Mạnh Cho mức ý nghĩa
5%
10
Bài 2: Cho hàm sản xuất Y = f(K,L), trong đó Y là tỷ lệ tăng của đầu ra, vốn và lao động ở 30
doanh nghiệp. Ước lượng dạng hàm sản xuất Cobb – Douglas.
Dependent Variable: LOG(Y)
Method: Least Squares
Included observations: 30
Variable Coefficient
0.0000
C 0.424816
0.137808
3.082671
0.0047 R-squared 0.918339
Mean dependent var -1.532700
Adjusted R-squared 0.912290
S.D. dependent var 1.453766
S.E. of regression 0.430545
b. Nếu mở rộng dạng hàm trên và ước lượng như sau:
Dependent Variable: LOG(Y)
Method: Least Squares
Included observations: 30
Variable Coefficient
Std. Error
t-Statistic
Prob.
3.837167
0.0008
LOG(L) 0.903031
0.177497
5.087576
0.0000
C 0.333010
0.156494
2.127939
0.0438
Có thể có đa cộng tuyến trong mô hình hồi quy trên hay không? ThS Đàm Đình Mạnh Cho mức ý nghĩa
5%
11
Câu 3: Một người muốn phân tích tình hình doanh thu của một bộ phim được phát hành với
các biến là: chi phí sản xuất, chi phí quảng cáo và yếu tố sau:
D = 1 nếu bộ phim đã được giới thiệu trên ít nhất một tạp chí trước khi phát hành
D = 0 nếu ngược lại
Dependent Variable: DT
Method: Least Squares
Included observations: 20
0.0000
CPQC 2.155770
0.291154
7.404238
0.0000
D 7.991656
2.118721
3.771925
0.0017
C 5.180920
2.700336
1.918620
0.0731
a. Có thể có đa cộng tuyến trong mô hình hồi quy này hay không?
b. Người ta ước lượng tiếp mô hình sau:
Dependent Variable: CPSX
Method: Least Squares
Included observations: 20
Variable Coefficient
0.1845
C 4.466279
1.027470
4.346871
0.0004 R-squared 0.399263
Mean dependent var 7.415000
Adjusted R-squared 0.328588
S.D. dependent var 2.910647
S.E. of regression 2.384976
5%
12
Bài 4: Cho các số liệu: Y là mức tiêu dùng của hộ gia đình, X2 là thu nhập và X3 là tài sản có
khả năng chuyển đổi cao.
Mô hình hồi quy là :
1 2 2 3 3
t t t t
Y X X u
Dependent Variable: Y
Method: Least Squares
Included observations: 25
Variable Coefficient
0.4509
C 33.87971
19.11513
1.772403
0.0902 R-squared 0.741695
Mean dependent var 169.3680
Adjusted R-squared 0.718213
S.D. dependent var 79.05857
S.E. of regression 41.96716
Cho bảng hệ số tương quan như sau:
Y X2 X3
Y 1.000000 0.857191 0.857438
X2 0.857191 1.000000 0.999995
X3 0.857438 0.999995 1.000000
Cho nhận xét về kết quả trên.
b. Người ta ước lượng X2 theo X3 như sau:
Dependent Variable: X2
Method: Least Squares
Included observations: 25
Variable Coefficient
Std. Error
t-Statistic
Prob.
R-squared 0.999991
Mean dependent var 159.4480
Adjusted R-squared 0.999991
S.D. dependent var 81.46980
S.E. of regression 0.250315
Sum squared resid 1.441126
F-statistic 2542299.
Durbin-Watson stat 2.245068
Variable Coefficient
Std. Error
t-Statistic
Prob. X 0.164457
0.035403
R-squared 0.449461
Mean dependent var 15.95282
Adjusted R-squared 0.418002
S.D. dependent var 5.624341
S.E. of regression 4.290742
Akaike info criterion 5.826453
Sum squared resid 644.3664
Schwarz criterion 5.955736
Log likelihood -107.7026
Hannan-Quinn criter. 5.872451
F-statistic 14.28704
Durbin-Watson stat 2.139543
Prob(F-statistic) 0.000029
Scaled explained SS 12.29287
Prob. Chi-Square(5) 0.0310
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Included observations: 38
1.440861
0.1593
X^2 -0.019887
0.013146
-1.512768
0.1402
X*N 0.092641
0.112030
0.826930
0.4144
N -4.506312
13.43527
-0.335409
0.7395
N^2 0.666529
Schwarz criterion 9.574732
Log likelihood -171.0072
Hannan-Quinn criter. 9.408162
F-statistic 2.957127
Durbin-Watson stat 2.539328
Prob(F-statistic) 0.026393
ThS Đàm Đình Mạnh Cho mức ý nghĩa
5%
14
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 11/23/10 Time: 22:15
Sample: 1 38
Included observations: 38
Variable Coefficient
Std. Error
t-Statistic
Prob.
2.494806
0.0175 R-squared 0.212383
Mean dependent var 16.95701
Adjusted R-squared 0.167376
S.D. dependent var 26.69574
S.E. of regression 24.35939
Akaike info criterion 9.299369
Sum squared resid 20768.30
Schwarz criterion 9.428652
Variable Coefficient
Std. Error
t-Statistic
Prob. X 2.956846
1.506867
1.962248
-2.141250
0.0397 R-squared 0.301413
Mean dependent var 16.95701
Adjusted R-squared 0.216736
S.D. dependent var 26.69574
S.E. of regression 23.62631
Akaike info criterion 9.284678
Sum squared resid 18420.69
Schwarz criterion 9.500150
15
Dùng kiểm định Glejer cho mô hình trên thì thu được kết quả sau:
Heteroskedasticity Test: Glejser
F-statistic 6.318352
Prob. F(2,35) 0.0045
Obs*R-squared 10.08035
Prob. Chi-Square(2) 0.0065
Scaled explained SS 11.34337
Prob. Chi-Square(2) 0.0034
C -2.079308
1.524274
-1.364130
0.1812
X 0.050619
0.020220
2.503425
0.0171
N 0.612339
0.236692
Log likelihood -86.41732
Hannan-Quinn criter. 4.752173
F-statistic 6.318352
Durbin-Watson stat 2.196850
Prob(F-statistic) 0.004542 Bài 2 : Xét mô hình chi tiêu của hộ gia đình:
1 2
i i i
Food Income u
INCOME 0.232253
0.055293
4.200378
0.0002
C 7.383218
4.008356
1.841956
0.0733
ThS Đàm Đình Mạnh Cho mức ý nghĩa
5%
16
Kiểm định hiện tượng phương sai sai số thay đổi bằng các cách khác nhau như sau:
Heteroskedasticity Test: Glejser
Method: Least Squares
Included observations: 40
Variable Coefficient
Std. Error
t-Statistic
Prob.
Adjusted R-squared 0.282947
S.D. dependent var 4.247806
S.E. of regression 3.597000
Akaike info criterion 5.446784
Sum squared resid 491.6594
Schwarz criterion 5.531228
Log likelihood -106.9357
Hannan-Quinn criter. 5.477316
F-statistic 16.38925
Durbin-Watson stat 2.096424
Prob(F-statistic) 0.000245
Test Equation:
Dependent Variable: ARESID
Method: Least Squares
Included observations: 40
Variable Coefficient
Std. Error
t-Statistic
Prob.
R-squared 0.266879
Mean dependent var 5.188213
Adjusted R-squared 0.247586
S.D. dependent var 4.247806
S.E. of regression 3.684622
Akaike info criterion 5.494920
Sum squared resid 515.9047
Schwarz criterion 5.579364
Log likelihood -107.8984
Hannan-Quinn criter. 5.525452
F-statistic 13.83319
Durbin-Watson stat 2.024894
t-Statistic
Prob. INCOME^2 0.012457
0.002794
4.457768
0.0001
C -20.95189
16.72724
-1.252562
0.2180
Sum squared resid 97510.95
Schwarz criterion 10.82116
Log likelihood -212.7344
Hannan-Quinn criter. 10.76725
F-statistic 19.87169
Durbin-Watson stat 1.974482
Prob(F-statistic) 0.000071
Hoặc
Dependent Variable: LOG(RESID^2)
Method: Least Squares
Included observations: 40
2.708507
0.0101
C -7.630549
5.105632
-1.494536
0.1433 R-squared 0.161814
Mean dependent var 6.162084
Adjusted R-squared 0.139757
S.D. dependent var 2.510868
Hoặc
Dependent Variable: RESID^2
Method: Least Squares
Included observations: 40
Variable Coefficient
Std. Error
t-Statistic
Prob.
Mean dependent var 44.51031
Adjusted R-squared 0.315161
S.D. dependent var 61.70718
S.E. of regression 51.06579
Akaike info criterion 10.75281
Sum squared resid 99093.15
Schwarz criterion 10.83726
Log likelihood -213.0563
Hannan-Quinn criter. 10.78335
F-statistic 18.94766
Durbin-Watson stat 1.951964
Prob(F-statistic) 0.000098
Prob. LOG(INCOME) 0.693976
0.137492
5.047380
0.0000
C 0.189228
0.579339
0.326627
0.7457
Schwarz criterion 0.309322
Log likelihood -2.497565
Hannan-Quinn criter. 0.255411
F-statistic 25.47604
Durbin-Watson stat 2.278955
Prob(F-statistic) 0.000011
và
Heteroskedasticity Test: Glejser
Dependent Variable: ARESID
Method: Least Squares
Included observations: 40
Variable Coefficient
Std. Error
t-Statistic
Prob.
Adjusted R-squared 0.058806
S.D. dependent var 0.153848
S.E. of regression 0.149255
Akaike info criterion -0.917608
Sum squared resid 0.846534
Schwarz criterion -0.833164
Log likelihood 20.35216
Hannan-Quinn criter. -0.887076
F-statistic 3.436729
Durbin-Watson stat 2.002216
Prob(F-statistic) 0.071537
Variable Coefficient
Std. Error
t-Statistic
Prob. X 0.164457
0.035403
4.645236
0.0000
N 1.145078
0.414428
S.E. of regression 4.290742
Akaike info criterion 5.826453
Sum squared resid 644.3664
Schwarz criterion 5.955736
Log likelihood -107.7026
Hannan-Quinn criter. 5.872451
F-statistic 14.28704
Durbin-Watson stat 2.139543
Prob(F-statistic) 0.000029 Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 11/25/10 Time: 08:33
Sample: 1 38
Included observations: 38
Presample missing value lagged residuals set to zero.
Variable Coefficient
Std. Error
t-Statistic
Prob.
0.9781
RESID(-1) -0.074675
0.171797
-0.434668
0.6665 R-squared 0.005526
Mean dependent var 1.91E-15
Adjusted R-squared -0.082221
S.D. dependent var 4.173165
S.E. of regression 4.341338
ThS Đàm Đình Mạnh Cho mức ý nghĩa
5%
20
Bài 2: Cho các số liệu: Y là mức tiêu dùng của hộ gia đình, X2 là thu nhập và X3 là tài sản có
khả năng chuyển đổi cao.
Mô hình hồi quy là :
1 2 2 3 3
t t t t
Y X X u
Dependent Variable: Y
Method: Least Squares
Included observations: 25
0.767602
0.4509
C 33.87971
19.11513
1.772403
0.0902 R-squared 0.741695
Mean dependent var 169.3680
Adjusted R-squared 0.718213
S.D. dependent var 79.05857
a. Có tự tương quan trong mô hình nói trên hay không?
b. Dùng phương pháp BG để xem xét tự tương quan ta được kết quả sau:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 5.154144
Prob. F(1,21) 0.0338
Obs*R-squared 4.926699
Prob. Chi-Square(1) 0.0264
X2 34.75910
35.53066
0.978285
0.3391
X3 -8.691659
8.883689
-0.978384
0.3390
C 4.029211
17.62108
0.228659
Akaike info criterion 10.28433
Sum squared resid 31111.48
Schwarz criterion 10.47935
Log likelihood -124.5542
Hannan-Quinn criter. 10.33842
F-statistic 1.718048
Durbin-Watson stat 1.832092
Prob(F-statistic) 0.193912
a. Cho biết kiểm định trên thực hiện thế nào. Cho kết quả ra sao.
Prob. C 0.266719
7.829427
0.034066
0.9731
E(-1) -0.401855
0.195590
-2.054577
0.0520