TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
VIỆN SAU ĐẠI HỌC
BÀI TẬP LỚN
KINH TẾ LƯỢNG VÀ PHÂN TÍCH DỮ LIỆU
Học viên: NGÔ THỊ THU NGÂN
Mã số: CH210461 Lớp: CH21D Số thứ tự: 36
PHÂN TÍCH BỘ SỐ LIỆU: Tổng sản phẩm quốc nội (GDP), Tổng giá trị
nhập khẩu (IP), dân số (P), chỉ số giá tiêu dùng (I) và tỷ lệ lạm phát (K).
Số quan sát: 32
Số biến số: 5
Loại số liệu: Số liệu chéo
Hà Nội, 01/2013
1. Vấn đề nghiên cứu: Thử nghiệm xây dựng mô hình kinh tế lượng để phân tích những tác
động ảnh hưởng của tổng giá trị nhập khẩu, dân số, chỉ số giá tiêu dùng, tỷ lệ lạm phát đến
tổng sản phẩm quốc nội của 32 quốc gia trên thế giới trong năm 2008. Nguồn số liệu được
lấy từ trang web: www. worldbank.org
Mô hình gồm 4 biến:
- Biến phụ thuộc: Tổng sản phẩm quốc nội GDP (đơn vị: tỷ USD)
- Biến độc lập: + Tổng giá trị nhập khẩu IP ( đơn vị: tỷ USD)
+ Dân số P (đơn vị: triệu người)
+ Chỉ số giá tiêu dùng I (đơn vị: %)
+ Tỷ lệ lạm phát K (đơn vị: %)
GDP
i
= β
1
+ β
2
IP
i
+ β
lệ lạm phát giúp ta biết được ảnh hưởng của các yếu tố này đến tổng sản phẩm quốc nội như
thế nào. Thông qua việc tìm hiểu lý thuyết cũng như những chỉ tiêu, hiểu được những đặc
điểm, tính chất và xu hướng phát triển để từ đó đưa ra những định hướng, giải pháp tối ưu
nhất.
3. Phân tích thống kê mô tả các biến
GDP I IP K P
Mean 1712.574 5.837500 406.3845 6.046875 138452.4
Median 769.6500 5.650000 227.7500 4.350000 47131.24
Maximum 14290.00 9.300000 2190.000 24.40000 1333480.
Minimum 0.004672 1.800000 6.424000 1.400000 4839.600
Std. Dev. 2790.227 2.368986 436.4579 4.998838 301125.1
Skewness 3.303796 -0.088011 2.522000 2.341013 3.334599
Kurtosis 14.57312 1.721102 10.07100 8.249733 12.86606
Jarque-Bera 236.7966 2.222084 100.5879 65.97475 189.0899
Probability 0.000000 0.329216 0.000000 0.000000 0.000000
Sum 54802.36 186.8000 13004.30 193.5000 4430476.
Sum Sq. Dev. 2.41E+08 173.9750 5905360. 774.6397 2.81E+12
Observations 32 32 32 32 32
Ma trận hiệp phương sai (Covariance)
GDP I IP K P
GDP 7542074.4095 -106.9289 1062550.7084 -1973.9936 425230475.4132
I -106.9289 5.4367 193.9630 -7.4624 -232956.2022
IP 1062550.7084 193.9630 184542.5106 -666.6376 41744162.7578
K -1973.9936 -7.4624 -666.6376 24.2075 114166.2790
P 425230475.4132 -232956.2022 41744162.7578 114166.2790 87842665507.8070
Ma trận tương quan (Correlation)
GDP I IP K P
GDP 1.000000 -0.016699 0.900650 -0.146092 0.522428
I -0.016699 1.000000 0.193643 -0.650480 -0.337096
IP 0.900650 0.193643 1.000000 -0.315404 0.327865
Method: Least Squares
Date: 12/04/12 Time: 12:11
Sample: 1 32
Included observations: 32
Variable Coefficient Std. Error t-Statistic Prob.
C -520.0262 939.3487 -0.553603 0.5844
IP 5.537833 0.486555 11.38172 0.0000
P 0.001936 0.000725 2.670349 0.0127
I -85.67018 112.2580 -0.763155 0.4520
K 35.41931 50.64912 0.699307 0.4903
R-squared 0.881281 Mean dependent var 1712.574
Adjusted R-squared 0.863693 S.D. dependent var 2790.227
S.E. of regression 1030.145 Akaike info criterion 16.85539
Sum squared resid 28652370 Schwarz criterion 17.08441
Log likelihood -264.6862 Hannan-Quinn criter. 16.93130
F-statistic 50.10701 Durbin-Watson stat 1.757226
Prob(F-statistic) 0.000000
Hệ số chặn, I, K không có ý nghĩa thống kê; IP, P có ý nghĩa thống kê.
Mô hình hồi quy phù hợp.
Mô hình 2: GDP
i
= e
β1
* IP
i
β2
* P
i
i
+ U
i
Dependent Variable: LGDP
Method: Least Squares
Date: 12/04/12 Time: 12:25
Sample: 1 32
Included observations: 32
Variable Coefficient Std. Error t-Statistic Prob.
C -9.374443 8.510765 -1.101481 0.2804
LIP 0.929916 0.958894 0.969779 0.3408
LP 0.972854 0.699540 1.390706 0.1757
LI 0.027739 2.395094 0.011582 0.9908
LK -0.160508 1.313107 -0.122236 0.9036
R-squared 0.421327 Mean dependent var 5.979288
Adjusted R-squared 0.335598 S.D. dependent var 3.170002
S.E. of regression 2.583897 Akaike info criterion 4.879075
Sum squared resid 180.2661 Schwarz criterion 5.108096
Log likelihood -73.06520 Hannan-Quinn criter. 4.954989
F-statistic 4.914619 Durbin-Watson stat 2.267570
Prob(F-statistic) 0.004151
Hệ số chặn và các hệ số góc không có ý nghĩa thống kê.
Mô hình hồi quy phù hợp.
Mô hình có hiện tượng đa cộng tuyến do kiểm định T và kiểm định F mâu thuẫn nhau.
Mô hình 3: GDP
i
= β
1
+ β
2
Sum squared resid 1.06E+08 Schwarz criterion 18.39449
Log likelihood -285.6475 Hannan-Quinn criter. 18.24138
F-statistic 8.589917 Durbin-Watson stat 1.572276
Prob(F-statistic) 0.000132
Hệ số chặn, P có ý nghĩa thống kê; IP, I, K không có ý nghĩa thống kê.
Mô hình hồi quy phù hợp.
Mô hình 4: lnGDP
i
= β
1
+ β
2
IP
i
+ β
3
P
i
+ β
4
I
i
+ β
5
K
i
+ U
i
Dependent Variable: LGDP
Method: Least Squares
+ α
3
I
i
+ α
4
K
i
+ V
i
Giả thuyết kiểm định: H
0
: Mô hình gốc không có đa cộng tuyến
H
1
: Mô hình gốc có đa cộng tuyến
Kết quả kiểm định:
Dependent Variable: IP
Method: Least Squares
Date: 12/04/12 Time: 12:38
Sample: 1 32
Included observations: 32
Variable Coefficient Std. Error t-Statistic Prob.
C 249.7954 361.7845 0.690453 0.4956
P 0.000590 0.000259 2.282292 0.0303
I 33.53055 43.13908 0.777266 0.4435
K -19.98516 19.30662 -1.035146 0.3095
R-squared 0.240921 Mean dependent var 406.3845
Adjusted R-squared 0.159592 S.D. dependent var 436.4579
S.E. of regression 400.1175 Akaike info criterion 14.93786
2
(loại I)
.
Vậy loại biến I ra khổi mô hình gốc thì mô hình sẽ tốt hơn.
6. Kiểm định phương sai sai số thay đổi bằng kiểm định White
Kiểm định White (no cross terms) với mô hình gốc
Giả thuyết kiểm định: H
0
: Mô hình gốc có phương sai sai số không đổi (đồng đều)
H
1
: Mô hình gốc có phương sai sai số thay đổi
Kết quả kiểm định:
Heteroskedasticity Test: White
F-statistic 10.19332 Prob. F(4,27) 0.0000
Obs*R-squared 19.25162 Prob. Chi-Square(4) 0.0007
Scaled explained SS 28.74397 Prob. Chi-Square(4) 0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/04/12 Time: 13:08
Sample: 1 32
Included observations: 32
Variable Coefficient Std. Error t-Statistic Prob.
C 398096.0 533322.3 0.746446 0.4618
IP^2 1.620100 0.263945 6.138013 0.0000
P^2 -9.45E-07 6.24E-07 -1.515275 0.1413
I^2 1989.808 9744.335 0.204201 0.8397
K^2 -768.6768 2109.721 -0.364350 0.7184
Variable Coefficient Std. Error t-Statistic Prob.
C -6346069. 8746344. -0.725568 0.4780
IP 2117.376 8028.012 0.263748 0.7951
IP^2 1.809189 1.647604 1.098073 0.2875
IP*P -0.007862 0.008149 -0.964808 0.3482
IP*I 467.7130 875.9217 0.533967 0.6003
IP*K -183.3001 911.9544 -0.200997 0.8431
P 51.65633 40.86247 1.264151 0.2232
P^2 -7.45E-07 6.48E-06 -0.114935 0.9098
P*I -8.704661 4.806980 -1.810838 0.0879
P*K -2.258672 2.613831 -0.864123 0.3995
I 1394420. 2240601. 0.622342 0.5420
I^2 -91833.21 136966.1 -0.670481 0.5116
I*K -14388.43 69317.88 -0.207572 0.8380
K 264778.0 541610.1 0.488872 0.6312
K^2 312.2264 13075.81 0.023878 0.9812
R-squared 0.808309 Mean dependent var 895386.6
Adjusted R-squared 0.650445 S.D. dependent var 1863141.
S.E. of regression 1101547. Akaike info criterion 30.96731
Sum squared resid 2.06E+13 Schwarz criterion 31.65437
Log likelihood -480.4769 Hannan-Quinn criter. 31.19505
F-statistic 5.120306 Durbin-Watson stat 1.958204
Prob(F-statistic) 0.001014
Theo kết quả kiểm định này, P-vaule của kiểm định F là 0,0010 < α = 0,05: bác bỏ H
0.
Vậy mô
hình gốc có phương sai sai số thay đổi.
Kiểm định White (cross terms) với mô hình sau khi đã loại bỏ biến I
Heteroskedasticity Test: White
Vậy
mô hình có phương sai sai số thay đổi.
7. Kiểm định tự tương quan
Kiểm định Breush-Godfrey
Giả thuyết kiểm định: H
0
: Mô hình gốc không có tự tương quan bậc nhất
H
1
: Mô hình gốc có tự tương quan bậc nhất
Kết quả kiểm định:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 0.515090 Prob. F(1,28) 0.4789
Obs*R-squared 0.614169 Prob. Chi-Square(1) 0.4332
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 11/20/12 Time: 13:15
Sample: 1 34
Included observations: 34
Presample missing value lagged residuals set to zero.
Variable Coefficient Std. Error t-Statistic Prob.
C 77.82925 416.1486 0.187023 0.8530
IP 0.028719 0.436329 0.065820 0.9480
P -0.015752 1.066749 -0.014766 0.9883
I -21.32565 106.3652 -0.200495 0.8425
K 1.724144 58.27986 0.029584 0.9766
RESID(-1) 0.150569 0.209795 0.717698 0.4789
R-squared 0.018064 Mean dependent var -3.74E-13
Adjusted R-squared -0.157282 S.D. dependent var 1023.967
i
+ U
i
Theo kết quả hồi quy ta có: d = Durbin-Watson stat = 1,757226
Với n= 32, α = 5%, k
’
= k-1 = 4
Tra bảng ta có: d
L
= 1,177; d
U
= 1,732
Do d
U
< d < 4 -
d
U
: Mô hình gốc không có tự tương quan.
8. Kiểm định định dạng phương trình hồi quy bằng kiểm định Ramsey RESET
Giả thuyết kiểm định: H
0
: Mô hình gốc có dạng hàm đúng/không thiếu biến
H
1
: Mô hình gốc có dạng hàm không đúng/thiếu biến
Kết quả kiểm định:
Ramsey RESET Test:
F-statistic 26.61220 Prob. F(1,26) 0.0000
Log likelihood ratio 22.55525 Prob. Chi-Square(1) 0.0000
- Mô hình gốc có hiện tượng đa cộng tuyến và đó là hiện tượng đa cộng tuyến không hoàn
hảo. Biện pháp khắc phục bằng cách loại bỏ biến P và I ra khỏi mô hình (trong đó bỏ biến I
tốt hơn).
- Mô hình có hiện tượng phương sai sai số thay đổi.
- Mô hình không có hiện tượng tự tương quan.
- Không thể bỏ biến IP, P ra khỏi mô hình. Có thể bỏ biến I, K ra khỏi mô hình trong trường
hợp cần thiết.
- Mô hình có dạng hàm không đúng, thiếu biến (do thực tế GDP phụ thuộc vào rất nhiều yếu
tố, song trong quá trình làm bài không thu thập được đầy đủ các số liệu).
Hướng mở rộng nghiên cứu:
Mô hình chỉ thu thập được số liệu của 32 quốc gia trên thế giới, chưa thu thập đầy đủ số
liệu của tất cả các nước trên thể giới. Để tăng mức ý nghĩa cho nghiên cứu cần thu thập thêm
số liệu của tất cả các quốc gia trên thế giới, đảm bảo độ lớn của số liệu. Bên cạnh đó còn có
một số nhân tố khác ảnh hưởng đến GDP mà chưa được đưa vào mô hình như xuất khẩu, chi
tiêu chính phủ…. Tuy nhiên khi thêm các biến mới vào mô hình, mô hình sẽ phức tạp hơn,
có thể có nhiều khuyết tật hơn gây khó khăn cho việc kiểm định.