Bài thực hành kinh tế lượng
Vấn đề nghiên cứu:
Diện tích rừng mất đi với mật độ dân số,
diện tích đất canh tác và diện tích đồng cỏ
chăn nuôi
I., Cơ sở lý thuyết.
Diện tích rừng mất đi phụ thuộc vào một số yếu tố sau đây:
+ Mật độ dân số: khi mật độ dân số càng cao thì xu hướng sẽ là mở rộng diện tích
đất đai cho người dân có them không gian sống. Điều đó có nghĩa là sẽ phải hy
sinh một lượng diện tích rừng và làm diện tích rừng bị mất tăng lên.
+ Diện tích đất dành cho trồng trọt: khi ngành trồng trọt phát triển mạnh, hay
người dân cần nhiều đất hơn để trồng các loại cây lương thực, thực phẩm, công
nghiệp,… họ sẽ phá rừng và tất nhiên diện tích rừng bị mất sẽ tăng lên.
+ Diện tích đất dành cho chăn nuôi: tương tự như ảnh hưởng của diện tích đất dành
cho trồng trọt, diện tích đất dành cho chăn nuôi cũng ảnh hưởng cùng chiều đến
diện tích rừng bị mất đi. Người dân tham gia sản xuất trong lĩnh vực chăn nuôi
càng nhiều thì họ sẽ lấy đi của rừng nhiều đất hơn.
II. Xây dựng mô hình kinh tế lượng.
Các biến sử dụng:
Forest_loss: diện tích rừng mất đi.
Popdens: mật độ dân số.
Cropch: sự thay đổi diện tích đất dành cho trồng trọt.
Pasturech: sự thay đổi diện tích đất dành cho chăn nuôi.
Ta có : PRF
E(Forest_loss
i
/ Popdens, Cropch, Pasturech) = β
1
+β
2
Popdens+β
2
Popdens + b
3
Cropch +b
4
Pasturech + e
i
Với e
i
là phần dư của mẫu
• Bảng số liệu về lượng giảm về rừng , mật độ dân số, diện tích canh tác và
diện tích đồng cỏ:
ob
s
Forest_loss
Popden
s
Cropch Pasturech obs
Forest_los
s
Popdens Cropch Pasturech
1 0,7 357 27,9 0 36 0,6 351 8,5 2,4
2 0,7 48 1,7 0 37 1 1541 14,3 6
3 0,8 932 14,5 0 38 2,9 1661 4 0
4 0,7 366 17,9 0 39 1,3 2769 1,5 0
5 0,8 83 2,2 0 40 1 510 0,4 0
6 0 22 5,1 0 41 0,9 200 3,6 0
7 0 67 4 -6,6 42 1,2 678 0,2 -0,8
8 0,6 413 0 0 43 2,9 1113 25,5 29,7
9 0,3 496 0,4 -1,1 44 1,4 2178 -2,9 18,3
được kết quả như bảng sau:
Model 1: OLS, using observations 1-70
Dependent variable: Forest_loss
Coefficient Std. Error t-ratio p-value
const 0,565674 0,13271 4,2625 0,00007 ***
Popdens 0,00080774
3
0,00011355
8
7,1131 <0,00001 ***
Cropch -
0,00397477
0,010214 -0,3891 0,69842
Pasturech 0,027966 0,0100031 2,7957 0,00677 ***
~ 3 ~
NHOM_42 KTE309(2-1213).10_LT
Mean dependent var 1,138571 S.D. dependent var 0,928189
Sum squared resid 30,00558 S.E. of regression 0,674263
R-squared 0,495245 Adjusted R-squared 0,472302
F(3, 66) 21,58553 P-value(F) 7,45e-10
Log-likelihood -69,67678 Akaike criterion 147,3536
Schwarz criterion 156,3475 Hannan-Quinn 150,9261
Theo kết quả trên ta được hàm hồi quy miêu tả mối quan hệ giữa các biến kinh tế
như sau:
-p-value(Popdens), p-value(Pasturech) < 0,01 => biến có ý nghĩa thống kê ở mức
1%
-p-value(Cropch)=0,6982 > 0,1 => biến Cropch không có ý nghĩa thống kê ở mức
10%
• Ý nghĩa của các hệ số ước lượng:
H
1
: R
2
> 0
Tiêu chuẩn kiểm định:
P-value(F)= 7,45e-10 < 0,01 => bác bỏ H
0
=> mô hình phù hợp
2.3 Mô hình có phân phối e
i
chuẩn do cỡ mẫu lớn.
Kiểm định Normality cho kết quả p-value=0 => phần dư của mô hình không có
phân phối chuẩn. Tuy nhiên vì mô hình có kích thước lớn (n=70) nên lỗi này
không ảnh hưởng nghiêm trọng tới mô hình do sự hội tụ về phân phối chuẩn khi
kích thước mẫu đủ lớn.
2.4 Đa cộng tuyến:
• Phát hiện đa cộng tuyến theo phương pháp hồi quy phụ.
Hồi quy PL theo PC bằng phần mềm Gretl ta thu được kết quả sau:
Model 2: OLS, using observations 1-70
Dependent variable: Popdens
~ 5 ~
NHOM_42 KTE309(2-1213).10_LT
Coefficient Std. Error t-ratio p-value
const 702,673 114,084 6,1592 <0,00001 ***
Cropch -13,8884 10,8568 -1,2792 0,20523
Pasturech 11,0228 10,6771 1,0324 0,30561
Mean dependent var 639,4270 S.D. dependent var 726,3400
Sum squared resid 35255298 S.E. of regression 725,3954
F(3, 66) 21,58553 P-value(F) 7,45e-10
Log-likelihood -69,67678 Akaike criterion 147,3536
Schwarz criterion 156,3475 Hannan-Quinn 150,9261
Test for normality of residual -
Null hypothesis: error is normally distributed
Test statistic: Chi-square(2) = 23,0444
with p-value = 9,90787e-006
White's test for heteroskedasticity (squares only) -
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 21,2084
with p-value = P(Chi-square(6) > 21,2084) = 0,00168293
White's test for heteroskedasticity -
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 30,5016
with p-value = P(Chi-square(9) > 30,5016) = 0,000360303
Breusch-Pagan test for heteroskedasticity -
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 72,5686
~ 7 ~
NHOM_42 KTE309(2-1213).10_LT
with p-value = P(Chi-square(3) > 72,5686) = 1,20259e-015
-với White :
p-value = P(Chi-square(9) > 30,501581) = 0,000360303 <0.01 => có
PSSS thay đổi.
-với White's test (squares only)
p-value = P(Chi-square(6) > 21,20815) = 0,00168293 <0.01 => có PSSS
thay đổi.
-với Breusch-Pagan test: :
p-value = P(Chi-square(3) > 72,568554) = 1,20259e-015<0,01 => có
PSSS thay đổi.
u
, 4-d
u
) => với mức ý nghĩa 5% mô hình không có tự
tương quan.
3. Khắc phục mô hình có PSSS thay đổi :
phát hiện biến gây ra PSSS thay đổi :
Từ kết quả thu được từ những kiểm định trên ta có thể kết luận mô hình có hiện
tượng PSSSTĐ. Để có thể khắc phục lỗi này ta cần tìm hiểu xem biến nào gây ra
lỗi. Ta thực hiện lấy phần dư của mô hình gốc, bình phương lên sau đó vẽ đồ thị về
mối quan hệ của nó với lần lượt 3 biến giải thích.
~ 9 ~
NHOM_42 KTE309(2-1213).10_LT
~ 10 ~
NHOM_42 KTE309(2-1213).10_LT
Từ 3 đồ thị trên ta có thể dễ dàng nhận thấy biến gây ra lỗi PSSSTĐ trong mô hình
là biến Popdens. Bây giờ chúng ta sẽ có các phương án để khắc phục PSSS thay
đổi do biến Popdens gây ra như sau :
1. Phương án một
• Giả định E(U
i
2
)=ƃ
2
Popdens
2
Thực hiện hồi quy mô hình theo trọng số Popdens
Ta có
fl_pop=per_pop++cr_pop+pas_pop+v
with p-value = P(Chi-square(3) > 10,9739) = 0,0118679
• Kiểm định mô hình
1. Mô hình có hệ số của biến cr_pop và pas_pop không có ý nghĩa thống kê
2. hình có xảy ra đa cộng tuyến
Per_pop 212,251
Cr_pop 71,897
Pas_pop 160,191
Ta thấy VIF(X
i
) >10 nên có đa cộng tuyến
3. Mô hình phù hợp do P-value(F)=3.49e-57 <0.05
4. Mô hình không có tự tương quan
2<DW=2.034742<4-D
u
=2.2792
5. Mô hình có PSSSTĐ
+ White’s test: Ta thấy p-value=0.000000<0.05 nên có xảy ra PSSSTĐ
+ BP test
Ta thấy p-value=0.0011868<0.05 nên có xảy ra PSSSTĐ
Vậy ta không nên dùng mô hình này
2. Phương án hai
• Giả định E(U
i
2
)=ƃ
2
Popdens
Thực hiện hồi quy mô hình theo trọng số
Ta có
fl_sqrt_pop=per_sqrt_pop++cr_sqrt_pop+pas_sqrt_pop+v
with p-value = P(Chi-square(7) > 57,2535) = 5,32273e-010
• Kiểm định mô hình
1. Mô hình có hai hệ số của biến cr_sqrt_pop và pas_sqrt_pop không có
ý nghĩa thống kê.
2. Không có hiện tượng đa cộng tuyến
Per_sqrt_pop 5,883
Sprt_pop 1,546
Cr_sqrt_pop 2,883
Pas_sqrt_pop 4,283
Ta thấy VIF(X
i
) <10 nên không có đa cộng tuyến
3. Mô hình phù hợp do có p-value(F)=1.78e-16<0.05
4. Mô hình không có tự tương quan
D
u
=1.7208<DW=1.929324<2
5. Mô hình có PSSSTĐ
+White’s test
Ta thấy p-value=1,44931e-008<0.05 nên có xảy ra PSSSTĐ
+ White's test (squares only)
Ta thấy p-value=5,32273e-010 <0.05 nên có xảy ra PSSSTĐ
Vậy ta không nên chọn cách mô hình này
3. Phương án ba
• Giả định E(U
i
2
)=ƃ
2
(E(Forest_loss))
Breusch-Pagan test for heteroskedasticity -
Null hypothesis: heteroskedasticity not present
Test statistic: LM = 0.528361
with p-value = P(Chi-square(3) > 0.528361) = 0.912618
• Kiểm định mô hình
1. Mô hình có một hệ số của biến cr_FIT không có ý nghĩa thống kê
2. Mô hình phù hợp do có p-value(F)=3.22e-15<0.05
3. Mô hình xảy ra đa cộng tuyến
~ 14 ~
NHOM_42 KTE309(2-1213).10_LT
Ta thấy hệ số tương quan giữa cr_FIT và per_FIT=0.8870>0.8
Ta hồi quy biến cr_FIT theo các biến độc lập còn lại
Ta thấy R-squared=1 tức là VIF tiến đến ∞
4. Mô hình không có tự tương quan
D
u
=1.7208<DW=1.898872<2
5. Mô hình qua được White’s test (squares only) và BP test nhưng không qua
được White’s test
+ White’s test (squares only)
~ 15 ~
NHOM_42 KTE309(2-1213).10_LT
Ta thấy p-value=0.172282 >0.05 => không có PSSS thay đổi
+ BP test
Ta thấy p-value=0.9122618 >0.05 => không có PSSS thay đổi
+ White’s test
~ 16 ~
NHOM_42 KTE309(2-1213).10_LT
Ta thấy 0,05> p-value=0.010323 >0,01
Tuy nhiên mô hình mới này có nhược điểm là biến Cropch không có ý nghĩa thống
điều chỉnh
Mô hình chưa bỏ biến
Cropch
0.654238 0.638522
Mô hình đã bỏ biến
Cropch
0.863093 0.859006
Ngoài ra các kiểm định khác cho thấy mô hình không có hiện tượng đa cộng tuyến
cũng như tự tương quan => mô hình rất phù hợp.
Vậy ta có thể lựa chọn mô hình này
4. Phương án bốn
• Ta sử dụng Robust standard errors cho mô hình hồi quy gốc
• Ta có mô hình hồi quy mới
Kết quả thu được không tốt hơn so với mô hinh ở mục D vì không những mô hình
không khắc phục được PSSSTĐ mà vẫn còn biến không có ý nghĩa thống kê ở mức
10% và giá trị R
2
quá thấp.
~ 18 ~
NHOM_42 KTE309(2-1213).10_LT
Vậy chung lại ta nên lựa chọn phương án số ba
• KẾT QUẢ:
Dựa vào sự phân tích những kết quả thu được ở trên ta có thể kết luận mô hinh
hình hồi quy là
Forest_loss = 0,4658 + 0,00097.popdens + 0,01295.pasturech +e
i
Mức độ phù hợp của mô hình so với thực tế khá cao R
2
= 86,31%.
Diễn giải mô hình