KTNL07_07401067_LE DINH NGUYEN
Bài 1
Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau
:
ĐVT:%
Nam US Anh Nhat Duc Phap
1960 1.5 1 3.6 1.5 3.6
1961 1.1 3.4 5.4 2.3 3.4
1962 1.1 4.5 6.7 4.5 4.7
1963 1.2 2.5 7.7 3 4.8
1964 1.4 3.9 3.9 2.3 3.4
1965 1.6 4.6 6.5 3.4 2.6
1966 2.8 3.7 6 3.5 2.7
1967 2.8 2.4 4 1.5 2.7
1968 4.2 4.8 5.5 18 4.5
1969 5 5.2 5.1 2.6 6.4
1970 5.9 6.5 7.6 3.7 5.5
1971 4.3 9.5 6.3 5.3 5.5
1972 3.6 6.8 4.9 5.4 5.9
1973 6.2 8.4 12 7 7.5
1974 10.9 16 24.6 7 14
1975 9.2 24.2 11.7 5.9 11.7
1976 5.8 16.5 9.3 4.5 9.6
1977 6.4 15.9 8.1 3.7 9.4
1978 7.6 8.3 3.8 2.7 9.1
1979 11.4 13.4 3.6 4.1 10.7
1980 13.6 18 8 5.5 13.3
Nguồn tin : khoa tóan thống kê – ĐHKT
a. Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian .
Cho nhận xét tổng quát về lạm phát của 5 nước ?
KTNL07_07401067_LE DINH NGUYEN
1956 1960 1964 1968 1972 1976 1980 1984
NAM
NHAT
0
4
8
12
16
20
1956 1960 1964 1968 1972 1976 1980 1984
NAM
DUC
0
5
10
15
20
25
1956 1960 1964 1968 1972 1976 1980 1984
NAM
ANH
KTNL07_07401067_LE DINH NGUYEN
Nhận xét: Tỉ lệ lạm phát của các nước Hoa Kì, Anh , Pháp có xu hướng ngày
càng tăng. Còn các nước Nhật và Đức thì tỉ lệ lạm phát tuy có những biến
động qua các năm nhưng không lớn và không có xu hướng tăng.
b. Lạm phát nước nào biến thiên nhiều hơn giải thích ?
ANH DUC NHAT PHAP US
Mean 8.547619 4.638095 7.347619 6.714286 5.123810
Median 6.500000 3.700000 6.300000 5.500000 4.300000
Maximum 24.20000 18.00000 24.60000 14.00000 13.60000
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 0.322944 1.612211 0.200311 0.8434
NAMMOHINH 0.822468 0.137908 5.963871 0.0000
R-squared 0.651809 Mean dependent var 8.547619
Adjusted R-squared 0.633483 S.D. dependent var 6.321046
S.E. of regression 3.826801 Akaike info criterion 5.612328
Sum squared resid 278.2437 Schwarz criterion 5.711806
Log likelihood -56.92945 F-statistic 35.56776
Durbin-Watson stat 1.141176 Prob(F-statistic) 0.000010
ANH = 0.3229437229 + 0.8224675325*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm
phát của nước Anh tăng thêm gần 0.823%.
KTNL07_07401067_LE DINH NGUYEN
0
5
10
15
20
25
0 4 8 12 16 20 24
NAMMOHINH
ANH
Đức
Dependent Variable: DUC
Method: Least Squares
Date: 05/14/10 Time: 20:57
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
R-squared 0.081565 Mean dependent var 7.347619
Adjusted R-squared 0.033226 S.D. dependent var 4.632992
S.E. of regression 4.555374 Akaike info criterion 5.960885
Sum squared resid 394.2773 Schwarz criterion 6.060364
Log likelihood -60.58929 F-statistic 1.687359
Durbin-Watson stat 1.175297 Prob(F-statistic) 0.209493
NHAT = 5.215151515 + 0.2132467532*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm
phát của nước Nhật tăng thêm 0.213%.
KTNL07_07401067_LE DINH NGUYEN
0
4
8
12
16
20
24
28
0 4 8 12 16 20 24
NAMMOHINH
NHAT
pháp
Dependent Variable: PHAP
Method: Least Squares
Date: 05/14/10 Time: 21:00
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 1.853247 0.832871 2.225130 0.0384
NAMMOHINH 0.486104 0.071244 6.823112 0.0000
R-squared 0.788624 Mean dependent var 5.123810
Adjusted R-squared 0.777499 S.D. dependent var 3.694984
S.E. of regression 1.742926 Akaike info criterion 4.039401
Sum squared resid 57.71804 Schwarz criterion 4.138879
Log likelihood -40.41371 F-statistic 70.88704
Durbin-Watson stat 1.131804 Prob(F-statistic) 0.000000
US = -0.1645021645 + 0.5288311688*NAMMOHINH
KTNL07_07401067_LE DINH NGUYEN
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm
phát của nước Hoa Kì tăng thêm gần 0.529%.
0
2
4
6
8
10
12
14
0 4 8 12 16 20 24
NAMMOHINH
US
d. Ươc lượng mô hình hồi qui: Lạm phát của từng quốc gia theo tỉ lệ lạm
phát của Mỹ
(Lamphat)
i
=
1
+
2
(lamphat-USA)
C 4.860462 0.627216 7.749263 0.0000
DUCLP 0.457815 0.142581 3.210916 0.0046
R-squared 0.351757 Mean dependent var 4.638095
Adjusted R-squared 0.317639 S.D. dependent var 3.458248
S.E. of regression 2.856691 Akaike info criterion 5.027598
Sum squared resid 155.0530 Schwarz criterion 5.127076
Log likelihood -50.78978 F-statistic 10.30998
Durbin-Watson stat 1.202348 Prob(F-statistic) 0.004600
DUC = 4.860462352 + 0.4578146464*DUCLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng
thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Đức tăng thêm 0.46%
Dependent Variable: NHAT
Method: Least Squares
Date: 05/14/10 Time: 21:06
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.
C 5.795073 0.866538 6.687612 0.0000
NHATLP 0.698147 0.177928 3.923768 0.0009
R-squared 0.447610 Mean dependent var 7.347619
Adjusted R-squared 0.418536 S.D. dependent var 4.632992
S.E. of regression 3.532831 Akaike info criterion 5.452469
Sum squared resid 237.1370 Schwarz criterion 5.551947
KTNL07_07401067_LE DINH NGUYEN
Log likelihood -55.25092 F-statistic 15.39596
Durbin-Watson stat 0.534453 Prob(F-statistic) 0.000912
NHAT = 5.795072835 + 0.6981471192*NHATLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng
thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Nhật tăng thêm khoảng
0.7%
tóan
Điểm khoa
học
điểm Anh
Văn
1 13.5 9.9 13.3
2 13.7 6.8 10
3 7 5.5 8.9
4 7.4 5.7 2.4
5 13.2 10.3 8.2
6 7.3 1.8 6.3
7 5.2 5.2 7.7
8 8.4 6.9 2.9
Người ta muốn xem xét xem là có mối quan hệ nào giữa điểm môn
Anh văn và điểm môn Khoa học của sinh viên . Cụ thể là chúng ta có thể
dựa vào điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn
Anh văn hay không - Cũng như dựa vào điểm môn Tóan của sinh viên có
thể dự đóan điểm của môn Anh văn hay không ?
Cho từng cặp môn học tương ứng , anh chị :
a. Ươc lượng mô hình hồi qui tuyến tính cho tập dữ liệu nói trên? - Đọc
và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng
quát ?
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/14/10 Time: 21:13
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
C 3.762656 3.422463 1.099400 0.3137
DIEMKHOAHOC 0.568114 0.489567 1.160442 0.2900
môn Anh Văn tăng thêm 0.61 điểm.
Khi điểm môn Toán bằng không thì về trung bình điểm môn Anh Văn là
1.69 điểm.
Nhận xét tổng quát: Do hệ số tương quan của 2 mô hình là rất thấp
(R
2
<0.5) cho thấy mức độ phù hợp của 2 mô hình là rất thấp. Các biến đưa
vào mô hình hầu như không có tác động đến biến phụ thuôc, mô hình đưa ra
không có ý nghĩa nhiều về mặt thống kê. Hay điểm môn Khoa Học hoặc
môn Toán không có ảnh hưởng đến điểm của môn Anh văn.
b. Giải thích ý nghĩa của hệ số tương quan ? Giải thích ý nghĩa của hệ số
độ dốc và tung độ gốc của phương trình hồi qui ?
ý nghĩa của hệ số tương quan:
KTNL07_07401067_LE DINH NGUYEN
R
2
đo lường mối tương quan giữa biến phụ thuộc (điểm Anh Văn) với biến
độc lập (điểm Khoa Học, điểm Toán). R
2
ở 2 mô hình trên đều rất nhỏ điều
đó chứng tỏ điểm của môn Anh Văn không phụ thuộc vào môn khoa học hay
môn toán.
Ý nghĩa của hệ số độ dốc v à tung độ gốc:
DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC
+ b1= 3.762656345: khi điểm môn Khoa Học bằng không thì về trung bình
điểm môn Anh Văn bằng 3.76
+ b2 = 0.5681141889 : khi điểm môn Khoa Học tăng thêm 1 điểm thì về
trung bình điểm môn Anh Văn tăng thêm 0.57 điểm
DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
22 189 35 270 5.05 54 52 83 270 3.25
23 126 58 560 6.16 55 79 43 1340 7.17
24 12 81 4240 1.8 56 61 88 670 3.52
25 167 29 240 4.75 57 168 28 410 6.09
26 135 65 430 4.1 58 28 95 4370 2.86
27 107 87 3020 6.66 59 121 41 1310 4.88
28 72 63 1420 7.28 60 115 62 1470 3.89
29 128 49 420 8.12 61 186 45 300 6.9
30 27 63 19830 5.23 62 47 85 3630 4.1
31 152 84 420 5.79 63 178 45 220 6.09
32 224 23 530 6.5 64 142 67 560 7.2
Trong đó: - CM : Tỉ lệ tử vong của trẽ sơ sinh (%)
- FLR : Tỉ lệ biết chử của dân số (%)
- PGNP : GNP bình quân đầu người (Đô la)
- TFR : Tỉ lệ sinh chung của dân số (%)
1. Hãy giải thích mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các
biến khác đã cho, bằng những lập luận mang tính cách kinh tế và lô gic ? -
Sau đó vẽ biểu đồ phân tán giữa CM và FLR; CM và PGNP; CM và TFR.
Rồi từ đó đối chiếu đồ thị với các giải thích của anh chị lúc ban đầu ( nêu lên
sự phù hợp và không phù hợp với lời giải thích ban đầu)
Trả lời:
Mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho:
+ Tỉ lệ biết chữ của dân số (FLR): đây là mối quan hệ tỉ lệ nghịch. Tỉ lệ
biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng thấp. Khi
dân trí cao thì người dân sẽ tiếp thu được nhiều tri thức hơn trong việc chăm
sóc, bảo vệ sức khỏe cho trẻ sơ sinh, dân trí cao thì con người sẽ phá bỏ
những phong tục tập quán lạc hậu, những điều lệ cổ hũ gây nguy hiểm đến
tính mạng của trẻ sơ sinh, từ đó làm giảm tỉ lệ tử vong ở trẻ sơ sinh.
+ GNP bình quân đầu người (PGNP): đây cũng là mối quan hệ tỉ lệ nghịch.
GNP bình quân đầu người càng cao thì người dân sẽ có điều kiện hơn trong
120
160
200
240
280
320
0 4000 8000 12000 16000 20000
PGNP
CM
Qua đồ thị cho thấy GNP bình quân đầu người càng cao thì tỉ lệ tử vong
càng thấp. Mức độ phân tán của GNP bình quân đầu người thấp còn khá cao,
điều này chứng tỏ GNP bình quân đầu người ở đây còn thấp và tỉ lệ tử vong
của trẻ sơ sinh ở đây còn cao. Đây hoàn toàn phù hợp với nhận xét ban đầu
0
40
80
120
160
200
240
280
320
1 2 3 4 5 6 7 8 9
TFR
CM
KTNL07_07401067_LE DINH NGUYEN
Qua đồ thị ta thấy tỉ lệ sinh chung của dân số càng cao thì tỉ lệ tử vong
của trẻ sơ sinh càng cao. Tuy nhiên cũng có một số trường hợp, tỉ lệ sinh
chung cao nhưng tỉ lệ tử vong của trẻ sơ sinh vẫn thấp, điều này cho thấy:
mặc dù tỉ lệ sinh cao nhưng công tác chăm sóc và bảo vệ sức khỏe tốt hạn
2
= 0.166217 cho thấy mô hình đưa ra không phù hợp, không có ý nghĩa
thống kê, biến đưa vào không giải thích nhiều về biến phụ thuộc, hay nói
cách khác tỉ lệ tử vong của trẻ sơ sinh ít chịu ảnh hưởng bởi GNP bình quân
đầu người mà phụ thuộc vào nhiều nhân tố khác nữa.
KTNL07_07401067_LE DINH NGUYEN
3. Hãy xây dựng mô hình hồi qui bội cho quan hệ CM; FLR và
PGNP. Nhận xét thông tin chính từ mô hình nầy , như ý nghĩa thống kê của
hệ số , hệ số xác định R
2
.
Dependent Variable: CM
Method: Least Squares
Date: 05/14/10 Time: 21:16
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 263.6416 11.59318 22.74109 0.0000
FLR -2.231586 0.209947 -10.62927 0.0000
PGNP -0.005647 0.002003 -2.818703 0.0065
R-squared 0.707665 Mean dependent var 141.5000
Adjusted R-squared 0.698081 S.D. dependent var 75.97807
S.E. of regression 41.74780 Akaike info criterion 10.34691
Sum squared resid 106315.6 Schwarz criterion 10.44811
Log likelihood -328.1012 F-statistic 73.83254
Durbin-Watson stat 2.186159 Prob(F-statistic) 0.000000
CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP
Phương trình hồi qui cho thấy:
+ Trong điều kiện GNP bình quân đầu người và tỉ lệ biết chữ của dân số
không đổi thì về trung bình tỉ lệ tử vong của trẻ sơ sinh là 263.64%
Date: 05/14/10 Time: 21:17
Sample: 1 64
Included observations: 64
Variable Coefficient Std. Error t-Statistic Prob.
C 168.3067 32.89165 5.117003 0.0000
FLR -1.768029 0.248017 -7.128663 0.0000
PGNP -0.005511 0.001878 -2.934275 0.0047
TFR 12.86864 4.190533 3.070883 0.0032
R-squared 0.747372 Mean dependent var 141.5000
Adjusted R-squared 0.734740 S.D. dependent var 75.97807
S.E. of regression 39.13127 Akaike info criterion 10.23218
Sum squared resid 91875.38 Schwarz criterion 10.36711
Log likelihood -323.4298 F-statistic 59.16767
Durbin-Watson stat 2.170318 Prob(F-statistic) 0.000000
CM = 168.3066897 - 1.768029221*FLR - 0.00551122506*PGNP +
12.86863633*TFR
Nhận xét:
Qua phương trình hồi qui cho thấy tất cả các biến đưa vào (FLR, PGNP,
TFR) đều giải thích được cho biến phụ thuộc (CM).
Hệ số hồi qui của các biến trong mô hình này lớn hơn các mô hình trên,
chứng tỏ các biến đưa ra ở mô hình này giải thích rõ biến phụ thuộc hơn so
với các mô hình trên.
R
2
= 0.747372 cao hơn các mô hình trên, cho thấy mức độ phù hợp này khá
cao, có ý nghĩa thống kê hơn cả các mô hình trên vì CM không chịu tác động
KTNL07_07401067_LE DINH NGUYEN
riêng lẽ bởi bất kì yếu tố nào mà CM chịu tác động cộng gộp bởi các nhân
tố: FLR, PGNP, TFR và nhiều nhân tố khác.
+ Mô hình này thể hiện giải thích rõ nhất tác động của các biến đến biến
7 0.133 2.8 0.703 0.207 1945 1808
9
888.4 275 0.08 111 0.926
8 0.114 3.17 0.686 0.175 1691 1427
2
880.2 185 0.119 144.5 0.659
9 0.122 5.34 0.671 0.275 3872 1816
8
1120.5 552 0.186 122.1 1
10 0.177 3.12 0.667 0.149 1886 1374
2
1065.6 191 0.135 124.2 0.908
11 0.1 2.48 0.564 0.146 1755 1254
3
814.3 159 0.166 128.8 0.648
12 0.097 2.97 0.738 0.203 1693 1381
4
554.2 212 0.099 69.8 0.763
13 0.112 2.43 0.737 0.158 1288 11120 708.7 118 0.126 100.7 0.2
14 0.12 2.77 0.665 0.162 1864 1473
8
886.5 199 0.11 121.6 0.825
15 0.119 2.19 0.664 0.125 1625 1244
6
876.3 142 0.097 135.3 0.681
16 0.145 2.09 0.715 0.139 1758 1259
4
966.1 136 0.101 109.4 0.434
17 0.134 1.95 0.733 0.17 1820 1377
5
8
772.3 155 0.087 146.7 0.826
30 0.116 4.91 0.723 0.182 1417 1496
4
849.1 179 0.085 201.1 0.563
31 0.129 2.83 0.674 0.183 1702 17211 940.7 219 0.095 116.9 1
32 0.098 2.75 0.689 0.176 1385 1091
4
672.8 161 0.176 88 0.489
33 0.128 2.67 0.663 0.179 2412 1605
0
969.9 287 0.134 115.9 0.912
34 0.115 2.13 0.548 0.132 1380 11617 846.3 168 0.148 156.3 0.554
35 0.13 2.55 0.664 0.148 1872 1205
2
821.6 157 0.126 103.2 0.384
36 0.123 2.26 0.67 0.137 1833 1322
8
920.6 182 0.103 126.7 0.789
37 0.124 1.91 0.66 0.151 1644 1223
2
900.8 138 0.134 124.2 0.588
38 0.134 2.63 0.756 0.179 1654 1262
2
889.7 189 0.107 118.6 0.677
39 0.146 2.25 0.647 0.136 1894 1343
7
1043.9 214 0.105 115.8 0.848
40 0.146 2.92 0.611 0.154 2054 1390
6
- INCC : Thu nhập đầu người tính bằng USD
- POV : Tỉ lệ của những người dân trong nước sống dưới mức
nghèo khó
- EDU1 : Tỉ lệ dân số đã học trung học
- EDU2 : Tỉ lệ dân số đã học trung học và đại học.
- ALCC : Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người.
- TOBC : Tiêu dùng thuốc lá đầu người tíng bằng bao
- HEXC : Chi tiêu y tế bình quân đầu người (USD)
- URB : Tỉ lệ dân số sống tại các khu vực thành thị
- AGED : Tỉ lệ dân số có độ tuồi trên 65
- PHYS : Các cán bộ y tế trên 1000.000 dân
Yêu cầu :
1. Chọn biến Mort là biến phụ thuộc – Đối với từng biến giải thích,
hãy lý giải tại sao nó có thể có tác động lên tỉ lệ tử vong tổng thể
và chỉ ra hướng tác động nầy?
+ Đối với INCC: thu nhập đầu người càng thấp thì tỉ lệ tử vong chung trên
100.000 dân số càng cao, do thu nhập thấp thì người dân có ít điều kiện hơn
trong việc chăm sóc sức khỏe cho bản thân và gia đình về dinh dưỡng, y
tế… từ dó có thể làm tăng khả năng tỉ lệ tử vong.
+ POV: Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó
càng cao thì việc chăm lo của người dân đến dinh dưỡng và tiếp cận đến các
dịch vụ y tế càng thấp, làm cho tỉ lệ suy dinh dưỡng cao, nếu người dân
mắc các bệnh tật thì cũng ít có khả năng chạy chữa, từ đó có thể làm tỉ lệ tử
vong chung trên 100.000 dân số càng cao,
KTNL07_07401067_LE DINH NGUYEN
+ EDU1 và EDU2: Tỉ lệ dân số đã học trung học và tỉ lệ dân số đã học trung
học và đại học càng cao cho thấy trình độ dân trí của người dân càng cao,
dân trí cao thì người dân mới tiếp thu được những kiến thức tiến bộ về sức
khỏe, y tế, khoa học….từ đó có thể giảm bớt được tỉ lệ tử vong chung trên
100.000 dân số do họ có thể bỏ nhưng hủ thục lạc hậu, những cách chữa
Sample: 1 51
Included observations: 51
Variable Coefficient Std. Error t-Statistic Prob.
KTNL07_07401067_LE DINH NGUYEN
C 46.59555 168.2097 0.277009 0.7832
AGED 4126.895 322.3451 12.80272 0.0000
ALCC -25.91511 11.09681 -2.335366 0.0246
EDU1 68.77913 196.8405 0.349415 0.7286
EDU2 -1180.217 548.8868 -2.150201 0.0376
HEXC 0.073889 0.034127 2.165088 0.0364
INCC 0.004511 0.005817 0.775551 0.4426
PHYS 0.640384 0.263636 2.429044 0.0197
POV 549.8647 308.5540 1.782069 0.0823
TOBC 1.470480 0.353504 4.159732 0.0002
URB -32.45556 35.64423 -0.910542 0.3680
R-squared 0.948570 Mean dependent var 855.0059
Adjusted R-squared 0.935713 S.D. dependent var 137.9660
S.E. of regression 34.98117 Akaike info criterion 10.13592
Sum squared resid 48947.30 Schwarz criterion 10.55259
Log likelihood -247.4660 F-statistic 73.77592
Durbin-Watson stat 1.597995 Prob(F-statistic) 0.000000
MORT = 46.59554973 + 4126.895059*AGED - 25.91510605*ALCC +
68.7791315*EDU1 - 1180.217201*EDU2 + 0.07388858751*HEXC +
0.00451136983*INCC + 0.6403836367*PHYS + 549.8646857*POV +
1.470480259*TOBC - 32.45555872*URB
Kiểm định cho mức ý nghĩa tổng quát
Giả thiết: Ho: R
2
= 0
H1: R
b4 0.349415 T < T
0.05
(40) Chấp nhận Ho