TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
PHÂN TÍCH ẢNH HƯỞNG CỦA CÁC NHÂN TỐ
ĐẾN TỈ LỆ TỬ VONG Ở TRẺ SƠ SINH
Báo cáo Kinh tế lượng
Hà Nội, tháng 04 năm 2014
Nhóm 10.1 – Bộ số liệu 58
TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
BÁO CÁO KINH TẾ LƯỢNG
Bộ số liệu 58 – LOWBRTH
PHÂN TÍCH CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN TỈ LỆ
TỬ VONG Ở TRẺ SƠ SINH
Họ và tên
GV hướng dẫn
: Tiến sỹ Đinh Thị Thanh Bình
Lớp
: KTE309.11
1
Nhóm 10.1 – Bộ số liệu 58
BÁO CÁO KINH TẾ LƯỢNG
Bộ số liệu 58 – LOWBRTH
- Nội dung: Phân tích ảnh hưởng của các nhân tố đến tỉ lệ tử vong ở trẻ sơ sinh.
Đây là một vấn đề nhận được nhiều sự quan tâm ở nhiều quốc gia trên thế giới. Việc
nghiên cứu để giảm tỉ lệ tử vong ở trẻ sơ sinh mang tính xã hội và nhân văn sâu sắc. Nó
không chỉ giúp giảm nỗi đau cho các gia đình mà còn giảm gánh nặng cho xã hội, và quan
trọng hơn cả là cải thiện chất lượng dân số; góp phần cải thiện số lượng và chất lượng nguồn
lao động.
Trong báo cáo thường niên về tình trạng sức khỏe bà mẹ và trẻ sơ sinh State of World
Mothers ra số 14 của tổ chức. Save the Children cho biết tỷ lệ từ vong trẻ sơ sinh tại Việt
Nam đã giảm 48% từ năm 1990 đến 2011. Việt Nam xếp thứ 86 trong bảng xếp hạng về
những nơi tốt nhất cho các bà mẹ. Việt Nam đang trong tiến trình đạt được mục tiêu thiên
niên kỷ về giảm tỷ lệ tử vong ở bà mẹ và trẻ em. Chính vì vậy, việc nghiên cứu về Tỉ lệ tử
vong ở trẻ sơ sinh cùng các nhân tố ảnh hưởng để tìm ra biện pháp hữu hiệu giảm thiểu tỉ lệ
này càng cần thiết hơn bao giờ hết.
- Các biến được chọn:
+ infmort
+ lowbrth
+ popul
+ pcinc
+ afdcpay
+ physicpc
- Bài cáo cáo gồm 4 phần:
+ Phần I: Mô tả biến với lệnh DES, TAB, SUM
+ Phần II: Phân tích hồi quy và tương quan
type
Display
format
float
float
int
int
int
float
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
Value
label
Variable label
infant mortality rate
perc births low weight
population, 1000s
per capita income
avg monthly AFDC payment
physicians per capita
3
Nhóm 10.1 – Bộ số liệu 58
tab1 infmort lowbrth popul pcinc afdcpay physicpc
tabulation of infmort
infant
mortality
rate
Freq.
Percent
Cum.
6.2
6.4
6.7
7
7.1
7.2
7.3
7.5
…
9.9
…
11.8
11.9
1.00
1.00
1.00
…
2.00
…
1.00
1.00
1.00
1.00
1.00
2.00
1.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.00
…
65.00
…
93.00
94.00
95.00
96.00
97.00
5.5
2
3
2
4
1
5
4
3
2.00
3.00
2.00
4.00
1.00
5.00
4.00
3.00
2.00
5.00
7.00
11.00
12.00
17.00
21.00
24.00
…
97.00
98.00
99.00
100.00
Total
100
100
Bảng I.3. Kết quả chạy lệnh mô tả TAB1 với biến lowbrth
4
Nhóm 10.1 – Bộ số liệu 58
- Dấu … đại diện cho các dữ liệu ở khoảng giữa nhưng không liệt kê ra do số lượng quan sát
lớn.
- Ví dụ về phân tích dữ liệu trong bảng:
+ Tỉ lệ trẻ sinh thiếu cân có giá trị từ 4.8% đến 9.6% đối với 100 quan sát
+ Ý nghĩa của Cum. : có 24% trong tổng số 100 số quan sát mà tỉ lệ trẻ sinh thiếu cân
< 5.5%.
tabulation of popul
population,
1000s
Freq.
Percent
1
1
1
1
1.00
1.00
1.00
1.00
1.00
1.00
…
1.00
…
1.00
1.00
1.00
1.00
1.00
1.00
1.00
2.00
3.00
4.00
5.00
6.00
…
60.00
…
11797
11889
…
17422
…
21258
21258
21915
22068
22558
24977
25528
1
1
1
1
1
1
1
…
1
…
1
1
1
1
1
1
1
95.00
96.00
97.00
98.00
99.00
100.00
Total
100
100.00
Bảng I.6. Kết quả chạy lệnh mô tả TAB1 biến pcinc
5
Nhóm 10.1 – Bộ số liệu 58
tabulation of afdcpay
avg monthly
AFDC payment
Freq.
Percent
Cum.
114
1.00
1.00
…
1.00
1.00
1.00
1.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
…
97.00
98.00
99.00
100.00
Total
100
100.00
Bảng I.7. Kết quả chạy lệnh mô tả TAB1 với biến afdcpay
tabulation of physicpc
physicians
1
1
1
1.00
1.00
1.00
1.00
1.00
1.00
…
1.00
1.00
1.00
1.00
1.00
1.00
2.00
3.00
4.00
5.00
6.00
…
96.00
97.00
98.00
99.00
100.00
Dấu
kì
vọng
Ý nghĩa
Đơn vị tính
Lowbrth
(𝑿𝟏 )
Tỷ lệ trẻ sinh
thiếu cân
+
%
Popul (𝑿𝟐 )
Dân số
+
1000 người
Pcinc (𝑿𝟑 )
Thu nhập bình
cao thì tỉ lệ tử
vong
trung
bình ở trẻ sơ
sinh càng cao
Dân số càng
cao thì tỉ lệ tử
vong
trung
bình ở trẻ sơ
sinh càng cao
Thu nhập bình
quân càng cao
thì tỉ lệ tử vong
trung bình ở trẻ
sơ sinh càng
thấp
Trợ cấp hàng
tháng càng cao
thì tỉ lệ tử vong
trung bình ở trẻ
sơ sinh càng
thấp
Tỷ lệ bác sỹ
trên đầu người
càng cao thì tỉ
lệ tử vong
trung bình ở trẻ
sơ sinh càng
thấp
physicpc
-0.1395
-0.5808
-0.3821
0.2658
0.1798
-0.5520
1.0000
0.6150
0.0094
1.0000
0.2702
1.0000
Bảng II.2. Kết quả khi chạy lệnh corr giữa các biến đốc lập
Theo kết quả ở trên, các hệ số tương quan 𝑟𝑖𝑗 đều có giá trị tuyệt đối nhỏ hơn 0.8
Không có hiện tượng đa cộng tuyến trong mô hình.
3. Chạy hồi quy
- Sử dụng lệnh
reg infmort lowbrth popul pcinc afdcpay physicpc
Kết quả thu được:
Source |
SS
df
-----------------------------------------------------------------------------infmort |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lowbrth |
.7119426
.1230073
5.79
0.000
.4677087
.9561765
popul |
.0000113
.0000265
0.43
0.671
-.0000413
.0000639
pcinc | -.0001369
.0000459
-2.98
0.004
-.0002281
-.0000457
afdcpay |
-.000353
.001489
̂ = 7.098026 + 0.7119426 × 𝑿𝟏 + 0.0000113 × 𝑿𝟐 − 0.0001369 × 𝑿𝟑 − 0.000353
𝒀
× 𝑿𝟒 − 0.9808367 × 𝑿𝟓
4. Phân tích kết quả hồi quy
- Phần tổng bình phương các độ lệch giữa giá trị quan sát Yi với giá trị trung bình của nó TSS
= 211.469089
- Phần tổng bình phương được giải thích bởi mô hình (biến giải thích) ESS = 110.351338
- Phần tổng bình phương không giải thích được (phần dư) RSS = 101.117751
- R2 = 52.18% có nghĩa là các yếu tố: Tỷ lệ trẻ sinh thiếu cân, Dân số, Thu nhập bình quân
đầu người, Trợ cấp trung bình hàng tháng nhận được từ AFDC, Tỷ lệ bác sỹ trên đầu người
đã giải thích được 52.18% tỷ lệ trẻ tử vong ở trẻ sơ sinh.
8
Nhóm 10.1 – Bộ số liệu 58
- Trong các giá trị p-value ở bảng trên, giá trị p-value của biến popul, afdcpay và physicpc
lần lượt là 0.671, 0.813 và 0.515 đều lớn hơn mức ý nghĩa α = 0.05
Không có cơ sở để bác bỏ Ho (giả thuyết 𝛽𝑖 = 0). Như vậy ba biến popul, afdcpay và
physicpc không có ý nghĩa thống kê, tức là có thể không gây ảnh hưởng đến tỉ lệ tử vong
ở trẻ sơ sinh.
- Ý nghĩa các tham số trong mô hình.
𝛽0= 7.098026 có nghĩa là trong điều kiện các nhân tố khác không đổi và giá trị các
biến độc lập bằng 0 thì tỷ lệ tử vong ở trẻ sơ sinh trung bình là 7.098026 %.
𝛽1= 0.7119426 có nghĩa là trong điều kiện các nhân tố khác không đổi, nếu tỷ lệ trẻ
sinh thiếu cân tăng 1 % thì tỷ lệ tử vong trung bình ở trẻ sơ sinh tăng 0.7119426%.
𝛽2= 0.0000113, không có ý nghĩa thông kê.
𝛽3= -0.0001369 có nghĩa là trong điều kiện các yếu tố khác không đổi, nếu thu nhập
bình quân tăng 1 đơn vị thì tỷ lệ tử vong trung bình ở trẻ sơ sinh giảm 0.0001369 %.
𝛽4 = -0.000353, không có ý nghĩa thống kê.
Kết quả thu được:
(1)
(2)
(3)
(4)
(5)
infmort = 0
popul = 0
pcinc = 0
afdcpay = 0
physicpc = 0
F (5, 94) = 20.52
Prob > F = 0.0000
Kiểm định F cho toàn bộ hệ số hồi quy là 20.52; Prob > F có giá trị nhỏ hơn α = 0.05 nên
bác bỏ giả thuyết Ho.
Kết quả thu được từ stata cũng giống với khi dùng công thức.
9
Nhóm 10.1 – Bộ số liệu 58
b. Kiểm định 𝛽𝑖 = 0
𝐻𝑜: 𝛽𝑖 = 0
Cặp giả thuyết thống kê: {
𝐻1: 𝛽𝑖 ≠ 0
̂
𝛽 −𝛽
Sử dụng thống kê 𝑇 = 𝑖 ̂ 𝑖, giá trị của kiểm định này chính là cột t trong bảng kết quả
-2.98
-0.0002281
-0.0000457
𝛽4 = 0
𝛽4 ≠ 0
-0.24
-0.0033094
0.0026033
𝛽5 = 0
𝛽5 ≠ 0
-0.56
-3.958029
1.996355
𝛽0 = 0
𝛽0 ≠ 0
𝛽4 ≠ 0
𝛽5 ≠ 0
𝛽0 ≠ 0
P-value
α
Kết luận
0.000
Bác bỏ Ho
Không đủ cơ sở bác bỏ Ho
0.671
Bác bỏ Ho
0.004
0.05
Không đủ cơ sở bác bỏ Ho
0.813
Không đủ cơ sở bác bỏ Ho
0.515
Bác bỏ Ho
0.000
Bảng II.5. Kiểm định dùng P-value
Cách 3: Sử dụng phương pháp giá trị tới hạn
(𝟗𝟒)
𝑪𝟎.𝟎𝟐𝟓 = 𝒕𝟎.𝟎𝟐𝟓 = 𝟐. 𝟑𝟔𝟖
Ho
𝛽1 = 0
H1
Bác bỏ Ho
6.67
𝛽0 = 0
𝛽0 ≠ 0
Bảng II.6. Kiểm định dùng phương pháp giá trị tới hạn
Kiểm tra lại bằng stata
- Dùng lệnh: test [var]
10
Nhóm 10.1 – Bộ số liệu 58
Bản chất của lệnh test này trong stata là chạy lại mô hình hồi quy sau khi đã bỏ đi biến
đang cần kiểm định, sau đó tính F.
Ví dụ: Kiểm định 𝛽2 = 0
test popul
Kết quả thu được:
(1) popul = 0
F (1,94) =
Prob > F =
0.18
0.6710
Prob > F có giá trị lớn hơn α = 0.05 nên chúng ta không có cơ sở bác bỏ Ho, tức là 𝛽2 có
thể bằng 0.
c. Kiểm định 𝛽𝑖 = 𝛽𝑗 = 0
𝐻𝑜: 𝛽𝑖 = 𝛽𝑗 = 0
Cặp giả thuyết thống kê: {
popul = 0
F (2, 94) = 18.21
Prob > F = 0.0000
Prob > F nhỏ hơn α = 0.05 nên bác bỏ Ho, tức là có ít nhất một trong hai 𝛽1 ℎ𝑜ặ𝑐 𝛽2 khác 0.
III. PHẦN III – KIỂM TRA CÁC KHUYẾT TẬT
1. Kiểm định phương sai sai số thay đổi
a. Dựa vào đồ thị
- Bước 1: Chạy hồi quy mô hình đầy đủ
- Bước 2: Dùng lệnh rvfplot
Kết quả thu được
11
Nhóm 10.1 – Bộ số liệu 58
Hình III.1. Kết quả chạy lệnh rvfplot
Dựa vào đồ thị trên ta thấy mô hình bị mắc “bệnh” phương sai sai số thay đổi. Các điểm
phân bố không theo quy luật.
b. Sử dụng lệnh imtest, white
Kết quả thu được:
White's test for Ho: homoscedasticity
against Ha: unrestricted heteroskedasticity
chi2(19) = 47.41
Prob > chi2 = 0.0005
Cameron & Trivedi's decomposition of IM-test
Source
Heteroskedasticity
Như vậy mô hình có thể có hiện tượng phương sai sai số thay đổi, hay nói cách khác giả
thuyết phương sai thuần nhất không được thỏa mãn.
c. Sử dụng kiểm định Breusch-Pagan
- Lệnh hettest
Kết quả:
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of lowbrth
chi2(1)
= 3.16
Prob > chi2 = 0.0753
Kết quả của lệnh hettest cũng cho thấy có phương sai sai số thay đổi.
d. Cách sửa: chạy lại hồi quy với lệnh robust
reg infmort lowbrth popul pcinc afdcpay physicpc, robust
Kết quả thu được:
12
Nhóm 10.1 – Bộ số liệu 58
Linear regression
Number of obs = 100
F (5, 94)
= 14.95
Prob > F
= 0.0000
R-squared
1.636684
1.139736
t
5.34
0.44
0.44
-0.19
-0.60
6.23
P>|t|
0.000
0.663
0.000
0.850
0.550
0.000
[95% Conf. Interval]
.4471794
-.00004
-.0002109
-.0040551
-4.230511
4.835054
.9767059
.0000626
-.0000629
Bảng III.3. Kết quả sử dụng phương pháp nhân tử phóng đại phương sai
Các giá trị của VIF < 10 -> Không có hiện tượng đa cộng tuyến.
3. Kiểm định phân phối chuẩn
Cặp giả thuyết:
𝐻:
𝐶ó 𝑝ℎâ𝑛 𝑝ℎố𝑖 𝑐ℎ𝑢ẩ𝑛
{ 0
𝐻1 : 𝐾ℎô𝑛𝑔 𝑝ℎâ𝑛 𝑝ℎố𝑖 𝑐ℎ𝑢ẩ𝑛
a. Dùng đồ thị
- Bước 1: dùng lệnh predict r, resid
- Bước 2: dùng lệnh kdensity r, normal
Kết quả thu được đồ thị dưới đây
13
Nhóm 10.1 – Bộ số liệu 58
Hình III.2. Đồ thị thu được khi chạy kdensity r, normal
- Dựa vào đồ trị trên ta thấy hai đồ thị không trùng nhau
Nhiễu không phân phối chuẩn.
b. Dùng lệnh Sktest r
Kết quả thu được:
Bảng III.4. Kết quả khi chạy Sktest r
Prob>chi2 = 0.0315 < α = 0.05
Bác bỏ Ho (giả định là phân phối chuẩn)
Như vậy kết quả này giống với cách dùng đồ thị ở trên.
Vậy giả thuyết nhiễu phân phối chuẩn không thỏa mãn với mô hình trên.