tiểu luận xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới - Pdf 13

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
 Môn: PHÂN TÍCH ĐNNH LƯỢNG

Tiểu luận:
Danh sách nhóm 7:
Phạm Anh Tuấn
Nguyễn Trọng An
Hoàng Ngọc Lâm
Đoàn Ngọc Châu


ĐỀ KIỂM TRA
MÔN: PHÂN TÍCH ĐNN H LƯỢN G
LỚP: MBA8
Ghi chú: Sinh viên làm bài theo nhóm Yêu cầu:
Sử dụng dữ liệu trong file World 95 Tieng Viet.sav đính kèm, bạn hãy tự xây dựng cho mình một
mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới.
Bạn được tự do lựa chọn các biến giải thích để đưa vào mô hình cũng như tự quyết định dạng thức
của các liên hệ giữa biến giải thích và biến kết quả.
Hãy mô tả chi tiết quá trình xây dựng mô hình của bạn và tăng tính thuyết phục của mô hình này
bằng các công cụ chNn đoán và đánh giá mô hình. Giải thích ý nghĩa các kết quả của mô hình rút ra.
Sản phẩm nộp:
1. Bài làm dạng file Word (có ghi tên các thành viên của nhóm ở trang đầu)
2. File output SPSS
Cả 2 file được đặt tên như sau MBA8_KT_nhomX (X là số thứ tự nhóm)
Hình thức:
File Word định dạng khổ giấy A4 (canh lề 2cm mỗi phía),
font chữ Time N ew Roman, cỡ 12 points
Cách đoạn (Spacing before) 6 points, giãn dòng (line spacing) 1.2
Chúc thành công!



KẾT LUẬN .

 Trang 1
Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8

LỜI NÓI ĐẦU

Phân tích định lượng là một môn khoa học về đo lường các mối quan hệ kinh tế xã hội diễn ra trong
thực tế. N gày nay, nó là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi
tính, nhằm định lượng các mối quan hệ kinh tế xã hội, dự báo khả năng phát triển hay diễn biến của
các hiện tượng kinh tế xã hội và phân tích chính sách.

Một khía cạnh quan trọng trong nghiên cứu kinh tế xã hội là nghiên cứu để tìm hiểu, đưa ra các
quyết định thay đổi cho tương lai. Phán đoán tốt, trực giác và quan tâm đến thực trạng của nền kinh
tế, môi trường kinh doanh và môi trường xã hội có thể cho người nghiên cứu một ý tưởng sơ bộ hay
“cảm giác” về những gì có thể xảy ra trong tương lai. Tuy nhiên, chuyển từ cảm giác thành con số
để có thể sử dụng một cách hiệu quả thì khá khó khăn. Phân tích dữ liệu thống kê giúp các nhà
nghiên cứu và quản lý dự đoán thực tế phức tạp của kinh tế và xã hội trong tương lai ít rủi ro hơn.
N hững người ra quyết định và người quản lý thành công nhất chính là những người có thể hiểu
thông tin và sử dụng thông tin hiệu quả.
N gười ta dùng một số thống kê có tên là hệ số tương quan Pearson (ký hiệu là r) để lượng hóa mức
độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng. Trong đó:
-1 ≤ r ≤ 1
9 r có thể âm hoặc dương, trị tuyệt đối của r tiến gần đến 1 khi hai biến có mối tương quan
tuyến tính chặt chẽ.
9 Trị tuyệt đối của r = 1 : Khi tất cả các điểm phân tán xếp thành một đường thẳng.
9 Giá trị r = 0 : Khi hai biến không có mối liên hệ tuyến tính
Phân tích hồi qui trước hết là đo mức độ tuyến tính giữa hai biến, nhằm ước lượng hay dự báo một
biến trên cơ sở giá trị đã cho của một biến khác. Về mặt kỹ thuật, trong phân tích hồi qui, các biến
không có tính chất đối xứng. Biến phụ thuộc là đại lượng ngẫu nhiên, biến giải thích là phi ngẫu
nhiên, giá trị của chúng đã được xác định.

1. Xây dưng phương trình của mô hình hồi đơn tuyến tính từ dữ liệu mẫu:
Xét mối liên hệ tuyến tính giữa một biến phụ thuộc và một biến độc lập. Mô hình được xây dựng từ
dữ liệu mẫu có dạng đường thẳng như sau:
Ŷ
i
= B
0
+ B
1
*X
Trong đó:
9 X
i
: là trị quan sát thứ i của biến độc lập
9 Ŷ
i

1
, β
0
: là các hệ số độ dốc và hằng số của tổng thể
9 e
i
: sai số thực, là chênh lệch giữa giá trị thực Y
i
quan sát được và giá trị dự báo (do ảnh
hưởng của các yếu tố khác chưa nghiên cứu tới), tức là:
e
i
= (Y - Ŷ
i
) = Y
i
– (β
0
+ β
1
* X)

2. Đánh giá độ phù hợp của mô hình:
Một công việc quan trọng của bất kỳ thủ tục thống kê xây dựng mô hình từ dữ liệu mẫu nào cũng
đều là chứng minh sư phù hợp của mô hình. Để biết mô hình hồi qui tuyến tính đã xây dựng phù
hợp đến mức độ nào, ta dùng một thước đo là hệ số xác định R
2
(Coefficient of Determination).

SST

3. Kiểm định các giả thiết:

Ta tiến hành qua hai bước sau:

a. Kiểm định giả thiết về độ phù hợp của mô hình (phân tích phương sai):
Xây dựng xong mô hình hồi qui tuyến tính, ta phải xem xét độ phù hợp của mô hình đối với tập dữ
liệu qua giá trị R
2
. Để kiểm định độ phù hợp của mô hình hồi qui tổng thể, ta đặt giả thiết R
2
=0.
Nếu sau khi kiểm định ta có đủ bằng chứng bác bỏ giả thiết H
0
: R
2

pop
=0 thì kết luận mô hình hồi
qui tuyến tính xây dựng được phù hợp với tổng thể. Đại lượng F được sử dụng cho kiểm định này.
Nếu xác suất F nhỏ thì giả thiết R
2
pop
=0 bị bác bỏ. Tính F theo công thức sau:


)(
Y)-Y
^
(
1
2
1
2
−−

=


=
=
pN
Y
p
F
N
i
i
N
i
Y
i
^
sidualSquareMean
gressionMeanSquare
F

1400000
1200000
1000000
800000
600000
400000
200000
0
-200000
Ti thä TB cđa phơ n÷
90
80
70
60
50
40

Correlations Tuổi thọ TB
phụ nữ
Số lượng
dân
Pearson Correlation
1 071
Sig. (2-tailed)
. .461
Tuổi thọ TB phụ nữ
N

Tuổi thọ TB
phụ nữ
Mật độ dân
số
(người/km2)
Pearson Correlation
1 .128
Sig. (2-tailed)
. .186
Tuổi thọ TB phụ nữ
N
109 109
Pearson Correlation
.128 1
Sig. (2-tailed)
.186 .
Mật độ dân số
(người/km2)

N
109 109
+ Tuổi thọ trung bình phụ nữ với Tỉ lệ dân sống ở vùng đơ thị (%):
TØ lƯ d©n sèng ë vïng ®« thÞ (%)
120100806040200
Ti thä TB phơ n÷
90
80
70
60
50

90
80
70
60
50
40

Correlations Tuổi thọ TB
phụ nữ
Tỉ lệ dân biết
chữ (%)
Pearson
Correlation
1 .865(**)
Sig. (2-tailed)
. .000
Tuổi thọ TB phụ nữ
N
109 107
Pearson
Correlation
.865(**) 1
Sig. (2-tailed)
.000 .
Tỉ lệ dân biết chữ
(%)
N

109 109
Pearson Correlation
579(**) 1
Sig. (2-tailed)
.000 .
Tốc độ tăng dân số
(%/năm)
N
109 109
** Correlation is significant at the 0.01 level (2-tailed).

+ Tuổi thọ trung bình phụ nữ với Tỉ suất tử trẻ sơ sinh o/oo:
TØ st tư trỴ s¬ sinh o/oo
2001000-100
Ti thä TB phơ n÷
90
80
70
60
50
40

Correlations Tuổi thọ
TB phụ nữ
Tỉ suất tử trẻ
sơ sinh o/oo
Pearson

Tuổi thọ
trên đầu
TB phụ nữ
người (USD)

Pearson
1 .642(**)
Correlation

Sig. (2-tailed)
. .000
Tuổi thọ TB phụ nữ
N
109 109
Pearson
.642(**) 1
Correlation
Sig. (2-tailed)
.000 .
GDP tính trên đầu
người (USD)
N
109 109
** Correlation is si
g
nificant at the 0.01 level
(
2-tailed
)
.

90
80
70
60
50
40

Correlations
Tuổi thọ
TB phụ nữ
Calori nạp
hàng ngày
TB 1 người
Pearson Correlation
1 .775(**)
Sig. (2-tailed)
. .000
Tuổi thọ TB phụ nữ
N
109 75
Pearson Correlation
.775(**) 1
Sig. (2-tailed)
.000 .
Calori nạp hàng ngày TB
1 người
N

tailed).
Correlations Tuổi thọ
TB phụ nữ
Số con TB
của 1 phụ nữ
Pearson
Correlation
1 838(**)
Sig. (2-tailed)
. .000
Tuổi thọ TB phụ nữ
N
109 107
Pearson
Correlation
838(**) 1
Sig. (2-tailed)
.000 .
Số con TB của 1
phụ nữ
N
107 107
** Correlation is significant at the 0.01 level (2-tailed).
Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8
Trang 10

+ Tuổi thọ trung bình phụ nữ với Tỉ lệ nữ giới biết chữ (%):


ị nào mà có giá trị tuy củ

 Số con TB của một phụ nữ, ứng với r = -0.838

Trong các trường hợp nêu trên,
tions

Tuổi thọ
TB phụ nữ
Tỉ lệ nữ giới
biết chữ (%)
Pearson
Correlation
1 .819(**)
Sig. (2-tailed)
. .000
Tuổi thọ TB phụ nữ
N
109 85
Pearson
Correlation
.819(**) 1
Sig. (2-tailed)
.000 .
Tỉ lệ nữ giới biết
chữ (%)
N
85 85
** Correlation is significant at the 0.01 level (2-tailed).

1
.838(a)
.702
.699 5.827
a Predictors: (Constant), Số con TB của 1 phụ nữ
NOVA(b)

A

Model
Sum of
Squares
df
Mean
Square
F Sig.
1 Regression
8379.723 1 837 39.72
246.790 .000(a)
Residual 3565.267 105 33.955
Total 11944.991 106
a Predictors: (Constant), Số con TB của 1 phụ nữ
Dependent Variable: Tuổi thọ TB phụ nữ
Coefficients(a)

bModel
Unsta dardized n


 Kiểm định giả thiết về độ phù ch phương sai):
Ta đặt giả thiết R
2
=0. Nếu sau khi kiểm định ta có đủ bằng chứng bác bỏ giả thiết H
0
: R
2

pop
=0
thì kết luận mơ hình hồi qui tuyến tính xây dựng được phù hợp với tổng thể.
Coeffi a) a biết đ hơn về hệ s ương
ượ ốc và hằng được thể t B. Ta v được ph ng trình h
ạng sau
Ŷ
i
= 86.661 –
Tuổi thọ TB phụ nữ = 86.661 – 4.674 * S
a c
n thế g khi số con tăng 1 thì tuổi thọ
hợp của mơ hình:

Từ bảng Model Summary, ta có R Square = 0.702 (tiến gần đến 1). Vậy mơ hình này là phù hợp. e. Kiểm định các giả thiết:
hợp của mơ hình (phân tí

 K m định hiết về ý ng số hồi qui:
H
0
: β
1
=0, ta kỳ vọng giả thiết này sẽ bị bác bỏ
1
.

iể giả t hĩa của hệ
Giả thiết dùng để kiểm định giả thiết này là
vì nếu β =0, nghĩa là Y độc lập với X

Coefficients(a)
Model Unstandardized Coefficients
Standardized
Coefficients
t Sig.
B Std. Error Beta
1 (Constant) 86.661 1.200 72.194 .000
Số con TB của
1 phụ nữ
-4.674 .297 838 -15.710 .000
a Dependent Variable: Tuổi thọ TB phụ nữ Từ bảng Coefficients(a), ta thấy mức ý nghĩa quan sát được đối với hệ số độ dốc của Tuổi thọ trung
ị bác bỏ. Vậy độ dốc của mơ hình tổng thể
khác 0

hình hồi q tuyến tính.
bội mở rộ
gi ích tốt hơn cho biến phụ thuộc. Mơ hìn
Yi = β
o
+ β
1
X
1i
+ β
2
X
2i
+ β
3
X
3i
+ … + β
p
X
pi
+ e
i

Trong đó:
 X
pi
: Biểu hiệ
 e
i

Tuổi thọ
TB phụ nữ
Tỉ lệ dân sống ở
vùng đô thò (%)
Calori nạp
hàng ngày
TB 1 người
Số con TB
của 1 phụ
nữ
Tỉ lệ nữ giới
biết chữ
(%)
Tuổi thọ TB phụ nữ Pearson Correlation
1
.743(**) .775(**) 838(**) .819(**)
Sig. (2-tailed) . .000 .000 .000 .000
N 109 108 75 107 85
Tỉ lệ dân sống ở
vùng đô thò (%)
Pearson Correlation
.743(**) 1
.692(**) 619(**) .612(**)
Sig. (2-tailed) .000 . .000 .000 .000
N 108 108 74 106 85
Calori nạp hàng
ngày TB 1 người
Pearson Correlation
.775(**)
.692(**)

càng lớn thì liê
ồ u biến lập, biến nào có trị tuyệ i của hệ ương quan
n h g Correl ho thấy t ng
c biến độc lập vớ ng bình ph như sau:
¾ Số con trung bình của một phụ nữ r = 0.838)
¾ Tỉ lệ nữ giới biết chữ (%). (r = 0.819)
¾ Calori n trung bình t người. (r = 0.775)
dâ thị
c số 1 trên đườ chéo là hệ số tương quan tính được gi một biế ới chính nó. Ta chỉ c
ía dưới đường chéo, vì chúng đối xứng nhau qua
ng chéo.

t luận các biến độc lập này có thể đưa vào
mơ hình để giải thích cho Tuổi thọ trung bình phụ nữ.

2. Xây dựng mơ hình:

Sử dụng SPSS ta có các bảng số liệu sau:

Variables Entered/Removed(b) (Bảng 01)
i qui bội với nhiề
ệ tuyến tính càng m
độc t đố số t
ạnh. Bản ations c ươ quan giảm dần giữa
cá i Tuổi thọ tru ụ nữ
. (
ạp hàng ngày mộ
¾ Tỉ lệ n sống ở vùng đơ (%). (r = 0.743)

Cá ng ữa n v ần


ảng 03) ANOVA(b) (B

Model Sum of Squares df Mean Square F Sig.
Regression 5780.805 4 1445.201 58.348 .000(a)
Residual 1337.500 54 24.769
1 Total 7118.305 58
a Predictors: (Constant), Tỉ lệ nữ giới biết chữ (%), Calori nạp hàng ngày TB 1 người, Tỉ lệ dân sống ở vùng đô thò
Dependent Variable: Tuổi thọ TB phụ nữ
Coefficients(a) (Bảng 04)
(%), Số con TB của 1 phụ nữ
b Model Unstandardized Coefficients
Standardized
Coefficients
t Sig.
B Std. Error Beta
(Constant) 47.467 7.016 6.765 .000
Tỉ lệ dân sống ở vùng đô
thò (%)
.110 .039 .251 2.811 .007
C g ngày Talori nạp hàn B 1
người
.005 .002 .216 2.525 .015
S TB của 1 phụ nố con ữ -1.648 .646 275 - 50 2.5 .014

a thước đo s đối v liệu t ợp hơn 1 giải
i dữ li ế như trị R
2
hiện.
ro nh huống này, R điều ch
dụng để phản ảnh sát hơn mức độ phù của m h h
i nhiều biế ph
ồi qui tuy nh đa vì
ư sau:
hợp ơ hìn tuyến đa biế điều
ơng nhất thiết tăng lên n được thêm vào ình, n thước phù
c sử dụng cho tình hu ến tí biến ng ph uộc và lệch
phóng đại của R
2
. R
2
điều chỉnh được tính nh
Trong đó:
 P : là biến độc lập trong phương trình.
1−−
−=
pN
RR
)1(
2
22
− Rp

3
= β
4
=0
i của Y, điều này cũng có nghĩa là mơ hình ta xây dựng phù hợp với tập dữ liệu.

OVA(b) (Bảng 03)

Trong b
h
hợp của mơ

4

ử dụng ng phân tích phương sai là m phép kiểm định giả th
ến tính t ng th ủa ki biến ph
ến tính với tồn bộ các biến độc lập hay khơng.
G

Nếu giả thiết H
o
bị bác bỏ thì ta kết luận là kết hợp của các biến hiện có trong mơ hình có thể giải
thích được thay đổAN

Model Sum of Squares df Mean Square
F Sig.
Regression

Standardized
Coefficients
t
Sig.
B Std. Error
Beta (Constant)
47.467 7.016

6.765
.000
Tỉ lệ dân sống ở vùng đô thò (%)
.110 .039
.251
2.811
.007
Calori nạp hàng ngày TB 1 người
.005 .002
.216
2.525
.015
Số con TB của 1 phụ nữ
-1.648 .646
275
-2.550
.014
1


+ 0.128X
4
+ e
iTrong b
g

nghĩa β
k
đo lường sự thay đổi ng giá trị tr ìn khi X
hồi qui riêng phần của tổng t c th kiểm thời g thiết β
k
=
. T R Square khá cao và giá trị ỏ. Ch ó có ng mơ ình.
Ta có phương trình thể hiện Tuổi thọ trung bình phụ n ộc vào các bi độc l p:

* Ý nghĩa của các hệ số độ dốc
:
 Hệ số β =0.11 cho biết: khi
1
Tỉ lệ dân số sống ở đơ thị tăng thêm 1%, trong điều kiện lượng
Calori nạp hằng ngày trung bình một người, Số con trung bình của một phụ nữ và Tỉ lệ nữ
 Hệ số β
2
=0.005 cho biết: khi lượng Calori nạp hằng ngày trung bình một người tăng thêm
 Hệ số β
3
= -1.648 cho biết: khi Số con trung bình của một phụ nữ tăng thêm 1, trong điều


6. Lựa chọn biến cho mô hình:

Sự lựa chọn biến để đưa vào m
được đưa vào mà ta không lường được vai trò quan trọng của nó. Trong khi đó, có một vài biến
được sử dụng có thể lại không phải là biến quyết định cho biến thiên của biến phụ thuộc. Do vậy, ta
phải xem xét các kết quả khi ta đưa vào hay bỏ ra các biến trong phương trình hồi qui để quyết
định.
T
(R
2
change
(pop)
) cũng khác 0 hay không. N ghi ngờ này được kiểm định bằng giả thiết:
H
o
: (R
2
change
(pop)
) = 0

Đại lượng kiểm định F được tính
Trong đó:

 p : là tổng số biến độc lập trong phương trình.
 q : là số biến được đưa vào phương trình trong bước này.

Variables
Removed
Method
1
Tỉ lệ dân sống ở vùng đô thò (%)(a) . Enter
2
Calori nạp hàng ngày TB 1 người(a) . Enter
3
Số con TB của 1 phụ nữ(a) . Enter
4 Tỉ lệ nữ giới biết chữ (%)(a) . Enter
a All requested variables entered.
ụ nữ
Model Summary
b Dependent Variable: Tuổi thọ TB phChange Statistics
Model R R Square
Adjusted
R Square
Std. Error
of the
Estimate
R Square
Change
F Change df1 df2
Sig. F
Change
1 .741(a) .549 .541 7.505 .549 69.376 1 57 .000
2 .797(b) .635 .622 6.812 .086 13.188 1 56 .001

Total 7118.305 58
Regression 5591.608 3 1863.869 67.147 .000(c)
Residual 1526.697 55 27.758
3
Total 7118.305 58
Regression 5780.805 4 1445.201 58.348 .000(d)
Residual 1337.500 54 24.769
4
Total 7118.305 58
a Predictors: (Constant), Tỉ lệ dân sống ở ò (%)
Predictors: (Constant), Tỉ lệ dân sống ò (%), Calori nạp hàng ngày TB 1 người
Predictors: (Constant), Tỉ lệ dân sống ở vùng đô thò (%), Calori nạp hàng ngày TB 1 người, Số con TB của 1 phụ

d Predictors: (Con tant), Tỉ áng ở vùng đô thò ori nạp h g ngày TB ời, Số con TB của 1 phụ
nữ, T ä nư õ (%
e Depende : Tuổi nữ
vùng đô th
b ở vùng đô th
c
õ
s lệ dân so (%), Cal àn 1 ngư
ỉ le õ giới biết chư )
nt Variable thọ TB phụ
Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8
Trang 21

oefficC ients(a)

.009 .002 .397 3.632
.001
Số con TB của 1 phụ nữ 2
Tỉ lệ nữ giới biết chữ (%) (Constant)
59 6.91 5.695 10.520
.000
Tỉ lệ dân sống ở vùng đô thò (%)
.152 .038 .346 3.981
.000
Calori nạp hàng ngày TB 1 người
.004 .002 .198 2.185
.033
Số con TB của 1 phụ nữ
-2.938 .473 491 -6.214
.000
3
Tỉ lệ nữ giới biết ữ (%) ch(Constant)
47 7.46 7.016 6 65.7
.000
Tỉ lệ dân sống ở vùng đô thò (%)
.110 .039 .251 2.811

ble: Tuổi thọ TB phụ nữ
ến độc lập cùng được
c của R
2
bằng 0 tương
đưa vào ơng t ong m m địn giả th t mức
ến ủa

1
= β
2
= β
3
= β
4
=0, với hy vọn bỏ g t H
o
cients(a), ta thấy giá tr nh ý số hồ t nhỏ
ỏ giả thiết H
o
. Vậy 4 b a ới h

Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8
Trang 22

Qua các phân nh k và ki nh t lạ ấy 4 độc l
đưa vào đều c g có ý ng ích biến T ọ trung bình phụ
Điều cho t đa cộng tu n. Cho nê , mơ hình y là phù p.
tích trên, ta thấy R
2
của mơ hì há cao ểm đị i cho th biến ập ta
hấp nhận được vì chún hĩa giải th cho uổi th nữ.
này hấy khơng tồn tại hiện tượng yế n nà hợ


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status