Bài tập Phân tích định lượng MBA-08
1
TRƯỜNG Đ ẠI HỌC MỞ TP.HCM
LỚP CAO HỌC QUẢN TRỊ KINH DOANH KHÓA 8
TIỂU LUẬN MÔN HỌC:
PHÂN TÍCH ĐỊNH LƯỢNG
ĐỀ TÀI TIỂU LUẬN:
NHÓM THỰC HIỆN:
Đào Hùng Anh.
Võ Phương Hồng Cúc.
Lê Trọng Đoan
Cao Văn Tuấn.
Yêu cầu:
Sử dụng dữ liệu trong file World 95 Tieng Viet.sav đính kèm, bạn hãy tự xây dựng cho mình một mô
hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới.
Bạn được tự do lựa chọn các biến giải thích để đưa vào m ô hình cũng như tự quyết định dạng thức
của các liên hệ giữa biến giải thích và biến kết quả.
Hãy mô tả chi tiết quá trình xây dựng mô hình của bạn và tăng tính thuyết phục của mô hình này bằng
các công cụ chẩn đoán và đánh giá mô hình. Giải thích ý nghĩa các kết quả của mô hình rút ra.
Sản phẩm nộp:
1. Bài làm dạng file Word (có ghi tên các thành viên của nhóm ở trang đầu)
2. File output SP SS
Cả 2 file được đặt tên như sau MBA8_KT_nhomX (X là số thứ tự nhóm)
Hình thức:
File Word định dạng khổ giấy A4 (canh lề 2cm mỗi phía),
font chữ Time New Roman, cỡ 12 points
Cách đoạn (Spacin g before) 6 points, giãn dòng (line spacing) 1.2
Chúc thành công!
Bài tập Phân tích định lượng MBA-08
4
MỤC LỤC
I. Lý thuyết về hồi quy tuyến tính.
1. Hệ số tương quan đơn.
2. Xây dựng ph ươn g trình hồi quy tuyến tính.
3. Đánh giá sự phù hợp của mô hình.
Bài tập Phân tích định lượng MBA-08
5
I.Lý thuyết tổng quát về hồi quy đơn biến.
1. Hệ số tương quan.( correlation coefficient)
- Hệ số tương quan r nhằm nói lên sự liên kết chặt chẽ giữa hai biến nào đó.
- Hệ số tương quan cho mẫu là ước lượng của hệ số tương quan r để đo lường mối liên kết tuyến chặt
chẽ giữa các biến của mẫu.
- Hệ số này không có đơn vị.
- Hệ số này có giá trị biến thiên từ -1 đến 1.
- Khi có giá trị âm hệ hai biến có tương quan nghịch biến.
- Khi có giá trị dương hệ hai biến có tương quan đồng biến.
- Khi gía trị này bằng khôn g thì hai biến khôn g có liên kết.
biết X nguyên nhân, X được đặt trên trục hoành và Y đặt trên trục tung. Trong phần nghiên cứu của
tiểu luận ta chi đi khảo sát mối liên quan tuyến tính theo đường thẳng đố i với mối liên hệ theo các
hình khác như parabol hay hình gấp khúc không được đề cập.
Phương trình hồi quy tuyến tính của tổng thể và mẫu có dạng đường thẳng như sau:
Yi =
0
+
1
X
i
+ , Yi = B
0
+ B
1
X
i
+
Trong đó Y là biến kết quả dự đoán thứ i, X
i
là biến nguyên nhân thứ i, B
0
hệ số tương quan tung độ
góc là giá trị của Y khi X bằng không, B
1
là hệ số tương quan độ dốc của đường thẳng biểu diễn mô
hình hồi quy, là gía trị khác biệt giữa hồi quy và giá trị thực tế.
Ý nghĩa của các hệ số :
- B
0
của mô hình.
Thông thường thước đo cho mô hình tuyến tính được dùng là hệ số xác định R2. R2 được tính theo
công thức:
Trong đó SSR được xem như là giá trị sai lệch giữa gía trị dự đoán theo hồi quy so với giá trị trung
bình của tập dữ liệu, nó nói lên ph ần giá trị mà ta có thể ước lượng gần với thực tế hơn khi có phương
pháp hồi quy so với khi ta chỉ tính giá trị trung bình của tổng thể tập mẫu.
Ví dụ khi ta tính thu nhập theo đầu người của thành phố HCM thì giá trị là 5 triệu đồng/người như
vậy khi một gia đình có 3 người đi làm thì ta có thể hiểu là gia đình này thu nhập là 15 triệu đồng.
Nhưng ta đã biết lương bổng thì phụ thuộc vào rất nhiều vấn đề như trình độ học thức, năm kinh
nghiệm, loại công ty hay sự quan h ệ với cấp trên… như vậy khi ta dùng m ô hình hồi quy để tính
lương của một người theo trình độ học vấn thì ta có thể tính như sau:
Lương = B
0
+ B
1
*trình độ = 1 + 2.5*trình độ, khi xét đến một người có học vị đại học anh ta có gía
trị trình độ là 3 thì Lương =1+2.5*3=8.5 triệu. Như vậy khoản chênh lệch 3.5 triệu giữa giá trị trung
bình và giá trị tính theo hồi là SSR.
Giá trị SST được định nghĩa khá đơn giản là giá trị sai lệch giữa giá trị trung bình của tập khảo sát và
giá thị thực tế của một giá trị thực tế nào đó.
Như vậy từ công thức ta có thể thấy giá trị R
2
sẽ nằm trong khoảng từ 0 đến 1 khi R2 càng gần 0 thì
mô hình không phù hợp do mô hình hồi quy không có tác dụng làm sai lệch nhỏ đi mà nó cũng giống
như tính trung bình mà thôi. Khi R
thức sau :
2
1
2
1
ˆ
( ) /
( ) /( 1)
N
i
i
N
i
i
Y Y p
F
Y Y N p
b. kiểm định giả thuyết về hệ số hồi quy của tổng thể:
Kiểm định thường được thực hiện chính là độ dốc của mô hình tổng thể, ý nghĩa của v iệc phải đi kiểm
định này là do cho dù ta đã có độ dốc của mẫu là B
1
khác 0 nhưng ta khôn g thể chắc rằng độ dốc của
và chỉ một biến kết quả. Ví dụ như xét đến sự hao phí nhiên liệu cho một động cơ đốt trong thì có thể
có một số biến nguyên nhân là: độ nặng của xe, dung tích cylinder, số cylinder hay tỉ số nén, khoảng
cách từ tử điểm trên đến tử điểm dưới…
Mô hình hồi quy bội có dạng: Y =
0
+
1
X
1
+
2
X
2
+…+
p
X
p
+e
Y: là biến kết quả,
k
là các hệ số hồi quy riêng phần, X
k
là các biến nguyên nhân, e là sai số.
Các ưu điểm của hồi quy bội so với hồi quy đơn:
- Hồi quy bội cho ta đường hồi quy chính xác hơn so với hồi quy đơn khi ta chọn được các
biến nguyên nhân chính xác.
- Giúp ta hiểu rõ hơn về vấn đề đang nhiên cứu, do mọi vấn đề hay hiện tượng trong tự
nhiên hay trong kinh tế, xã hội đều có nhiều n guyên nhân gây ra chứ không phải chỉ một
nguyên nhân ảnh hưỡng duy nhất.
- Sai số e là nhỏ so với hồi quy đơn, khi các biến được chọn phù h ợp.
kết quả hay không thông qua kiểm định giả thuyết H0:
0
=
1
=
2
=0, và khi giả thuyết H0 bị bác bỏ thì
ta kết luận độ phù hợp tron g m ô hình giải thích được biến khảo sát.
Bài tập Phân tích định lượng MBA-08
10 Xét hệ số beta riêng phần cho mơ hình:
Hệ số này nói lên sự tác động riêng của một biến ngun nhân nào đó vào biến kết quả khi các biến
ngun nhân còn lại khơng có sự thay đổi, hệ số này còn được kiểm định thơng qua mức ý nghĩa sig.
khi mức ý nghĩa càng nhỏ thì ta đánh giá biến ngun nhân đó có tác động đến mơ hình, ngược lại khi
giá trị của mức ý nghĩa lớn hơn 0.05 chẵng hạn thì khơng có sự tác động lớn của biến ngun nhân đó
đến mơ hình.
II. Ứng dụng Hồi quy đơn biến tuyến tính vào để xây dựng một mơ hình hồi quy giải thích sự
khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới.
1.Xác định biến ngun nhân và kết quả.
Để x ác định biến thì ta dùng SPSS tìm hệ số tương quan r giữa các biến so với biến tuổi thọ phụ nữ,
trong đó có ba điều kiện cần xem xét:
- Các điểm trên đồ thị Scatter phải tương đối tuyến tính theo đường thẳng do ta khảo sát mơ hình hơi
quy tuyến tính đơn.
- Hệ số tương quan càng gần 1 càng tốt.
- Có sự xem xét thực tế là biến n gun nhân đó có thật sự tương quan ảnh hưởng đến biến kết quả là
tuổi thọ phụ nữ.
T uổi thọ TB
phụ nữ
Pearson
Correlation
1 .865(**)
Sig. (2-tailed) . .00 0
N 109 107
T ỉ l ệ d ân
bi ế t chữ (%)
Pearson
Correlation
.86 5(**) 1
Sig. (2-tailed) .00 0 .
N 107 107
Bài tập Phân tích định lượng MBA-08
11
- Tuổi thọ phụ nữ theo mật độ dân số:
Ma t do dan so ( nguoi/km2)
6000500040003000200010000-1000
Tuo i tho phu nu
90
80
70
60
50
40- Tuổi thọ phụ nữ theo tỷ lệ dân sống ở thành thị:
80
70
60
50
40
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
T uổi
thọ T B
phụ nữ
Mật độ
dân s ố
(ngư ời/km
2)
T uổi thọ TB phu ï
nữ
Pearson
Correlation
1 .12 8
Sig. (2-tai led)
. .186
N
109 109
Mật độ dân s ố
108
T ỉ lệ dân s ống
ở vùn g đo â thò
(%)
Pearson Correlation
.743(** )
1
Sig. (2-tailed)
.00 0
.
N
108
108
T uổi
tho ï TB
phụ nữ
T ốc độ
tăng
dân số
(%/năm)
Tuổi tho ï TB phụ
nữ
Pearson Correlation
1 579(**)
Sig. (2-tai led)
. .00 0
N
109 10 9
GDP tính trên
đầu người (USD)
Pearson Correl ation .642(** ) 1
Sig. (2-tai led) .000 .
N 109 10 9
Bài tập Phân tích định lượng MBA-08
12
- Tuổi thọ phụ nữ theo tơn giáo:
Ton giao
76543210
Tuoi th o phu nu
9 0
8 0
7 0
6 0
5 0
4 0
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
70
60
50
40
** Correlati on is signi ficant at the 0.01 level (2-tailed ). T uổi
tho ï TB
phụ nữ
Region or
ec onomic
group
Tuổi tho ï TB phụ
nữ
Pearson Correlation
1 321(**)
Sig. (2-tai led)
. .00 1
N
109 109
Region or economic
group
Pearson Correlation
321(**) 1
Correlati on
.77 5(**) 1
Sig. (2-tai led)
.000 .
N
75 75Tuổi tho ï
T B phụ
nữ
Số con TB
của 1 phụ
nữ
Tuổi tho ï T B phu ï
nữ
Pearson Correlation
1 83 8(**)
Sig. (2-tai led)
. .000
N
109 107
Số c on T B của 1
phụ nữ
Pearson Correlation
838(**) 1
Sig. (2-tai led)
.00 0 .
Bài tập Phân tích định lượng MBA-08
13
- Tuổi thọ phụ nữ tính theo khí hậu:
Kh i hau chinh
1086420
Tuoi th o phu nu
90
80
70
60
50
40
** Correlati on is signi ficant at the 0.01 level (2-tailed ).
Sau khi dùng SPSS để vẽ đồ thị điểm và tính hệ số tương quan r ta thấy có các biến sau có thể dùng
làm biến ngun nhân là:
- Tỷ lệ dân biết chữ có r = 0.865 và đồ thị các điểm tuyến tính theo đường thẳng.
- Tỷ lệ dân sống ở thành thị có r = 0.743 và đồ thị các điểm tuyến tính theo đường thẳng.
- Theo lượng calogi nạp vào hằng ngày cho từng n gười r = 0.775 và đồ thị các điểm tuyến tính theo
đường thẳng.
- Số con trung bình r = -0.838 và đồ thị các điểm tuyến tính theo đường thẳng nghịch biến.
- Tỷ lệ biết chữ của phụ nữ r = 0.819 và đồ thị các điểm tuyến tính theo đường thẳng.
Theo các tiêu chí nói trên ta chọn một biến làm biến ngun nhân. Ta chọn tỷ lệ phụ nữ biết chữ do
nếu chọn theo tỷ lệ dân biết chữ nó có hệ số tương quan tốt nhất nhưng khi xét đến biết chữ thì lại có
tính cả đàn ơng và trẻ con.
2. Xây dựng mơ hình hồi quy tuyến tính.
a Predictors: (Constant), T ỉ l ệ nư õ giới biết chữ (%) ANOVA(b) T uổi thọ
TB phụ
nữ
Khí
hậu
chín h
T uổi thọ T B
phụ nư õ
Pearson
Correlation
1
.33 7(**
)
Sig. (2-tai led)
. .000
N
109 107
Khí hậu chính Pearson
Correlation
.33 7(**) 1
6475.177 168.698 .00 0(a)
Residual
3185.811
83
38.383
T otal
9660.988
84
a Predic tors: (Constant), T ỉ l ệ nư õ giới biết chữ (%)
b Depend en t Variable: Tuổi thọ T B phụ nữ
Coefficients(a)
Model
Unstandardi zed
Coefficients
Standardized
3. Đánh giá sự phù hợp và kiểm định mơ hình
a. Đánh giá sự phù hợp của m ơ hình:
Như đã thể hiện trong phần I thơng qua giá trị Rsquare ta có thể đánh giá độ phù hợp của mơ hình
giá trị Rsquare được SP SS tính trong bảng sau:
Model Summary
Model R
R
Square
Adjusted
R Square
Std. Error
of the
Estimate
1 .819(a) .670 .666 6.195
a Predictors: (Constant), Tỉ lệ nữ giới biết chữ (%)
Rsquare =0.67 có giá trị tương đối lớn hơn trung bình nhưng khơng q gần 1 điều này cho thấy mơ
hình có sự phù hợp tương đối và có nghĩa là các điểm trên đồ thị scatter khá rời rạc và khơng trùng
nhiều trên đường hồi quy. Điều này cho ta kết luận rằng tuổi thọ phụ n ữ khơng chỉ phụ thuộc vào việc
biết chữ m à còn phụ thuộc vào các vấn đề khác như số con sinh, lượng calogi nạp vào hay GDP tính
trên đầu người…Như vậy để có thể có mơ hình tốt hơn ta phải tìm hiểu và phân tích tuổi thọ phụ nữ
qua mơ hình hồi quy đa biến.
Squares df Mean Square F Sig.
1 Regressio
n
6475.177
1
6475.177
168.698 .000(a)
Residual
3185.811
83
38.383
T otal
9660.988
84
a Predictors: (Constant), T ỉ l ệ nư õ giới biết chữ (%)
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t Sig.
B Std. Error Beta
1 (Constant)
47.170 1.72 6
27.337 .000
T ỉ l ệ nữ giới
biết c hữ (%)
.30 7 .02 4
.81 9 12 .988 .000
a Depend en t Variable: Tuổi thọ T B phụ nữ Theo kết quả với mức ý nghĩa quan sát rất nhỏ 0.0001 nên ta có thể hòan tồn bác bỏ giả thuyết Ho
hay ta có thể nói mơ hình hồi quy t uyến tính của tổng thể có độ dốc
1
khác khơng.
4. Mơ hình đa biến, chọn lựa biến ngun nhân, xây dựng và đánh giá.
Chọ lựa biến ngun nhân:
N
109 107 107 75
Tỉ lệ dân biết
chữ (%)
Pearson Correlation
.86 5(**) 1 866(**) .682(** )
Sig. (2-tai led)
.000 . .000 .000
N
107 107 105 74
Số c on T B c ủ a 1
phụ nữ
Pearson Correlation
83 8(**) 866(**) 1 696(**)
Sig. (2-tai led)
.000 .000 . .00 0
N
107 105 107 75
Calori nạp hàng
ngày T B 1 người
Pearson Correlation
.77 5(**) .682(**) 696(**) 1
Variables
Entered
Variabl es
Removed
Meth od
1
Calori nạp
hàng ngày
T B 1 người,
T ỉ l ệ d ân
bi ết chữ
(%), Số c on
T B của 1
phụ nữ(a)
. Enter
a All requested variables entered .
b Depend en t Variable: Tuổi thọ T B phụ nữ
Model Summary
Model R R S quare
Adjusted R
Square
Std. Error of the
Esti mate
1
a Predictors: (Constant), Calori nạp ha øng nga øy T B 1 người, Tỉ lệ da ân biết chữ (%), Số c on T B của 1 phụ nữ
b Depend en t Variable: Tuổi thọ T B phụ nữ
Coefficients(a)
Model
Unstandardi zed
Coefficients
Standardized
Coefficients
t Sig. B Std. E rror Beta
1 (Constant)
40.498 6.700
6.044 .000
T ỉ l ệ dân biết
chữ (%)
.22 7 .049 .45 8 4.599 .000
Số c on T B của
1 phụ nữ
-1.4 30 .594 243 -2.407 .019
Calori nạp hàng
ngày TB 1
người
=
2
=
3
=0, nếu giả thuyết H0 bị bác bỏ lúc này ta sẽ kết luận rằng có sự
phù hợp của mơ hình cho tổng thể giửa các biến ngun nhân và biến kết quả.
Bài tập Phân tích định lượng MBA-08
18
Mod
el
Sum of
Squares
df
Mean Square
F
Sig.
1 Regressio
n
7962.254
3
Unstandardi zed
Coefficients
Standardized
Coefficients
t
Sig.
B Std. E rror Beta
1 (Constant)
40.498 6.700
6.0 44
.00 0
T ỉ l ệ dân biết
chữ (%)
.22 7 .049
.45 8
4.5 99
.00 0
Số c on T B của
1 phụ nữ
-1.4 30 .594
243
-2.407 .019
Calori nạp hàng
ngày TB 1
người
.00 6 .001
.29 6
4.2 44 .00 0