37Do
ñ
ó, b
1
= 1261 / 98 = 12,867 b
0
= 77,286 – 12,867×5,00 = 12,949
Do
ñ
ó
ñườ
ng h
ồ
i quy tuy
ế
n ntính bình ph
ươ
ng be nh
ấ
t là
xy 87,1295,12
ˆ
+
=
Tu
ổ
i (x
i
)
Kh
ố
i l
ượ
ng
(y
i
)
Gí tr
ị
h
ồ
i quy
ii
xy 87.1295.12
ˆ
+
=
Ph
ầ
n d
ư
ằ
ng giá tr
ị
trung bình c
ủ
a ph
ầ
n d
ư
b
ằ
ng không
[Phân d
ư
so v
ớ
i
ñườ
ng h
ồ
i quy bình ph
ươ
ng] 70,737res
7
1
2
==
∑
=i
i
(
i
y
ñượ
c dùng
ñể
ướ
c tính kh
ố
i l
ượ
ng trung bình c
ủ
a bê
ñố
i
v
ớ
i m
ộ
t ngày tu
ổ
i cho tr
ướ
c.
Có th
ể
ướ
ế
t
ñố
i v
ớ
i mô hình h
ồ
i quy:
y
i
~ N(β
0
+ β
1
x
i
, σ
2
) ho
ặ
c t
ươ
ng
ñươ
ng v
ớ
i ε
i
~ N(0, σ
2
)2(
ˆ
)2(SS Residual
1
2
2
−−=
−=
∑
=
nyy
ns
n
i
iiðố
i v
ớ
i s
ố
li
ệ
u vê kh
ố
i l
ượ
ng c
ủ
ng h
ồ
i quy
ñ
i qua g
ố
c to
ạ
ñộ
)
Ki
ể
m
ñị
nh th
ố
ng kê:
)se(
0
0
b
b
t = df = n - 2 trong
ñ
ó
∑
∑
=
ng c
ủ
a bê:
66,7
987
273
15,12)se(
0
=
×
×=b
t = 12.95 / 7.66 = 1.69, v
ớ
i b
ậ
c t
ự
do df = 7 – 2 = 5.
P-value: P = 2×P(T
5
> 1.69) = 0.15
Nh
ư
v
ậ
y gi
ả
thuy
ế
0
= 0, thì mô hình
ñượ
c rút g
ọ
n nh
ư
sau y
i
= β
1
x
i
+ ε
i
có ngh
ĩ
a là y ‘t
ỷ
l
ệ
’
v
ớ
i x.
5.5.2.
ðộ
d
ố
c
ñị
nh th
ố
ng kê:
)se(
1
1
b
b
t =
df = n - 2 trong
ñ
ó
∑
=
−
=
n
i
i
xx
s
b
1
2
1
)(
)se(
ðố
i v
Nh
ư
v
ậ
y gi
ả
thuy
ế
t H
0
b
ị
bác b
ỏ
: K
ế
t lu
ậ
n r
ằ
ng kh
ố
i l
ượ
ng c
ủ
a bê t
ă
ng m
ng sai (ANOVA), chúng ta c
ũ
ng có th
ể
chia s
ự
bi
ế
n
ñộ
ng c
ủ
a s
ố
li
ệ
u (y) thành các thành ph
ầ
n
ñượ
c gi
ả
i thích trong mô hìmh và thành ph
ầ
n
không gi
ả
i thích
ñượ
c:
39
T
ổ
ng SS =
∑
=
−
n
i
i
yy
1
2
)( = Σ(Quan sát − Trung bình)
2
= (18 − 77.29)
2
+ (32 − 77.29)
2
+ … + (164 − 77.29)
2
= 16,963
SS h
ồ
i quy =
=
−
n
i
ii
yy
1
2
)
ˆ
( = Σ(Quan sát − H
ồ
i quy)
2
= Σ(Ph
ầ
n d
ư
)
2
= (18 − 12.95)
2
+ (32 − 38.68)
2
+ … + (164 − 167.36)
2
= 738
Chú ý r
1
22
1
)( = 12.87
2
× 98 = 16,226
c
ũ
ng nh
ư
trên, apart from some round off error.
K
ế
t qu
ả
phân tích
ñượ
c trình bày
ở
b
ả
ng ANOVA
Ngu
ồ
n T
ổ
ng bình B
ậ
c t
ự
ệ
u v
ề
bê, b
ả
ng ANOVA là
Ngu
ồ
n T
ổ
ng bình B
ậ
c t
ự
do TB bình
bi
ế
n
ñộ
ng ph
ươ
ng (SS) (df) ph
ươ
ng (MS)
H
ồ
i quy 16,226 1 16,226
Ph
ầ
n d
ố
ng kê: 2,1
MS
Residual
MS Regression
−== ndfFTrong ví d
ụ
vè bê: F = 16,226 / 147.5 = 110.0 v
ớ
i df = 1, 5
So sánh v
ớ
i phân b
ố
F
1,5
, ta có P = 0.00.
Nh
ư
v
ậ
y ta có giá tr
ị
a t-test và F-test:
t
2
= F (10.49
2
= 110.0) Chú ý b
ậ
c t
ự
do b
ằ
ng nhau (b
ằ
ng 5)
R
2
- Ph
ầ
n bi
ế
n
ñộ
ng
ñượ
c gi
ả
i thích b
ằ
ng mô hình. V
Minitab example: Khối lượng (y) và tuổi (x) của 7 bê
MTB > NAME C1 'Tuoi' C2 'Khoi luong'
MTB > REGR C2 1 C1
Stat > Regression > Regression Regression Analysis
The regression equation is
Khoi luong = 12.9 + 12.9 Tuoi
Predictor Coef StDev T P
Constant 12.949 7.663 1.69 0.152
Tuoi 12.867 1.227 10.49 0.000
S = 12.15 R-Sq = 95.7% R-Sq(adj) = 94.8%
Analysis of Variance
Source DF SS MS F P
Regression 1 16226 16226 109.97 0.000
Residual Error 5 738 148
Total 6 16963
Lưu ý:
Ki
ể
m
ñị
nh, n
có m
ộ
t bi
ế
n
ướ
c tính x, Thì chúng ta có th
ể
dùng t-test
ho
ặ
c F-test
ñể
th
ự
c hi
ệ
n phép th
ử
. C
ả
2 ph
ươ
ng pháp
ñề
u cho ta giá tr
ị
P nh
ư
nhau
i quy / T
ổ
ng SS = 16226 / 16963 = 0.957
Gí tr
ị
R
2
cho ta th
ấ
y giá tr
ị
h
ồ
i quy (R-sq=95.7%)
416. Tương quan
6.1. Giới thiệu
Chúng ta có th
ể
s
ử
d
ụ
ng h
ệ
s
ố
ñế
n +1. N
ế
u m
ộ
t bi
ế
n có xu h
ướ
ng t
ă
ng còn bi
ế
n
kia gi
ả
m thì h
ệ
s
ố
t
ươ
ng quan là âm. Còn n
ế
u c
ả
hai bi
ế
n có xu h
ướ
ớ
i
m
ẫ
u. M
ứ
c
ñộ
t
ươ
ng quan có th
ể
ñượ
c ki
ể
m
ñị
nh b
ằ
ng phép th
ử
t
ừ
2 phía:
H
0
:
ρ
= 0 versus H
n
i
i
n
i
ii
ssn
yyxx
yyxx
yyxx
r
1
))((
)()(
))((
1
1
2
1
2
1
−
−−
=
−−
−−
=
∑
∑∑
∑
là giá
tr
ị
trung bình và
ñộ
l
ệ
ch chu
ẩ
n c
ủ
a m
ẫ
u th
ứ
2. Chú ý r
ằ
ng:
r = 0 ⇒ không có m
ố
i quan h
ệ
tuy
ế
n tính;
r = +1 ⇒ quan h
ệ
tuy
ế
n tính d
ví d
ụ
h
ồ
i quy tuy
ế
n tính
ñơ
n gi
ả
n
ñể
tính toán. Các s
ố
li
ệ
u v
ề
ñộ
d
ố
c (b
1
)
ñ
ã
ñượ
c tính toán trong trong ph
ầ
xX
ii
−
=
yyY
ii
−
=
ii
YX
0 18 -5 -59,29 296,43
2 32 -3 -45,29 135,86
3 64 -2 -13,29 26,57
4 45 -1 -32,29 32,29
6 91 1 13,71 13,71
8 127 3 49,71 149,14
12 164 7 86,71 607,00
35 541 0 0,00 1.261,00
00,5
ñ
a là 1).
42
6.3. Những ví dụ về sự tương quan
r
= - 1
x
y
r
= 1
x
y
r
= -0.9
x
y
r
= 0.9
x
y
r
= 0.5
x
y
r