PHÂN TÍCH TƯƠNG
QUAN VÀ HỒI QUI I. HỆ SỐ TƯƠNG QUAN (Correlation
coefficient)
Hệ số tương quan đo lường mức độ quan
hệ tuyến tính giữa hai biến; chính xác hơn
là quan hệ tuyến tính giữa hai biến, không
phân biệt biến này phụ thuộc vào biến kia. . 1. Hệ số tương quan mẫu (r): (Sample
correlation coefficient)
Gọi (x1, y1), (x2, y2), , (xn, yn) là n cặp quan sát của
một mẫu ngẫu nhiên của hai biến ngẫu nhiên X & Y.
Hệ số tương quan mẫu : 2. Ðặc tính của hệ số tương quan (r):
•
r không có đơn vị.
•
r luôn luôn biến động trong [-1, 1], nếu hệ
số tương quan (r) dương cho biết X và Y
biến động cùng chiều và âm thì ngược lại.
•
r = 1 hoặc r = - 1: X và Y có liên hệ hoàn
toàn chặt chẽ.
•
3. Quyết định:
)2(
)1(
2
−
−
=
n
r
r
t
Kiểm định hệ số tương quan
α
,2
−
>
n
tt
α
,2
−
−<
n
tt
n 2, / 2
t t
α
−
>
≠
=
0:
0:
)3(
1
0
ρ
ρ
H
HII. TƯƠNG QUAN HẠNG: (RANK CORRELATION)
Tương quan hạng dùng để sử
dụng cho kiểm định mối liên hệ
giữa các biến khi phân phối của
tổng thể được giả sử không phải
là phân phối chuẩn hoặc trong
trường hợp hiện diện các giá trị
bất thường của biến quan sát
(lớn quá hoặc nhỏ quá). II. TƯƠNG QUAN HẠNG: (RANK CORRELATION)
Nếu các hạng được xếp không trùng
nhau thì sử dụng công thức của
Spearman như dưới đây để tính hệ
số tương quan hạng.
=
0:
0:
)1(
1
0
ρ
ρ
H
H
Kiểm định hệ số tương quan
α
,s
rr
>
α
,s
rr
−<
s, / 2
r r
α
>
n
2
i
i 1
2
6 d
r 1
)3(
1
0
ρ
ρ
H
H III.Hồi qui tuyến tính một chiều (tuyến tính
đơn) Simple linear regression:
•
Ðặt (x1,y1), (x2,y2) (xn,yn) là mẫu gồm n
cặp quan sát trên đường hồi qui tổng thể.
•
Theo phương pháp bình phương bé nhất thì
ước lượng các hệ số α và β là các giá trị a và
b sao cho tổng bình phương sai số của
phương trình sau đây là bé nhất:
iii
xy
εβα
++= 1. Phương trình hồi qui tuyến tính một chiều:
Đường hồi qui tuyến tính mẫu của y trên x: y = a + bx
•
Các hệ số a và b được tính như sau:
2
i
2
i 1
e
n n
b
2 2
2 2
i i
i 1 i 1
b
t
s
e / n 2
s
s
x n x x n x
β
=
= =
−
=
−
÷
= =
− −
∑
b
S
b
t
0
β
−
=
<
=
01
00
:
:
)2(
ββ
ββ
H
H
≠
=
01
00
:
n
tt
tt3. Phân tích phương sai hồi qui
Ta có:
Nguồn
biến động
Độ tự
do (df)
Tổng bình
phương (SS)
Phương
sai (MS)
Thống
kê F
Giá trị
phân vị
Do hồi qui 1 SSR
Dư số n-2 SSE
Tổng cộng SST
∑
−=
−=−
2
~
2
~
2
yyyyyy
iiii
:tổng biến động của y
:tổng bình phường hồi qui, là biến động
của y được giải thích bằng đường hồi qui
:dư số,là biến động của y do các nhân tố
khác gây ra IV. Hồi qui nhiều chiều:(Multiple egression)