Chương 7: Tương quan và hồi quy tuyến tính - Pdf 19

Gv. Cao Hào Thi
CHƯƠNG 7
TƯƠNG QUAN & HỒI QUI TUYẾN TÍNH
(Linear Correlation and Regression)

7.1. KHÁI NIỆM CHUNG
Trong các chương trước chúng ta chỉ nghiên cứu các vấn đề liên quan đến mẫu ngẫu
nhiên của một biến ngẫu nhiên X. Trong chương này, chúng ta quan tâm đến mẫu ngẫu
nhiên bao gồm các cặp giá trò của hai biến ngẫu nhiên X và Y.
Ví dụ
Để nghiên cứu về chiều cao và sức nặng của các em học sinh trong một trường, chúng ta
lấy mẫu ngẫu nhiên gồm n học sinh và thu thập các số liệu về chiều cao và sức nặng của
n học sinh. Gọi X là biến ngẫu nhiên để dư chiều cao của học sinh và Y là biến ngẫu
nhiên chỉ sức nặng của học sinh. Với n học sinh ta có n cặp giá trò (Y
i
, X
i
).

X
(m)
x
1
x
2
x
3
x
i
x
n

vuông góc.
Dựa vào đồ thò phân tán ta có thể xác đònh được dạng quan hệ giữa 2 biến Y và X.
Gv. Cao Hào Thi
2
7.2.2. Tương quan tuyến tính (Linear Correlation)
Trong đồ thò phân tán, nếu các điểm M(x
i
, y
i
) qui tụ xung quanh một đường thẳng (D) ta
nói hai biến ngẫu Y và X có một sự tương quan tuyến tính. Đường thẳng (D) được gọi là
đường hồi qui tuyến tính (đường hòa hợp thẳng).
7.2.3. Hệ số tương quan ρ của tập hợp chính (The Population Correlation Coefficient)
Gọi X, Y là cặp giá trò của các biến ngẫu nhiên với số trung bình là µ
x
, µ
y
và phương sai
là σ
x
2
, σ
y
2
. Để đo lường mức độ quan hệ giữa X và Y người ta dùng đại lượng hiệp
tượng quan (covariance) và hệ số tương quan (correlation coefficent).
7.2.3.1. Hiệp tương quan (Covariance)

xy
(,)
(,)

ρ
σ
σσ
=
xy
xy
Với
σ
µ
σ
µ
x
x
i
N
y
iii
i
N
x
N
y
N
2
1
2



−−
EX Y
EX EY
xy
xy
[( )( )]
[( ) ] * [( ) ]
22

ρ
µµ
µµ
=
−−
−−

==

∑∑
()()
()*()
xy
xy
xi y
i
N
ix iy
i

))((
),(
,

7.2.4.2. Hệ số tương quan của mẫu r (Sample Correlation Coefficient)
r
S
SS
XY
XY
=


r
xxyy
xx yy
i
i
n
i
i
i
n
i
i
n
=
−−
−−
=















=
==

∑∑
1
2
1
2
2
1
2
.

Ghi Chú
• -1 ≤ r ≤ 1
• r được dùng để ước lượng hướng và độ mạnh của mối quan hệ giữa X,Y.

- y)
2
(x
i
- x )(y
i
- y)
0
1
2
3
4
6
5
7
8
4

-2
-1
0
1
2
0
-1
1
2
-2
4
1

2
5
1i
i
2
5
1i
i
i
5
1i
i
.
)()(
)()(
−=
×

=

−×−

−⋅


=
==
=

r = -0.1 tương quan yếu.

t
2
2n
−−
=


r: hệ số tương quan của mẫu
n: cỡ mẫu
t
n-2
: tuân theo phân phối Student t với độ tự do n-2

Trường hợp 2
H
0
: ρ = 0
H
1
: ρ > 0
R : bác bỏ H
0
nếu t
n-2
> - t
n - 2, αTrường hợp 3
H

I
x
i
y
x
2
x
i
2
x
i
y
i

70
55
100
40
15
20
13
18
9
25
36
19
4900
3025
10000
1600

1n
1
S
29154562062856
5
1
xnx
1n
1
S
20
6
120
n
x
x
50
6
300
n
y
y
6
1i
iiXY
2
2
6
1i
2






=
==−=









=
==

=
==

=
=
=
=
/**
/*
./*


,
0.025
= 2.776
- t
n - 2 , α/2
= -2.776
4. r = -0.835

t
r
rn
n−
−−
=

−−
2
22
12
0835
108354()/()
.
[(.)]/

t
n -2
= - 3.03
5. Ra quyết đònh
t
n - 2

: Giá trò đối với sự dao động ngẫu nhiên hay sai số trong lần quan sát thứ i.
• A : là thông số diễn tả tung độ gốc của đường hồi qui của tập hợp chính, hay A là
giá trò trung bình của biến phụ thuộc Y khi biến độc lập X thay đổi 1 đơn vò.
• B : là thông số diễn tả độ dốc của đường hồi qui của tập hợp chính, hay B diễn tả
sự thay đổi của giá trò trung bình của biến phụ thuộc Y khi biến độc lập X thay
đổi 1 đơn vò.
7.3.1.2. Phương trình hồi qui tuyến tính đơn giản của tập hợp chính
(Population Simple Linear Regression Equation)
Là phương trình diễn tả giá trò trung bình của biến phụ thuộc Y theo biến độc lập X đã
biết.

µ
Y/ X
= A + BX
7.3.1.3. Phương trình hồi qui tuyến tính đơn giản của mẫu
Chúng ta có thể ước lượng các tham số (A,B) của phương trình hồi qui tuyến tính đơn
giản của tập hợp chính bằng cách sử dụng số liệu của mẫu ngẫu nhiên thu thập được.
Dựa vào số liệu của mẫu ta có phương trình hồi qui tuyến tính đơn giản của mẫu.

Y

= a + bX
Gv. Cao Hào Thi
8

Trong đó:


i
n
i
i
n

=

==
∑∑ ∑
=−=−−
1
2
1
2
1
2
()

Y b
1

Y

i

Y

()




a
YabX
b
YabX
ii
i
n
i
i
n
i
−− =
−− =
=
=


2
1
1
2
0
0()

Giải hệ phương trình ta có:

=
=
=




1
2
1
1
1
2

Người ta chứng minh được rằng a, b là những ước lượng không chệch và vững của A,B.
Đường thẳng
Y

= a + bX được gọi là đường hồi qui thực nghiệm
Đường thẳng
Y

= A + BX được gọi là đường hồi qui lý thuyết
Ví dụ
Tìm đường hồi qui thực nghiệm của y theo x cho bời bảng tương quan sau:
x
i
1 2 3 4 5
y
i

25
2
10
12
12
30
Tổng 15 20 55 66
n = 2 x ==
15
5
3
y ==
20
5
4

Gv. Cao Haứo Thi
10

b
xy nxy
xnx
aybx
ii
i
i
i
n
=



Nhờ tải bản gốc
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status