Giáo trình: Chương 9: Tương quan & Hồi quy tuyến tính - Pdf 87

Cao Haøo Thi 1

CHƯƠNG 9

TƯƠNG QUAN & HỒI QUI TUYẾN TÍNH
(Linear Correlation and Regression)

7.1. KHÁI NIỆM CHUNG
Trong các chương trước chúng ta chỉ nghiên cứu các vấn đề liên quan đến mẫu ngẫu nhiên
của một biến ngẫu nhiên X. Trong chương này, chúng ta quan tâm đến mẫu ngẫu nhiên bao
gồm các cặp giá trị của hai biến ngẫu nhiên X và Y.
Ví dụ
Để nghiên cứu về chiều cao và cân nặng của các em học sinh trong một trường, chúng ta
lấy mẫu ngẫu nhiên gồm n học sinh và thu thập các số liệu về chiều cao và cân nặng của n
học sinh. Gọi X là biến ngẫu nhiên để đo chiều cao của học sinh và Y là biến ngẫu nhiên
chỉ cân nặng của học sinh. Với n học sinh ta có n cặp giá trị (Y
i
, X
i
).

X
(m)
x
1
x
2
x
3
..... x
i

i
) trong hệ tọa độ
vuông góc.
Dựa vào đồ thị phân tán ta có thể xác định được dạng quan hệ giữa 2 biến Y và X. Y
X
X
Y
X
Y
(D)
Cao Haøo Thi

27.2.2. Tương quan tuyến tính (Linear Correlation)
Trong đồ thị phân tán, nếu các điểm M(x
i
, y
i
) qui tụ xung quanh một đường thẳng (D) ta
nói hai biến ngẫu Y và X có một sự tương quan tuyến tính. Đường thẳng (D) được gọi là
đường hồi qui tuyến tính (đường hòa hợp thẳng).
7.2.3. Hệ số tương quan ρ của tập hợp chính (The Population Correlation Coefficient)
Gọi X, Y là cặp giá trị của các biến ngẫu nhiên với số trung bình là µ
x
, µ

xy
N
==
−−
=

(,)
()()
1

7.2.3.2. Hệ số tương quan của tập hợp chínhρ
σσ
==Corr X Y
Cov X Y
xy
(,)
(,)ρ
σ
σσ
=
xy
xy
Với
N

µ
σ

hay

ρ
µ µ
µµ
=


−−
EX Y
EX EY
xy
xy
[( )( )]
[( ) ] * [( ) ]
22ρ
µµ
µµ
=
−−
−−

==




ρ = 0 : X, Y không tương quan tuyến tính.
7.2.4.

Hệ số tương quan r của mẫu

7.2.4.1. Hiệp tương quan của mẫu
(Sample Covariance)

1n
yyxx
YXCovS
i
n
1i
i
YX

−−

==
=

))((
),(
,

7.2.4.2. Hệ số tương quan của mẫu r
(Sample Correlation Coefficient)

()()
()*()
1
1
2
1
2

hay

r
xy nxy
xnx yny
ii
i
n
i
i
n
i
i
n
=










r được dùng để ước lượng hướng và độ mạnh của mối quan hệ giữa X,Y.
⏐r⏐ > 0,8 tương quan mạnh
⏐r⏐ = 0,4 - 0,8 tương quan trung bình
⏐r⏐ < 0,4 tương quan yếu
⏐r⏐ càng lớn thì tương quan giữa X và Y càng chặt
r > 0 hướng TN - ĐB, r < 0 hướng TB - ĐN
0 < r ≤ 1 : gọi là tương quan tuyến tính thuận (X↑, Y↑)
-1 ≤ r ≤ 0 : gọi là tương quan tuyến tính nghịch (X↑, Y↓
)


r là ước lượng của ρ
Cao Haøo Thi

4

Ví dụ

Tính hệ số tương quan giữa 2 biến X, Y cho bởi bảng tương quan sau:
X 0 1 2 3 4
Y 6 7 8 9 4
Giải

Số phần tử của mẫu n = 5
x
i
y
i

y
)
0
1
2
3
4
6
5
7
8
4

-2
-1
0
1
2
0
-1
1
2
-2
4
1
0
1
4
0
1

5
1
2
5
1
5
1
−=
×

=
−×−
−⋅−
=
∑∑

==
=
i
i
i
i
i
i
i
yyxx
yyxx
r

r = -0,1 tương quan yếu.

hay t
n-2
> t
n-2,a/2
Với
)/()( 2nr1
r
t
2
2n
−−
=


r: hệ số tương quan của mẫu
n: cỡ mẫu
t
n-2
: tuân theo phân phối Student t với độ tự do n-2

Trường hợp 2
H
0
: ρ = 0
H
1
: ρ > 0
R : bác bỏ H
0
nếu t

a) Tìm hệ số tương quan giữa 2 biến X, Y
b) Kiểm định giả thuyết cho rằng biến giữa X và Y không tương quan, với α = 0.05
Giải

a) Tính r
y
I
x
i
y
x
2
x
i
2
x
i
y
i

70
55
100
40
15
20
13
18
9
25


Nhờ tải bản gốc
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status