PHÂN TÍCH TƯƠNG QUAN VÀ
HOI QUY
MỤC TIÊU
Sau khi hoàn thành phần nầy, học viên sẽ co khả
năng:
Tính toán và phân tích hệ số tương quan giàn đơn giữa hai
biến
Xác định mức độ tin cậy thống kê của hệ số tương quan.
Tính toán và giải thích được hàm tương quan tuyến tính đơn
biến
Thông hiểu được các giả thuyết khi xây dựng hàm tương
quan
Biết được cách kiểm định trong hàm tương quan
Sơ đồ phân tán và hệ số tương quan
Sơ đồ phân tán thể hiện mối quan hệ giửa hai
biến
Phân tích hệ số tương quan dùng để đo lường mối
quan hệ đồng hành giửa hai biến.
Hệ số tương quan không thể hiện mối quan hệ
nhân quả.
Sơ đồ phân tán (scatter plot)
y
x
y
Hệ số tương quan của mẩu r dùng ước lượng cho
rho và nó thể hiện tương quan tuyến tính dựa trên
các phần tử quan sát được từ mẩu.
(continued)
Đặc điểm của ρ and r
Không có đơn vị đo lường
Biến động trong phạm vi -1 và1
Càng gần -1, mối quan hệ nghịch biến càng cao
Càng gần +1, mối quan hệ đồng biến càng cao
Càng gần 0, mối quan hệ tuyến tính càng yếu
r = +.3 r = +1
Một số ví dụ về các giá trị của r
y
x
y
x
y
x
y
x
y
x
r = -1
r = 6 r = 0
Cách tính hệ số tương quan
kớnh thaõn
caõy
y x xy y
2
x
2
35 8 280 1225 64
49 9 441 2401 81
27 7 189 729 49
33 6 198 1089 36
60 13 780 3600 169
21 7 147 441 49
45 11 495 2025 121
51 12 612 2601 144
=321 =73 =3142 =14111 =713
0
10
20
30
40
50
60
70
0 2 4 6 8 10 12 14
0.886
](321)][8(14111)(73)[8(713)
(73)(321)8(3142)
]y)()y][n(x)()x[n(
yxxyn
r
Giả thuyết
H
0
: ρ = 0 (Không có quan hệ tương quan)
H
A
: ρ ≠ 0 (Có quan hệ tương quan)
Công thức tính
(with n – 2 degrees of freedom)
2n
r1
r
t
2
Ví dụ
Có mối quan hệ tương quan giửa chiều cao và
đường kính của cây với mức ý nghĩa 5% ?
H
0
: ρ = 0 (No correlation)
H
1
: ρ ≠ 0 (correlation exists)
a
Example: Test Solution
Kết luận: Có mối
quan hệ tương
quan giử chiều
cao và đường
kính của cây o
mức ý nghĩa 5%
Quyết định :
Từ chối H
0
Reject H
0
Reject H
0
a/2=.025
-t
α/2
Do not reject H
0
0
t
α/2
a/2=.025
-2.4469 2.4469
4.68
d.f. = 8-2 = 6
Mô hình hồi quy tuyến tính giản đơn
Phân phối xác suất của các sai lệch ngẩu nhiên có
phương sai không đổi
Quan hệ giửa x và y là quan hệ tuyến tính
Hàm tương quan tuyến tính của đám
đông
(continued)
Sai lệch ngẩu
nhiên của biến x
i
y
x
Giá trị quan sát
của y tương ứng
với x.
Giá trị dự đoán
của y ứng với x
εxββy
10
x
i
Slope = β
1
Hằng số = β
0
ε
i
xbby
Hệ số của hàm tương quan theo tiêu
chuẩn tổng bình phương bé nhất
Công thức tính b
1
và b
0
:
Hoặc:
n
x
x
n
yx
xy
b
2
Yù nghĩa của hệ số góc và hằng số
của hàm tương quan