PHÂN TÍCH hồi QUY và TƯƠNG QUAN - Pdf 13


Bài 4: Phân tích hồi quy và tương quan

v1.0 69
Nội dung Mục tiêu
 Nhiệm vụ của phân tích hồi quy và
tương quan.
 Một số mô hình hồi quy và cách xác
định các tham số của mô hình.
 Cung cấp phương pháp phân tích thống kê
nghiên cứu mối liên hệ nhân quả giữa các
hiện tượng kinh tế – xã hội.

Thời lượng học

Hướng dẫn học
 7 tiết

 Đọc bài giảng và thảo luận.
 Trả lời câu hỏi ôn tập, câu hỏi trắc nghiệm
và làm bài tập.


liên hệ này có thể diễn ra theo thời gian hay không gian nhất định. Các mối liên hệ
diễn ra theo thời gian nghĩa là sự tác động qua lại và sự phụ thuộc vào nhau của các
hiện tượng khi chúng ở các giai đoạn và quá trình của sự phát triển. Các mối liên hệ
diễn ra theo không gian nghĩa là sự tác động qua lại và sự phụ thuộc vào nhau của các
hiện tượng khi chúng ở cùng một thời gian. Thậm chí ngay trong cùng một hiện tượng
nghiên cứu bao gồm nhiều tiêu thức khác nhau, thì những tiêu thức này cũng có mối
liên hệ qua lại nhất định. Tuỳ theo mức độ chặt chẽ, mà người ta chia mối liên hệ
thành các loại dưới đây.
4.1.1.1. Liên hệ hàm số
 Khái niệm: Liên hệ hàm số là mối liên hệ hoàn
toàn chặt chẽ. Sự thay đổi của hiện tượng này có
tác dụng quyết định đến sự thay đổi của hiện tượng
liên quan theo một tỷ lệ xác định.
Liên hệ hàm số được viết dưới dạng: y = f(x), có
nghĩa là cứ mỗi giá trị của x thì theo một hàm nào
đó có một giá trị của y tương ứng.
Mối liên hệ này thường có trong tự nhiên. Ví dụ
trong vật lý: S = v  t
 Đặc điểm: Liên hệ hàm số không những được biểu hiện ở tổng thể mà còn được
biểu hiện trên từng đơn vị cá biệt.
4.1.1.2. Liên hệ tương quan
 Khái niệm: Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ. Sự thay
đổi của hiện tượng này có thể làm hiện tượng liên quan thay đổi theo nhưng không
có ảnh hưởng hoàn toàn quyết định.
Mối liên hệ này rất phổ biến và thường gặp trong các hiện tượng kinh tế – xã hội.
 Đặc điểm: Liên hệ tương quan không được biểu hiện trên từng đơn vị cá biệt mà
phải thông qua hiện tượng số lớn (là tổng thể).
Ví dụ: Mối liên hệ giữa tuổi nghề và NSLĐ. Tuổi nghề có tác động đến NSLĐ
nhưng NSLĐ không chỉ chịu ảnh hưởng của tuổi nghề mà còn chịu ảnh hưởng của
các nhân tố khác. Mặt khác, nếu nghiên cứu riêng lẻ từng đơn vị cá biệt, có những

thức nguyên nhân, đâu là tiêu thức kết quả.
Trong mối liên hệ này, có thể có nhiều nguyên
nhân nhưng chỉ có một kết quả.
 Bước 2: Thăm dò mối liên hệ bằng các phương pháp thống kê: phương pháp đồ
thị, phân tổ, số bình quân, phương pháp quan sát 2 dãy số song song…
 Bước 3: Lập phương trình hồi quy biểu hiện mối liên hệ.
Ví dụ: Các phương trình y = a + bx; y = a + bx + cx
2

 Bước 4: Tính toán các tham số và giải thích ý nghĩa của chúng.
4.1.2.2. Đánh giá mức độ chặt chẽ của mối liên hệ tương quan
Sau khi đã xây dựng được phương trình hồi quy biểu diễn mối liên hệ giữa các hiện
tượng kinh tế – xã hội, nhiệm vụ thứ hai của phân tích hồi quy tương quan là đánh giá
mức độ chặt chẽ của mối liên hệ tương quan và sự phù hợp của mô hình thông qua hệ
số tương quan (tuyến tính) và tỷ số tương quan (phi tuyến tính).
4.1.3. Ý nghĩa của phân tích hồi quy và tương quan
Phân tích hồi quy và tương quan là phương pháp thường được sử dụng để nghiên cứu
mối liên hệ tương quan giữa các hiện tượng kinh tế – xã hội. Bên cạnh đó, nó còn
được sử dụng nhiều trong nghiên cứu thống kê, như phân tích dãy số thời gian, dự
đoán thống kê
Trong phần tiếp theo, bài giảng sẽ đi vào trình bày cách thức xây dựng và phân tích
một mô hình hồi quy thể hiện mối liên hệ giữa một tiêu thức nguyên nhân và một tiêu
thức kết quả.
4.2. Hồi quy và tương quan giữa hai tiêu thức số lượng
Trước hết là dạng mô hình đơn giản nhất, mô hình hồi quy tuyến tính.

Bài 4: Phân tích hồi quy và tương quan

v1.0 73
4.2.1. Mô hình hồi quy tuyến tính giữa hai tiêu thức số lượng

x
ˆ
y: Trị số điều chỉnh của tiêu thức chịu ảnh hưởng (kết quả) (biến phụ
thuộc) theo quan hệ với x.
 b
0
: Hệ số tự do (hệ số chặn), là điểm xuất phát của đường hồi quy lý thuyết,
nêu lên ảnh hưởng của các nhân tố khác (tiêu thức nguyên nhân khác) ngoài
x tới sự biến động của y.
 b
1
: Hệ số hồi quy (hệ số góc, độ dốc), phản ánh ảnh hưởng trực tiếp của tiêu
thức nguyên nhân x đến tiêu thức kết quả y. Mỗi khi x tăng lên 1 đơn vị thì
y sẽ thay đổi trung bình b
1
đơn vị.
b
1
nói lên chiều hướng của mối liên hệ: b
1
> 0: Mối liên hệ thuận; b
1
< 0:
Mối liên hệ nghịch.
o Cách xác định tham số:
b
0
, b
1
phải được xác định sao cho đường hồi quy lý thuyết mô tả gần đúng nhất

phải thỏa mãn hệ phương trình:
01
2
01
ynb b x
xy b x b x









 Hệ phương trình chuẩn
Từ hệ phương trình trên, sau khi biến đổi, b
0
và b
1
có thể được tính đơn giản
hơn theo công thức:
1
2
x
xy xy
b




222
x
xx
x(x)
nn

   





Chú ý:
Nên sử dụng công thức rút gọn ở trên để tính b
0
và b
1
chứ không nên giải hệ phương
trình chuẩn.
Ví dụ: Có tài liệu về 11 xe máy Honda Wave đã qua sử dụng như sau:
Stt
Số năm sử dụng
(năm) x
Giá bán
(triệu đồng) y
xy x
2
y
2
1 5 8,5 42,5 25,0 72,25

Xác định các tham số:
22 2 2
x
x (x) 29,636 5, 273 1,831    
1
2
x
xy xy
b



=
43, 018 5, 273 8,864
2, 03
1,831


 < 0  mối liên hệ nghịch
b
0
=
y
– b
1
x = 8,864 – (–2,03  5,273) = 19,57
Vậy phương trình hồi quy tuyến tính biểu diễn mối liên hệ giữa số năm sử
dụng và giá bán có dạng:
x
ˆ

= 19,57 (triệu đồng), đây chính là
mức giá của 1 chiếc xe Honda Wave mới.
Sau khi đã xây dựng xong mô hình hồi quy phản ánh mối liên hệ giữa các hiện tượng
kinh tế – xã hội, nhiệm vụ tiếp theo của phân tích hồi quy và tương quan là phải đánh
giá được trình độ chặt chẽ của mối liên hệ đó cũng như sự phù hợp của mô hình đã có.
4.2.1.2. Hệ số tương quan
 Khái niệm: Hệ số tương quan là chỉ tiêu đánh giá mức độ chặt chẽ của mối liên hệ
tương quan tuyến tính đơn.
 Tác dụng:
o Xác định cường độ của mối liên hệ từ đó chọn ra nguyên nhân chủ yếu hoặc
thứ yếu đối với hiện tượng nghiên cứu.
o Xác định chiều hướng cụ thể của mối liên hệ (thuận – nghịch).
o Hệ số tương quan còn dùng trong nhiều trường hợp dự đoán thống kê và tính
sai số của dự đoán.
 Công thức tính:
x
1
xy y
xy xy
rb




Bài 4: Phân tích hồi quy và tương quan

76 v1.0

Kết luận: Mối liên hệ giữa số năm sử dụng và giá bán xe Honda Wave cũ là mối liên
hệ tương quan tuyến tính nghịch và rất chặt chẽ.
4.2.1.3. Hệ số xác định
Khái niệm: Hệ số xác định dùng để đánh giá sự phù hợp của mô hình, nó cho biết tỷ
lệ % thay đổi của y được giải thích bởi mô hình.
Ở ví dụ trên, ta có: r
2
= (–

0,925)
2
= 0,8556.
Như vậy, 85,56% sự thay đổi của giá bán xe máy Honda Wave cũ được giải thích bởi
mô hình đã nói ở trên trong mối quan hệ với số năm sử dụng. Điều đó nói lên rằng,
số năm sử dụng là hoàn toàn hữu ích khi dự đoán mức giá bán của một chiếc xe cũ.
4.2.1.4. Kiểm định các tham số của phương trình hồi quy tuyến tính đơn
 Trong mối liên hệ tương quan giữa x và y, cứ mỗi giá trị của x ta có thể thu được
nhiều giá trị của y. Khi đó, chúng ta phải có một số giả định sau:
o Đường hồi quy tổng thể chung: với phương trình tuyến tính
x
y
ˆ
= 
0
+ 
1
x, thì
mỗi giá trị của x sẽ có nhiều giá trị tương ứng của y, khi đó số bình quân của các
giá trị này sẽ nằm trên một đường thẳng. Đường thẳng đó gọi là đường hồi quy
tổng thể chung và phương trình của nó là phương trình hồi quy tổng thể chung.

+ 
1
x, biểu diễn mối liên hệ
phụ thuộc giữa tiêu thức nguyên nhân x và tiêu thức kết quả y. Từ phương trình
đó, chúng ta cho rằng có thể dùng x để dự đoán giá trị của y. Nhưng có thật sự là
như vậy hay không?
Chúng ta đã biết, trong mô hình hồi quy, hệ số hồi quy thể hiện mối liên hệ giữa x
và y, nó cho biết ảnh hưởng trực tiếp của nguyên nhân x đến kết quả y. Chính vì
vậy, để
trả lời câu hỏi trên, người ta thực hiện kiểm định hệ số hồi quy của phương
trình tuyến tính đơn.
Trình tự thực hiện kiểm định như sau:
o Bước 1: Phát biểu giả thiết không và giả thiết đối của nó.
Giả thiết không là: H
0
: 
1
= 0 (x không có mối liên hệ với y)
Giả thiết đối là: H
1
: 
1
≠ 0 (có mối liên hệ tuyến tính giữa x và y)
o Bước 2: Xác định mức ý nghĩa α (với 1 – α là hệ số tin cậy).
o Bước 3: Chọn tiêu chuẩn kiểm định và tính giá trị của tiêu chuẩn kiểm định từ
mẫu quan sát.
Trên thực tế, các giá trị 
0
, 
1

S




Nhưng trong phương trình trên, chúng ta chưa biết

, nên có thể dùng sai số tiêu
chuẩn
2
ix
e
ˆ
(y y )
S
n2




của mẫu để thay thế. Khi đó, biến ngẫu nhiên kết quả
có phân phối t-student với bậc tự do df = n – 2.
11
e
2
i
b
t
S
(x x)

α/2
, với bậc tự do là n – 2. Tra bảng t để xác định giá trị tới hạn đó.
Nếu giá trị tuyệt đối của t tính được mà lớn hơn giá trị tới hạn t tra bảng thì bác bỏ
giả thiết H
0
. Ngược lại, thì chưa có cơ sở để bác bỏ giả thiết H
0
.
Ví dụ:
Với số liệu ở ví dụ trên, giả sử có cơ sở cho rằng số năm sử dụng không có ảnh
hưởng đến mức giá bán của chiếc xe Honda Wave cũ. Khi đó, ta sẽ thực hiện kiểm
định giả thiết sau:
Giả thiết không là: H
0
: 
1
= 0 (số năm sử dụng không có mối liên hệ với mức giá bán).
Giả thiết đối là: H
1
: 
1
≠ 0 (có mối liên hệ tuyến tính giữa số năm sử dụng và mức
giá bán).
Chúng ta thực hiện kiểm định giả thiết trên với mức ý nghĩa
 = 0,05.
Giá trị tới hạn là
 t
α/2
=  t
0,025

2
i
(x - x)
ˆ
2
ix
(y -y )

1 5 8,5 9,42 0,075 0,846
2 4 10,3 11,45 1,621 1,323
3 6 7,0 7,39 0,529 0,152
4 5 8,2 9,42 0,075 1,488
5 5 8,9 9,42 0,075 0,270
6 5 9,8 9,42 0,075 0,144
7 6 6,6 7,39 0,529 0,624
8 6 9,5 7,39 0,529 4,452
9 2 16,9 15,51 10,713 1,932
10 7 7,0 5,36 2,983 2,690
11 7 4,8 5,36 2,983 0,314
Tổng 58 97,5 20,182 14,236
Trung bình 5,273 8,864
2
ix
e
ˆ
(y y )
14,236
S 1, 2577
n2 112


t
1r
n2



có phân phối t – student với bậc tự do n – 2.
Với mức ý nghĩa α cho trước, tuỳ thuộc vào dạng của giả thiết đối mà miền bác bỏ
được xây dựng như sau:
H
0
:  = 0 nếu t > t
α
, bác bỏ giả thiết H
0
(kiểm định phải)
H
1
:  > 0
H
0
:  = 0 nếu t > t
α
, bác bỏ giả thiết H
0
(kiểm định trái)
H
1
:  < 0
H

 



Ta thấy
t > t
α
= 1,833, bác bỏ giả thiết H
0
.
Với mẫu đã cho, ở mức ý nghĩa 5%, có thể kết luận rằng số năm sử dụng xe và giá
bán của chiếc xe Honda Wave có mối liên hệ tương quan tuyến tính với nhau, và
đây là mối liên hệ nghịch.
Tuy nhiên, trên thực tế, không phải mối liên hệ nào cũng là mối liên hệ tương quan
tuyến tính. Vì vậy, chúng ta nghiên cứu trường hợp tiếp theo (mô hình hồi quy phi
tuyến tính), mối liên hệ này thường gặp nhiều hơ
n trong thực tế.

Bài 4: Phân tích hồi quy và tương quan

80 v1.0
4.2.2. Mô hình hồi quy phi tuyến giữa hai tiêu thức số lượng
4.2.2.1. Một số dạng mô hình hồi quy phi tuyến thường gặp
 Phương trình parabol (bậc 2)
o Vận dụng khi tiêu thức nguyên nhân tăng hay giảm với 1 lượng đều nhau thì tiêu
thức kết quả biến động với 1 lượng không đều nhau (nhanh hơn hoặc chậm hơn).
Ví dụ: Chi phí quảng cáo và doanh thu.


 









 Phương trình hypebol
o Vận dụng khi tiêu thức nguyên nhân tăng thì tiêu thức kết quả giảm với tốc độ
không đều nhau.
o Mô hình hồi quy:
1
x0
b
ˆ
yb
x

b
0

o Vận dụng khi trị số của tiêu thức kết quả thay đổi theo cấp số nhân.

o Mô hình hồi quy:
x
x01
ˆ
ybb
hay: lny = lnb
0
+ x  lnb
1
lnb
0
, lnb
1
phải thỏa mãn hệ phương trình:
01
2
01
ln y n ln b ln b x
x ln y ln b x ln b x

  


o Tỷ số tương quan nằm trong khoảng [0,1].
o η = 0: Không có mối liên hệ tương quan phi tuyến.
o η = 1: Mối liên hệ tương quan phi tuyến hoàn toàn chặt chẽ.
o η càng gần 1: Mối liên hệ càng chặt chẽ.
Nhận xét
η luôn > 0 do đó tỷ số tương quan chỉ có thể đánh giá trình độ chặt chẽ của mối liên hệ
chứ không nói được chiều hướng của mối liên hệ.
η có thể dùng cho cả phi tuyến và tuyến tính (khi r  0). Bài 4: Phân tích hồi quy và tương quan

82 v1.0
TÓM LƯỢC CUỐI BÀI
 Các hiện tượng kinh tế – xã hội luôn tồn tại trong một mối liên hệ ràng buộc lẫn nhau.
Tuỳ theo mức độ chặt chẽ của mối liên hệ mà có thể phân ra thành hai loại: liên hệ hàm số và
liên hệ tương quan.

Phân tích hồi quy và tương quan thực chất là phương pháp phân tích mối liên hệ phụ thuộc
với hai nhiệm vụ chủ yếu: xây dựng phương trình hồi quy biểu diễn mối liên hệ và đánh giá
mức độ chặt chẽ của mối liên hệ.

Với mối liên hệ đơn giản nhất giữa hai tiêu thức số lượng, tuỳ theo việc thăm dò dạng của
mô hình hồi quy mà ta có thể xây dựng phương trình tuyến tính hoặc phi tuyến. Các hệ số
của mô hình hồi quy được xác định theo phương pháp bình phương nhỏ nhất. Hệ số tương
quan và tỷ số tương quan được sử dụng để đánh giá mức độ chặt chẽ của mố
i liên hệ tương
quan giữa hai tiêu thức số lượng.
4. Trình bày tác dụng và tính chất của hệ số tương quan.
5. Trình bày tác dụng và tính chất của tỷ số tương quan.

Bài 4: Phân tích hồi quy và tương quan

84 v1.0

16 3,7
24 2,6
19 3,9
25 4,3
a) Vẽ đồ thị biểu diễn mối liên hệ giữa thu nhập khả dụng và chi cho lương thực thực phẩm
của các hộ trên.
b) Xác định phương trình hồi quy biểu diễn mỗi liên hệ đó. Giải thích ý nghĩa của các tham số.
c) Sử dụng phương trình hồi quy để dự đoán chi cho lương thực thực phẩm hàng năm của hộ
gia đình có mức thu nhập khả dụng là 25 tri
ệu đồng.

Bài 4: Phân tích hồi quy và tương quan

v1.0 85
3. Có kết quả điều tra một mẫu gồm 8 sinh viên về thời gian tự học trong hai tuần và điểm kiểm
tra môn học đó sau hai tuần như sau:
Thời gian tự học (giờ) Điểm kiểm tra
10 9,2
15 8,1
12 8,4
20 7,4
8 8,5
16 8,0
14 8,4
22 8,0
a) Xây dựng phương trình hồi quy tuyến tính đơn biểu diễn mối liên hệ giữa thời gian tự học
và điểm kiểm tra của các sinh viên trong mẫu nói trên. Giải thích ý nghĩa của các tham số.
b) Đánh giá trình độ chặt chẽ của mối liên hệ trên.
c) Hãy cho biết phương trình vừa xây dựng được có phù hợp để giải thích mối liên hệ giữa
hai biến trên không?

G 720 18

Bài 4: Phân tích hồi quy và tương quan

86 v1.0
a) Xây dựng phương trình hồi quy tuyến tính đơn biểu diễn ảnh hưởng của giá trị sản xuất
tới lượng nhiên liệu tiêu thụ. Giải thích ý nghĩa các tham số.
b) Liệu có đầy đủ bằng chứng để kết luận rằng hệ số hồi quy trong phương trình nói trên là
khác 0 và vì vậy có thể sử dụng giá trị sản xuất để dự đoán lượng nhiêu liệu tiêu thụ hay
không? Hãy thực hiện ki
ểm định giả thiết cần thiết với mức ý nghĩa 5%.
6. Công ty Coca Cola đang nghiên cứu ảnh hưởng của chiến dịch quảng cáo gần nhất. Họ tiến
hành phỏng vấn ngẫu nhiên 10 người để biết xem những người này đã đọc hay xem quảng cáo
của hãng bao nhiêu lần và số lon Coca Cola mà họ đã mua trong tuần qua. Kết quả như sau:
Số lần xem hay đọc quảng cáo Số lon đã mua
4 12
9 14
3 7
0 6
1 3
6 5
2 5
5 10
a) Hãy xây dựng phương trình hồi quy tuyến tính đơn biểu diễn mối liên hệ giữa hai biến trên.
b) Đánh giá trình độ chặt chẽ của mối liên hệ.
c) Với kết quả điều tra ở trên, có thể kết luận rằng số quảng cáo đã đọc hay xem có mối liên
hệ tương quan tuyến tính thuận với số lon Coca Cola đã mua hay không? Hãy thực hiện
kiểm định giả thiết với mức ý ngh
ĩa 0,05.
7. Có số liệu về độ tuổi và nhịp tim của một mẫu gồm 10 người được chọn ngẫu nhiên như sau:

50 350
a) Vẽ đồ thị biểu diễn mối liên hệ trên.
b) Xây dựng phương trình hồi quy biểu diễn mối liên hệ trên.
c) Với mức ý nghĩa 5%, có thể kết luận rằng, giữa giá vé xe buýt và số lượng hành khách có
mối liên hệ tương quan tuyến tính âm hay không?
9. Để dự đoán về những chi phí quản lý phải trả dựa trên số lượng sản phẩm sản xuất ra, một
nhà quản lý đã thu thập thông tin ở các đơn vị khác nhau và thu được kết quả sau:
Chi phí quản lý phải trả (triệu đồng) Số lượng sản phẩm
191 40
170 42
272 53
155 35
280 56
173 39
234 48
116 30
153 37
178 40
a) Xây dựng phương trình hồi quy biểu diễn mối liên hệ trên.
b) Dự đoán chi phí quản lý phải trả khi có 50 sản phẩm được sản xuất ra.
c) Tính sai số tiêu chuẩn của mô hình dự đoán trên.
10. Liệu có phải có điểm cao khi học thì ra trường sẽ có việc làm với mức lương cao hơn? Một
sinh viên thống kê doanh nghiệp đã thực hiện điều tra ngẫu nhiên một mẫu gồm một số người

Bài 4: Phân tích hồi quy và tương quan

88 v1.0
bạn mới tốt nghiệp của anh ta về mức lương khởi điểm và điểm trung bình khi học đại học
của họ. Kết quả như sau:
Mức lương khởi điểm (triệu đồng) Điểm trung bình học đại học


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status