Bài 2: Phân tích hồi quy và một số ý tưởng cơ bản
11
BÀI 2. PHÂN TÍCH HỒI QUY VÀ MỘT SỐ Ý TƯỞNG CƠ BẢN Mục tiêu
Sau khi kết thúc bài, học viên sẽ hiểu
được những vấn đề sau đây:
• Khái niệm phân tích hồi quy.
• Số liệu trong phân tích hồi quy.
• Mô hình hồi quy tổng thể (PRF).
• Mô hình hồi quy mẫu (SRF).
• Quan niệm tuyến tính trong phân tích
hồi quy.
• Ý nghĩa của nhiễu ngẫu nhiên trong
mô hình.
Nội dung
Hướng dẫn học
• Khái niệm phân tích hồi quy.
• Số liệu trong phân tích hồi quy.
• Mô hình hồi quy tổng thể (PRF).
• Mô hình hồi quy mẫu (SRF).
• Quan niệm tuyến tính trong phân tích hồi quy.
• Ý nghĩa của nhiễu ngẫu nhiên trong mô hình.
dạng
()
i12i
EY/X X=β +β . Với mẫu ở trên, người ta đã ước lượng được mô hình hồi quy mẫu
có dạng:
ii
ˆ
Y 3.25 0.75X=− +Câu hỏi
Với kết quả này, các nhà nghiên cứu sẽ kết luận gì về sự ảnh hưởng của điểm
thi đầu vào tới điểm trung bình học tập năm thứ nhất của sinh viên Viện đại
học Mở?
Với kết quả này, ta có thể suy ra rằng điểm thi đầu vào là có ảnh hưởng đến điểm trung bình
năm thứ nhất. Cụ thể, khi điểm thi đầu vào tăng lên 1 điểm thì điểm trung bình chung năm thứ
nhất của sinh viên sẽ tăng trung bình là 0,75 điểm. Bài 2: Phân tích hồi quy và một số ý tưởng cơ bản
13
2.1. Khái niệm phân tích hồi quy
Trong cuộc sống hàng ngày, chúng ta thường gặp tình huống khi phải thành lập mối
quan hệ giữa hai đại lượng. Đôi khi mối quan hệ đó là hoàn hảo. Ví dụ, quan hệ
chuyển đổi giữa một loại tiền tệ và loại tiền tệ khác được chi phối bởi tỷ suất chuyển
đổi giữa chúng. Tại một thời điểm xác định, một đô la Mỹ được đổi thành 18000 đồng
Việt Nam. Vào cùng ngày, không quan trọng ai là người đang giao dịch, tỷ suất chuyển
đổi vẫn như vậy. Quan hệ hoàn hảo này được mô tả bởi một công thức toán học:
báo qua X của Y. Quan hệ không hoàn hảo giữa Y và X được biểu thị qua công thức
(2.4). Công thức này gần như đồng nhất với công thức (2.3), chỉ khác ở phần dư u
được cộng thêm vào.
i12ii
YbbXu
=
++ (2.4)
Tổng của tất cả các phần dư đưa ra một dấu hiệu của việc giải thích hiệu lực tác động
của X đối với Y. Khi phần dư nhỏ, thì X là một dự báo mạnh của Y (hay giữa X và Y
có quan hệ tuyến tính mạnh). Còn khi phần dư lớn, X là một dự báo yếu của Y (hay
giữa X và T có quan hệ tuyến tính yếu). Theo biểu đồ, những dấu chấm của điểm dữ
liệu gần với đường dự báo khi X là một dự báo mạnh của Y, còn những dấu chấm
phân tán xa đường dự báo khi X là dự báo yếu của Y. Điều này được mô tả dưới dạng
biểu đồ trên Hình 2.1.
Phương trình (2.4) biểu diễn mô hình hồi quy tuyến tính đơn, nội dung xuất phát và
đơn giản nhất trong các nghiên cứu về phân tích hồi quy. Từ đó, ta có thể từng bước
xây dựng các mô hình phức tạp hơn, thiết kế các công cụ đa dạng hơn để giải quyết
các vấn đề trong kinh tế lượng.
Bài 2: Phân tích hồi quy và một số ý tưởng cơ bản
14
Quan hệ tuyến tính mạnh Quan hệ tuyến tính yếu
Hình 2.1 Mức độ quan hệ tuyến tính giữa hai biến.
Phân tích hồi quy là một trong những công cụ cơ bản
của kinh tế lượng. Phân tích hồi quy là mô tả mối quan
hệ phụ thuộc của một biến (thường được gọi là biến
phụ thuộc hay biến được giải thích) vào một hay
Trong ví dụ 1 ta xác định mối quan hệ của mức chi
tiêu Y và mức thu nhập X. Trong ví dụ 2 ta xác định
mối quan hệ giữa doanh thu Y và chi phí cho quảng cáo
1
X và tiền lương trả cho nhân
viên tiếp thị
2
X.
Phân tích hồi quy giải quyết những vấn đề sau:
Francis Galton
(1822-1911)
Bài 2: Phân tích hồi quy và một số ý tưởng cơ bản
15
• Ước lượng giá trị trung bình của biến phụ thuộc với giá trị đã cho của biến độc lập.
Trong ví dụ 1, ta cần ước lượng mức chi tiêu trung bình khi biết mức thu nhập X.
• Dự báo giá trị của Y khi biết được giá trị của biến giải thích X.
• Kiểm định giả thuyết và bản chất của sự phụ thuộc và xác định hiệu quả tác động
của biến độc lập lên biến phụ thuộc.
Khi mô tả mối quan hệ giữa biến phụ thuộc và các biến độc lập cũng cần phân biệt
rõ các kiểu quan hệ sau:
o Quan hệ tất định hay còn gọi là quan hệ toán học giữa X và Y, quan hệ này
được cho dưới dạng một hàm số Yf(X)
=
, cứ cho một giá trị của X ta sẽ xác
định được một giá trị của Y. Biểu thức (2.3) mô tả một mối quan hệ tất định
giữa X và Y.
o Quan hệ thống kê là quan hệ mà không xác định được giá trị duy nhất của Y
khi cho biết giá trị của X mà ta chỉ biết được giá trị của Y theo một xác suất
chuẩn. Ta có đồ thị trong trường hợp này cho trong Hình 2.2.
Hình 2.2. Quan hệ ngẫu nhiên giữa X và Y với sai số ngẫu nhiên u có phân bố chuẩn.
X
E(Y|x
i
)
Phân phối của Y
với X=x
0
Kỳ vọng có điều kiện Y
Bài 2: Phân tích hồi quy và một số ý tưởng cơ bản
16
Trong hình 2.2, đại lượng Y không nhận giá trị tất định, các giá trị của Y được xác
định một cách ngẫu nhiên, phụ thuộc vào giá trị của đại lượng ngẫu nhiên u.
Đường thẳng tất định Y biểu diễn giá trị trung bình của Y ứng với từng giá trị cho
trước của X. Đối với mỗi giá trị cố định của X thì Y có thể nhận những giá trị khác
nhau tập trung xung quanh giá trung bình của Y trên đường thẳng đ
ó. Với mỗi giá trị
β và
2
β là các tham số chưa biết và gọi là các hệ số hồi quy,
1
β : được gọi là hệ số chặn,
2
β : được gọi là hệ số dốc (hoặc hệ số góc).
Phương trình (2.6) gọi là phương trình hồi quy tuyến tính đơn. Trong các phương trình
hồi quy, thuật ngữ “tuyến tính” có hai nghĩa như sau:
• Tuyến tính đối với biến:
Ví dụ: Phương trình
12
E(Y | X) X
=
β+β là tuyến tính đối với biến, phương trình
2
12
E(Y | X) X=β +β không tuyến tính với biến.
•
Tuyến tính đối với tham số: hàm
E(Y | X)
chỉ tuyến tính theo tham số
β
.
Ví dụ: Phương trình
12
E(Y | X) X
=
β+β là phương trình tuyến tính đối với các
tham số và biến, còn phương trình
ˆ
Y
là một ước lượng của
i
E(Y | X ) dựa trên số liệu mẫu
12 n
(Y,Y , ,Y ). Ta thay
i
E(Y | X ) bằng ước lượng
tương ứng
i
ˆ
Y
vào phương trình hồi quy tổng thể (PRF) ta thu được phương trình:
i12i
ˆˆ
ˆ
YX=β +β
, (2.7)
trong đó
1
ˆ
β
là ước lượng của
1
β
,
2
ˆ
β
E(Y | X ) , được gọi là sai số ngẫu nhiên
(hay nhiễu ngẫu nhiên), bao gồm những giá trị mà ta không thể quan sát được. Nếu
i
E(Y | X ) có dạng tuyến tính tức là
i12i
E(Y | X ) X
=
β+β , thì phương trình (2.9) có dạng:
i12ii
YXu=β +β + (2.10)
Từ phương trình (2.9) ta lấy kỳ vọng có điều kiện theo 2 về ta thu được
[
]
ii i ii
E(Y |X) E E(Y|X) u |X=+
iii
E(Y | X ) E(u | X )
=
+ .
Bài 2: Phân tích hồi quy và một số ý tưởng cơ bản
18
Từ đó ta có:
ii
E(u | X ) 0= .
Phương trình (2.9) cho ta thấy rằng ngoài các biến giải
thích trong mô hình vẫn còn những yếu tố khác ảnh
hưởng đến biến phụ thuộc mà những biến này ta không
thể quan sát được. Vì vậy ta gộp chúng lại và gọi đó là
YXu
=
β+β +
, (2.11)
trong đó
i
ˆ
ulà ước lượng của
i
u. Từ phương trình (2.7) và (2.11) ta có
iii
ˆ
ˆ
YYu
=
+ (2.12)
Trên đồ thị ta có thể biểu diễn phương trình hồi quy mẫu (SRF) và hồi quy tổng thể
(PRF) như hình 2.3:
Hình 2.3. Đường hồi quy tổng thể và đường hồi quy mẫu.
=β +β
β
β có độ sai lệch đối
với
12
,ββ là nhỏ nhất.
Trong chương sau sẽ giải thích bài toán trên, tìm được các hệ số
12
ˆˆ
,ββ
sao cho tổng
bình phương các sai số là nhỏ nhất, đồng thời cũng tìm ra các hệ số
12
ˆˆ
,ββ
là các ước
lượng không chệch cho
12
,ββ(ước lượng không chệch của một tham số sẽ đảm bảo
xấp xỉ tốt giá trị thực của tham số đó khi cỡ mẫu đủ lớn).
Bài 2: Phân tích hồi quy và một số ý tưởng cơ bản
20
TÓM LƯỢC CUỐI BÀI
• Phân tích hồi quy (Regression Analysis): Phân tích hồi quy là nghiên cứu sự phụ thuộc của
một biến (thường được gọi là biến phụ thuộc hay biến được giải thích) vào một hay nhiều
biến khác (thường được gọi là biến độc lập hay biến giải thích).
•
Hàm hồi quy tổng thể: Giả sử ta cần xem xét sự phụ thuộc của Y vào X. Nếu như ta biết
được toàn bộ tổng thể, trung bình có điều kiện của Y sẽ là 1 hàm số của X:
ˆ
YX=β +β
(2)
trong đó
i
ˆ
Y
là ước lượng của E(Y/X
i
);
1
ˆ
β
và
2
ˆ
β
là ước lượng của β
1
và β
2
.
Mô hình (2) gọi là mô hình hồi quy mẫu (SRF).
•
Bản chất của nhiễu ngẫu nhiên(u
i
): Là phần chênh lệch giữa giá trị quan sát và trung bình
có điều kiện của Y:
Y
i
1.
Mục đích chính của kỹ thuật phân tích hồi quy là gì?
2. Thuật ngữ hồi quy tuyến tính có thể được hiểu như thế nào trong phân tích hồi quy?
3. Trong các mô hình hồi quy tuyến tính, có thể không sử dụng hệ số chặn hay không?
4. Việc sử dụng hồi quy đơn và hồi quy bội như thế nào trong thực tế?
5. Tại sao lại cần đưa ra khái niệm hàm hồi quy tổng thể?
6. Hàm hồi quy mẫu sẽ cho biết điều gì? Có những cách thể hiện nào cho hàm hồi quy mẫu và
hàm hồi quy tổng thể?
7. Khái niệm về sai số ngẫu nhiên và phần dư có thể được hiểu thế nào?
BÀI TẬP TRẮC NGHIỆM
1. Phân tích hồi quy là nghiên cứu về quan hệ phụ thuộc lẫn nhau (quan hệ qua lại) giữa biến
phụ thuộc và biến độc lập.
A. Đúng.
B. Sai.
2. Trong phân tích hồi quy, có thể có nhiều biến phụ thuộc và nhiều biến độc lập.
A. Đúng.
B. Sai.
3. Trong phân tích hồi quy, hồi quy tuyến tính là thường muốn nói tới tuyến tính theo các biến số.
A. Đúng.
B. Sai.
4. Mô hình hồi quy tổng thể 2 biến (PRF) có thể được viết dưới dạng:
A.
i122i
YX=β +β
B.
i122i
ˆˆ
ˆ
YX=β +β
YXu=β +β + ,
1
β
và
2
β
được gọi là:
A. Hệ số hồi quy riêng.
B. Hệ số góc (độ dốc) và hệ số chặn.
Bài 2: Phân tích hồi quy và một số ý tưởng cơ bản
22
C. hệ số chặn và hệ số góc (độ dốc).
D. Hệ số chặn và hệ số hồi quy riêng.
7. Trong mô hình hồi quy tuyến tính đơn, hệ số góc cho biết:
A. Hệ số co dãn của Y theo X.
B. Thay đổi trung bình của Y với mỗi 1 đơn vị thay đổi của X.
C. Thay đổi trung bình của X với mỗi 1 đơn vị thay đổi của Y.
D. Tỉ số Y/X.
8. Sai số ngẫu nhiên trong mô hình kinh tế lượng thể hiện những điều sau đây trừ:
A. Sai số của các biến khi thực hiện các phép đo.
B. Ảnh hưởng của các yếu tố ngoài mô hình lên biến phụ thuộc.
C. Các biến độc lập không hoàn toàn tương ứng với biến trong mô hình lý thuyết.
D. Sai số khi thực hiện phương pháp OLS để ước lượng mô hình.
9. Từ 1 mẫu ngẫu nhiên, ta có thể ước lượng được các mô hình hồi quy mẫu khác nhau.
A. Đúng.
B. Sai.
10. Các phần dư trong mô hình hồi quy mẫu là ước lượng của các sai số ngẫu nhiên trong mô
hình hồi quy tổng thể.