1/2/2013
1
MÔ HÌNH HỒI QUY
HAI BIẾN
Chương 2
I. HỒI TUYẾN TÍNH 2 BIẾN
1. Hàm hồi quy tuyến tính 2 biến của tổng thể
Nếu chỉ nghiên cứu một biến phụ thuộc bị ảnh hưởng
bởi một biến độc lập => Mô hình hồi quy hai biến
Trong quan hệ hồi quy , một biến phụ thuộc có thể được
giải thích bởi nhiều biến độc lập
Nếu mối quan hệ giữa hai biến này là tuyến tính => Mô
hình hồi quy tuyến tính hai biến
Hàm hồi quy tổng thể (PRF) của mô hình hồi quy hai biến
iii
UXYPRF
21
:
Trong đó
Y : Biến phụ thuộc
Y
i
: Giá trị cụ thể của biến phụ thuộc
X : Biến độc lập
X
i
: Giá trị cụ thể của biến độc lập
U
i
: Sai số ngẫu nhiên ứng với quan sát thứ i
I. HỒI TUYẾN TÍNH 2 BIẾN
0
1
2
3
4
5
6
7
0
1
2
3
4
5
6
7
8
Tiêu dùng Y (tri
eu đong/tháng )
Thu nh?p X (tri?u đ?ng /tháng)
Đồ thị minh họa
Thu nhập X (triệu đồng/tháng)
Y
i
PRF
6
7
8
Tiêu dùng Y (trieu đong/tháng )
e
i
Yi
1
ˆ
2
ˆ
Thu nh?p X (tri?u đ?ng /tháng)
ii
XY
21
ˆˆ
ˆ
SRF
Đồ thị minh họa
Thu nhập X (triệu đồng/tháng)
iii
eXYSRF
Nếu bỏ qua sai số ngẫu nhiên e
i
, thì giá trị thực tế Y
i
sẽ
trở thành giá trị ước lượng
ii
XYSRF
21
ˆˆ
ˆ
:
i
Y
ˆ
2. Hàm hồi quy mẫu của hồi quy 2 biến
I. HỒI TUYẾN TÍNH 2 BIẾN
0
1
2
3
e
i
Thu nh?p X (tri?u đ?ng /tháng)
SRF
e
i
e
i
e
i
e
i
e
i
e
i
II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ
NHẤT (OLS)
1. Ước lượng các tham số của mô hình
iiiii
XYYYe
21
ˆˆ
ˆ
iii
i
XYe
Tìm
21
ˆ
,
ˆ
sao cho tổng bình phương sai số là
nhỏ nhất
Tức là
Tại sao chúng ta không tìm Σe
i
nhỏ nhất ?
II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ
NHẤT (OLS)
Giải bài toán cực trị hàm hai biến , ta được
XY
x
yx
XnX
YXnXY
XX
YYXX
i
ii
n
i
i
Với
n
X
X
i
XXx
ii
là giá trị trung bình của X và
n
Y
Y
i
21
ˆˆ
ˆ
Xây dựng hàm hồi quy mẫu
X 100 80 98 95 75 79 78 69 81 88
Y 90 75 78 88 62 69 65 55 60 70
II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ
NHẤT (OLS)
2. Các giả thiết của OLS
Giả thiết 1 : Quan hệ giữa Y và X là tuyến tính
Các giá trị X
i
cho trước và không ngẫu nhiên
Giả thiết 2 : Các sai số U
i
là đại lượng ngẫu nhiên có giá
trị trung bình bằng 0
( | ) 0
ii
E U X
II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ
NHẤT (OLS)
2. Các giả thiết của OLS
Giả thiết 4 : Không có sự tương quan giữa các U
i
Giả thiết 5 : Không có sự tương quan giữa U
i
NHẤT (OLS)
2. Các giả thiết của OLS
Giả thiết 6 : các sai số U
i
có phân phối chuẩn
2
(0, )
i
UN
1/2/2013
4
II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ
NHẤT (OLS)
3. Hệ số xác định của mô hình
Tổng bình phương toàn phần TSS (Total Sum of Squares)
22
2
)()( YnYYYTSS
ii
Tổng bình phương hồi quy ESS (Explained Sum of Squares)
)(
ˆ
)
ˆ
(
222
2
i
i
X
i
Y
i
Y
ˆ
Y
RSS
TSS
ESS
II. PHƯƠNG PHÁP BÌNH PHƯƠNG NHỎ
NHẤT (OLS)
3. Hệ số xác định của mô hình
RSSESSTSS
Hệ số xác định
2
1
RSS ESS
R
TSS TSS
•0 ≤ R
2
≤ 1
•R
2
= 1 : mô hình phù hợp hoàn toàn với mẫu nghiên cứu
n
RSS
n
YY
n
e
iii
a. Đại lượng ngẫu nhiên U
i
Vì sao chia n-2 ? => Bài tập
Vì U
i
~ N(0 , σ
2
)
Nên Y
i
~ N(β
1
+β
ˆ
),(~
ˆ
2
ˆ
11
1
N
),(~
ˆ
2
ˆ
22
2
N
Trong đó
2
ˆ
1
là phương sai của
1
ˆ
XnXn
X
XnXn
X
i
i
i
i
22
2
22
2
2
ˆ
ˆ
2
2
ˆ
III. KiỂM ĐỊNH MÔ HÌNH HỒI QUY
1. Các đại lượng ngẫu nhiên
Vì :
),(
ˆ
2
ˆ
11
1
N
),(
ˆ
2
ˆ
22
2
N
Nên :
)1,0(
)
ˆ
(
ˆ
(
ˆ
1
11
nT
se
)2(
)
ˆ
(
ˆ
2
22
nT
se
Với T(n-2) là phân phối T-Student
với bậc tự do (n-2)
Vì sao lại là phân phối t-Student?
III. KiỂM ĐỊNH MÔ HÌNH HỒI QUY
2. Các khoảng tin cậy
a. Khoảng tin cậy của β
2
2. Các khoảng tin cậy
a. Khoảng tin cậy của β
2
a
aa
1
)
ˆ
(
ˆ
2
2
22
2
t
se
tPVì
a
t
1/2/2013
6
III. KiỂM ĐỊNH MÔ HÌNH HỒI QUY
2. Các khoảng tin cậy
b. Khoảng tin cậy của β
1
)2(
)
ˆ
(
ˆ
1
11
nT
se
tVì
2
2
1
2
2
2
2
ˆ
).2(
;
ˆ
).2(
aa
nn
Nên khoảng tin cậy của σ
2
với độ tin cậy 1-α là
Với có được khi tra bảng χ
2
với bậc tự do (n-2), mức ý nghĩa
và σ
2
với độ tin cậy 95%
Nhắc lại về giả thiết H
0
Trong thống kê, giả thiết phát biểu cần được kiểm định được
gọi là giả thiết không ( ký hiệu : H
0
). Giả thiết đối được ký hiệu
là giả thiết H
1
III. KiỂM ĐỊNH MÔ HÌNH HỒI QUY
Báo bỏ H
0
Chấp nhận H
0
H
0
sai
Đúng Sai lầm loại II
H
0
đúng
Sai lầm loại I Đúng
Người ta thường đặt giả thiết H
0
sao cho sai lầm loại I là
nghiêm trọng ( nguy hiểm) hơn sai lầm loại II
III. KiỂM ĐỊNH MÔ HÌNH HỒI QUY
Đặt α là khả năng mắc sai lầm loại I
Giả thiết 2 phía
H
o
:β
2
= β
o
H
1
:β
2
≠ β
o
độ tin cậy là 1-α
Giả thiết phía trái
H
o
:β
2
= β
o
H
1
:β
2
< β
o
Giả thiết phía phải
Kiểm định phía phải
Miền chấp nhận
Miền bác bỏ
)
ˆ
(
ˆ
22
a
set
)
ˆ
(
ˆ
22
a
set
Kiểm định phía trái
Miền bác bỏ
Miền chấp nhận
III. KiỂM ĐỊNH MÔ HÌNH HỒI QUY
3. Kiểm định giả thiết về hệ số hồi quy
Kiểm định hai phía
Miền chấp nhận Miền bác bỏ
Miền bác bỏ
)
Nếu -t
α/2
≤ t ≤ t
α/2
: chấp nhận giả thiết H
0
Nếu t < -t
α/2
hoặc t > t
α/2
: bác bỏ giả thiết H
0
)
ˆ
(
ˆ
2
02
se
t
SV tự suy luận điều kiện cho kiểm định phía trái và phải
III. KiỂM ĐỊNH MÔ HÌNH HỒI QUY
2. Kiểm định giả thiết về hệ số hồi quy
a. Kiểm định giả thiết về β
2
1
Tương tự kiểm định giả thiết về β
2
nhưng giá trị tới
hạn lúc này là
)
ˆ
(
ˆ
1
01
se
t
H
o
:β
1
= β
o
H
1
:β
1
≠ β
o
0
2
H
1
:σ
2
≠ σ
0
2
Với độ tin cậy là 1-α
Ví dụ áp dụng
Từ số liệu đã cho của ví dụ trước , yêu cầu kiểm định các giả
thiết sau
H
o
:β
2
= 0
H
1
:β
2
≠ 0
Với độ tin cậy là 95%
H
o
:β
1
:R
2
= 0
H
1
:R
2
≠ 0
Với độ tin cậy là 1- α
Kịểm định giả thiết
Bước 2 : Tra bảng tìm F(1,n-2), mức ý nghĩa là α
Bước 3 : Nếu F>F(1,n-2) , bác bỏ H
0
Nếu F≤F(1,n-2) , chấp nhận H
0
Bước 1 : tính
2
2
1
)2(
R
nR
F
độ tin cậy là (1-α) Việc kiểm định giả thiết
có ý nghĩa như thế nào?
Ví dụ áp dụng
Từ số liệu đã cho của ví dụ trước , yêu cầu kiểm định sự phù
hợp của mô hình với độ tin cậy 95%
Dấu của các hệ số hồi qui ước lượng được phù hợp
với lý thuyết hay tiên nghiệm không.
Các hệ số hồi qui ước lượng được có ý nghĩa về
mặt thống kê hay không ?
Mức độ phù hợp của mô hình (R
2
) và mô hình có
thực sự phù hợp?
Kiểm tra xem mô hình có thỏa mãn các giả thiết
của mô hình hồi qui tuyến tính cổ điển hay không.
5. Đánh giá kết quả hồi quy
1/2/2013
9
IV. SỬ DỤNG MÔ HÌNH HỒI QUY
1. Trình bày kết quả hồi quy
Kết quả hồi quy được trình bày như sau :
)()
ˆ
()
ˆ
(_
)
ˆ
()
ˆ
ii
_
672,09549,04517,5
ˆ
IV. SỬ DỤNG MÔ HÌNH HỒI QUY
2. Vấn đề đổi đơn vị tính trong hàm hồi quy
Trong hàm hồi quy hai biến , nếu đơn vị tính của X và
Y thay đổi thì ta không cần hồi quy lại mà chỉ cần áp
dụng công thức đổi đơn vị tính
Hàm hồi quy theo đơn vị tính cũ
ii
XY
21
ˆˆ
ˆ
Hàm hồi quy theo đơn vị tính mới
**
2
*
1
*
ˆˆ
ˆ
ii
XY
)
ˆ
()
ˆ
(
)
ˆ
()
ˆ
(
ˆˆ
2
2
1
*
2
2
ˆ
2
2
2
1
2
ˆ
11
*
1
2
ˆ
2
Ngoài ra :
IV. SỬ DỤNG MÔ HÌNH HỒI QUY
2. Vấn đề đổi đơn vị tính trong hàm hồi quy
Tuy nhiên, việc thay đổi đơn vị tính của các biến không làm
thay đổi tính BLUE của mô hình
Ví dụ áp dụng
Cho hàm hồi quy giữa lượng tiêu thụ cà phê (Y – ly/ngày) với giá
bán cà phê ( X – ngàn đồng/kg) như sau
ii
XY 2,09
ˆ
Viết lại hàm hồi quy nếu đơn vị tính của Y là ly/tuần
Ví dụ áp dụng
Từ số liệu đã cho của ví dụ trước về chi tiêu và thu nhập , yêu
cầu viết lại hàm hồi quy với đơn vị tính như sau
a) Y – triệu đồng/tháng ; X – triệu đồng/năm
b) Y – triệu đồng/ tháng ; X – triệu đồng / tháng
c) Y – ngàn đồng/tháng ; X – ngàn đồng /tháng
1/2/2013
10
IV. SỬ DỤNG MÔ HÌNH HỒI QUY
3. Vấn đề dự báo
ii
XYSRF
21
ˆˆ
ˆ
:
ˆ
Y
IV. SỬ DỤNG MÔ HÌNH HỒI QUY
3. Vấn đề dự báo
Với
)
ˆ
(
ˆ
);
ˆ
(
ˆ
0
2
00
2
0
YsetYYsetY
aa
ˆ
(
Y
Yse
Khoảng tin cậy giá trị trung bình của Y
0
với độ tin cậy (1-α) là
Ví dụ áp dụng
Từ số liệu đã cho của ví dụ trước , yêu cầu dự
báo khoảng giá trị của Y khi X
0
= 60 (triệu
đồng/năm) với độ tin cậy 95%
V. MỞ RỘNG MÔ HÌNH HỒI QUY HAI BiẾN
1. Hồi quy qua gốc tọa độ
Khi tung độ gốc bằng 0 thì mô hình trở thành mô hình hồi quy
qua gốc tọa độ , khi đó hàm hồi quy như sau
iii
iii
eXYSRF
UXYPRF
2
2
ˆ
:
:
1
ˆ
2
n
RSS
V. MỞ RỘNG MÔ HÌNH HỒI QUY HAI BiẾN
1. Hồi quy qua gốc tọa độ
*Lưu ý :
22
2
2
ˆ
ii
ii
oth
YX
YX
R
• R
2
có thể âm đối với mô hình này, nên không dùng R
2
Khi đó
iii
UXYPRF
*
21
*
:
Đây là dạng hồi quy tuyến tính đã biết
1/2/2013
11
V. MỞ RỘNG MÔ HÌNH HỒI QUY HAI BiẾN
2. Mô hình tuyến tính logarit
Ý nghĩa của hệ số β
2
: khi X thay đổi 1% thì Y
thay đổi β
2
% (Đây chính là hệ số co
giãn của Y đối với X)
XY
Y 1
2
Lấy đạo hàm 2 vế của hàm hồi quy log-log, ta được
Y
X
Biến phụ thuộc xuất hiện dưới dạng log và biến độc lập xuất
hiện dưới dạng tuyến tính (linear) nên mô hình có tên gọi là log-
lin
V. MỞ RỘNG MÔ HÌNH HỒI QUY HAI BiẾN
3. Mô hình log-lin
Ý nghĩa của hệ số β
2
: khi X thay đổi 1đơn vị
thì Y thay đổi (100.β
2
)
%
V. MỞ RỘNG MÔ HÌNH HỒI QUY HAI BiẾN
4. Mô hình lin-log
iii
UXYPRF ln:
21
ii
XX ln
*
Mô hình không tuyến tính theo các biến nhưng có thể chuyển về
dạng tuyến tính bằng cách đặt :
Khi đó
iii
UXYPRF
*
1
*
Mô hình không tuyến tính theo các biến nhưng có thể chuyển về
dạng tuyến tính bằng cách đặt :
Khi đó
iii
UXYPRF
*
21
:
1/2/2013
12
Ví dụ áp dụng
Từ số liệu đã cho của ví dụ trước , yêu cầu ước lượng hàm hồi
quy
iii
UXYPRF lnln:
21
X
i
Y
i
X
i
*
=lnX
ˆ
1
2*2*
1
***
2
n
i
i
n
i
i
XnX
YXnX
6278,0
ˆˆ
*
2
*
1
XY
c) Nếu giá bán là 8,5 ngàn đồng /kg thì doanh số bán trung bình là
bao nhiêu?
d) Hãy viết lại SRF ở trên nếu đơn vị tính của Y là triệu đồng/năm
e) Kiểm định giả thiết H
0
:β
2
= -1; H1 :β
2
≠ -1; với mức ý nghĩa
α=1%
f) Tính hệ số co giãn của Y theo X tại điểm
),( YX
Cho kết quả hồi quy giữa Y – doanh số bán (trđ/tấn) và X - giá bán
( ngàn đồng/kg) như sau :