Bài 3: Mô hình hồi quy tuyến tính đơn
23
BÀI 3. MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN Mục tiêu
Sau khi kết thúc bài, học viên sẽ hiểu
được những vấn đề sau đây:
• Ý tưởng của phương pháp bình phương
tối thiểu (OLS) và cách sử dụng OLS để
ước lượng các hệ số hồi quy.
• Ý nghĩa của các hệ số hồi quy ước lượng.
• Các giả thiết cơ bản của phương pháp OLS.
• Hệ số xác định r
2
đo độ phù hợp của
hàm hồi quy.
• Khoảng tin cậy và kiểm định giả
thuyết cho các hệ số hồi quy.
• Phân tích phương sai – kiểm định về
sự phù hợp của mô hình.
• Dự báo.
Nội dung
Hướng dẫn học
• Phương pháp OLS.
• Các giả thiết cơ bản của phương pháp bình
Tình huống
Công ty dầu ăn Tường An đang xem xét việc giảm giá bán sản
phẩm (loại bình 5 lít) để tăng lượng hàng bán ra, đồng thời quảng
bá sản phẩm của mình đến khách hàng. Người quản lí của công ty
muốn tính toán xem nếu sản phẩm này được giảm giá đi 1000
đồng/lít thì lượng hàng trung bình bán ra sẽ thay đổi thế nào. Đồng
thời, nếu như giảm giá 1000 đồng cho 1 lít mà lượng hàng bán
thêm được là nhiều hơn 50000 sản phẩm thì công ty sẽ tiến hành 1
chiến dịch khuyến mại trong 1 tháng với giá giảm đi là 10000/lít.
Để tiến hành nghiên cứu này, phòng marketing của công ty đã dựa vào các số liệu bán
hàng của công ty trong vòng 15 tháng qua (n =15 quan sát) để thu thập số liệu về giá bán
(P) và lượng bán (Q) cho loại dầu ăn này. Nghiên cứu viên sau khi tiến hành các thống
kê mô tả đã quyết định dùng hàm cầu dạng tuyến tính để xem xét ảnh hưởng của giá đến
lượng bán:
i12ii
QPu=β +β + .
Dùng số liệu của mẫu, ước lượng được hàm hồi quy mẫu có dạng
ii
ˆ
Q 6227 30.43P=−
.
Câu hỏi
• Theo kết quả của mô hình, khi giá giảm 1 đơn vị, lượng hàng bán ra thay đổi thế nào?
• Liệu khi giá giảm đi 1000 đồng 1 lít thì lượng hàng bán thêm lớn hơn được 50000 sản phẩm
như các nhà nghiên cứu muốn kiểm tra không?
• Giá bán quyết định bao nhiêu % trong sự thay đổi của lượng bán?
• Nếu giá bán là 150000 đồng 1 bình thì lượng bán dự báo là bao nhiêu?
ˆˆ
YXuYu=β +β + = + (3.3)
12
ˆˆ
,ββ
là các ước lượng của
ii
ii
xXx
yYy
=
−
⎧
⎨
=
−
⎩
,
i
ˆ
u
là ước lượng
của
i
u ,
i
ˆ
u
được coi là phần dư.
Từ (3.3) ta có:
trang bị phương pháp tìm giá trị cực tiểu, cực đại của
hàm
f(X,Y)
. Vậy để hàm
12
ˆˆ
f( , )
β
β đạt giá trị nhỏ nhất
thì
12
ˆˆ
,
β
β phải là nghiệm của hệ phương trình
n
12
i12i
i1
1
n
12
ii 1 2i
i1
2
ˆˆ
f( , )
ˆˆ
2(Y X ) 0
ˆ
1i2i ii
i1 i1 i1
ˆˆ
nXY
ˆˆ
XXXY
==
===
⎧
β+β =
⎪
⎪
⎨
⎪
β+β =
⎪
⎩
∑∑
∑∑∑
(3.5)
Bài 3: Mô hình hồi quy tuyến tính đơn
26
Ta có:
nn n
ii ii
i1 i1 i1
11 1
XX;YY;XYXY
(3.6)
Giải hệ phương trình (3.6) ta thu được nghiệm
2
22
12
XY (X)(Y)
ˆ
X(X)
ˆˆ
YX
⎧
−
β=
⎪
−
⎨
⎪
β= −β
⎩
(3.7)
Ta đặt
nn
22222
YY i i
i1 i1
S (Y Y) Y n(Y) nY n(Y)
==
=−=−=−
∑∑
⎨
⎪
β= −β
⎩
Phương pháp tìm các ước lượng
12
ˆˆ
,
β
β như trên được gọi là phương pháp bình phương
tối thiểu.
3.1.1. Tính chất của tham số hồi quy mẫu ước lượng bằng phương pháp bình
phương tối thiểu.
Phương pháp bình phương tối thiểu đem lại các ước lượng với các tính chất như sau:
•
Ứng với một mẫu
11 2 2 n n
((X , Y ),(X ,Y ), (X , Y )) cho trước, hệ số
12
ˆˆ
,ββ
được xác
định duy nhất.
•
Đường thẳng của phương trình hồi quy mẫu (SRF)
i12i
ˆˆ
ˆ
YX=β +β
i
ˆ
u bằng 0
n
i
i1
ˆ
u0.
=
=
∑
•
Các phần dư
i
ˆ
u và
i
ˆ
Y
không tương quan, tức là:
n
ii
i1
ˆ
ˆ
uY 0.
=
=
∑
12
ˆˆ
YX⇒β = −β
.
o Ta có:
()
nn
i12i
i1 i1
11
ˆˆ
ˆˆ
YY X
nn
==
==β+β
∑∑
12
ˆˆ
X
Y.
=β +β
=
o Ta có:
iii
ˆ
ˆ
==
=β+β−β+β
∑∑
222
12 1122
ˆˆ ˆˆˆˆ
nYn XYn( 2 X X)=β +β − β+ββ +β
n
22 22
ii 1 1 2 2 1 2 1 12 2
i1
1
ˆˆ ˆ ˆˆ ˆ ˆ ˆˆ ˆ
ˆ
ˆ
uY ( X) ( X X ) ( 2 X X ) 0.
n
=
⇒ =β β +β +β β +β − β + ββ +β =
∑
Vậy
n
ii
i1
ˆ
ˆ
uY 0.
.
Từ tính chất 4 và 5 ta có
nn
iii
i1 i1
ˆ
ˆˆ
uuY0
==
==
∑∑
.
Vậy ta có:
n
ii
i1
ˆ
uX 0.
=
=
∑
VÍ DỤ 3.1
Thu thập số liệu về điểm học tập của học sinh và mức thu nhập hàng năm của bố mẹ ta
có bảng số liệu sau:
Thu nhập (x) (triệu/năm) 45 60 30 90 75 45 105 60
Điểm trung bình (y) 8.75 7.5 6.25 8.75 7.5 5.0 9.5 6.5
Hãy tìm hàm hồi quy mẫu và tính các đặc trưng của nó
3.1.2. Các giả thiết cơ bản của phương pháp bình phương tối thiểu
Khi phân tích hồi quy, mục đích của chúng ta là tìm phương trình hồi quy mẫu thông
Y
là ước lượng tốt nhất cho
i
E(Y | X ) .
Chất lượng của các ước lượng sẽ phụ thuộc vào các
yếu tố sau:
•
Dạng hàm của mô hình được chọn.
•
Phụ thuộc vào các
i
X và
i
u.
•
Phụ thuộc vào cỡ của mẫu.
Vấn đề về dạng hàm của mô hình được lựa chọn chúng ta sẽ xem xét ở bài 7. Ta sẽ
đưa ra các giả thiết cho
i
X và
i
u để các ước lượng thu được không chệch và có
phương sai nhỏ nhất.
•
Giả thiết 1: Biến giải thích X có giá trị quan sát
i
X
khác với ít nhất 1 giá trị còn
lại, tức là phương sai mẫu hiệu chỉnh không suy biến:
n
XE(u) XE(u) 0.
=
−×
=−=
Giả thiết này có một ý nghĩa rất quan trọng là nếu X và u có được tương quan thì
khi X thay đổi, u cũng sẽ thay đổi. Vì thế giá trị kỳ vọng của Y sẽ khác
12
X.β+β
•
Giả thiết 4: Phương sai sai số thuần nhất (không đổi)
2
ij
Var(u ) Var(u )==σ
ij
∀
≠
.
•
Giả thiết 5: Không có tương quan giữa các
i
u, tức là:
ij
CoV(u ,u ) 0
=
ij
∀
≠ .
Với các giả thiết đã nêu, khi đó ta có tính chất của các ước lượng theo phương pháp
bình phương tối thiểu như sau:
thiểu là
2
22
12
XY (X)(Y)
ˆ
X(X)
ˆˆ
YX .
−
β=
−
β= −β
Đặt:
ii
ii
xXX
yYY
⎧
=−
⎪
⎨
=−
⎪
⎩Bài 3: Mô hình hồi quy tuyến tính đơn
∑
;
2
n
2
i
i1
ˆ
se( ) ;
x
=
σ
β=
∑
n
2
i
2
i1
1
n
2
i
i1
X
ˆ
Var( )
nx
=
σ
chưa biết nên dựa vào dữ liệu mẫu đã cho ta
thu được ước lượng của
2
σ là
2
ˆ
σ
được xác định
bằng công thức sau:
nn
22
ii
2
i1 i1
ˆˆ
uu
ˆˆ
n2 n2
==
σ= ⇒σ=
−−
∑∑
ˆ
σ
là sai số tiêu chuẩn của ước lượng (standard error of the estimate).
3.2. Hệ số xác định
2
r đo độ phù hợp của hàm hồi quy mẫu:
ˆˆ
yu
==
=+
∑∑
nn
22 2
2i i
i1 i1
ˆ
ˆ
xu
==
=β +
∑
∑
(3.10)
Bài 3: Mô hình hồi quy tuyến tính đơn
31
Đặt:
nn
22
ii
i1 i1
TSS y (Y Y)
==
== −
RSS u .
=
=
∑
(3.13) (3.12)
RSS (Residual sum of squares) là tổng tất cả các bình
phương sai lệch giữa giá trị quan sát
i
Y và giá trị
i
ˆ
Y
nhận
được từ hàm hồi quy hay gọi là tổng các phần dư.
Từ (3.10), (3.11), ( 3.12), (3.13) ta có:
TSS ESS RSS=+ (3.14)
Chia hai vế cho TSS ta có:
ESS RSS
1
TSS TSS
=+
nn
22
ii
i1 i1
nn
22
ii
i1 i1
−
==
−
∑
∑
Từ (3.14) và (3.15) ta có:
2
RSS
r1
TSS
=−
(3.16)
Ta có:
nnn
22 22 2
2
i2i2 i
2
i1 i1 i1 X
2
nn n
2
22 2
Y
ii i
i1 i1 i1
ˆˆ
ˆ
yx(XX)
1
S(YY)
n1
=
=−
−
∑Bài 3: Mô hình hồi quy tuyến tính đơn
32
là phương sai mẫu của X và Y. Ngoài ra vì
n
ii
i1
2
n
2
i
i1
xy
ˆ
x
=
=
β=
∑
∑
nên (3.17) có thể được viết
1
xy XY ( X)( Y)
n
r
x y (X X) (Y Y)
====
== = =
−
==
−−
∑∑∑∑
∑∑ ∑ ∑
nnn
ii i i
i1 i1 i1
nn nn
2222
ii ii
i1 i1 i1 i1
nXY(X)(Y)
nX(X) nY(Y)
===
== ==
−
=
⎡⎤⎡⎤
−−
⎢⎥⎢⎥
⎣⎦⎣⎦
điểm của
1
β và
2
β theo phương pháp bình phương
nhỏ nhất (OLS) dựa trên các giả thiết cơ bản về sai
số ngẫu nhiên
i
u là:
•
i
E(u ) 0.=
•
2
i
Var(u ) .=σ
•
ij
Cov(u ,u ) 0= , i j∀≠ .
Bài 3: Mô hình hồi quy tuyến tính đơn
33
Khi đó các ước lượng điểm thu được tương ứng là
12
ˆˆ
σ
,
Với giả thiết thêm vào đó,
12
ˆˆ
,
ββ
còn có các tính chất sau:
•
12
ˆˆ
,
ββ
là các ước lượng vững, tức là khi cỡ mẫu đủ lớn thì chúng hội tụ đến giá trị
12
,ββ.
•
1
ˆ
β
có phân phối chuẩn với
11
ˆ
E( )β=β
,
n
2
i
Z
β
−β
=
σ
có phân phối chuẩn tắcN(0;1).
•
2
β có phân phối chuẩn với:
22
ˆ
E( )β=β
,
2
2
22
n
2
i
i1
ˆ
Var( )
x
=
σ
β=σ=
∑
(3.20)
•
Các ước lượng
12
ˆˆ
,
ββ
có phương sai nhỏ nhất trong số các ước lượng không chệch
của
12
,ββ.
Ta có
i12ii
YXu.
=
β+β + Từ giả thiết của
i
u ta thu được các thống kê Z và
2
χ
có
quy luật phân phối chuẩn tắc và khi bình phương với
(n 2)
−
bậc tự do. Vậy ta có
thể tìm được khoảng ước lượng cho các tham số
12
,
β
β và
2
(3.19) và (3.20). Tuy nhiên vì phương sai
2
σ
chưa biết, nên các phương sai
22
12
,σσ cũng
chưa biết, vì vậy ta dùng ước lượng không chệch của
2
σ
là:
n
2
i
2
i1
ˆ
u
RSS
ˆ
.
n2 n2
=
σ= =
−−
∑
Khi đó các thống kê:
11
1
Các thống kê này có phân phối student với (n
– 2) bậc tự do. Đồng thời, thống kê
2
2
2
ˆ
(n 2)
σ
χ= −
σ
có phân phối khi bình phương với (n – 2) bậc tự do.
3.4.1. Khoảng ước lượng cho
1
β
Với độ tin cậy
1−α
cho trước, ta có:
{
}
(n 2) (n 2)
1
22
Pt Tt 1
−−
αα
−
<< =−α,
với
2
P{ t se( ) t se( )} 1
αα
−−
β
− β <β <β + β = −α
.
Vậy với mẫu cụ thể ta có khoảng ước lượng cho
1
β
là:
22
(n 2) (n 2)
11 11 1
ˆˆˆˆ
( t se( ); t se( ))
αα
−−
β∈β− β β+ β .
Bài 3: Mô hình hồi quy tuyến tính đơn
35
3.4.2. Khoảng ước lượng cho
2
β
Tương tự như trên ta có, với độ tin cậy
1
−
α
cho
−−
αα
β
− β <β <β + β = −α.
Vậy với mỗi mẫu cụ thể ta có khoảng ước lượng cho
2
β
là:
(
)
(n 2) (n 2)
22 22 2
22
ˆˆˆˆ
t Se( ); t Se( )
−−
αα
β∈β− β β+ β
3.4.3. Khoảng ước lượng cho
2
σ
Ta thấy thống kê
2
2
2
ˆ
(n 2)−σ
χ=
σ
(n 2)χ−.
Từ đó ta có:
22
2
22
/2;n 2 1 /2;n 2
ˆˆ
(n 2) (n 2)
P1
α− −α−
⎧
⎫
−σ −σ
⎪
<σ < = −α
⎨⎬
χχ
⎪
⎭
⎩
.
Vậy với mẫu cụ thể và độ tin cậy
1
−
α , ta có khoảng ước lượng cho
2
σ là:
22
2
22
36
Ta đã biết bài toán kiểm định giả thuyết gồm các bước cơ bản sau:
•
Bước 1: Thiết lập giả thuyết
0
Hvà đối thuyết
1
H.
•
Bước 2: Xây dựng tiêu chuẩn thống kê để kiểm định, xác định quy luật phân phối
xác suất của tiêu chuẩn thống kê khi giả thuyết
0
H được cho là đúng.
•
Bước 3: Xây dựng miền bác bỏ giả thiết W ứng với mức ý nghĩa α cho trước.
•
Bước 4: So sánh giá trị mẫu (quan sát được) của tiêu chuẩn thống kê ở bước thứ 2
với miền bác bỏ giả thuyết W ở bước 3 để đưa ra kết luận bác bỏ hay chấp nhận
giả thuyết
0
H.
3.5.1. Kiểm định giả thuyết cho
1
β
Ta đưa giả thuyết
0
H:
*
11
có phân phối Student với n – 2 bậc
tự do. Ta sẽ dựa vào thống kê này để tiến hành kiểm
định giả thuyết cho
1
β . Ta có các bài toán kiểm định
giả thuyết sau:
Bài toán 1: Kiểm định hai phía
*
01 1
*
11 1
H:
H:
⎧
β=β
⎪
⎨
β≠β
⎪
⎩
Miền bác bỏ:
(n-2) (n-2)
/2 /2
W( ;t )(t ; )
αα
=−∞− ∪ +∞ với
(n-2)
p
t là phân vị mức p (p = α /2) của
1
T.
Bài toán 3: Kiểm định một phía (trái)
*
01 1
*
11 1
H:
H:
⎧
β=β
⎪
⎨
β<β
⎪
⎩
Miền bác bỏ:
(n-2)
W( ;t )
α
=−∞− .
3.5.2. Kiểm định giả thuyết cho
2
β
Ta có giả thuyết
*
02 2
H:β=β với đối thuyết
*
có phân phối Student với n – 2 bậc tự do. Do đó, ta có
thể tiến hành các bài toán kiểm định giả thuyết sau
cho
2
β :
Bài toán 1: Kiểm định hai phía
*
02 2
*
12 2
H:
H:
⎧
β=β
⎪
⎨
β≠β
⎪
⎩
Miền bác bỏ:
(n-2) (n-2)
/2 /2
W( ;t )(t ; )
αα
=−∞− ∪ +∞
(n-2)
p
t
là phân vị mức p của phân phối Student
T.
Bài toán 3: Kiểm định một phía (trái)
*
02 2
*
12 2
H:
H:
⎧
β=β
⎪
⎨
β<β
⎪
⎩
Miền bác bỏ:
(n-2)
W( ;t ).
α
=−∞−
3.5.3. Kiểm định giả thuyết cho phương sai
2
σ
Giả thuyết
22
00
H:σ=σ, với một trong các đối thuyết
Bài toán 1: Kiểm định hai phía
22
00
22
10
H:
H:
⎧
σ=σ
⎪
⎨
σ≠σ
⎪
⎩Bài 3: Mô hình hồi quy tuyến tính đơn
38
Miền bác bỏ:
22
1- / 2;n 2 / 2;n 2
W(0; )( ; )
α− α−
=χ ∪χ +∞
trong đó
2
p
;n 2
−
22
10
H:
H:
⎧
σ=σ
⎪
⎨
σ<σ
⎪
⎩
Miền bác bỏ:
()
2
1- ;n 2
W= 0;
α−
χ .
3.5.4. Phương pháp xác suất ý nghĩa (p-value)
Với một mẫu cụ thể ta có giá trị quan sát của thống kê
i
T
(i 1, 2)
=
là:
*
ii
iqs
0
H càng ít nghiêm trọng. Vậy khi đã cho trước mức
ý nghĩa
α (đây là xác suất giới hạn để được bác bỏ
0
H), nếu xác suất ý nghĩa không
vượt quá
α
thì ta có thể bác bỏ
0
H mà không sợ phạm sai lầm nghiêm trọng, còn nếu
xác suất ý nghĩa lớn hơn
α thì chưa có cơ sở để bác bỏ
0
H.
Bây giờ ta có thể sử dụng xác suất ý nghĩa để tiến hành các bài toán kiểm định đối
với các tham số
12
,ββ.
• Kiểm định hai phía
*
0i i
*
1i i
H:
H:
⎧
β=β
⎪
iiqs
PT t> hoặc
}
iiqs
Tt<−
{
}
iiqs
2P T t=>.
Bước 3: So sánh xác suất ý nghĩa đó với mức ý nghĩa
α
đã xác định từ trước, nếu
p-value ≤α thì bác bỏ
0
H , còn nếu p-value >α thì chấp nhận giả thuyết
0
H.
• Kiểm định một phía (phải)
*
0i i
*
1i i
H:
H:
⎧
β=β
⎪
⎨
β>β
⎪
Kiểm định một phía (trái)
*
0i i
*
1i i
H:
H:
⎧
β=β
⎪
⎨
β<β
⎪
⎩
i = 1, 2
Bước 1: Tính
*
ii
iqs
*
i
ˆ
t
Se( )
β−β
=
β
;
Bước 2: Tính p-value =
{
,
β
β là
12
ˆˆ
4.785256, 0.042094
β= β= và sai số
chuẩn là:
12
ˆˆ
Se( ) 1.195385, Se( ) 0.017601.
β= β= Vì cỡ mẫu n = 8, với mức tin
cậy
0.05α= , tra bảng phân phối student ta có:
(7)
0.025
t 2.364624= . Vậy ta có các
khoảng ước lượng cho
12
,ββ là:
()
()
1
1
4.785265 2.364624x1.195385; 4.786265 2.36462x1.195385
1.958629; 7.611901 .
β∈ − +
⇒β ∈
Tương tự ta có:
Với mức ý nghĩa 5%, tra bảng phân phối student ta có:
(7)
0.025
t 2.364624=
.
Vậy miền bác bỏ của bài toán là: W =
(
)
(
)
; 2.364624 2.364624;
−
∞− ∪ +∞.
Ta thấy giá trị tiêu chuẩn thống kê
2
tW
∉
, do đó chưa bác bỏ được H
0
. Như vậy
có thể kết luận thu nhập của bố mẹ không ảnh hưởng đến kết quả học tập của con
cái một cách có ý nghĩa.
Cách 2: Ta thấy giá trị p- value = 0.0539 > 0.05 vì vậy chưa thể bác bỏ được H
0
.
Bài 3: Mô hình hồi quy tuyến tính đơn
41
c) Từ kết quả trong bảng ta có r
(*)
Giả thuyết
0
H nói lên rằng biến X không ảnh
hưởng tới Y, khi đó ta bác bỏ giả thuyết
0
Hcũng có nghĩa là ta bác bỏ giả thuyết cho
rằng biến X không có ảnh hưởng tới biến Y.
Trong các phần trước ta thấy nếu như giả thuyết
0
Hlà đúng, tức là:
2
0β= , thì thống kê
2
22
ˆ
(n 2) RSS−σ
=
σσ
có phân phối khi - bình phương với n – 2 bậc tự do, còn thống kê
2
ESS
σ
cũng có có phân phối khi-bình phương với 1 bậc tự do. Mặt khác hai thống kê đó độc
lập với nhau, vậy thống kê
22
2
2
Ý nghĩa: Cách tiếp cận theo hướng phân tích phương sai như trên cho phép ta đưa ra
các phán đoán về độ phù hợp của mô hình hồi quy đang xét. Cụ thể, nếu thống kê F có
giá trị rất lớn (ứng với xác suất ý nghĩa rất nhỏ) thì ta có thể kết luận mô hình được lập
phù hợp với số liệu quan sát. Còn nếu thống kê F có giá trị nhỏ đến mức xác suất ý
nghĩa tương ứng của nó lớn hơn m
ức ý nghĩa đã định (bằng 5% chẳng hạn) thì rõ ràng
mô hình là không phù hợp với số liệu, lúc đó cần tìm mô hình khác.
Ta có bảng phân tích phương sai ngắn gọn như sau:
Bài 3: Mô hình hồi quy tuyến tính đơn
42
Nguồn biến thiên Tổng bình phương Bậc tự do Phương sai
X
=
=β
∑
n
22
i
i1
ˆ
ESS x
1
ESS
1
Phần dư
=
=
Y
thỏa mãn
phương trình:
0120
ˆˆ
ˆ
YX
=β +β .
Giá trị thực
0
Ythỏa mãn phương trình
01200
YXu
=
β+β + , với
0
u là sai số.
Ta có :
00 11 2200
ˆˆ
ˆ
YY( )( )X u
−=β−β+β−β −.
Đồng thời
112 2
ˆˆ
E( ) ;E( )
β
=
ββ
−= β−β+β−β −
2
11 0 2 2 0 112 2 0
ˆˆˆˆ
Var( ) (X ) Var( ) 2X Cov( ; ) Var(u )
= β −β + β −β + β −β β −β +
2
2
2222
0
0
xx xx xx
x
1X X
2x
nS S S
⎛⎞
=σ++σ−σ+σ
⎜⎟
⎝⎠
2
22
0
xx
(X X)
1
1X
nS
YY
t
ˆ
Se(Y Y )
−
=
−
có phân phối Student với n – 2 bậc tự do.
Vậy với mức ý nghĩa
α cho trước ta có khoảng ước lượng
0
Y là:
Bài 3: Mô hình hồi quy tuyến tính đơn
43
ỨNG DỤNG
n2 n2
0000000
22
ˆˆ ˆˆ
YtSe(YY)YYtSe(YY)
−−
αα
−−<<+−
(3.21)
Công thức (3.21) cho ta khoảng ước lượng về giá trị
0
Y của Y khi cho biết trước giá
trị
YE(Y|X)( )( )X
−=β−β+β−β2
2
0
00
xx
(X X)
1
ˆ
Var(Y E(Y | X ))
nS
⎡
⎤
−
−=σ+
⎢
⎥
⎣
⎦
.
Do
2
σ chưa biết, ta dùng ước lượng
2
ˆ
σ
, dẫn đến:
khi ấy thống kê
0
00
ˆ
Y
ˆ
YE(Y|X)
t
S
−
=
.
có phân phối Student với n – 2 bậc tự do.
Áp dụng kết quả trên, ta có thể ước lượng giá trị trung bình có điều kiện
0
E(Y | X )bằng biểu thức sau:
ỨNG DỤNG
00
n2 n2
ˆˆ
000
YY
22
ˆˆ
YtS E(Y|X)YtS
−−
αα
−< <+
(3.22)
i
càng tốt. Vì vậy, ta đi tìm min cho hàm sau:
()
nn
22
12 i i 1 2i
i1 i1
ˆˆ ˆ ˆ
f, u (Y X).
==
ββ = = −β−β
∑∑
Như vậy phương pháp OLS sẽ tối thiểu hóa tổng bình phương các phần dư:
n
2
i
i1
ˆ
RSS u min.
=
=⇒
∑
Ta có công thức cho các hệ số ước lượng là:
12
ˆˆ
YX
β
=−
(
)
ii
X,Y
12
ˆˆ
,ββ
là các ước lượng điểm của
12
,ββ.
•
Các giả thiết cơ bản của phương pháp OLS và các khuyết tật tương ứng của mô hình
Dưới đây là các giả thiết cần lưu ý:
Giả thiết 1: Mô hình hồi quy phải có dạng tuyến tính.
Giả thiết 2: Các giá trị của X được giả thiết là phi ngẫu nhiên và không tương quan với các
sai số ngẫu nhiên, tức là :
()
(
)
(
)
(
)
() ()
ii ii i i
ii ii
CoV X ,u E X u E X E u
XE u XE u 0.
=−×
đo độ phù hợp của hàm hồi quy, giá trị của r
2
cho biết bao nhiêu phần trăm sự biến thiên
của biến Y được giải thích bởi biến X hoặc bởi hàm hồi quy mẫu.
•
Ý nghĩa khoảng tin cậy:
KTC cho β
1
:
(
)
(
)
(
)
n2 n2
11a 11a 1
22
ˆˆˆ ˆ
tSe ; t Se
−−
β∈β− β β+ β
KTC cho β1 cho biết trung bình của Y thay đổi thế nào khi X = 0.
KTC cho β2:
(
)
(
)
()
j
= β
j
*
(j = 1,2).
Kiểm định Gt cho β
1
= β
1
* cho biết trung bình của Y có bằng β
1
* khi X = 0 hay không.
Kiểm định Gt cho β
2
= β
2
* cho biết tốc độ thay đổi của trung bình của Y khi biến X thay đổi
1 đơn vị có bằng β
2
* hay không.
•
Phân tích phương sai – kiểm định về sự phù hợp của mô hình.
Để kiểm định sự phù hợp của mô hình hồi quy tuyến tính so với số liệu, ta có thể tính các
tổng bình phương sai số ESS, RSS và TSS, từ đó xác định thống kê F có phân phối Fisher rồi
tiến hành kiểm định giả thuyết đối với thống kê đó.
•
Dự báo.
Từ số liệu mẫu, ta ước lượng được mô hình hồi quy thực nghiệm, từ đó có thể dự báo được
giá trị của biến phụ thuộc mỗi khi có một giá trị mới của biến độc lập.
∑∑
B.
()
nn
iii
i1 i1
ˆ
ˆ
uYYmin
==
=−→
∑∑
C.
()
2
nn
2
iii
i1 i1
ˆ
ˆ
uYYmin
==
=−→
∑∑
D.
()
2
nn