Bài 2. ƯỚC LƯỢNG VÀ Kiểm định
MÔ HÌNH HỒI QUI đơn 1. Mô hình
- Mô hình hồi qui đơn ( Simple regression ) là mô hình một phương trình
gåm một biến phụ thuộc (Y) và một biến giải thích (X).
- Mô hình có dạng: PRF E(Y/X
i
)=
β
1
+
β
2
X
i
PRM Y
i
=
β
1
+
β
2
X
i
+ u
i
(X
i
β
i
+ e
i
phản ánh xu thế biến động về mặt trung bình của mẫu.
2. Phương pháp bình phương nhỏ nhất( Ordinary least squares -OLS)
2.1. Phương pháp
- Tìm , sao cho Q = → min
1
ˆ
β
2
ˆ
β
∑∑
==
=−
n
i
i
n
i
ii
eYY
1
2
1
2
)
ˆ
2
= -2 ∑X
i
(Y
i
-
β
ˆ
1
-
β
ˆ
2
X
i
) = 0
⇒
β
ˆ
1
n +
β
ˆ
2
∑X
i
= ∑Y
i
Y
i
)/n ;
2
X
= (∑X
i
2
)/n
⇒
=
2
ˆ
β
22
)( XX
YXXY
−
−
; =
1
ˆ
β
XY
2
ˆ
β
−
∑
∑
=
=
n
i
i
n
i
ii
x
yx
1
2
1
→
y
ˆ
i
=
β
ˆ
2
x
i
gọi là hàm hồi quy mẫu đi qua gốc toạ độ.
1
, ước lượng bằng phương pháp bình phương nhỏ nhất nên được gọi là
i
n
i
e
d. Các phần dư không tương quan với các giá trị của biến giải thích:
cov(e
i
,x
i
) =
0
1
=
ii
Xe∑
=
n
i
e. Các phần dư không tương quan với các giá trị ước lượng của biến
phụ thuộc Y : cov(e
i
, ) = = 0
i
y
ˆ
∑
=
n
i
iYei
j
) = 0
∀
i ≠ j
Giả thiết 6: SSNN và biến giải thích không tương quan
Cov(u
i
, X
i
) = 0
∀
i
Giả thiết 7: Các giá trị của biến giải thích phải khác nhau càng nhiều càng tốt
Var(X) > 0
Giả thiết 8: Kích thước mẫu phải lớn hơn số tham số cần ước lượng của mô hình.
n > k
Giả thiết 9: Mô hình được chỉ định đúng.
Giả thiết 10: Không có đa cộng tuyến giữa các biến giải thích của mô hình hồi quy
bội.
Định lý Gaus-Markov: Nếu tổng thể thỏa mãn các giả thiết trên thì
ước lượng OLS sẽ là ước lượng tuyến tính, không chệch, tốt nhất
(trong số các ước lượng không chệch) của các tham số (Best Linear
Unbiassed Estimator - BLUE).
4. Các tham số của ước lượng OLS
Các ước lượng là biến ngẫu nhiên tùy thuộc mẫu, nên có các tham số đặc
trưng
n
i
i
n
i
i
xn
X
Var( ) =
2
ˆ
β
2
1
2
1
σ
∑
=
n
i
i
x
Độ lệch chuẩn : SD( ) =
j
β
ˆ
)
ˆ
ˆ
=
2
ˆ
σ
là độ lệch chuẩn của đường hồi qui :
(Standard error of Regression)
Lúc đó ta thu được:
Se( ) =
1
ˆ
β
∑
∑
=
=
n
i
i
n
i
i
xn
X
1
2
1
2
ˆ
β
ˆ
2
)
Hiệp phương sai phản ánh mối quan hệ giữa
β
ˆ
1
và
2
ˆ
β
Các tham số trên thường được cho trong ma trận sau:
var - cov =
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
)var() ,cov(
),cov() var(
212
211
βββ
βββ
=
2
i
y
ˆ
+ e
i
2
+ 2e
i
i
y
ˆ
=
∑
=
n
i
i
y
1
2
+ + 2
∑
=
n
i
i
y
1
∑∑∑
===
+=
n
i
n
i
n
i
iii
eyy
1
2
1
2
1
2
ˆ
Ký hiệu: = TSS = ESS và
∑
= RSS
∑
=
n
i
i
y
1
2
∑
=
TSS
RSS
TSS
ESS
−= 1
gọi là hệ số xác định, 0 ≤ R
2
≤ 1
í nghĩa: Hệ số xác định R
2
là tỉ lệ (hoặc tỉ lệ %) sự biến động của
biến phụ thuộc được giải thích bởi biến giải thớch (theo mô hình ,
trong mẫu).
6. Hệ số tương quan R :
Là căn bậc hai của hệ số xác định và đo mức độ tương quan tuyến tính giữa
Y và X. Mức độ liên quan chặt chẽ tuyến tính giữa X và Y.
Giá trị của R càng gần 1 và -1 thì X và Y càng liên quan chặt chẽ
Giá trị của R càng gần 0 thì X và Y liên quan lỏng lẻo
Hệ số tương quan thường được cho trong ma trận sau:
r =
⎟
⎟
⎠
⎞
i
phân phối chuẩn thì mọi hàm tuyến
tính của nó cũng phân phối chuẩn.
+ Phân phối chuẩn có tính chất là tính độc lập và không tương quan là đồng
nhất.
Kết hợp các giả thiết 3,4,5 và 11 ta có giả thiết chung là:
u
i
∼ n.i.d (0,
σ
2
)
Mô hình thoả mãn các giả thiết trên gọi là mô hình hồi quy tuyến tính cổ điển (
Clasic Linear Regression Model - CLRM ).
.8. Các tính chất của các ước lượng OLS.
a. Các ước lượng của CLRM là các ước lượng không chệch.
b. Các ước lượng của CLRM là các ước lượng vững
c. Các ước lương của CLRM là các ước lượng hiệu quả nhất.
d.
β
ˆ
1
∼
N(
β
1
∼
T(n-2)
e.
β
ˆ
2
∼
N(
β
2
, var(
β
ˆ
2
))
⇒
U=
)
ˆ
(
ˆ
2
22
β
ββ
sd
−
g. Các ước lượng của CLRM đều là BLUE hoặc BUE h. Y
i
∼
N (
β
1
+
β
2
X
i
,
σ
2
) i = 1, 2, . . . N.
.9. Suy diễn thống kê.
9.1. Ước lượng khoảng
Với độ tin cậy 1 -
α
cho trước:
– Se( )t
j
β
ˆ
j
β
ˆ
α
/2
(n – 2) <
β
j
< + Se( )t
j
β
ˆ
j
β
ˆ
α
/2
(n – 2)
Khoảng tin cậy bên phải:
j
β
ˆ
– Se( )t
j
β
−
−
n
n
α
χ
σ
< σ
2
<
)2(
)2(
ˆ
2
11
2
−
−
−
n
n
α
χ
σ
Khoảng tin cậy hai phía:
)2(
)2(
ˆ
)2(2
2
)2(
ˆ
−
−
n
n
α
χ
σ
< σ
2
Khoảng tin cậy bên trái:
σ
2
<
)2(2
1
2
)2(
ˆ
−
−
−
n
n
α
χ
)
ˆ
(
ˆ
*
j
jj
Se
β
ββ
−
Nếu ⏐T
qs
⏐> t
α
/2
(n – 2) thì bác bỏ H
0
, ngược lại : chưa có cơ
sở bác bỏ H
0
.
ii. Cặp giả thuyết Nếu T
⎪
⎩
⎪
⎨
⎧
:H
:H
jj
jj
ββ
ββ
qs
< – t
α
(n – 2) : bác bỏ H
0
Trường hợp đặc biệt → T
⎩
⎨
⎧
≠
=
0:H
0:H
1
0
j
j
β
β
qs
=
)
α
thì bác bỏ H
0
Nếu P-value>
α
thì thừa nhận H
0 ⎩
⎨
⎧
≠
=
2
0
2
1
2
0
2
0
:H
:H
σσ
σσ
iii. Cặp giả thuyết
Tiêu chuẩn kiểm định:
⎧
>
=
2
0
2
1
2
0
2
0
:H
:H
σσ
σσ
Cặp giả thuyết
Nếu χ
qs >
thì bác bỏ H
2
α
χ
0
⎩
⎨
⎧
<
=10. Kiểm định về sự thích hợp của mô hình .
Cặp giả thuyết
⎩
⎨
⎧
≠
=
0:H
0:H
2
1
2
0
R
R
Biến giải thích không giải thích cho Y
Biến giải thích có giải thích cho Y
⇔
⎩
⎨
⎧
≠
=
0:H
0:H
- Ngược lại, Y không phụ thuộc vào biến giải thích, hàm hồi qui
không phù hợp.
Vì hai cặp giả thiết tương đương, kiểm định F tương đương kiểm định T
F
qs
= (T
qs
)
2
.
Kiểm định F nói trên cũng có thể tiến hành bằng phương pháp P-value
Khoảng tin cậy đối xứng:
– Se( )t
0
ˆ
Y
0
ˆ
Y
α
/2
(n – 2)
< E(Y/X
0
) < + Se( )t
0
ˆ
Y
0
ˆ
Y
α
/2
(n – 2)
Khoảng tin cậy bên phải:
– Se( )t
0
ˆ
β
2
ˆ
β
0
và Se( ) =
0
ˆ
Y
2
2
0
)(
1
ˆ
i
x
XX
n Σ
−
+
σ
11.2. Dự báo giá trị cá biệt
– Se(
0
ˆ
0
- Y
0
) =
2
2
0
)(
1
1
ˆ
i
x
XX
n Σ
−
++
σ
VÝ dô 1: Håi quy hµm tiªu dïng Keynes vµ cho nhËn xÐt.
Dependent Variable: Y
Method: Least Squares
Date: 02/16/09 Time: 09:07
Sample: 1980 1991
Included observations: 12
Variable Coefficie
m
Trong đó: R
i
là lợi tức của công ty i
R
m
là lợi tức của chỉ số thị trường.
α thể hiện tác động của các yếu tố khác ngoài R
m
đối với R
i
β đo mức độ nhạy cảm của chứng khoán I trước những dao động của thị
trường.
Nếu chứng khoán ít nhạy cảm trước những biến động của chỉ số thị trường thì 0
< β < 1 và được gọi là chứng khoán tự vệ. Nếu chứng khoán nhạy cảm trước
những biến động của chỉ số thị trường thì β > 1 và gọi là chứng khoán năng động.
Mô hình SIM giả định rằng lợi tức của mỗi chứng khoán đều có ba bộ phận hợp
thành:
α đại diện cho phần lợi tức không phụ thuộc vào lãI suet thị trường
β đo lường mức độ nhạy cảm của lợi tức chứng khoán đang xét trước những
thay đổi của lợi tức của chỉ số chứng khoán.
Như vậy mô hình SIM chỉ ra hai loại rủi ro khác nhau trong đầu tư chứng
khoán:
• Rủi ro thị trường, được đo bằng β, là rủi ro liên
quan đến sự biến động của toàn bộ thị trường và
không thể giảm thiểu bằng cách đa dạng hóa trong
phạm vi thị trường.
• Rủi ro riêng chỉ liên quan đến cổ phiếu đang xét.
Nó có thể đo bằng sai số chuẩn của β. Nhà đầu tư
chỉ có thể loại trừ rủi ro riêng bằng các đa dạng hóa
criterion
-
3.11868
7
Sum squared resid 0.300471 Schwarz criterion -
3.07222
9
Log likelihood 189.1212 F-statistic 44.8113
1
Durbin-Watson
stat
1.882724 Prob(F-statistic) 0.00000
0
Ví dụ 3: Hãy thu thập số liệu của Việt nam để hồi quy các mô hình sau:
(a) FDI
t
= β
1
+ β
2
GDP
t
+ U
t
(b) lnFDI
t
= β
1
+ β