Phương pháp hồi quy và tương quan - Phân tích dãy số thời gian và dự báo Hồi qui tuyến tính một chiều ( tuyến tính đơn) - Pdf 10

CHƯƠNG 1
CƠ SỞ LÝ LUẬN
1.1. Phương pháp hồi quy và tương quan
1.1.1. Hồi qui tuyến tính một chiều ( tuyến tính đơn)
Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay còn gọi
là biến được giải thích) vào một biến hay nhiều biến khác (biến độc lập hay còn gọi là
biến giải thích) với ý tưởng cơ bản là ước lượng (hay dự đoán) giá trị trung bình của
biến phụ thuộc trên cơ sở các giá trị đã biết của biến độc lập.
1.1.1.1. Phương trình hồi qui tuyến tính một chiều
Đặt (x
1,
y
1
), (x
2,
y
2)
,…, (x
n
, y
n
) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể:
y =
α
+
1
x
β
+
1
ε

1
n
i i
i
n
i
i
x y nx y
x nx
=

=




=
1
1
2
1
( )( )
( )
n
i
i
n
i
i
x x y y

là phương sai của sai số và được ước lượng từ công thức sau:
-1-
2
e
s
=
2
1
2
n
i
i
e
n
=


=
2
SEE
n −
Đặt b là ước lượng mẫu của
β
thì phương sai của b là
2
b
σ
=
2
2

=
2
2
( )
e
i
S
x x−

=
2
2
2
e
i
x nx
σ


Giả sử, sai số hồi qui (
1
ε
) có phân phối chuẩn thì ngẫu nhiên (t) dùng để kiểm định giả
thuyết về
β
và ước lượng khoảng tin cậy của
β
được tính như sau:
t =
b

2,
2
n
t
α

) =
2
α
1.1.1.3. Kiểm định tham số hồi qui tổng thể (
β
)
Ở mức ý nghĩa
α
, giả thuyết H
0
có thể được kiểm định dưới các trường hợp:
Đặt giả thuyết:
0 0
1 0
:
:
H
H
β β
β β
=


>

0
b
b
S
β

Quyết định bác bỏ giả thuyết H
0
khi: t <
2,n
t
α

t <
2,n
t
α

2,
2
2,
2
n
n
t t
t t
α
α



y
1
=
µ
1
y
+ e
1
Vậy e
1
là sự khác biệt giữa giá trị thực tế với giá trị dự đoán của phương trình hồi qui
tuyến tính. Như vậy e
1
thể hiện phần biến thiên của Y không thể giải thích bởi mối quan
hệ tuyến tính giữ Y và X.
Ta có:
2
( )
i
y y−

=
µ
2
( )
i
y y−

+
2

2
+ ∑ (
i
– y
tb
)
2
Trong đó:
∑ ( y
i
– y
tb
)
2
= SST là tổng biến động của y
∑ (
i
– y
tb
)
2
= SSR là tổng bình phương hồi qui, là đại lượng biến động
của y được giải thích bởi đường hồi qui.
-3-
∑ ( y
i
-
i
)
2

S
e
2
1
2
2
1
( )
1
1
n
n
i
i
x x
n
x nx
+
=

+ +


Ước lượng khoảng giá trị trung bình của
1n
y
+
với độ tin cậy (1 -
α
)


1.1.2. Hồi qui tuyến tính nhiều chiều
-4-
Nguồn biến
động
Độ tự do
(d.f)
Tổng bình phương
(SS)
Trung bình bình phương
(MS)
Do hồi qui
Dư số
1
(n-2)
SSR=∑ (
i
– y
tb
)
2
SSE=∑ ( y
i
-
i
)
2
SSE/(n-2)
Tổng cộng (n-1) SST= ∑ ( y
i

+ U
Giải thích biến:
- Y (biến phụ thuộc): chỉ tiêu phân tích: Năng suất lúa dình quân cả năm.
-
α
( biến độc lập): hệ số chặn phản ánh mức độ ảnh hưởng của các nhân tố khác đến
chỉ tiêu phân tích.
-
β
: hệ số ước lượng, các hệ số hồi quy này phản ánh mức độ ảnh hưởng của từng
nhân tố đến biến giải thích.
Nếu
β
>0 thì ảnh hưởng thuận và ngược lại là ảnh hưởng nghịch.
β
càng lớn thì sự ảnh
hưởng đến chỉ tiêu phân tích càng mạnh.
- X
i
các yếu tố ảnh hưỏng đến năng suất.Với i chạy từ 1 đến k.
- U là sai số
1.1.2.2. Phương trình hồi qui
Gọi các hệ số a, b
1
…b
k
ước lượng cho
α
,
1

k.
1.1.2.3. Phân tích phương sai hồi qui
 Hệ số xác định:
Hệ số xác định R
2
là nói lên tính chặt chẽ giữa biến phụ thuộc Y và các biến độc lập X
i
,
tức là nó thể hiện phần trăm biến thiên của Y có thể được giải thích bởi sự biến thiên
của tất cả các biến X
i
.
R
2
=
SSR
SST
= 1 -
SSE
SST
0

R
2


1
-5-
Trong đó:
SSE =

i
y y
=


: là tổng biến động của y.
SSR càng lớn thì mô hình hồi quy càng có độ tin cậy cao trong việc giải thích biến
động y
 Hệ số tương quan bội R
R nối lên tính chặt chẽ của mối quan hệ giữa biến phụ thuộc (y) và các biến độc lập (x
i
).
R =
2
R
(-1

R

1)
 Phân tích ANOVA hồi quy:
Kiểm định sự phù hợp của mô hình (ANOVA):
Giá trị được dùng để kiểm định là giá trị F. Việc kiểm định này nhằm đảm bảo
cho việc phù hợp của mô hình hồi quy tuyến tính mẫu với các hệ số tìm được vẫn có giá
trị khi suy diễn ra mô hình thực cho tổng thể.
Để kiểm định sự phù hợp của mô hình hồi quy tổng thể, ta sử dụng Sig.F để làm
căn cứ cho việc chấp nhận hay bác bỏ giả thiết
Sig.F < α : mô hình có ý nghĩa.
Sig.F > α : mô hình không có ý nghĩa.
1.1.2.4. Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi quy nhiều

,
1
b
S
,
2
b
S
, …,
k
b
S
là những độ lệch chuẩn đã ước lượng, và U coi phân phối chuẩn thì biến ngẫu nhiên t
được tính như sau:
t
α
=
a
a
S
α

;
1
b
t
=
1
1 1
b

n k
t
α
− −
i
b
S

1,
2
n k
t
α
− −
là một số sao cho (P
1
1,
2
n k
n k
t t
α
− −
− −
 
>
 
 
.
1.2.Dãy số thời gian

1.2.4. Các yếu tố ảnh hưởng đến dãy số thời gian
Biến động của một dãy số thời gian: X1, X2,…, Xn thường được xem như là kết quả
hợp thành của các yếu tố sau đây:
- Tính xu hướng: Quan sát số liệu thực tế của hiện tượng trong một thời gian
dài (thường là nhiều năm), ta thấy biến động của hiện tượng theo một chiều hướng
( tăng hoặc ) giảm rõ rệt. Nguyên nhân của 2 loại biến động này là sự thay đổi trong
công nghệ sản xuất, gia tăng dân số, biến động về tài sản…
- Tính chu kỳ: biến động của hiện tượng được lặp lại với một chu kỳ nhất định,
thường kéo dài 2-10 năm, trải qua 4 giai đoạn: phục hồi, phát triển, thịnh vượng, suy
thoái và đình trệ. Biến động theo chu kỳ là do biến động tổng hợp của nhiều yếu tố khác
nhau. Chẳng hạn như trong kỳ kinh doanh thì chu kỳ đời sống sản phẩm ảnh hưởng rất
lớn đến doanh thu của công ty qua 4 giai đoạn của nó.
- Tính thời vụ: biến động của một số hiện tượng kinh tế - xã hội mang tính thời
vụ nghĩa là hàng năm, vào thời điểm nhất định (tháng hoặc quý) biến động của hiện
tượng được lặp đi lặp lại. Nguyên nhân của biến động hiện tượng là do các điều kiện
thời tiết khí hậu tập quán xã hội, tín ngưỡng của dân cư…
-8-
- Tính ngẫu nhiên hay bất thường: là những biến động không có quy luật và hầu
như không thể dự đoán được. Loại biến động này thường xảy ra trong một thời gian
ngắn và không lặp lại. Nguyên nhân là do ảnh hưởng của các biến cố chính trị, thiên tai,
chiến tranh…
Giá trị X trong dãy số thời gian X1, X2,…, Xn, có thể được diễn tả bằng công thức sau:
X
i
= T
i
. C
i
. S
i

n
x x x
n
+ + +
=
1
1
n
i
x
n
=

 Mức độ trung bình của dãy số thời điểm
Khoảng cách thời gian giữa các thời điểm bằng nhau
x
=
1 2 1
1 1
...
2 2
1
n
x x x
n

+ + + +

Nếu khoảng cách giữa các điểm thời gian không bằng nhau
-9-


( I =2, …,n)
- Lượng tăng (giảm) tuyệt đối định gốc: Biểu hiện lượng tăng giảm tuyệt đối
giữa kỳ nghiên cứu và kỳ được chọn làm gốc.
'
n

= x
i
– x
1
x
1
: kỳ được chọn làm gốc
Giữa lượng tăng (giảm) tuyệt đối từng kỳ và định gốc có mối liên hệ sau. Tổng
đại số các lượng tăng (giảm) tuyệt đối từng kỳ bằng lượng tăng (giảm) tuyệt đối định
gốc, nghĩa là:
1
n
i
i=


=
'
n

- Lượng tăng (giảm) tuyệt đối trung bình: chỉ tiêu này biểu hiện một cách
chung nhất lượng tăng (giảm) tuyệt đối, tính trung bình cho cả thời kỳ nghiên cứu.


'
i
t
=
1
i
x
x
(I = 2,3,…,n)
* Mối quan hệ giữa tốc độ phát triển từng kỳ và định gốc
- Tích các tốc độ phát triển từng kỳ bằng tốc độ phát triển định gốc.
Công thức:
'
2
n
n
i
i
tt =


- Thương của hai tốc độ phát triển định gốc liền nhau bằng tốc độ phát từng kỳ.
Công thức:
i
i
i
t
t
t
=


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status