Đồ án tốt nghiệp mô HÌNH CHUỖI THỜI GIAN mờ TRONG dự báo CHUỖI THỜI GIAN - Pdf 22

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN

NGUYỄN THỊ KIM LOAN MÔ HÌNH CHUỖI THỜI GIAN MỜ
TRONG DỰ BÁO CHUỖI THỜI GIAN LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01
Giáo viên hướng dẫn: TS. NGUYỄN CÔNG ĐIỀU

1.2. Các phép toán trên tập mờ 25
2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ 30
2.1. Quan hệ mờ 30
2.2. Suy luận xấp xỉ và suy diễn mờ 31
3. Hệ mờ 33
3.1. Bộ mờ hoá 33
3.2. Hệ luật mờ 34
3.3. Động cơ suy diễn 35
3.4. Bộ giải mờ 36
3.5. Ví dụ minh hoạ 37
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

CHƢƠNG 3. MỘT SỐ THUẬT TOÁN CƠ BẢN TRONG CHUỖI THỜI
GIAN MỜ VÀ MỘT SỐ THUẬT TOÁN CẢI TIẾN 39
1. Một số khái niệm 39
1.1. Định nghĩa tập mờ và chuỗi thời gian mờ 39
1.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ 40
2. Mô hình một số thuật toán dự báo trong mô hình chuỗi thời gian mờ 41
2.1. Mô hình thuật toán của Song và Chissom 41
2.2. Mô hình thuật toán của Chen 42
2.3. Thuật toán của Singh 43
2.4. Mô hình Heuristic cho chuỗi thời gian mờ 45
3. Ứng dụng trong dự báo chứng khoán 48
3.1. Bài toán chỉ số chứng khoán Đài Loan 48
3.2. Xây dựng chƣơng trình 60
KẾT LUẬN 64
TÀI LIỆU THAM KHẢO 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

1

chứng khoán và trong nhiều lĩnh vực khác như tiêu thụ điện, hay dự báo nhiệt
độ của thời tiết…
Tuy nhiên xét về độ chính xác của dự báo, một số thuật toán trên còn
cho kết quả chưa cao. Để nâng cao độ chính xác của dự báo, một số thuật toán
cho moo hình chuỗi thời gian mờ liên tiếp được đưa ra. Chen sử dụng mô hình
bậc cao của chuỗi thời gian mờ để tính toán. Sah và Degtiarev thay vì dự báo
chuỗi thời gian đã sử dụng chuỗi thời gian là hiệu số bậc nhất để nâng cao độ
chính xác. Đây cũng là một phương pháp hay được sử dụng trong mô hình
Box-Jenkins để loại bỏ tính không dừng của chuỗi thời gian. Huarng đã sử
dụng các thông tin có trước trong tính chất của chuỗi thời gian như mức độ
tăng giảm để đưa ra mô hình heuristic chuỗi thời gian mờ.
Trong thời gian gần đây, đề tài này vẫn luôn được một số tác giả nghiên
cứu. Các hướng hiện nay vẫn là tập trung nâng cao độ chính xác dự báo của
mô hình chuỗi thời gian mờ. Bài báo của I-Hong Kuo và các tác giả (2008) đưa
ra phương pháp tăng độ chính xác của dự báo bằng tối ưu các phần tử đám
đông (Particle swarm optimaization). Ching Hsue Cheng và các đồng tác giả
(2008) mở rông nghiên cứu bằng các phương pháp kỳ vọng (Exspectation
method) và Phương pháp lựa chọn mức (Grade Selection Method) thông qua
các ma trận chuyển dịch có trọng. Ngoài ra hiện nay có xu hướng sử dụng kết
hợp các phương pháp khác nhau với chuỗi thời gian mờ như phương pháp
mạng Nơ ron như Cagdas H. Aladag (2008) hay Medey Khascay (2008). Ngay
cả một nhà nghiên cứu sâu trong lĩnh vực này là Huarng cũng đã mở rộng theo
hướng này từ năm 2006. Thuật toán di truyền cũng tìm được ứng dụng trong
hướng nghiên cứu này. Năm 2007 có bài báo của Li-Wei Lee sử dụng mối
quan hệ mờ và thuật toán di truyền để dự báo nhiệt độ và chỉ số tài chính của
Đài Loan. Ngoài ra một số tác giả khác tìm những thuật toán khác đơn giản để
dự báo như bài báo của Singh (2007) hay thuật toán dựa vào trend của chuỗi
thời gian (Baldwin 2000).
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

4
chứng. Kết quả thu được rất khả quan. Độ chính xác của dự báo được nâng lên
khá nhiều so với các thuật toán trước đây đề ra.
Nội dung chính của luận văn nghiên cứu những khái niệm, tính chất và
những thuật toán khác nhau trong mô hình chuỗi thời gian mờ để dự báo cho
một số chuỗi số trong kinh tế xã hội, được trình bày trong 3 chương:
Chương 1: trình bày các kiến thức cơ bản về chuỗi thời gian.
Chương 2: trình bày Lý thuyết tập mờ và chuỗi thời gian mờ.
Chương 3: trình bày một số thuật toán cơ bản trong chuỗi thời gian mờ
và một số thuật toán cải tiến.
Luận văn này được hoàn thành dưới sự hướng dẫn tận tình của TS
Nguyễn Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối
với thầy. Tác giả xin chân thành cảm ơn các thầy giáo Viện công nghệ thông
tin, khoa Công nghệ thông tin Đại học Thái Nguyên đã tham gia giảng dạy
giúp đỡ em trong suốt qúa trình học tập nâng cao trình độ kiến thức. Tuy nhiên
vì điều kiện thời gian và khả năng có hạn nên luận văn không thể tránh khỏi
những thiếu sót. Tác giả rất mong các thầy cô giáo và bạn đóng góp ý kiến để
đề tài được hoàn thiện hơn. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

5
CHƢƠNG 1
CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN

Trong phần này, chúng ta sẽ tìm hiểu về một lớp mô hình chuỗi thời
gian hết sức thông dụng trong thực tế. Đó là mô hình quy trình trượt
ARMA(Autoregressive Moving Average). Ta sẽ nghiên cứu các đặc trưng của

1
, x
2
,……… x
n
}nào đó. Để có
thể nói về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát x
t

là một giá trị thể hiện của biến ngẫu nhiên X
t
với t

T. Ở đây T được gọi là tập
chỉ số. Khi đó ta có thể coi tập dữ liệu X:={x
1
, x
2
,……… x
n
} là thể hiện của quá
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

6
trình ngẫu nhiên X
t
, t

T. Và vì vậy, ta có thể định nghĩa một quá trình ngẫu
nhiên như sau

t
, t

Z

là một quá trình ngẫu nhiên có var(X
t
)<

với mỗi t


Z. Khi đó hàm tự hiệp phương sai của X
t
được định nghĩa theo công thức sau:
)],
s
X)(
r
X[(),cov(:),( E
s
XE
r
XE
s
X
r
Xsr
x


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

7
Định lý 1.1
Nếu

X
t
, t

Z

là một quá trình dừng, và nếu như a
t


R, i

Z thoả mãn
điều kiện



i
i
a
thì hệ thức
ZtaY
i


X
t
, t

Z

ta có:
Zht
t
X
ht
XCovh
x
h
x
y 

 ,),,()0,()(


Hàm số
(.)
x
y
được gọi là hàm tự hiệp phương sai của X
t
, còn 
x
(h)là

Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn X:={x
t
, t =
1,2,…n}của một chuỗi thời gian đừng nên về nguyên tắc ta không thể biết
chính xác được các hàm tự hiệp phương sai của chuỗi thời gian đó, muốn ước
lượng nó ta đưa vào khái niệm hàm tự hiệp phương sai mẫu của thể hiện X.
Hàm tự hiệp phương sai mẫu của một thể hiện X được định nghĩa bởi
công thức
nhx
hj
xx
hn
j
j
xnnhc 






 0),)(
1
(
11
:)(

Và
,0),(:)(  hnhchc
trong đó


Z

sao cho
1
::


ttt
XBXY

Toán tử lìu B là toán tử tuyến tính va khả nghịch. Nghịch đảo của nó
B
-1
:=F được gọi là toán tử tiến, định nghĩa bởi công thức:
FX
t :=
X
t+1
Các toán tử B, F thoả mãn hệ thức
B
n
X
t
= X
t-n,
F
n
X
t :=

i
a

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

9
Chú ý:
Một cách tổng quát, người ta có thể định nghĩa các chuỗi theo toán tử
tiến F hay toán tử lùi b và muốn thế chúng ta hạn chế trong trường hợp các quá
trình là dừng. Khi đó, giả sử ta có quá trình dừng

X
t
, t

Z

và một dãy {a
i
,iZ tuyệt đối khả tổng, tức là



i
i
a
, thì định lý 1.1, quá trình
ZtXaY
it
i

Z

. Các
chuỗi theo B khi đó sẽ có những tính chất cho phép ta xử lý nó tương tự như
đối với chuỗi nguyên thông thường. Đặc biệt ta có thể thực hiện phép cộng,
phép nhân hay phép lấy nghịch đảo. Điều này có vai trò quan trọng trong các
phép biến đổi của đa thức tự hồi quy, đa thức trung bình trượt và các phép biến
đổi xử lý chuỗi thời gian khác.
2. Quá trình ARMA
2.1. Quá trình tự hồi quy
Định nghĩa 1.5 (Quá trình ồn trắng)
Quá trình ngẫu nhiên

t
t

Z

được gọi là một ồn trắng, ký hiệu

WN(0,

2
), khi nó thoả mãn các điều kiện sau:
E

t

s
= 0 (t s)

Z} thoả mãn
0,
p-t
X
2211





p
a
t
p
a
t
Xa
t
Xa
t
X

.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

10
với {

} là một ồn trắng.
Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức

thì X
t
được gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta
chỉ xét các quá trình nhân quả.
Các đặc trưng của quá trình tự hồi quy cấp p:
- E(X
t
) = 0
-



p
t
i
ia
1
2
|)()0(


-
0,0)(
1
)( 


 hih
p
i

1
=

















)(
)1(

)2(
)1(
p
p





p
z
p
azazaza 
2
21
1:)(
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

11
Nghĩa là nếu cho

ta sẽ tính được a và ngược lại cho a ta cũng sẽ tính
được

. Trong hệ phương trình Jule – Walker, nếu ta đặt 
pi
= a
i
, i =1,…p thì
hệ phương trình Jule – Walker tương đương với
pjpjj
p
, ,1),()(
1



Đại lượng 

X
t
, t

Z

thoả mãn biểu thức
0,, ,
21
,
111





q
bR
q
bbb
qt
q
b
t
b
t
X


với

b(z)

(z) = 1.
Và khi đó 
1
có thể biểu diễn dưới dạng













j
j
j
z
j
j
z
j
jt
X
j

0



Khi quá trình
t
X
có thể biểu diễn ở dạng trên, tức là khi b(z) chỉ có
nghiệm có môđun lớn hơn 1 thì ta nói
t
X
là một quá trình khả nghịch. Và từ
nay về sau, nếu không nói gì thêm thì khi nói về các quá trình AR và MA
chúng ta hiểu đó là các quá trình nhân quả và khả nghịch.
Các đặc trưng của quá trình trung bình trượt:
Trước hết, ta dễ dàng thấy rằng
0
t
EX
,
Và










h
b
ht
t
XE
ht
X
t
XEh










Từ đó ta suy ra











var:)0(
q
bb
t
X 


Từ công thức hiệp sai của quá trình trung bình trượt ta suy ra công thức
của tự tương quan như sau:

















qh
qh
q
bb

Z

được gọi là quá trình tự hồi quy trung bình
trượt cấp p,q , kí hiệu
t
X

ARMA(p,q) là một quá trình

X
t
, t

Z

thỏa mãn
0,0,, ,
2
,
1
,,
2
,
1
,

11

11





Trong đó
t

là ồn trắng, a(.) và b(.) lần lượt là đa thức tự hồi quy và đa
thức trung bình trượt có bậc tương ứng là p và q:
p
z
p
azaza 
1
1:)(

q
z
q
bzbzb 
1
1:)(

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

14
Khi đó ta có thể viết quá trình ARMA ở dạng toán tử như sau
t
Bb
t
XBa

iti
t
X


Và có thể tính các hệ số
t

bằng cách chia theo lũy thừa tăng a(z) cho b(z).
Các đặc trưng của quá trình ARMA:
Trước hết ta có
)(
.
1
)(
1
.
)(
1
)()( ih
X
q
i
i
bh
p
t
X
iha
ht

Mặt khác ta có thể biểu diễn
ikt
i
i
kt
X







0

Và ta có










0,
2
0,0
)(




p
i
qhih
i
ah
1
.),()(


3. Ước lượng tham số mô hình ARMA
Giả sử ta cần ước lượng các tham số của mô hình ARMA(p,q)
,0,0,, ,
2
,
1
,, ,
2
,
1
,
11

11





đóng vai trò là sai số.
Đối với mô hình ARMA cũng có nhiều phương pháp ước lượng tham số
hiệu quả và được nêu ra chi tiết trong P.Brockwell, R. David, 2001. Dưới đây,
ta sẽ xem xét phương pháp bình phương cực tiểu theo kiểu thuật toán Hannan
– Rissanen. Ý tưởng của thuật toán này là sử dụng hồi quy tuyến tính để ước
lượng các tham số. Nếu q>0 ta còn phải ước lượng các giá trị chưa biết
t

.
Thuật toán Hannan – Rissanen
Bước 1:
Dùng ước lượng Yule Walker để ước lượng các tham số mô hình
AR(m), với m > max(p,q).

Bước 2:
Ước lượng vecto tham số
t
q
bb
p
aa ) ,
1
,, ,
1
(

trên cơ sở cực tiểu
hóa hàm
., ,1,
11

t
b
pt
x
p
a
t
xa
t
xa
n
qmt
t
xS














Giải hệ Gauss-Markov, kết quả thu được ở dạng sau:
,






























qn

21

2

12

1
1

11

1


Ước lượng phương sai
t

theo công thức
.
)(
2
qmn
S
HR







18
khai thác đặc trưng tương quan riêng mẫu của chuỗi tăng trưởng ở trên. Kết
quả được minh họa bằng đồ thị sau:

Hình 1.3 Tự tương quan của chuỗi tăng trưởng Hình 1.4 Tự tương quan riêng của chuỗi tăng trưởng
Ta thấy rằng tương quan riêng của chuỗi tăng trưởng biến đổi trong một
khoảng tương đối hẹp khá giống với tự tương quan riêng của một quá trình
dừng. Tuy nhiên ta lại không thấy được dấu hiệu triệt tiêu của tự tương quan
riêng mặc dù ta đã lấy đến trễ 100. Điều này cho thấy cho chuỗi tăng trưởng
chắc chắn không thể là một quá trình tự hồi quy. Ta cũng biết rằng, về mặt lý
thuyết có thể xấp xỉ mô hình AR nhiều tham số bằng mô hình ARMA với ít
tham số hơn. Điều này cũng cho thấy mô hình ARMA nhiều khả năng không
phù hợp với chuỗi tăng trưởng của chúng ta.
Bây giờ ta lấy bình phương chuỗi tăng trưởng, kết quả cho bởi đồ thị
dưới đây
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

19

Hình 1.5 Bình phương chuỗi tăng trưởng
Nhìn vào đồ thị ta có thể ta có thể thấy được việc tạo thành các cụm biến
động trong đó các thời kỳ và biến động mạnh xen kẽ nhau. Ta tính tiếp các đặc
trưng mẫu của bình phương chuỗi tăng trưởng. Kết quả được thể hiện bằng các
đồ thị sau

Hình 1.6 Tự tương quan của bình phương chuỗi tăng trưởng

Hình 1.10. Tự tương quan riêng của nhiễu
Ban đầu, do tính ít tương quan của nhiễu ước lượng được nên ta thấy nó
giống với một quá trình ồn trắng. Tuy nhiên khi lấy bình phương nhiễu ta lại
thấy khác

Hình 1.11. Bình phương nhiễu

Hình 1.12 Tự tương quan bình phương nhiễu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

22

Hình 1.13 Tự tương quan riêng bình phương nhiễu
Rõ ràng là nhiễu có hiện tượng tạo cụm biến động giống như chuỗi tăng
trưởng ban đầu. Còn khi nhìn vào đồ thị tự tương quan của bình phương nhiễu
ta thấy nó thể hiện sự tương quan mạnh nên ta có thể kết luận rằng nhiễu
không phải là một ồn trắng như mong muốn. Và như vậy mô hình ARMA sẽ
không phù hợp với chuỗi số liệu này.
Mặc dù mô hình ARMA tỏ ra không phù hợp với chuỗi thời gian tài
chính nhưng những kỹ thuật mà nó cung cấp là một cơ sở rất quan trọng và
mang lại nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau
Box-Jenkins. Chính Box-Jenkins là những người đầu tiên đưa ra các kỹ thuật
lấy sai phân để khử khuynh tất định nhằm tăng khả năng dừng của một chuỗi
thời gian. Với những vận dụng sáng tạo khái niệm khuynh này, những người
nghiên cứu đi sau Box-jenkins đã cho ra đời hai lớp mô hình rất quan trọng đối
với chuỗi thời gian tài chính. Đó là mô hình cộng tích, Cointegration
(Granger,1981) và mô hình tự hồi quy biến động bất thường của chuỗi thời
gian tài chính. Mô hình ARCH là cống hiến mang tính khai phá của Engle, nó
có thể giải thích sự bất thường của phương sai mà chỉ sử dụng những thông tin
quá khứ của bản thân nhiễu. Mô hình GARCH (Generalized Autoregressive

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Đồ án tốt nghiệp mô HÌNH CHUỖI THỜI GIAN mờ TRONG dự báo CHUỖI THỜI GIAN - Pdf 22

Tài liệu, ebook tham khảo khác

Học thêm